DailyNews
vip

据品玩 9 月 22 日报道,据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2 seq 模型。 据悉,OpenBA 是一款具有 150 亿参数的双语非对称 seq2 seq 模型,也是首个加入中国开源模型社区的大语言模型变体。论文显示,研究者采用高效的技术以及采用三阶段的训练策略,从头开始训练了 OpenBA 模型。 实验显示,OpenBA 在 BELEBELE 基准测试中的性能优于 LLaMA-70 B,在 MMLU 基准测试中的性能优于 BLOOM-176 B,在 C-_(hard)基准测试中的性能优于 GLM-130 B。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)