DailyNews
vip

Pinwan a rapporté le 22 septembre que, selon la page Arxiv, une équipe de recherche et développement de l'Université de Suzhou a récemment lancé un modèle seq2 seq open source appelé OpenBA. Il est rapporté qu'OpenBA est un modèle seq2 asymétrique bilingue avec 15 milliards de paramètres. Il s'agit également de la première grande variante de modèle linguistique à rejoindre la communauté chinoise des modèles open source. L'article montre que les chercheurs ont utilisé une technologie efficace et une stratégie de formation en trois étapes pour former le modèle OpenBA à partir de zéro. Les expériences montrent qu'OpenBA fonctionne mieux que LLaMA-70 B dans le benchmark BELEBELE, mieux que BLOOM-176 B dans le benchmark MMLU et mieux que GLM-130 B dans le benchmark C-_ (dur).

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)