Pinwan informó el 22 de septiembre que, según la página Arxiv, un equipo de investigación y desarrollo de la Universidad de Suzhou lanzó recientemente un modelo seq2 seq de código abierto llamado OpenBA. Se informa que OpenBA es un modelo bilingüe asimétrico seq2 seq con 15 mil millones de parámetros y también es la primera variante de modelo de lenguaje grande que se une a la comunidad de modelos de código abierto chino. El artículo muestra que los investigadores utilizaron tecnología eficiente y una estrategia de capacitación de tres etapas para entrenar el modelo OpenBA desde cero. Los experimentos muestran que OpenBA funciona mejor que LLaMA-70 B en el punto de referencia BELEBELE, mejor que BLOOM-176 B en el punto de referencia MMLU y mejor que GLM-130 B en el punto de referencia C-_ (duro).

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
NFT Market Rebounds
905 Popularidad
Altcoins on the Rise
5k Popularidad
ETH Breaks Through $3,700
2k Popularidad
4Gate Square Creator Spark Program
143k Popularidad
5Content Mining & Earn Rich Commission
1833k Popularidad
6Gate Alpha New Listings
63k Popularidad
7July Market Forecast
112k Popularidad
8Which Sectors Are You Watching in 2025?
451k Popularidad
9Crypto
7207k Popularidad
10contentstar
10722k Popularidad

Anclado