Пінван повідомив 22 вересня, що згідно зі сторінкою Arxiv, дослідницька група з університету Сучжоу нещодавно запустила модель seq2 seq з відкритим кодом під назвою OpenBA. Повідомляється, що OpenBA — це двомовна асиметрична модель seq2 seq із 15 мільярдами параметрів.Це також перший великий варіант мовної моделі, який приєднався до китайської спільноти моделей з відкритим кодом. Стаття показує, що дослідники використовували ефективну технологію та триетапну стратегію навчання для навчання моделі OpenBA з нуля. Експерименти показують, що OpenBA працює краще, ніж LLaMA-70 B у тесті BELEBELE, краще, ніж BLOOM-176 B у тесті MMLU, і краще, ніж GLM-130 B у тесті C-_ (жорсткий).

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
NFT Market Rebounds
2k Популярність
Altcoins on the Rise
5k Популярність
ETH Breaks Through $3,700
2k Популярність
4Gate Square Creator Spark Program
158k Популярність
5Content Mining & Earn Rich Commission
1833k Популярність
6Gate Alpha New Listings
63k Популярність
7July Market Forecast
112k Популярність
8Which Sectors Are You Watching in 2025?
451k Популярність
9Crypto
7207k Популярність
10contentstar
10722k Популярність

Закріпити

карта сайту