DailyNews
vip

Згідно зі звітом будинку веб-майстра від 6 листопада, Yuanxiang XVERSE оголосила, що відкриє вихідний код високопродуктивної великої моделі загального призначення XVERSE-65B з параметрами 65 мільярдів, яка буде безумовно безкоштовною для комерційного використання. XVERSE-65B — це багатомовна велика мовна модель, розроблена компанією Shenzhen Meta Elephant Technology. У ньому використовується структура трансформаторної мережі з розміром параметра 65 млрд. Модель має довжину контексту 16K і підходить для таких завдань, як багатоходові розмови, запитання та відповіді зі знаннями та підсумки. Модель була протестована на декількох стандартних наборах даних з хорошою продуктивністю.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити