1月2日のQubitのレポートによると、HuaweiのNoah's Ark Labなどは、新しい大規模言語モデルアーキテクチャであるPangu-πを共同で立ち上げました。 非線形性を高めることで、アーキテクチャは従来のTransformerよりも改善され、特徴の崩壊の問題を大幅に軽減し、モデル出力をより表現力豊かにすることができます。 同じデータで学習した場合、Pangu-π(7B)はマルチタスクでLLaMA2を凌駕し、推論速度10%を達成したと報告されています。 1BスケールまでのSOTA。 同時に、このアーキテクチャに基づいて、ファーウェイは「雲山」と呼ばれる大規模な財務および法的モデルも洗練させました。 この作業は、AI Dacheng Taoが主導しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)