広場
最新
注目
ニュース
プロフィール
ポスト
DailyNews
2024-01-02 05:53:22
フォロー
1月2日のQubitのレポートによると、HuaweiのNoah's Ark Labなどは、新しい大規模言語モデルアーキテクチャであるPangu-πを共同で立ち上げました。 非線形性を高めることで、アーキテクチャは従来のTransformerよりも改善され、特徴の崩壊の問題を大幅に軽減し、モデル出力をより表現力豊かにすることができます。 同じデータで学習した場合、Pangu-π(7B)はマルチタスクでLLaMA2を凌駕し、推論速度10%を達成したと報告されています。 1BスケールまでのSOTA。 同時に、このアーキテクチャに基づいて、ファーウェイは「雲山」と呼ばれる大規模な財務および法的モデルも洗練させました。 この作業は、AI Dacheng Taoが主導しています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
共有
コメント
0/400
コメント
コメントなし
トピック
1
/3
1
CandyDrop Airdrop Event 6.0
36k 人気度
2
White House Crypto Report
42k 人気度
3
Join Alpha RION Airdrop to Earn $40
25k 人気度
4
Fed Holds Rates Decision
8k 人気度
5
July Spark Program TOP 10 Creators Announced
2k 人気度
ピン
サイトマップ
1月2日のQubitのレポートによると、HuaweiのNoah's Ark Labなどは、新しい大規模言語モデルアーキテクチャであるPangu-πを共同で立ち上げました。 非線形性を高めることで、アーキテクチャは従来のTransformerよりも改善され、特徴の崩壊の問題を大幅に軽減し、モデル出力をより表現力豊かにすることができます。 同じデータで学習した場合、Pangu-π(7B)はマルチタスクでLLaMA2を凌駕し、推論速度10%を達成したと報告されています。 1BスケールまでのSOTA。 同時に、このアーキテクチャに基づいて、ファーウェイは「雲山」と呼ばれる大規模な財務および法的モデルも洗練させました。 この作業は、AI Dacheng Taoが主導しています。