Pangu モデルの 6000 ワードの詳細説明: 世界の AI のもう一方の極をサポートできるか?

ファーウェイは大型モデルの分野で“力”を見せつけた。

7月7日、2023年ファーウェイ開発者カンファレンス(HDC 2023)が開幕した。午後の2時間以上の基調講演で、HUAWEI CLOUDはPangu大型モデルの進歩を初めて詳細に明らかにし、業界向けのPangu大型モデル3.0をリリースしただけでなく、基本的な機能も詳細に紹介しました。大型モデルを開発できるファーウェイの技術力。

Pangu Large Model 3.0 には「5+N+X」の 3 層構造が含まれており、3 層とは、L0 層の 5 つの基本的な大型モデル、L1 層の N 業界規模の大型モデル、および L2 層を指します。これにより、ユーザーはシーン モデルをさらに洗練して独自にトレーニングできるようになります。完全な階層型デカップリング設計が採用されており、企業ユーザーはビジネス ニーズに基づいて適切な大規模モデルの開発、アップグレード、微調整を選択して、数千の業界の変化するニーズに適応できます。

ファーウェイの輪番会長であるフー・ホウクン氏は、最近のWAICカンファレンスで、ファーウェイの開発モデルの中核はコンピューティングパワーとアプリケーション**に焦点を当てることであると述べた。一方で、コンピューティング能力を深化し、中国の人工知能産業の発展をサポートする強力なコンピューティング能力基盤を構築することです。一方で、汎用の大規模モデルから業界全体の大規模研究やイノベーションに至るまでの大規模モデルを組み合わせて、人工知能を何千もの産業や科学研究に真に役立つようにすることです。

ファーウェイは中国で最も早く大規模モデルを展開したクラウドサービスプロバイダーの1つであり、早ければ2021年にもPangu大規模モデルをリリースした。大規模モデルの開発に向けて、ファーウェイは、Kunpeng と Ascend に基づいた AI コンピューティング パワー クラウド プラットフォームを最下層から構築し、さらにヘテロジニアス コンピューティング アーキテクチャ CANN、フルシナリオ AI フレームワーク MindSpore、そしてAI開発生産ラインModelArts。

会議では、大型モデルとコンピューティングパワーベースに加えて、HUAWEI CLOUD は、Pangu 大型モデルと政府関係、気象、鉄道、製造、金融などの特定の業界を組み合わせた典型的な事例も強調しました。ファーウェイの複数のアップグレードと再構築、クラウド ソフトウェア製品とサービスの適用事例。

基本的な技術力、AI**+ クラウド製品サービス システム、または特定の業界での応用事例のいずれであっても、HUAWEI CLOUD は高度に成熟した体系的なビジネス能力を実証しており、業界に大きな感銘を与えます。 **中国の OpenAI が誰かについて誰もがまだ議論していますが、HUAWEI CLOUD は大規模モデル向けにかなり成熟した開発の道を切り開きました。

ファーウェイは独自の実践を用いて大規模モデルが重要であることを証明しているが、より重要なのは、大規模モデルを使用して業界や製品の問題点を解決し、企業やユーザーに料金を支払わせることができる製品やサービスを作ることである。そして何千もの業界に真の価値を創造します。

01 Pangu Large Model 3.0: レイヤード デカップリング アーキテクチャ

デカップリングは、本日リリースされた Pangu Model 3.0 のキーワードです。これは、過去数カ月間に実際に大規模モデルを導入した業界の顧客に共通するアピールでもあります。

ある大手SaaSベンダーは、自社の大規模モデルアップグレードアプリケーションをリリースする際、「自社で大規模モデルを開発するのではなく、さまざまなビジネスシナリオで、どの大規模モデルが何が得意なのかを判断して、そのモデルを採用する」と述べた。異なる大規模モデル間で切り替えられるようにするには、「当社独自の製品アーキテクチャが、基礎となる大規模モデルから独立しているか、疎結合である必要があります。」

「Panguの大型モデルのデカップリング設計は業界のためだ。」 ファーウェイ開発者カンファレンスで、ファーウェイのエグゼクティブディレクター兼ファーウェイクラウドCEOのZhang Pingan氏は、Panguの大型モデルの差別化路線を語った。その核心は、Pangu モデルのさまざまなレイヤーと機能を分離し、業界ユーザーが独自のニーズに応じて開発できるようにすることです。

具体的には、Pangu 大規模モデル 3.0 は、「5+N+X」3 層アーキテクチャを含む業界指向の大規模モデル シリーズです。

「5」は、L0 レイヤーの 5 つの基本的な大規模モデルを表します: 自然言語、ビジョン、マルチモーダル、予測、科学コンピューティングの大規模モデルが含まれており、業界シナリオにおけるさまざまなスキルのニーズを提供し、満たします。

Pangu 3.0 は、100 億パラメータ、380 億パラメータ、710 億パラメータ、1,000 億パラメータを備えたシリアル化された基本的な大規模モデルを顧客に提供し、さまざまなシナリオ、さまざまな遅延、さまざまな応答速度における顧客の多様なニーズに対応します。同時に、知識質問応答、コピー生成、NLP 大規模モデルのコード生成、マルチモーダル大規模モデルの画像生成と画像理解などの新しい機能セットも提供され、これらのスキルを直接使用できます。顧客とパートナー企業による。大きなモデルのサイズに関係なく、Pangu は一貫した機能セットを提供します。

「5+N+X」の 3 層構造の「N」は、L1 レベルの N 個の大きなインダストリ モデルを表します。業界大規模モデルを提供するには 2 つの方法があります。1 つは、HUAWEI CLOUD が、政務、財務、製造、鉱業、気象などの大規模モデルを含む、業界の公開データを使用してトレーニングされた一般的な業界大規模モデルを提供できる方法であり、もう 1 つは、業界の顧客に基づくことができます。Pangea の大規模モデルの L0 層と L1 層にある独自のデータを使用して、顧客向けに独自の大規模モデルをトレーニングします。

Zhang Pingan氏は、「Panguは業界にサービスを提供するために生まれ、さまざまな大規模モデルの導入、開発、推論形式を提供する。ファーウェイのPanguの大規模モデルと同様に、独自の大規模な業界モデルを生成できる」と述べた。さらに、トレーニング データも大規模モデルから切り離されています。

「5+N+X」の X は、L2 レイヤーが顧客により詳細なシーン モデルを提供することを意味します。これは、政務ホットライン、ネットワーク アシスタント、最先端の薬物検査、ベルトコンベア上の異物検出、台風などに重点を置いています。パス 特定の業界アプリケーションや予測などの特定のビジネス シナリオ向けの「すぐに使える」モデル サービスを顧客に提供します。

「**5+N+X」の3層大型モデルを通じて、HUAWEI CLOUDは独自の大規模モデルベースを構築しました。

昨日の世界人工知能会議で、ファーウェイの輪番会長であるフー・ホウクン氏は、次のように生き生きと説明した:「ベンチマークの最も基本的なレベルは、一般的な大規模モデルであり、これを基本大規模モデルと呼んでいます。このレベルでの私たちのイメージは読み取りと呼ばれます」 「何千冊もの本を読むことでうまくいきます。大量の基礎知識が学びます。このレイヤーでは、何千マイルも旅するという、業界モデルやシーンモデルも作成されます。何千冊の本を読むことで克服すべき課題はまだたくさんあります」 「重要な点は、ファーウェイがさまざまな業界のパートナーと協力して、さまざまな業界の知識を大型モデルに完全に適合させ、統合していることです。」

**また、大規模モデルの革新は、モデルそのものの革新だけではなく、AIのさまざまな根幹技術の革新にも依存します。会合ではファーウェイのノアの方舟研究所所長姚俊氏が盤古モデルの技術基盤を紹介した。

ファーウェイは、最下層にKunpengとAscendをベースとしたAIコンピューティングパワークラウドプラットフォームを構築しているほか、ヘテロジニアスコンピューティングアーキテクチャCANN、フルシナリオAIフレームワークMindSpore、AI開発生産ラインModelArtsなどを活用して、大規模モデルの開発と運用のための分散ソリューションを提供し、並列アクセラレーション、オペレーターとコンパイルの最適化、クラスターレベルの通信の最適化などの主要な機能を提供します。ファーウェイの AI ルート テクノロジーに基づいて、大規模モデルのトレーニングのパフォーマンスを業界の主流の GPU の 1.1 倍に調整できます。

コンピューティング能力は、大規模なモデルをトレーニングするための基礎です。このカンファレンスで、張平安氏は、単一クラスター2000Pフロップスのコンピューティングパワーを備えたAscend AIクラウドサービスが、ファーウェイクラウドのウランカブと貴安のAIコンピューティングパワーセンターで同時に開始されると発表した。 Shengteng AI Cloud Service は、ファーウェイのオールシナリオ AI フレームワーク Shengsi MindSpore のサポートに加えて、Pytorch や Tensorflow などの主流の AI フレームワークもサポートしています。

同時に、これらのフレームワークのオペレータの 90% は、ファーウェイのエンドツーエンド移行ツールを通じて Ascend プラットフォームにスムーズに移行できます。たとえば、Meitu はわずか 30 日間で 70 のモデルを Ascend に移行しましたが、同時に HUAWEI CLOUD と Meitu チームが共同で 30 以上のオペレーターを最適化し、並行してプロセスを加速しました。元のソリューションと比較して、AI のパフォーマンスが向上しました。 30%増加します。

さらに、大規模なモデルのトレーニング中に GPU の障害が頻繁に発生するため、開発者はトレーニングを頻繁に再開する必要があり、これには長い時間がかかり、多額のコストがかかります。 Ascend AI クラウド サービスは、より安定した AI コンピューティング サービスを提供でき、30 日間のキロカロリー トレーニングの長期安定率は 90% に達し、ブレークポイントの回復時間は 10 分を超えません。

02 数千の業界に力を与える

任正非氏は以前、「人工知能ソフトウェアプラットフォーム企業が人間社会に直接貢献するのは2%未満かもしれない。98%は工業社会と農業社会の促進である。しかし、アプリケーションプラットフォームは我々の選択肢ではなく、我々は今後もそうするだろう」と語った。 AI コンピューティング パワー プラットフォームの最下層です。」

大型モデルを何千もの業界に導入することが、ファーウェイの大型モデル開発の焦点となっている。会合では、HUAWEI CLOUDが政務、鉄道、気象、金融など7分野におけるPangu大型モデルの応用事例を紹介した。

政府関係事項

政務分野では、HUAWEI CLOUDと深セン福田区政府サービスデータ管理局が、盤古政務モデルに基づく福田市の政務スマートアシスタント「Xiaofu」を立ち上げ、人々の相談意図を正確に把握し、従来のワンストップサービスを変えることができる。モデル。 12,345 のホットライン、政策文書、政府事務百科事典などを含む 200,000 件を超える政府事務データを微調整することで、政府事務アシスタントは法律や規制、処理手順などの豊富な業界知識を習得しています。

Huawei Cloud によると、Pangu の大きな政務モデルの中核は認知能力です。都市の公共システムを見て理解してもらい、認識から認知、処分までの閉ループを完成させましょう。また、さまざまなシナリオに応じて、質問応答、コピー生成、ビデオ認識、マルチモーダル理解などのさまざまな機能を提供します。

HUAWEI CLOUD は 2 つの典型的なシナリオを導入しました: 1 つ目はコンサルティング シナリオで、企業ユーザーが関連する投資支援政策について政府のアシスタントに相談し、政府のアシスタントは関連する規制や政策を導入し、コンサルタントに適切な提案を提供できます。2 番目のシナリオは、次のとおりです。上図は、対話とマルチモーダル機能に基づいた行政事務処理シーンで、職員はカメラで撮影した写真に基づいて、写真内の違反をインテリジェントに分析できます。

鉄道

鉄道分野では、ファーウェイがトラック検知アシスタントの応用事例をデモした。

従来の鉄道検査官は、鉄道網を走る貨車に欠陥がないかどうかを検出するために、毎日何百万枚もの列車の写真を検査しなければなりません。 Pangu大型モデルの導入後、ライブネットワーク上を走行する67種類のトラックと430種類以上の故障を正確に識別でき、故障のない画像の選別率は95%にも達する。つまり、鉄道検査官は従来の1/20の列車写真を検出するだけで済み、これは作業効率が20倍に向上することに相当します。

炭鉱

炭鉱の分野では、盤古鉱山の大型モデルが全国の8つの鉱山で使用されており、大型モデルは採掘、掘削、機械、輸送、運搬、輸送などのビジネスプロセスの下で1,000以上の細分化されたシナリオをカバーできます。これにより、より多くの炭鉱労働者が地上で作業できるようになり、炭鉱労働者の労働環境がより快適になるだけでなく、安全事故も大幅に減少します。

気象学

ファーウェイクラウドの記者会見では気象分野が焦点となったが、つい数日前、盤古気象大型モデルの研究結果が海外トップジャーナル「ネイチャー」に掲載され、査読者らは次のようにコメントした。天気予報の未来。

当初、今後 10 日間の台風の進路を予測するには、3,000 台のサーバーを備えた高性能コンピューター クラスターでのシミュレーションに 5 時間かかりました。事前トレーニング済みのパンゲア気象大規模モデルに基づいて、AI 推論を通じて、研究者は単一サーバー上に 1 枚のカードを構成するだけで済み、10 秒以内により正確な予測結果を取得できるようになりました。

現在、パンゲア気象大型モデルは、波、高温、台風、寒波などの天気を予測することができ、従来の天気予報と比較して、より高速かつ正確に予測することができます。以前、盤古は気象局と協力して「マワ」の進路を10日前に予測した。さらに、盤古氏は欧州気象庁の予想と比較して、フィンランドへの寒波の到来を2日前に予測した。盤古の予報も実際の気温に近く、

ファイナンス

金融の分野では、Pangu Large Model は ICBC と協力して一連の探索的アプリケーションを作成しました。

典型的なシナリオの 1 つは、銀行窓口の業務効率を向上させることです。 ICBC は全国に数万の店舗を持ち、20 万人の窓口担当者を擁しています。さまざまなサービスを切り替える必要があるため、多くの時間が無駄になります。

Pangu Financial Large Model は、さまざまな銀行業務、ポリシー、事件文書を事前にトレーニングし、顧客の問題に応じて窓口スタッフ向けの手順と業務ガイダンスを自動的に生成することができ、当初 5 操作必要だった平均操作を 1 操作に削減します。 5分以上。

これは最も基本的なアプリケーションにすぎませんが、ファーウェイは金融業界と協力して、将来的にはこの大規模なモデルを信用分析などのより多くの金融シナリオに適用することを検討しています。

製造

ファーウェイ自体も製造会社であり、製造するハードウェア製品には通信基地局、携帯電話、自動車、チップなどの分野が含まれます。過去に蓄積した経験に基づいて、ファーウェイはPangu大型モデルを生産および製造分野に導入しました。

従来は、1つの生産ラインの1日の生産計画を立てるのに、装置の配置計画を立てるのに3時間以上かかることもよくありました。ファーウェイの生産ラインのさまざまなデバイスデータ、ビジネスプロセス、ルールを学習した後、Pangu製造大型モデルはビジネスニーズを正確に理解し、Tianchou AIソルバープラグインを呼び出して、1分で次の3日間の生産計画を立てることができます。

創薬

医薬品の研究開発の分野では、新薬の独自の研究開発には平均10年かかり、10億ドルの費用がかかります。盤古薬の大分子モデルは、西安交通大学第一附属病院の劉冰教授のチームが40年ぶりに世界初の新しい標的と新クラスの抗生物質を発見し、リード医薬品の開発サイクルを1か月に短縮するのに役立った。開発コストを 70% 削減します。

03 Huawei Cloud 製品システムに統合された大型モデル

何千もの業界での実践に加えて、HUAWEI CLOUD Pangu モデルは、製品イノベーションを再構築するために HUAWEI CLOUD の製品サービスにも深く統合されています。

盤古ラージモデル + ファーウェイクラウドサービス

Panguモデルの恩恵を受けて、Huawei Cloudの一連のBエンド製品とサービスがアップグレードされ、再構築されました。説明会では、HUAWEI CLOUDはデータサービス、クラウドカスタマーサービス、BI、クラウド検索の4つのサービスアップグレードの詳細を紹介した。

* データサービスでは、Panguラージモデルのコピーライティングとコード生成技術を通じて、データ書き込みとフロントエンドコード書き込みの効率を向上させることができ、新製品の発売サイクルを大幅に短縮できます。

  • クラウド顧客サービスでは、業界ナレッジベースに組み込まれた対話 Q&A とインテントマイニングの機能により、AI 優先応答の全プロセスが実現され、顧客サービスの効率が 30% 向上します。
  • BI では、NL2SQL と AutoGraph インテリジェント ルーティングを通じて、SQL からビジュアル チャートへの自動レコメンデーションが実現され、複数ラウンドの自然言語対話を通じて、誰もがデータからビジネスの詳細についての洞察を簡単に得ることができます。 ※クラウド検索では、マルチモーダルエンベディングとNL2API技術により、動画、テキスト、地図など幅広いシーンの検索を実現し、強力な意味理解・汎化機能により、検索精度が15%向上します。

Pangu 大型モデル + CodeArts コード ツール

HUAWEI CLOUD は、CodeArts 研究開発ツールと Pangu 大型モデルを組み合わせ、開発者向けのインテリジェントなプログラミング アシスタントである CodeArts Snap を正式にリリースしました。

このツールは、選択された 760 億行のコードと 1,300 万の技術文書を学習しており、インテリジェントな生成、インテリジェントな質問と回答、インテリジェントなコラボレーションの 3 つのコア機能を備えており、一文の対話でのコード生成と、自動アノテーションと生成を実現できます。 1 つのコマンドをインテリジェントに展開できるため、すべてのソフトウェア開発者が独自のプログラミング アシスタントを持つことができます。

盤古大型モデル + デジタルマン

HUAWEI CLOUDは、Pangu基本大型モデルを通じてMetaStudioデジタルコンテンツ生産ラインを強化し、Pangu Digital Human Congressモデルを作成し、モデル生成とモデル駆動という2つの主要なサービスを提供し、事前トレーニングに20万時間のオーディオおよびビデオデータを使用しました。

これら 2 つの主要なサービスに基づいて、開発者はデジタル ヒューマン モデルを迅速に生成して推進することができ、オンライン教育、エンターテイメントのライブ放送、企業カンファレンス、その他の業界アプリケーションを強化し、すべての企業従業員が「デジタル ヒューマンの自由」を実現できるようになります。例えば、ユーザーはHUAWEI CLOUD MetaStudioのサービスページに20秒のパーソナルビデオをアップロードするだけで、パーソナライズされたデジタルヒューマンの説明ビデオを迅速に生成することができ、これまで3人の研究開発担当者が3日間かけて行っていた作業を、1日で完了できるようになります。わずか3分。

盤古大型モデル + 身体化されたインテリジェンス

会合では、ファーウェイ・クラウドもロボティクス分野でのPanguモデルの応用について言及し、ビデオをデモした。

以前は、ロボットにコマンドを与えるには開発者がプログラミングする必要がありましたが、Pangu モデルの自然言語理解能力に基づいて、ロボットは自然言語を認識し、コマンドを実行し、全体的な認識に基づいて自律的な知能を備えることができます。会議でファーウェイは、ユーザーがプログラムコマンドを入力する必要はなく、自然言語でロボットに命令を与えるだけでよく、ロボットはアイテムを拾うなどのコマンドを完了し、それに基づいて自律的に判断するビデオをデモンストレーションした。プロセス内の環境に応じて(移動など、ターゲットオブジェクトを妨げている雑貨を開くなど)、タスクを完了します。

ファーウェイによると、上記のデモはコンセプトビデオではなく、HDCカンファレンスの会場で展示された実際の製品だという。

**04 要約と考察: ファーウェイは AI のもう一方の極になれるか? **

Zhang Pingan 氏は次のように述べています。「世界中の顧客、パートナー、開発者が大規模モデルをトレーニングして使用できるよう支援するために、私たちは世界中の顧客のための世界を構築することに尽力しています AI **もう 1 つの極、新しい AI 開発者を提供しますの選択」。 **

それよりも早く、今年3月の時点で、任正非氏は社内で同様の意味を表明していた。同氏は、マイクロソフトに限らず、AIモデルが急増するだろうと述べた。任正非氏の理由は、実際には今日のファーウェイクラウドの取り組みの方向性、つまり、人工知能ソフトウェアプラットフォーム企業の人間社会への直接的な貢献は2%未満であり、98%は工業社会と農業社会の促進である。

例えば、中国やドイツの工場では無人生産の実現に向けて業界への人工知能の導入を進めており、例えば天津港の埠頭でも貨物の積み下ろしの無人化が試みられています。コンテナは自動的に船から降ろされ、そのまま運んで車で運び去りますが、例えば山西省の炭鉱では地下に5G+の人工知能を導入したことで人員が60~70%削減され、そしてほとんどの人は地上の管制室でスーツを着て働いています。

これらはここ数年でAIが産業面に大規模に適用されている例ですが、これらの産業に共通しているのは、規模も生産額も巨大であり、少しの効率改善で大きなメリットが得られるということです。

**大規模モデルの出現により、本質的にはより効率的な生産性ツールが提供されます。 **一方で、既に AI を導入している業界にとって、これは効率の向上と変革プロセスの高速化を意味し、効率の向上はより多くの業界にとって「経済勘定」の計算が容易になることも意味します。少数のいわゆる主要産業から何千もの産業を変革することです。

ファーウェイがこの業界に果敢に参入する理由はここにあるが、実際、アリババクラウド、テンセントクラウド、ボルケーノクラウド、バイドゥクラウドといった国内の大手クラウドサービス企業も同様の考えを持っている。同じ方向で開始点が近い場合、この競争で誰が最も速く走れるかは、コンピューティング能力、大規模なモデルベース、プラットフォーム、製品から特定のソリューションに至るまでのチェーン全体の能力によって決まります。

周知の理由により、ファーウェイは現在認められている世界最先端のコンピューティングチップを入手できず、この競争では本質的に不足しているようだ。しかし、今日の記者会見から判断すると、ファーウェイは上流の制約により遅れを取っているとは思えず、大型モデルのキーチェーンでは成熟した製品とケースを開発しており、分離されたパング大型モデルはモデルの建築はさらに目を引きます。 **実際、今日のローカリゼーションのニーズを考慮すると、コンピューティング能力の点で遅れをとらないファーウェイが、独立した制御可能な優位性を持つようになる可能性があります。 **

大型モデルはファーウェイにとって新たなチャンスとなっており、それが現実になりつつあるようだ。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)