大型モデルTo C発売、AI実用化のハーフタイムにシャンパン開け?

出典:インターネット江湖

画像ソース: Unbounded AI によって生成‌

大型のモデルは、評価において想像力を高めることができないようです。

今年 3 月 14 日、OpenAI は GPT-4 をリリースしました。これにより、大規模モデルの理解と信頼性がさらに向上しました。その 2 日後、Baidu Wen Xin Yi Yan が正式にリリースされ、Wen Yi Yan が正式にサービスを一般公開したのは 8 月末になってからでした。

Baidu に加えて、iFlytek も 5 月 6 日に Spark モデルをリリースし、9 月 5 日に一般公開されます。シャンタン。 4月にRirixin大型モデル制度がリリースされ、8月末にはRirixin大型モデルが承認されました。 Tencent Hunyuan と Alitong Qianwen も市場への参入を急いだ。

国内初の大型モデルのデビューから半年が経過した現在、各資本市場の動向はどうなっているでしょうか。

香港における百度の株価終値は、3月14日が129香港ドル、9月18日が132.2香港ドルだった。

センスタイムは4月11日に3.33香港ドルで取引を終え、9月18日には1.46香港ドルで取引を終えた。

iFlytekの終値は5月8日が63.76元、9月18日が48.38元だった。

……

確かに大型モデルのコンセプトについては話題になっていたが、現状ではその賑わいは薄れ、市場が買う気配はない。

8月15日には「生成型人工知能サービス管理措置(意見募集案)」が発効し、AIGC製品準拠への道が明確になったことにより、Baidu、iFlytek、SenseTime、プレーヤーは ToC 市場を掌握し始めました。

では、人々の携帯電話に搭載された「最初の大型モデルアプリケーション」は、AI世代への「最初の入り口」となるのだろうか?検討してみる価値はあります。

大型モデルはフロントに「転がり込んで」、AI起動後のハーフタイムにシャンパンを開けた?

確かなことは、最前線で市場が期待しているのは、アプリケーションという意味での「製品化」だということだ。大規模モデルはどのような客観的な問題を解決できますか? 問題を解決できるアプリケーションは、商業的価値のあるアプリケーションです。

大規模モデルの最も直接的な応用は音声アシスタントです。

大型モデルは音声対話アプリケーションの波を強化しており、一部のハードウェア業界に「第二の春」をもたらす可能性がある。たとえば、スマート スピーカーには新たなセールス ポイントがあり、Xiaodu スマート スピーカーには新たな成長ポイントが見つかる可能性がある。

音声アシスタントの分野で最も成功したアプリケーションは自動車かもしれません。

Wen Xinyiyan は、Geely、Great Wall、Hongqi、Dongfeng Nissan、Lantu へのアクセスを獲得しました。ChatGPT は Mercedes-Benz に接続され、Spark 大型モデルは GAC に接続され、Huawei Pangu は Thalys に接続されています...これもその 1 つです。大規模モデルの商品化のための最も簡単なシナリオ。結局のところ、車載シナリオでは、音声アシスタント アプリケーションが緊急に必要とされており、B サイド実装としては比較的成熟した分野でもあります。

大規模モデルの C サイドへの浸透において重要な一歩が踏み出されましたが、それらを実際に大規模に適用できるようになるまでには、まだ長い道のりがあるのではないかと思います。

今日の歓声はハーフタイムにシャンパンをあけるようなものですが、大型モデルはまだまだ成熟には程遠いのが現実です。

人々が受け入れなければならないのは、大きなモデルは非常に強そうに見えますが、実際に問題を解決するために使用すると、それほど強力ではないことがわかるということです。

最も実用的な、単純なニーズの一部については、大規模なモデルでは依然としてそれらを満たすことができません。その背後にはデータの問題や生態学的な問題がありますが、最終的には、実際のニーズを限られた範囲でしか解決できません。

1 つ目はデータの鮮度の問題です。実際に使用してみると、同じ質問に対して、大規模モデルで得られる回答は検索ほど良くないことがわかりました。

百度検索で得られた答えは次のとおりです。

ウェン・シンイーヤン氏の答えは次のとおりです。

適時性と正確性の点で、検索は常識とより一致しており、実際の場面に対する人々の理解とより一致しています。

「Wen Xin Yiyan は、言語、テキスト、プログラム コードを扱うあらゆるアプリケーション シナリオで役立つ可能性があります。」と Wang Haifeng 氏はかつて外の世界に語ったことがあります。

確かに、大型モデルのアプリケーション シナリオは非常に広範囲に及びますが、実際の需要シナリオでは、現在の大型モデル製品には改善の余地が多くあるように思われます。

Wen Xinyiyan と比較すると、iFlytek Spark モデルが答えを与えますが、時期は 2022 年の上場企業のランキングであり、最新のデータではなく、データの鮮度の問題でもあります。

データの鮮度の問題は、本質的にはデータ エコロジーの独立した問題です。

一部の垂直分野の質問については、大規模なモデルが提供する回答は、専門性や適時性の点で人々のニーズを満たしていないようです。これは、Wen Yiyan にせよ Xinghuo Model にせよ、誰もが垂直分野でのデータ トレーニングを十分に受けていないことが原因である可能性があります。

たとえば、金融情報に関して言えば、大規模なモデルによって提供される結果は、金融情報 Web サイトで見つかる結果ほど正確で有用ではない可能性があります。もちろん、著作権の問題も関係しているかもしれませんが、本質的には島の問題です。データエコシステム。

ChatGPT を例に挙げると、OpenAI、Google、およびそのサポート対象である Anthropic は、長年にわたって他の Web サイトや企業のオンライン コンテンツを使用して生成 AI モデルをトレーニングしてきました。データ量は保証されていますが、潜在的な法的問題もあります。

大規模なモデルが最前線になると、このデータアイランドの問題はさらに顕著になります。ユーザーはデータの取得方法には関心がないため、ツールが使いやすいかどうかだけを気にします。

Tianyancha APP で大型モデルを検索すると、関連する結果が 100 以上あります。多くの大型モデルが独自の APP をリリースしていますが、現時点では本当に使いやすいものは多くありません。大量のユーザーが流入しているのは、 C 側アプリケーションで大規模なモデルによって実行される作業は、実際にはまだ非常に限られています。

たとえば、ユーザーが 2K 解像度の画像を 4K に変換したい場合、技術的には複雑ではありませんが、大型モデルでは一般ユーザーには結果が得られません。一度使って効果がなかったら、再度使い続けるのは難しいと思います。

かつてのスマートスピーカーや音声アシスタントと同じように、実は誰もが携帯電話にAI音声アシスタントを搭載しているのに、なぜもっと使われないのでしょうか?実際、それは使いにくいからです。したがって、Baidu、iFlytek、さらには SenseTime にとって、課題は C 側のアプリケーションを作成できるかどうかではなく、それらが十分に優れているかどうかです。

より成功している Baidu 製品は Baidu Search です。インテリジェント検索は確かに非常に強力ですが、大規模な製品が検索と同じレベルを達成できるかどうかには疑問符が必要です。

iFlytek の場合、一部のハードウェア製品は順調に進んでいますが、試されるのはソフトウェア製品を定義できるかどうかです。SenseTime の場合、ToB アプリケーションは数多く行われてきましたが、ToC には明らかにまだより多くの経験が必要です。

現時点では、国内の ToC の大規模なモデルはあまり区別されていません。そのほとんどは、コンテンツ作成、AI ペイント、翻訳、AI オフィスなどのシナリオで使用されています。また、会議の概要や会議の概要の作成など、いくつかの実用的な問題の解決にも役立ちます。 PPTのアウトラインを書いたり、研究レポートを書いたり、日々の作業報告を書いたりします。

しかし次に、ToCという大きなモデルが本当に「ヒット」し、差別化できるのかというと、AI技術だけで試されるものではないのではないかと危惧しています。

大型モデルの商品化の猶予期間が残り少なくなってきています。

B 側で大規模なモデルを実装する際の最大の障害の 1 つは、ビジネスを理解できないことです。

例えば、金融分野はデータ指向が強い分野であり、人はデータに基づいて意思決定を行う必要がありますが、大量のデータと金融理論を使ってAIを訓練した場合、刻々と変化する市場を前に、どのように対応すればよいのでしょうか。大規模なモデルによって多くの意思決定が可能ですか? 精度は?ユーザーはあえてそれを使用しますか?

マスク氏は以前、FSD V12はほぼ完全にニューラルネットワークであり、一連のエンドツーエンドの自動運転技術を構築していると述べた。言い換えれば、エンドツーエンドの情報入出力プロセスは「ブラックボックス」です。

AI が具体的にどのように意思決定を行うかはわかりませんが、最終的には使用可能な結果が得られるでしょう。

このようなアプリケーションでは、ほとんどの場合問題ありません。たとえば、旅行分野では、人々が必要とするのは目的地に安全に到着することです。意思決定のブラックボックスの問題が存在しても、実際のアプリケーションには影響しません。 。

意思決定のブラック ボックスの最大の問題は、意思決定の信頼性の問題であり、クラウド ツー エンドの大規模モデルにも同様の問題があります。

たとえば、大規模なモデルに質問した場合、AI の質問によって得られる答えは本物であり、十分に信頼できるものですか?この問題は依然として多大な努力を払って解決する必要がある。簡単に言うと、大規模なモデルにどのような結果が正しくて使いやすいかを教えるには、モデルの出力結果を現実と常に「一致させる」必要があります。

これは、C 側で実装される大規模なモデルにとっても重要な課題です。

出力結果の信頼性と有効性は、最も基本的なレベルで保証できないのですか?これは、大規模モデルのアプリケーションが本当に大爆発を引き起こすことができるかどうかを解決する必要がある前提問題です。

以前、ChatGPT はこれを行うために多額の費用を費やしましたが、Wen Xinyiyan、Spark Model、SenseTime の毎日の新しいモデルも明らかにこのプロセスを通過する必要があります。

現段階では、一般的な大型モデルの適用に対する熱狂は、むしろ人々の修身的なものであり、企業による大型モデルのリリースには一連の広報活動が伴うことが多いですが、それに加えて、どのようなメリットが増加するのか量の面では、まだ明確な計画はなく、「AI インテリジェント大規模モデルによりコストが削減され、効率が向上する」という宣伝文句があるだけです。

製品プロモーションにおいては「巨人」であり、ビジネスにおいては「小人」であるこの現状は、流通市場でよく見てもらうために、自らをビッグモデルとしてレッテルを貼ろうとしていることにほかなりません。ただし、市場はすでに足で投票しており、最終的には実際の商業パフォーマンスを確認することになります。

インターネット江湖は、過去の大型モデルの価値が、流通市場で良い価格を得るためにテクノロジー企業が「ラベルを貼る」ことにあるとすれば、今後生き残れるかどうかは「製品化」を完了できるかどうかにかかっていると考えている。 . 本当に「世界征服」するには応用力が頼りです。

シリコンバレーのゴッドファーザーであるピーター・ティールはかつて、自分たちにレッテルを貼ることを好む企業はほぼすべて投資不可能であると述べ、「私はテーマ別の話題の投資にはすべて懐疑的です。一般的に言えば、区別はないと言われています」と述べました。誰もが、クラウド コンピューティング、ビッグ データ、人工知能、医療 SaaS などとラベル付けされて、まったく異なるものを 1 つのホット スポットにまとめることを好みますが、実際には、最下層のレイヤーはまったく異なります。差別化はありません。」

大型モデルも同様です。

実際、AI トラックのバブルが終わった後、市場は、大型モデルの真の価値は依然として製品化にあることを明確に理解しました。製品化の鍵は技術競争だけではなく、プロダクトマネージャーの力量競争でもある。

現時点では、前の時代の「王」(アリババやテンセントなど)の方が百度よりも経験と発言力があるかもしれません。

一方で、製品化の鍵となるのは、ユーザーのニーズを正確に定義できることです。

たとえば、現在は誰もが AI ネイティブ アプリケーションを作成することを好みますが、ユーザーの実際のニーズをより適切に満たす方法は製品の定義によって異なります。

一方、大型モデルは製品化して初めて差別化が可能であり、製品化はむしろ製品化の当然の結果です。

各社から発売されている大型模型製品を体験してみると、名前は違えど製品に大きな違いはなく、できる作業の種類も似ていると強く感じます。

たとえば、温信宜燕を初めて使用したときは、彼は本当に強力で、すべての質問に答えられると感じますが、もう少し深い内容になると、彼の答えはあまりにも定型的であることがわかり、ほとんどの場合、それらは空虚な言葉や決まり文句のようなものです。

Wen Xinyiyan 氏、iFlytek の Spark モデル、SenseTime の SenseChat だけでなく、実際には、どのユーザーのパフォーマンスもそれほど変わりません。

これは本質的に、大規模なモデルは本質的に強力な人工知能ではなく、継続的なトレーニングのためにデータに依存する必要があり、本当の意味で情報に基づいて判断を下すことができないためです。したがって、差別化の鍵は最終的な応用製品にあります。

Internet Jianghu は、大型モデルの製品は、シナリオを通じてユーザーを「引き付ける」必要があるだけでなく、ユーザーを維持し、さらにはユーザーの支払い意欲を刺激するために経験を活用する必要があると考えています。

現在、承認された大型モデルのアプリケーション製品は、ユーザーの日常シーンのほとんどをカバーするツールが中心となっており、新たな入口となることを期待して、仕事からエンターテインメントまであらゆる方向のアプリケーションが登場し始めています。

問題は、ほとんどのユーザーがまだアーリーアダプターの状態にあり、実際の問題を解決するためにそれを使用するユーザーが多くない可能性があることです。その理由は依然として製品の用途にある可能性があります。

単純にタイプミスをチェックするというニーズを例に挙げると、個人的な経験から言えば、現在市場に流通している主流の大型モデルのアプリケーションはあまり優れたものではありませんが、逆に記事校正に特化したバーティカルプラットフォームもいくつかあり、ユーザーエクスペリエンスは良好です。はるかに良いです。作家として、私は実際、そのような製品にはお金を払う意欲を持っています。

テキスト作業だけでなく、コード生成や画像生成など、現在の大型モデルは「使えるか」という問題はとりあえず解決しましたが、本当の鍵は「使いやすいか」という問題を解決することです。

したがって、これらの細分化されたアプリケーションにおける製品機能が、ユーザーが実際に大規模なモデルを使用できるかどうかの鍵となる可能性があります。

多数のユーザーがそれを使用し、AI のトレーニングに十分なデータが使用されると、大規模な AI モデルの機能が飛躍的に向上する可能性があります。 ChatGPT が本格的に普及したのは、多数のユーザーが流入した後です。

大規模モデルがオープンした後、AI ネイティブ アプリケーションが爆発的に増加することが予測されており、アプリケーションの爆発後にどれだけのユーザーが留まることができるかは、「Wen Xin Yiyan」が深く考える必要がある問題かもしれません。

業界観察者のLiu Yu氏は、「『100モデルの戦い』で最後に笑いたいなら、どれだけのユーザーが実際のお金を出してでも支払うかを見なければならない」と述べた。

ChatGPT のユーザー数が 1 億人を超えた後、C サイドに対して月額 20 米ドルのサブスクリプション料金を請求し始め、B サイド専用のエンタープライズ バージョンを開始しました。これは、OpenAI の考え方がテクノロジーを作ることから製品を作ることへと変化していることを示しています。もちろん、ChatGPT がより現実的な問題を解決できることが証明されていることが前提となります。

国内の大型モデルが GPT4 のレベルに達するにはあと 1 年かかる、言い換えれば、大型モデルのプレーヤーが大型モデル AI のネイティブ アプリケーションを真に定義し改善するには、まだ 1 年は残されているということです。次に、この領域で適切な作業を行い、大規模モデルのデータの適時性をさらに向上させる方法が鍵となる可能性があります。

最後に次のように書きます。

スティーブ・ジョブズとiPhoneの成功は、本当に輝くのはテクノロジーではなく製品であることを証明しています。

優れたアプリケーション製品を作成する方法は、大型モデルのプレーヤーにとってより明確な目標かもしれません。次の C サイド アプリケーションは実際に大規模なモデルでやり直す必要があることが予測されますが、これは間違いなく Baidu、iFlytek、SenseTime にとってチャンスとなります。

AI業界には風待ちの人材が不足したことはありませんが、本当に不足しているのは風を起こす人材です。次は本物の剣と銃の戦場です。誰がさまざまな対応ができるか見守っていきたいと思います」を呼び出し、大規模モデル アプリケーションの宝の山を開拓します。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)