OpenAIの共同創設者Karpathy氏は「AIエージェントが実際に機能するまでには10年かかるかもしれない」と語った。

主催:Twitterアカウント「@GPTDOACN」

最近、OpenAI の共同創設者である Andrej Karpathy 氏は、開発者イベントで短いスピーチを行い、AI エージェント (人工知能エージェント) に関する彼と OpenAI の内部の見解について語りました。

アンドレイ・カルパシー氏は、これまでの AI エージェント開発の困難さと、新しい技術ツールの下で開発された新たな機会を比較し、テスラでの仕事を「自動操縦に気を取られていた」と嘲笑することも忘れませんでした。同氏は、自動運転とVRを悪いAIエージェントの例とみている。

アンドレイ・カルパシー氏は、新たな機会を得るために、ディープラーニングの初期に起こったことと同じように、今が再び神経科学に戻り、そこからインスピレーションを求める時期であると信じています。

一方、Andrej Karpathy 氏は、AI エージェントの構築においては、OpenAI のような企業よりも一般人、起業家、オタクのほうが有利であると考えており、現在は誰もが平等な競争状態にあるため、この点での結果を期待していると述べています。

以下はこの共有の全文です。

こんにちは、みんな。私は、AI エージェントのテーマについて、やる気を起こさせる言葉を話すよう招待されました。

AI エージェントはある意味私に近いものだと思います。話を始めましょう。これは非常に初期の OpenAI の話です。2016 年頃、当時 OpenAI はおそらく十数人しかいなかったです。当時のトレンドは実際には RL エージェントです (強化学習エージェント)。誰もがエージェントの構築に非常に興味を持っていましたが、当時は主にゲームベースであり、Atari のようなゲーム会社が興奮していました。OpenAI での私のプロジェクトでは、RL エージェントをキーボードに集中させようとしており、マウスはコンピュータ上で使用されていました。 、ゲームではありません。私はそれらをもっと便利にして、たくさんの仕事をしたいと思っています。そのプロジェクトは World of Bits と呼ばれています。数人の同僚と私は最終的に論文を発表することになりました。

実際には RL 強化学習手法に基づいているため、これは驚くべき論文ではありません。私たちの Web ページは非常にシンプルで、航空券を予約したり、食べ物を注文したりすることができます。テクノロジーの準備が整っていなかったので、当時はこのようなことを行うのは賢明ではなかったため、これらはどれもうまくいかないのは明らかでした。事実は、AI エージェントのことを完全に忘れて言語モデルを実行する必要があることを証明しています。

5 年後に私たちはここに戻ってきましたが、私は自動運転に少し気を取られていましたが、AI エージェントが再びクールになった今、私たちのツールボックスは完全に異なり、これらの問題へのアプローチ方法もまったく異なります。実際、皆さんは AI エージェントに取り組んでいますが、強化学習手法は使用していないかもしれません。クレイジーだ、こんなことになるとは予想していなかったと思う。とても楽しかったです。

AI エージェントがなぜこれほど人気があるのかについて少しお話しましょう。 AGI (汎用人工知能) が、1 つではなく多数の AI エージェントの機能を最大限に活用することは多くの人にとって明らかだと思います。おそらく、デジタルエンティティの組織や文明が存在するでしょう。それは非常に刺激的で、少しクレイジーですらあると思います。しかし、これには水を差しておきたいとも思います。想像しやすく、構築し、実証するのは簡単ですが、製品を作るのは非常に難しい、さまざまな種類の問題があると思います。多くのものがこれに当てはまりますが、自動運転などがその一例だと思います。

自動運転は想像するのが簡単で、街区を走行する車のデモを構築するのも簡単ですが、それを製品化するまでには 10 年かかりました。 VR も同様で、実用化するには 10 年かかると思います。

AIエージェントについても、ある程度同じことが言えると思います。シナリオを想像するのは簡単で、非常にエキサイティングですが、もし参加するのであれば、実際に機能するまでに 10 年を投資する必要があると思います。

もう 1 つ言いたいのは、今神経科学に戻って、ある意味で再び神経科学からインスピレーションを受けるのは興味深いことだと思います。ディープラーニングの初期の頃は神経科学からインスピレーションを受けていました。それらの間の関係について考えるのは非常に興味深いものです。特に、多くの人が解決策の一部として言語モデルに注目していると思いますが、人間のすべての認知能力を備えた完全なデジタル エンティティをどのように構築するのでしょうか?明らかに、私たちは自分のやっていることを計画し、考え、反映するために何らかの基礎的なシステムが必要であることに誰もが同意しており、ここで神経科学が活躍します。

たとえば、海馬は非常に重要ですが、AI エージェントでは、記憶の保存やマークの検索などに使用される海馬の役割は何でしょうか?私たちは視覚野と聴覚野を構築する方法については一般的に理解していますが、AI エージェントにおいてそれが何を意味するのかはわかっていないことがたくさんあります。 AI エージェントのビジュアル ゲームはどのように見えるのでしょうか? AI エージェントにおける、潜在意識の場所である視床に相当するものは何ですか?とても興味深いですね。

実は今日は神経科学の本、デヴィッド・イーグルマン著『脳と行動』を持ってきましたが、とても興味深く啓発的でした。初期の頃に個々のニューロンを設計したように、神経科学から興味深いインスピレーションを得て、おそらく今日もそれを行う必要があります。

最後に激励の言葉を述べて終わりたいと思います。興味深いですが、明白ではないのは、あなたが構築する AI エージェント (ライブ視聴者を指します) は、実際には現代の AI エージェントの機能の最前線にあるということです。OpenAI、DeFi などのすべての大規模な LLM 機関、私は彼らが最前線にいるのは疑わしい。あなたは最前線にいます。

たとえば、OpenAI は、Transformer の大規模言語モデルのトレーニングに非常に優れています。論文が何らかの別のトレーニング方法を提案した場合、OpenAI 内の Slack グループでの議論は、「ああ、誰かが 2 年半試したが効果がなかった、私たちはこの方法には興味がない」というものになるでしょう。隅々まで非常に理解が深い。しかし、新しい AI エージェントの論文が出たとき、私たちは非常に興味を持ち、とても素晴らしいと思いました。なぜなら、私たちのチームはそれに 5 年も費やしていないからです。私たちはあなた以上に何も知りません。私たちはあなたたち全員と協力しています。人々は一緒に競争します。これが、AI エージェントができることの最前線にいると考える理由です。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)