AIエージェントはWeb3ゲームのイノベーションへの道を再定義します

主なインサイト

1.AI Agentは、LLMの一般的な大規模モデルに基づくツールであり、開発者とユーザーが独立して対話できるアプリケーションを直接構築できます。 2.AI トラックの将来の主なパターンは、「一般的な大型モデル+ペンダントアプリケーション」です。 AIエージェントの生態学的ニッチは、一般的な大型モデルとDappをつなぐミドルウェアであるため、AIエージェントは堀が低く、長期的な競争力を向上させるためには、ネットワーク効果を構築し、ユーザーの粘着性を改善する必要があります。 3.この記事では、Web3ゲームトラックでの「一般的な大規模モデル、ペンダントアプリケーションエージェント、および生成AIアプリケーション」の開発について説明します。 その中で、ジェネレーティブAIテクノロジーと組み合わせることで、短期的にゲームにヒットする可能性が非常に高いです。

01 テクニカルブリーフ

今年の爆発的な汎用人工知能AGI(人工知能)技術では、大規模言語モデル(LLM)が絶対的な主役です。 OpenAIのコアテクノロジストであるAndrej Karpathy氏とLilian Weng氏は、LLMベースのAIエージェントはAGI分野の次の重要な開発方向であり、多くのチームもLLM駆動型AIエージェント(AI-Agents)システムを開発していると述べました。 簡単に言えば、AIエージェントは、自動運転、音声認識、ゲーム戦略などのさまざまなタスクやインタラクションを実行するために、大量のデータと複雑なアルゴリズムを使用して人間の思考と意思決定プロセスをシミュレートするコンピュータープログラムです。 Abacus.ai の写真は、AIエージェントの基本原理を明確に紹介しており、手順は次のとおりです。

1.知覚とデータ収集:ゲームの状態、画像、音声などの情報とデータを取得するための知覚システム(センサー、カメラ、マイクなど)を介したデータ入力、またはAIエージェント。 ** 2.状態表現:データは、ニューラルネットワークに簡単に入力できるように、ベクトルやテンソルに変換するなど、エージェントが理解できる形式で処理および表現する必要があります。 ** 3.ニューラルネットワークモデル:ディープニューラルネットワークモデルは、画像処理用の畳み込みニューラルネットワーク(CNN)、シーケンスデータ処理用のリカレントニューラルネットワーク(RNN)、または自己注意メカニズム(トランスフォーマー)などのより高度なモデルなど、意思決定と学習に一般的に使用されます。 ** 4.強化学習:エージェントは、環境との相互作用を通じて最良の行動戦略を学びます。 さらに、エージェントの動作原理には、戦略ネットワーキング、バリューネットワーキング、トレーニングと最適化、および探索と利用が含まれます。 たとえば、ゲームシナリオでは、戦略ネットワークはゲームの状態を入力してから、アクション確率分布を出力できます。 バリューネットワークは状態値を推定することができます。 エージェントは、環境と対話してポリシーを最適化し、ネットワークを評価し、より良い結果を出力することで、学習アルゴリズムを継続的に強化できます。 **

要約すると、AIエージェントは理解、決定、行動するインテリジェントなエンティティであり、ゲームを含むさまざまな分野で重要な役割を果たすことができます。 OpenAIのコア技術者であるLilian Wengによる「LLM搭載自律エージェント」は、非常に興味深い実験であるジェネレーティブエージェントを含む、AIエージェントの原理の非常に包括的な紹介を提供します。

ジェネレーティブエージェント(GA)は、LLMテクノロジーを使用して25の仮想キャラクターを生成し、それぞれがLLMを搭載したエージェントによって制御され、サンドボックス環境で生活し、相互作用する「ザシムズ」ゲームに触発されています。 GAは、LLMとメモリ、プランニング、およびリフレクション機能を組み合わせるように巧妙に設計されており、エージェントプログラムが以前の経験に基づいて意思決定を行い、他のエージェントと対話できるようにします。

この記事では、エージェントがポリシーネットワーク、バリューネットワーク、および環境との相互作用に基づいて意思決定パスを継続的にトレーニングおよび最適化する方法について詳しく説明します。

原理は次のとおりです:ここで、メモリストリーム(Memory Stram)は、エージェントのすべてのインタラクション体験を記録する長期メモリモジュールです。 取得モデルは、関連性、鮮度、重要性に基づいて取得されたメモリを提供し、エージェントが決定を下すのに役立ちます。 リフレクションメカニズムは、過去のイベントを要約し、エージェントの将来のアクションをガイドします。 計画と反映は連携して、エージェントが反映と環境情報を実用的な行動に変換できるようにします。

この興味深い実験は、新しい社会的行動の生成、情報の普及、関係記憶(2人の仮想キャラクターがトピックについて議論し続けるなど)、社会活動の調整(パーティーを開催し、他の仮想キャラクターを招待するなど)など、AIエージェントの機能を示しています。 全体として、AI-Agentは非常に興味深いツールであり、ゲームでのそのアプリケーションは深く調査する価値があります。

02 技術動向

2.1 AIトラックのトレンド

ABCDEの投資調査パートナーであるLao Baiは、AIの次の開発に関するシリコンバレーのベンチャーキャピタルコミュニティの判断を要約しました。

  1. **垂直モデルなし、大型モデル+垂直アプリケーションのみ。 ** 2.携帯電話などのエッジデバイス上のデータは障壁となる可能性があり、エッジデバイスに基づくAIも機会になる可能性があります。 ** 3.コンテキストの長さは、将来質的な変化を引き起こす可能性があります(ベクトルデータベースは現在AIメモリとして使用されていますが、コンテキストの長さはまだ十分ではありません)。 **

**つまり、業界の一般的な開発法の観点から、大規模一般モデルモデルモードは重すぎて普遍性が強いため、大規模一般モデルの分野で常にホイールを構築する必要はありませんが、ペンダントの分野に大規模な一般モデルを適用することにもっと焦点を当てるべきです。 **

同時に、エッジデバイスとは、通常はクラウドコンピューティングセンターやリモートサーバーに依存しないが、データ処理と意思決定をローカルで行うエンドデバイスを指します。 エッジデバイスは多様であるため、AIエージェントをデバイス上で実行し、デバイスデータを適切に取得する方法は課題ですが、新しい機会でもあります。

最後に、コンテキストの問題も多くの注目を集めています。 簡単に言えば、LLMコンテキストのコンテキストは情報量として理解でき、コンテキストの長さはデータの次元数として理解できます。 ユーザーが特定の製品を購入する可能性を予測するために使用されるeコマースWebサイトのビッグデータモデルがあるとします。 この場合、コンテキストは、ユーザの閲覧履歴、購入履歴、検索履歴、ユーザ属性などの情報を含むことができる。 コンテキスト長とは、上海の30歳の男性ユーザーの競合製品の購入履歴、最近の購入頻度、最近の閲覧履歴など、特徴情報の重ね合わせの次元を指します。 コンテキストの長さが長くなると、ユーザーの購入決定に影響を与える要因をモデルがより包括的に理解するのに役立ちます。

現在のコンセンサスは、AIのメモリとしてベクトルデータベースを使用しているため、コンテキストの長さが不十分ですが、コンテキストの長さは将来質的に変化し、LLM後のモデルは、より長く、より複雑なコンテキスト情報を処理および理解するためのより高度な方法を模索できます。 さらに、想像を超えるアプリケーションシナリオが出現しています。

2.2 AIエージェントのトレンド

Folius Venturesは、以下に示すように、ゲームトラックでのAIエージェントのアプリケーションモデルを要約しました。

図1はLLMモデルであり、主にユーザーの意図を従来のキーボード/クリック入力から自然言語入力に変換し、ユーザーの参入障壁を下げる役割を果たします。

図2は、AIエージェントと統合されたフロントエンドDappであり、端末からユーザーの習慣とデータを収集しながら、ユーザーに機能的なサービスを提供します。

図の3はさまざまなAIエージェントであり、アプリ内機能やボットなどの形で直接存在できます。

一般に、AI Agent はコードベースのツールとして、Dapps がアプリケーションの機能を拡張するための基盤となるプログラムとして、またプラットフォーム (大規模なモデルと垂直アプリケーションをリンクするミドルウェア) の成長触媒として機能します。

ユーザーシナリオに関しては、AIエージェントを統合する可能性が最も高いDappは、ソーシャルアプリ、チャットボット、ゲームに対して十分にオープンである可能性があります。 または、既存のWeb2トラフィックポータルを、AIエージェントを介してよりシンプルでアクセスしやすいAI + web3エントランスに変換します。 つまり、業界はWeb3ユーザーのしきい値を下げることを議論してきました。

業界の開発法則に基づき、AIエージェントが配置されているミドルウェア層は、堀がほとんどない競争の激しいトラックになることが多いです。 したがって、AIエージェントは、B2Cのニーズに合わせてエクスペリエンスを継続的に改善することに加えて、ネットワーク効果を作成したり、ユーザーの粘着性を作成したりすることで、堀を改善できます。

03トラックマップ

Web3ゲームのAIアプリケーションでは、いくつかの異なる試みがあり、次のカテゴリに分類できます。

1.一般的なモデル:一部のプロジェクトは、一般的なAIモデルの構築、Web3プロジェクトのニーズに適したニューラルネットワークアーキテクチャと一般的なモデルを見つけることに焦点を当てています。 ** 2.垂直アプリ:ペンダントアプリは、ゲームの特定の問題を解決したり、通常はエージェント、ボット、ボットキットの形式で特定のサービスを提供したりするように設計されています。 ** 3. **生成AIアプリケーション:大規模モデルに対応する最も直接的なアプリケーションはコンテンツ生成であり、ゲームトラック自体はコンテンツ業界であるため、ゲーム分野での生成AIアプリケーションは非常に注目に値します。 仮想世界での要素、キャラクター、ミッション、ストーリーの自動生成から、ゲームの戦略、決定、さらにはゲーム内のエコロジーの自動進化まで、それが可能になり、ゲームがより多様で深くなりました。 ** 4.AIゲーム:現在、AIテクノロジーを統合し、以下に示すさまざまなアプリケーションシナリオを持つゲームがすでにたくさんあります。 **

3.1 ユニバーサルラージモデル

現在、Web3には、QTM定量トークンモデルなど、経済モデル設計と経済生態学的開発のためのシミュレーションモデルがすでにあります。 Outlier VentureのAchim Struve博士は、ETSCCでの講演で経済モデル設計のアイデアをいくつか挙げました。 たとえば、経済システムの堅牢性を考慮して、プロジェクトチームはLLMモデルを介してデジタルツインデジタルツインを作成し、エコシステム全体を1:1でシミュレートできます。

下図のQTM(量子化トークンモデル)は、AI主導の推論モデルです。 QTMは10年の固定シミュレーション時間を使用し、各時間ステップは1か月を測定します。 各時間ステップの開始時に、トークンがエコシステムに発行されるため、モデルにはインセンティブモジュール、トークン権利確定モジュール、エアドロップモジュールなどがあります。 これらのトークンはいくつかのメタバケットにドロップされ、そこからより詳細な一般化されたユーティリティの再配布が行われます。 次に、これらのユーティリティツールからの報酬の支払いなどを定義します。 また、オフチェーンビジネスと同様に、これは破壊や買い戻しの可能性など、ビジネスの一般的な資金調達状況も考慮に入れており、ユーザーの採用を測定したり、ユーザーの採用を定義したりすることもできます。

もちろん、モデルの出力品質は入力の品質に依存するため、QTMを使用する前に、より正確な入力情報を取得するために十分な市場調査を行う必要があります。 しかし、QTMモデルはすでにWeb3経済モデルにおけるAI駆動モデルの非常に実用的なアプリケーションであり、QTMモデルに基づく多くのプロジェクトパーティがあり、操作の難易度が低く、プロジェクトパーティが使用するしきい値を下げます。

3.2 ペンダントアプリケーションエージェント

ペンダントアプリケーションは主にエージェントの形で存在し、ボット、ボットキット、仮想アシスタント、インテリジェントな意思決定支援システム、さまざまな自動データ処理ツールなどがあります。 一般的に、AI AgentはOpenAIの一般的なモデルを基盤とし、テキスト読み上げ(TTS)などの他のオープンソースまたは自社開発のテクノロジーを組み合わせ、FineTune(機械学習とディープラーニングの分野におけるトレーニング手法であり、主な目的は、大規模データで事前にトレーニングされたモデルをさらに最適化することです)に追加して、特定の分野でChatGPTよりも優れたパフォーマンスを発揮するAIエージェントを作成します。

現在、Web3ゲームトラックの最も成熟したアプリケーションはNFTエージェントです。 ゲームトラックのコンセンサスは、NFTはWeb3ゲームの重要な部分でなければならないということです。

イーサリアムエコシステムにおけるメタデータ管理技術の開発に伴い、プログラム可能な動的NFTが登場しました。 NFTの作成者は、アルゴリズムによってNFT機能をより柔軟にすることができます。 ユーザーにとっては、ユーザーとNFTの間により多くの相互作用がある可能性があり、生成された相互作用データは情報源になっています。 AI Agentは、インタラクションプロセスを最適化し、インタラクションデータのアプリケーションシナリオを拡張して、NFTエコシステムにより多くの革新と価値を注入できます。

ケース1:たとえば、Gelatoの開発フレームワークを使用すると、開発者はオフチェーンイベントまたは特定の時間間隔に基づいてNFTメタデータを更新するロジックをカスタマイズできます。 Gelatoノードは、特定の条件が満たされるとメタデータの変更をトリガーし、オンチェーンNFTの自動更新を有効にします。 たとえば、このテクノロジーを使用して、スポーツAPIからリアルタイムの試合データを取得し、アスリートが試合に勝ったときなどの特定の条件下でNFTのスキル特性を自動的にアップグレードできます。

ケース2:PaimaはダイナミックNFTのアプリケーションエージェントも提供しています。 PaimaのNFT圧縮プロトコルは、L1で最小限のNFTのセットを作成し、L2でのゲームの状態に基づいてそれらを進化させ、プレーヤーにより深くインタラクティブなゲーム体験を提供します。 たとえば、NFTは、キャラクターの経験値、ミッションの完了、装備などの要因に応じて変更できます。

ケース3:Mudulas Labsは非常に有名なZKMLプロジェクトであり、NFTトラックにもレイアウトがあります。 Mudulasは、AIを介してNFTを生成してチェーンに公開できるNFTシリーズzkMonを発売し、zkpを生成し、ユーザーはNFTが対応するAIモデルから生成されたかどうかを確認できます。 より包括的な情報については、第7.2章:世界初のzkGAN NFTを参照してください。

3.3 ジェネレーティブ AI アプリケーション

前述したように、ゲーム自体がコンテンツ産業であるため、AIエージェントは、不確実でダイナミックなゲームキャラクターの作成など、短時間で低コストで大量のコンテンツを生成することができます。 したがって、ジェネレーティブAIはゲームアプリケーションに最適です。 現在、ゲームの分野でのジェネレーティブAIの応用は、次の主なタイプに要約できます。

  1. **AIで生成されたゲームキャラクタークラス:AIとの対戦など、またはAIがゲーム内のNPCのシミュレーションと制御を担当したり、AIを直接使用してキャラクターを生成したりします。 **
  2. **AI生成ゲームコンテンツクラス:ミッション、ストーリーライン、小道具、マップなど、AIによって直接生成されるさまざまなコンテンツ **
  3. **AI生成ゲームシーンクラス:AIを使用して、ゲーム世界の地形、風景、雰囲気を自動的に使用、最適化、または拡張することをサポートします。 **

3.3.1 AI によって生成されたロール

ケース 1: マイシェル

MyShellは、ユーザーがチャット、スピーキングの練習、ゲームのプレイ、さらにはニーズに応じてカウンセリングを求めるための独自のボットを作成できるボット作成プラットフォームです。 一方、Myshellはテキスト読み上げ(TTS)テクノロジーを使用しており、わずか数秒で誰かの声を模倣するボットを自動的に作成します。 さらに、MyShellはAutoを使用しており、ユーザーは自分のアイデアを記述するだけでLLMモデルを指示でき、プライベートラージ言語モデル(LLM)の基礎を築いています。

Myshellのユーザーは、そのボイスチャット機能は非常にスムーズで、GPTのボイスチャットやLive2Dよりも高速であると言います。

ケース2:AIアリーナ**

AIアリーナは、ユーザーがLLMモデルを使用して自分のバトルエルフ(NFT)を継続的にトレーニングし、トレーニングしたバトルウィザードをPvP / PvEバトルバトルに送信できるAIバトルゲームです。 バトルモードはニンテンドースタースマッシュブラザーズに似ていますが、AIトレーニングにより、より競争力のある楽しみが追加されます。

パラダイムは、現在オープンベータフェーズで開始されているAIアリーナへの投資を主導し、プレーヤーは無料でゲームに参加したり、NFTを購入してトレーニングの強度を高めたりすることができます。

ケーススタディ3:リーラ対世界**

リーラ対世界は、ムドゥラス研究所によって開発されたチェスゲームです。 ゲームでは、ゲームの両面はAIと人であり、チェスゲームの状況は契約に置かれています。 プレイヤーはウォレットを介して操作(契約と対話)します。 AIは新しいチェスゲームの状況を読み取り、判断を下し、計算プロセス全体のzkpを生成し、どちらもAWSクラウドで完了し、zkpはチェーン上のコントラクトによって検証され、検証が成功した後、チェスコントラクトは「チェスをプレイする」ために呼び出されます。

3.3.2 AI生成ゲームコンテンツ

事例1:AIタウン

AI Townは、スタンフォード大学のジェネレーティブエージェントの論文に触発された、a16zとそのポートフォリオ企業であるConvex Devのコラボレーションです。 AI Townは、町内のすべてのAIが相互作用と経験に基づいて独自のストーリーを構築できる仮想の町です。

これには、Convex バックエンド サーバーレス フレームワーク、Pinecone ベクター ストレージ、クラーク認証、OpenAI 自然言語テキスト生成、Fly デプロイなどのテクノロジ スタックが使用されます。 さらに、AI Townはすべてオープンソースであり、ゲーム内開発者は、機能データ、スプライトテーブル、タイルマップのビジュアル環境、テキスト生成プロンプト、ゲームのルールとロジックなど、さまざまなコンポーネントをカスタマイズできます。 AI Townを体験できる通常のプレイヤーに加えて、開発者はソースコードを使用してゲーム内およびゲーム外でもさまざまな機能を開発でき、この柔軟性により、AI Townはさまざまなタイプのアプリケーションに適しています。

したがって、AIタウン自体はAI生成コンテンツゲームですが、開発エコロジーであり、開発ツールでもあります。

ケース2:ポール

ポールは、フルチェーンゲームがAIストーリーを生成してチェーンに直接移動するためのソリューションパスを提供することを専門とするAIストーリージェネレーターです。 実装ロジックは、LLMに多数の事前ルールを入力することであり、その後、プレーヤーは、ルールに基づいてセカンダリコンテンツを自動的に生成することができます。

現在、ポールサイドラーを使用して公開されたゲームストレイライトプロトコルがあり、ストレイライトはマルチプレイヤーNFTゲームであり、コアゲームプレイは「Minecraft」のフルチェーンゲームバージョンであり、プレイヤーは自動的にNFTを作成し、モデル入力の基本的なルールに従って独自の世界を構築できます。

3.3.3 AIが生成したゲームシーン

ケース1:パフド研究所

Pahdo Labsは、Godotエンジン上に構築されたアニメ、ファンタジー、ロールプレイングゲーム、オンラインゲーム作成プラットフォームであるHalcyon Zeroに現在取り組んでいるゲーム開発スタジオです。 ゲームは、社交の中心地として機能するにぎやかな町を中心とした空気のようなファンタジーの世界で行われます。

このゲームを非常に特別なものにしているのは、プレイヤーがゲームが提供するAI作成ツールを使用して、より多くの3D効果の背景をすばやく作成し、お気に入りのキャラクターをゲームに持ち込むことができることです。

ケース2:カエディム

Kaedim は、Game Studio 用の Generate AI ベースの 3D モデル生成ツールを開発し、Game Studio がニーズを満たすゲーム内 3D シーン/アセットをバッチ生成するのをすばやく支援します。 Kaedimの一般的な製品はまだ開発中であり、2024年にゲームスタジオで利用できるようになる予定です。

Kaedim製品のコアロジックは、AI-Agentとまったく同じで、一般的な大規模モデルをベースとして使用し、チーム内のアーティストは引き続き優れたデータを入力し、エージェントの出力をフィードバックし、機械学習を通じてモデルを継続的にトレーニングし、最終的にAI-Agentに要件を満たす3Dシーンを出力させます。

04 まとめ

この記事では、ゲームの分野でのAIの応用の詳細な分析と要約を行いました。 一般に、一般的なモデルの将来とゲームでのジェネレーティブAIのアプリケーションには、スターユニコーンプロジェクトがあります。 ペンダントアプリケーションの堀は低いですが、先発者の利点は強く、先発者の利点を利用してネットワーク効果を生み出し、ユーザーの粘着性を向上させることができれば、想像力の余地は巨大です。 また、ジェネレーティブAIは当然ゲームのコンテンツ業界に適しており、すでに多くのチームがゲームでGAの適用を試みており、このサイクルはGAを使用した人気のあるゲームに登場する可能性が非常に高いです。

記事に記載されているいくつかの方向性に加えて、将来的には他の探索角度があります。 たとえば:

(1)データトラック+アプリケーション層:AIデータトラックは、数十億ドル相当のユニコーンプロジェクトを生み出し、データ+アプリケーション層の連携も想像力に溢れています。

(2)Socialfiとの統合:社会的相互作用の革新的な方法を提供するなど。 AI エージェントを使用して、コミュニティ ID 認証とコミュニティガバナンスを最適化します。 または、よりスマートでパーソナライズされた推奨事項など。

(3)エージェントの自動化と成熟に伴い、自律世界の主な参加者は人ですか、それともボットですか? チェーン上の自律的な世界は、DAUの80%+がボットであるUniswapのようになる可能性はありますか? もしそうなら、Web3ガバナンスの概念と組み合わせたガバナンスエージェントも検討する価値があります。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)