1.AI Agent — это инструмент, основанный на общей большой модели LLM, позволяющий разработчикам и пользователям напрямую создавать приложения, которые могут взаимодействовать независимо друг от друга.
2.AI Основной паттерн будущего трека может быть: «общая большая модель + применение кулона»; Экологическая ниша ИИ-агента — это промежуточное ПО, которое соединяет общую большую модель и Dapp, поэтому у ИИ-агента низкий ров, и для повышения долгосрочной конкурентоспособности необходимо выстраивать сетевые эффекты и улучшать прилипчивость пользователей.
3. В этой статье рассматривается разработка «общих больших моделей, агентов подвесных приложений и приложений генеративного ИИ» в игровом треке Web3. Среди них, в сочетании с технологией генеративного искусственного интеллекта, он имеет большой потенциал для того, чтобы попасть в игру в краткосрочной перспективе.
01 Техническое задание
В этом году во взрывоопасной технологии AGI (Artificial General Intelligence) Large Language Model (LLM) является абсолютным главным героем. Ключевые технологи OpenAI Андрей Карпаты и Лилиан Венг также заявили, что ИИ-агенты на основе LLM являются следующим важным направлением развития в области AGI, и многие команды также разрабатывают системы ИИ-агентов на основе LLM (AI-Agents). Простыми словами, ИИ-агент — это компьютерная программа, которая использует большие объемы данных и сложные алгоритмы для моделирования человеческого мышления и процесса принятия решений с целью выполнения различных задач и взаимодействий, таких как автономное вождение, распознавание речи и игровая стратегия. На рисунке Abacus.ai четко представлен основной принцип работы AI Agent, а шаги следующие:
Восприятие и сбор данных: ввод данных или ИИ-агент через системы восприятия (датчики, камеры, микрофоны и т. д.) для получения информации и данных, таких как состояние игры, изображения, звук и т. д. **
Представление состояния: Данные должны быть обработаны и представлены в форме, понятной агенту, например, преобразованы в векторы или тензоры, чтобы их можно было легко ввести в нейронную сеть. **
Модели нейронных сетей: Модели глубоких нейронных сетей обычно используются для принятия решений и обучения, такие как сверточные нейронные сети (CNN) для обработки изображений, рекуррентные нейронные сети (RNN) для обработки данных последовательностей или более сложные модели, такие как механизмы самовнимания (трансформеры). **
Обучение с подкреплением: агенты изучают лучшие стратегии действий через взаимодействие с окружающей средой. Кроме того, принципы работы агента включают в себя стратегическую сеть, сетевую сеть ценностей, обучение и оптимизацию, а также исследование и использование. Например, в игровом сценарии стратегическая сеть может вводить состояние игры, а затем выводить распределение вероятностей действия; Сеть создания ценности способна оценить ценность состояния; Агенты могут постоянно усиливать алгоритмы обучения, взаимодействуя со средой для оптимизации политик и сетей создания ценности и получения лучших результатов. **
Таким образом, ИИ-агенты — это интеллектуальные сущности, которые понимают, принимают решения и действуют, и они могут играть важную роль в различных областях, включая игры. Книга «LLM Powered Autonomous Agents» (LLM Powered Autonomous Agents) Лилиан Венг (Lilian Weng) представляет собой исчерпывающее введение в принципы работы ИИ-агентов, включая очень интересный эксперимент: генеративные агенты.
Генеративные агенты (GA) вдохновлены играми The Sims, которые используют технологию LLM для создания 25 виртуальных персонажей, каждый из которых управляется агентом LLM, живущим и взаимодействующим в песочнице. GA умело спроектирован таким образом, чтобы сочетать LLM с возможностями памяти, планирования и рефлексии, что позволяет программам агентов принимать решения на основе предыдущего опыта и взаимодействовать с другими агентами.
В статье подробно описывается, как агент непрерывно обучает и оптимизирует пути принятия решений на основе сетей политик, сетей ценностей и взаимодействий со средой.
Принцип заключается в следующем: где Memory Stream (Memory Stram) — это модуль долговременной памяти, который записывает все переживания взаимодействия агента. Модель извлечения предоставляет восстановленные воспоминания на основе релевантности, свежести и важности, чтобы помочь агенту принять решение. Механизм рефлексии обобщает прошлые события и направляет будущие действия агента. Планирование и рефлексия работают вместе, чтобы помочь агентам преобразовать размышления и информацию об окружающей среде в действенные действия.
Этот интересный эксперимент показывает нам возможности агентов ИИ, такие как генерация нового социального поведения, распространение информации, реляционная память (например, два виртуальных персонажа, продолжающих обсуждать тему), координация социальных действий (например, проведение вечеринки и приглашение других виртуальных персонажей) и так далее. В целом, AI-Agent является очень интересным инструментом, и его применение в играх стоит изучить более подробно.
02 Технологические тренды
2.1 Отслеживание тенденций ИИ
Лао Бай, партнер по инвестиционным исследованиям в ABCDE, однажды подытожил суждение венчурного сообщества Кремниевой долины о следующем развитии ИИ:
**Нет вертикальной модели, только большая модель + вертикальное применение; **
Данные на периферийных устройствах, таких как мобильные телефоны, могут стать препятствием, а использование ИИ на периферийных устройствах также может стать возможностью; **
Длина Контекста может стать причиной качественных изменений в будущем (векторные базы данных сейчас используются в качестве памяти ИИ, но длины контекста все равно не хватает). **
** То есть, с точки зрения общего закона развития отрасли, поскольку режим крупномасштабной модели общей модели слишком тяжел и обладает сильной универсальностью, нет необходимости постоянно строить колеса в области крупномасштабных общих моделей, а следует больше сосредоточиться на применении крупномасштабных общих моделей в области подвесок. **
При этом к периферийным устройствам относятся конечные устройства, которые обычно не полагаются на центры облачных вычислений или удаленные серверы, а проводят обработку данных и принятие решений локально. Из-за разнообразия периферийных устройств развертывание агентов ИИ для работы на устройствах и правильного получения данных об устройствах является сложной задачей, но это также и новая возможность.
Наконец, большое внимание привлек и вопрос контекста. Проще говоря, контекст в контексте LLM можно понимать как объем информации, а длину контекста можно понимать как количество измерений данных. Предположим, что у вас есть модель больших данных веб-сайта электронной коммерции, которая используется для прогнозирования вероятности того, что пользователь купит определенный продукт. В этом случае контекст может включать такие сведения, как история просмотров пользователя, история покупок, история поиска, атрибуты пользователя и т. д. Длина контекста относится к измерению наложения информации о признаках, таких как история покупок конкурирующих продуктов 30-летних пользователей мужского пола в Шанхае, частота недавних покупок и недавняя история просмотров. Увеличение длины контекста может помочь модели более полно понять факторы, влияющие на решение пользователя о покупке.
В настоящее время консенсус заключается в том, что, хотя нынешнее использование векторных баз данных в качестве памяти ИИ делает длину контекста недостаточной, длина контекста качественно изменится в будущем, и модель после LLM может искать более продвинутые методы обработки и понимания более длинной и сложной информации о контексте. Кроме того, появилось больше сценариев применения, выходящих за рамки воображения.
2.2 Тренды ИИ-агентов
Folius Ventures обобщила модель применения AI Agent в игровом треке, как показано ниже:
На рисунке 1 показана модель LLM, которая в основном отвечает за преобразование намерений пользователя из традиционного ввода с клавиатуры/щелчка мыши в ввод на естественном языке, снижая барьер входа для пользователей.
На рисунке 2 показано интерфейсное Dapp, интегрированное с агентом искусственного интеллекта, которое предоставляет пользователям функциональные сервисы, собирая пользовательские привычки и данные с терминала.
3 на рисунке — это различные агенты ИИ, которые могут существовать непосредственно в виде функций в приложении, ботов и т. д.
В целом, как инструмент на основе кода, AI Agent может выступать в качестве базовой программы для децентрализованных приложений для расширения функциональности приложений и в качестве катализатора роста платформы, то есть промежуточного программного обеспечения, которое связывает большие модели и вертикальные приложения.
С точки зрения пользовательских сценариев, наиболее вероятное децентрализованное приложение для интеграции AI Agent, вероятно, будет достаточно открытым для социальных приложений, чат-ботов и игр; Или трансформировать существующий портал трафика Web2 в более простой и доступный вход AI+web3 через AI Agent; То есть в индустрии обсуждается снижение порога пользователей Web3.
В соответствии с отраслевым законодательством о развитии, уровень промежуточного программного обеспечения, в котором находится ИИ-агент, часто становится высококонкурентным треком практически без рва. Таким образом, в дополнение к постоянному улучшению опыта в соответствии с потребностями B2C, агенты ИИ могут улучшать свои рвы, создавая сетевые эффекты или создавая прилипчивость пользователей.
03 Карта трассы
Было предпринято несколько различных попыток применения ИИ в играх Web3, которые можно сгруппировать в следующие категории:
Общие модели: Некоторые проекты сосредоточены на построении общих моделей ИИ, поиске подходящих архитектур нейронных сетей и общих моделей для нужд проектов Web3. **
Вертикальные приложения: Подвесные приложения предназначены для решения конкретных проблем в играх или предоставления определенных услуг, обычно в виде агентов, ботов и наборов ботов. **
**Приложение генеративного ИИ: Наиболее прямым приложением, соответствующим большой модели, является генерация контента, а сам игровой трек - индустрия контента, поэтому приложение генеративного ИИ в игровой сфере очень достойно внимания. От автоматической генерации элементов, персонажей, миссий или сюжетных линий в виртуальном мире, до автоматической генерации игровых стратегий, решений и даже автоматической эволюции внутриигровой экологии, это стало возможным, сделав игру более разнообразной и глубокой. **
4.AI игры: В настоящее время уже существует множество игр, которые интегрируют технологию искусственного интеллекта и имеют различные сценарии применения, которые будут проиллюстрированы ниже. **
3.1 Универсальная большая модель
В настоящее время в Web3 уже есть имитационные модели для разработки экономических моделей и экономического экологического развития, такие как количественная модель токенов QTM. Д-р Ахим Струве из Outlier Venture в своем выступлении на ETHCC озвучил некоторые идеи по разработке экономической модели. Например, учитывая надежность экономической системы, проектная группа может создать цифровой двойник Digital Twin с помощью модели LLM для моделирования всей экосистемы 1:1.
QTM (Quantized Token Model) на рисунке ниже представляет собой модель логического вывода на основе искусственного интеллекта. QTM использует фиксированное время моделирования в 10 лет, при этом каждый временной шаг измеряется одним месяцем. В начале каждого временного шага токены эмитируются в экосистему, поэтому в модели есть модули поощрения, модули вестинга токенов, модули аирдропа и т. д. Затем эти токены будут распределены по нескольким мета-корзинам, из которых будет происходить более детальное обобщенное перераспределение полезности. Затем определите выплаты вознаграждений и т. д. с помощью этих утилит. Кроме того, как и оффчейн-бизнес, он также учитывает общую ситуацию с финансированием бизнеса, такую как возможность уничтожения или обратного выкупа, а также может измерять принятие пользователями или определять принятие пользователями.
Конечно, выходное качество модели зависит от качества входных данных, поэтому перед использованием QTM необходимо провести достаточное исследование рынка для получения более точной входной информации. Тем не менее, модель QTM уже является очень практичным применением модели, управляемой искусственным интеллектом, в экономической модели Web3, и существует множество проектных сторон, основанных на модели QTM, для создания приложений 2C/2B с более низкой сложностью эксплуатации, снижая порог использования участниками проекта.
3.2 Подвесной агент приложений
Подвесные приложения в основном существуют в виде агентов, которыми могут быть боты, боткиты, виртуальные помощники, интеллектуальные системы поддержки принятия решений, различные автоматизированные средства обработки данных и так далее. Вообще говоря, AI Agent берет за основу общую модель OpenAI, объединяет другие технологии с открытым исходным кодом или собственной разработки, такие как преобразование текста в речь (TTS) и т. д., и добавляет конкретные данные для FineTune (методика обучения в области машинного обучения и глубокого обучения, основная цель — дальнейшая оптимизация модели, которая была предварительно обучена на крупномасштабных данных) для создания ИИ-агента, который работает лучше, чем ChatGPT в определенной области.
В настоящее время наиболее зрелым приложением игрового трека Web3 является NFT Agent. Консенсус на игровом треке заключается в том, что NFT должны быть важной частью игр Web3.
С развитием технологии управления метаданными в экосистеме Ethereum появились программируемые динамические NFT. Создатели NFT могут алгоритмически сделать функциональность NFT более гибкой. Для пользователей может быть больше взаимодействия между пользователями и NFT, а сгенерированные данные о взаимодействии стали источником информации. AI Agent может оптимизировать процесс взаимодействия и расширить сценарии применения данных взаимодействия, привнося больше инноваций и ценности в экосистему NFT.
Случай 1: Например, фреймворк разработки Gelato's позволяет разработчикам настраивать логику для обновления метаданных NFT на основе событий вне сети или определенных временных интервалов. Узлы Gelato будут инициировать изменения метаданных при выполнении определенных условий, что позволит автоматически обновлять ончейн-NFT. Например, эта технология может быть использована для получения данных о матчах в режиме реального времени из спортивных API и автоматического обновления характеристик навыков NFT при определенных условиях, например, когда спортсмен выигрывает матч.
Случай 2: Paima также предоставляет агент приложений для Dynamic NFT. Протокол сжатия NFT Paima чеканит набор минимальных NFT на L1, а затем развивает их в зависимости от состояния игры на L2, предоставляя игрокам более глубокий и интерактивный игровой опыт. Например, NFT могут меняться в зависимости от таких факторов, как очки опыта персонажа, выполнение миссий, снаряжение и так далее.
Кейс 3: Mudulas Labs — очень известный проект ZKML, у которого также есть макет в треке NFT. Mudulas запустил серию NFT zkMon, которая позволяет генерировать NFT с помощью ИИ и публиковать их в цепочке, генерируя при этом zkp, с помощью которого пользователи могут проверить, генерируется ли их NFT из соответствующей модели ИИ. Для получения более подробной информации см.: Глава 7.2: 1-й в мире zkGAN NFT.
3.3 Приложения генеративного ИИ
Как упоминалось ранее, поскольку игра сама по себе является индустрией контента, AI-Agent может генерировать большое количество контента за короткое время и с низкими затратами, включая создание неопределенных, динамичных игровых персонажей и так далее. Таким образом, генеративный ИИ идеально подходит для игровых приложений. В настоящее время применение генеративного ИИ в сфере гейминга можно свести к следующим основным видам:
** Класс игрового персонажа, сгенерированный ИИ: например, игра против ИИ, или ИИ отвечает за симуляцию и управление NPC в игре, или даже напрямую использует ИИ для создания персонажей. **
**Класс игрового контента, сгенерированный ИИ: Различный контент, непосредственно сгенерированный ИИ, такой как миссии, сюжетные линии, реквизит, карты и т. д. **
**Класс игровой сцены, сгенерированный искусственным интеллектом: поддерживает автоматическое использование, оптимизацию или расширение ландшафта, ландшафта и атмосферы игрового мира с помощью ИИ. **
MyShell — это платформа для создания ботов, которая позволяет пользователям создавать своих собственных ботов для общения в чате, практики разговорной речи, игры и даже обращения за консультацией в соответствии со своими потребностями. Между тем, Myshell использует технологию преобразования текста в речь (TTS), которая автоматически создает бота, который имитирует чей-либо голос всего за несколько секунд. Кроме того, MyShell использует Auto, который позволяет пользователям инструктировать модели LLM, только описывая свои идеи, закладывая основу для частных больших языковых моделей (LLM).
Пользователи Myshell говорят, что функция голосового чата работает очень плавно, быстрее, чем голосовой чат GPT и Live2D.
Кейс 2: Арена ИИ**
AI Arena — это боевая игра с искусственным интеллектом, в которой пользователи могут использовать модель LLM для непрерывного обучения своих собственных боевых эльфов (NFT), а затем отправлять обученных боевых волшебников в сражения на поле боя PvP/PvE. Боевой режим похож на Nintendo Star Smash Bros., но с обучением ИИ, добавляющим больше соревновательного веселья.
Paradigm возглавила инвестиции в AI Arena, которые теперь начались на этапе открытого бета-тестирования, где игроки могут войти в игру бесплатно или приобрести NFT для увеличения интенсивности тренировок.
Кейс 3: Лила против всего мира**
Leela vs the World — это шахматная игра, разработанная Mudulas Labs. В игре двумя сторонами игры являются ИИ и люди, а ситуация шахматной игры помещается в контракт. Игроки оперируют (взаимодействуют с контрактами) через свои кошельки. Искусственный интеллект считывает новую шахматную ситуацию, выносит суждение и генерирует zkp для всего процесса вычислений, оба из которых выполняются в облаке AWS, а zkp проверяется контрактом в цепочке, и после успешной проверки шахматный контракт вызывается для «игры в шахматы».
3.3.2 Игровой контент, созданный искусственным интеллектом
Кейс 1: Город ИИ
AI Town — это совместный проект a16z и его портфельной компании Convex Dev, вдохновленный статьей Стэнфордского университета о генеративном агенте. AI Town — это виртуальный город, в котором каждый ИИ в городе может создать свою собственную историю, основанную на взаимодействиях и опыте.
Для этого используются технологические стеки, такие как бессерверная платформа Convex backend, векторное хранилище Pinecone, аутентификация Clerk, генерация текста на естественном языке OpenAI и развертывание Fly. Кроме того, AI Town имеет открытый исходный код и позволяет внутриигровым разработчикам настраивать различные компоненты, включая данные о функциях, таблицы спрайтов, визуальную среду Tilemap, подсказки для генерации текста, правила игры и логику и многое другое. В дополнение к обычным игрокам, которые могут испытать AI Town, разработчики также могут использовать исходный код для разработки различных функций в игре и даже вне игры, и эта гибкость делает AI Town подходящим для множества различных типов приложений.
Таким образом, AI Town сама по себе является контентной игрой, созданной искусственным интеллектом, но это также экология развития и даже инструмент разработки.
Случай 2: Павел
Пол — это генератор историй с искусственным интеллектом, который специализируется на предоставлении решения для полноцепочечных игр, чтобы генерировать истории с искусственным интеллектом и переходить непосредственно в цепочку. Логика реализации заключается в том, чтобы ввести большое количество априорных правил в LLM, а затем игрок может автоматически генерировать вторичный контент на основе правил.
В настоящее время существует протокол игры Straylight, опубликованный с использованием Пола Зайдлера, Straylight — многопользовательская NFT-игра, основной игровой процесс — полноцепочечная игровая версия «Minecraft», игроки могут автоматически чеканить NFT, а затем конструировать свой собственный мир в соответствии с основными правилами ввода модели.
Pahdo Labs — студия разработки игр, в настоящее время работающая над Halcyon Zero, платформой для создания аниме, фэнтези, ролевых игр и онлайн-игр, построенной на движке Godot. Действие игры происходит в неземном фэнтезийном мире, сосредоточенном вокруг шумного городка, который служит социальным центром.
Что делает эту игру особенной, так это то, что игроки могут использовать инструменты создания ИИ, предоставляемые игрой, чтобы быстро создавать больше фонов с 3D-эффектами и вводить в игру своих любимых персонажей, что действительно предоставляет инструменты и игровые сцены для популярной игры UGC.
Случай 2: Каэдим
Компания Kaedim разработала инструмент генеративной генерации 3D-моделей на основе искусственного интеллекта для Game Studio, который может быстро помочь Game Studio создавать внутриигровые 3D-сцены/ассеты, отвечающие их потребностям. Общий продукт Kaedim все еще находится в стадии разработки и, как ожидается, будет доступен Game Studio в 2024 году.
Основная логика продуктов Kaedim точно такая же, как и у AI-Agent, используя общую большую модель в качестве основы, а затем художники внутри команды будут продолжать вводить хорошие данные, а затем давать обратную связь выходным данным агента, непрерывно обучать модель с помощью машинного обучения и, наконец, позволить AI-Agent выводить 3D-сцены, соответствующие требованиям.
04 Резюме
В этой статье мы сделали подробный анализ и резюме применения ИИ в сфере гейминга. В целом, в будущем появятся звездные проекты единорогов общих моделей и применения генеративного ИИ в играх. Несмотря на то, что ров применения подвесных пультов невелик, преимущество первопроходца сильно, и если на преимущество первопроходца можно положиться для создания сетевых эффектов и повышения прилипчивости пользователя, пространство для воображения огромно. Кроме того, генеративный ИИ естественным образом подходит для индустрии контента игр, и уже есть много команд, пробующих применение GA в играх, и этот цикл с большой вероятностью приведет к появлению популярной игры с использованием GA.
Помимо некоторых направлений, упомянутых в статье, в будущем появятся и другие углы исследования. Как что:
(1) Трек данных + прикладной уровень: Трек данных ИИ породил некоторые проекты-единороги, оцениваемые в миллиарды долларов, а связь данных + прикладной уровень также полна воображения.
(2) Интеграция с Socialfi: например, предоставление инновационных способов социального взаимодействия; Используйте агент ИИ для оптимизации аутентификации и управления удостоверениями сообщества; Или более умные персонализированные рекомендации и т.д.
(3) С автоматизацией и зрелостью агентов, будут ли основными участниками в Autonomous World люди или боты? Возможно ли, что автономный мир в цепочке может быть похож на Uniswap, где 80%+ DAU — боты? Если это так, то агенты управления в сочетании с концепциями управления Web3 также заслуживают изучения.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Агенты с искусственным интеллектом переопределяют путь к инновациям в играх Web3
Ключевые инсайты
1.AI Agent — это инструмент, основанный на общей большой модели LLM, позволяющий разработчикам и пользователям напрямую создавать приложения, которые могут взаимодействовать независимо друг от друга. 2.AI Основной паттерн будущего трека может быть: «общая большая модель + применение кулона»; Экологическая ниша ИИ-агента — это промежуточное ПО, которое соединяет общую большую модель и Dapp, поэтому у ИИ-агента низкий ров, и для повышения долгосрочной конкурентоспособности необходимо выстраивать сетевые эффекты и улучшать прилипчивость пользователей. 3. В этой статье рассматривается разработка «общих больших моделей, агентов подвесных приложений и приложений генеративного ИИ» в игровом треке Web3. Среди них, в сочетании с технологией генеративного искусственного интеллекта, он имеет большой потенциал для того, чтобы попасть в игру в краткосрочной перспективе.
01 Техническое задание
В этом году во взрывоопасной технологии AGI (Artificial General Intelligence) Large Language Model (LLM) является абсолютным главным героем. Ключевые технологи OpenAI Андрей Карпаты и Лилиан Венг также заявили, что ИИ-агенты на основе LLM являются следующим важным направлением развития в области AGI, и многие команды также разрабатывают системы ИИ-агентов на основе LLM (AI-Agents). Простыми словами, ИИ-агент — это компьютерная программа, которая использует большие объемы данных и сложные алгоритмы для моделирования человеческого мышления и процесса принятия решений с целью выполнения различных задач и взаимодействий, таких как автономное вождение, распознавание речи и игровая стратегия. На рисунке Abacus.ai четко представлен основной принцип работы AI Agent, а шаги следующие:
Таким образом, ИИ-агенты — это интеллектуальные сущности, которые понимают, принимают решения и действуют, и они могут играть важную роль в различных областях, включая игры. Книга «LLM Powered Autonomous Agents» (LLM Powered Autonomous Agents) Лилиан Венг (Lilian Weng) представляет собой исчерпывающее введение в принципы работы ИИ-агентов, включая очень интересный эксперимент: генеративные агенты.
Генеративные агенты (GA) вдохновлены играми The Sims, которые используют технологию LLM для создания 25 виртуальных персонажей, каждый из которых управляется агентом LLM, живущим и взаимодействующим в песочнице. GA умело спроектирован таким образом, чтобы сочетать LLM с возможностями памяти, планирования и рефлексии, что позволяет программам агентов принимать решения на основе предыдущего опыта и взаимодействовать с другими агентами.
В статье подробно описывается, как агент непрерывно обучает и оптимизирует пути принятия решений на основе сетей политик, сетей ценностей и взаимодействий со средой.
Принцип заключается в следующем: где Memory Stream (Memory Stram) — это модуль долговременной памяти, который записывает все переживания взаимодействия агента. Модель извлечения предоставляет восстановленные воспоминания на основе релевантности, свежести и важности, чтобы помочь агенту принять решение. Механизм рефлексии обобщает прошлые события и направляет будущие действия агента. Планирование и рефлексия работают вместе, чтобы помочь агентам преобразовать размышления и информацию об окружающей среде в действенные действия.
Этот интересный эксперимент показывает нам возможности агентов ИИ, такие как генерация нового социального поведения, распространение информации, реляционная память (например, два виртуальных персонажа, продолжающих обсуждать тему), координация социальных действий (например, проведение вечеринки и приглашение других виртуальных персонажей) и так далее. В целом, AI-Agent является очень интересным инструментом, и его применение в играх стоит изучить более подробно.
02 Технологические тренды
2.1 Отслеживание тенденций ИИ
Лао Бай, партнер по инвестиционным исследованиям в ABCDE, однажды подытожил суждение венчурного сообщества Кремниевой долины о следующем развитии ИИ:
** То есть, с точки зрения общего закона развития отрасли, поскольку режим крупномасштабной модели общей модели слишком тяжел и обладает сильной универсальностью, нет необходимости постоянно строить колеса в области крупномасштабных общих моделей, а следует больше сосредоточиться на применении крупномасштабных общих моделей в области подвесок. **
При этом к периферийным устройствам относятся конечные устройства, которые обычно не полагаются на центры облачных вычислений или удаленные серверы, а проводят обработку данных и принятие решений локально. Из-за разнообразия периферийных устройств развертывание агентов ИИ для работы на устройствах и правильного получения данных об устройствах является сложной задачей, но это также и новая возможность.
Наконец, большое внимание привлек и вопрос контекста. Проще говоря, контекст в контексте LLM можно понимать как объем информации, а длину контекста можно понимать как количество измерений данных. Предположим, что у вас есть модель больших данных веб-сайта электронной коммерции, которая используется для прогнозирования вероятности того, что пользователь купит определенный продукт. В этом случае контекст может включать такие сведения, как история просмотров пользователя, история покупок, история поиска, атрибуты пользователя и т. д. Длина контекста относится к измерению наложения информации о признаках, таких как история покупок конкурирующих продуктов 30-летних пользователей мужского пола в Шанхае, частота недавних покупок и недавняя история просмотров. Увеличение длины контекста может помочь модели более полно понять факторы, влияющие на решение пользователя о покупке.
В настоящее время консенсус заключается в том, что, хотя нынешнее использование векторных баз данных в качестве памяти ИИ делает длину контекста недостаточной, длина контекста качественно изменится в будущем, и модель после LLM может искать более продвинутые методы обработки и понимания более длинной и сложной информации о контексте. Кроме того, появилось больше сценариев применения, выходящих за рамки воображения.
2.2 Тренды ИИ-агентов
Folius Ventures обобщила модель применения AI Agent в игровом треке, как показано ниже:
На рисунке 1 показана модель LLM, которая в основном отвечает за преобразование намерений пользователя из традиционного ввода с клавиатуры/щелчка мыши в ввод на естественном языке, снижая барьер входа для пользователей.
На рисунке 2 показано интерфейсное Dapp, интегрированное с агентом искусственного интеллекта, которое предоставляет пользователям функциональные сервисы, собирая пользовательские привычки и данные с терминала.
3 на рисунке — это различные агенты ИИ, которые могут существовать непосредственно в виде функций в приложении, ботов и т. д.
В целом, как инструмент на основе кода, AI Agent может выступать в качестве базовой программы для децентрализованных приложений для расширения функциональности приложений и в качестве катализатора роста платформы, то есть промежуточного программного обеспечения, которое связывает большие модели и вертикальные приложения.
С точки зрения пользовательских сценариев, наиболее вероятное децентрализованное приложение для интеграции AI Agent, вероятно, будет достаточно открытым для социальных приложений, чат-ботов и игр; Или трансформировать существующий портал трафика Web2 в более простой и доступный вход AI+web3 через AI Agent; То есть в индустрии обсуждается снижение порога пользователей Web3.
В соответствии с отраслевым законодательством о развитии, уровень промежуточного программного обеспечения, в котором находится ИИ-агент, часто становится высококонкурентным треком практически без рва. Таким образом, в дополнение к постоянному улучшению опыта в соответствии с потребностями B2C, агенты ИИ могут улучшать свои рвы, создавая сетевые эффекты или создавая прилипчивость пользователей.
03 Карта трассы
Было предпринято несколько различных попыток применения ИИ в играх Web3, которые можно сгруппировать в следующие категории:
3.1 Универсальная большая модель
В настоящее время в Web3 уже есть имитационные модели для разработки экономических моделей и экономического экологического развития, такие как количественная модель токенов QTM. Д-р Ахим Струве из Outlier Venture в своем выступлении на ETHCC озвучил некоторые идеи по разработке экономической модели. Например, учитывая надежность экономической системы, проектная группа может создать цифровой двойник Digital Twin с помощью модели LLM для моделирования всей экосистемы 1:1.
QTM (Quantized Token Model) на рисунке ниже представляет собой модель логического вывода на основе искусственного интеллекта. QTM использует фиксированное время моделирования в 10 лет, при этом каждый временной шаг измеряется одним месяцем. В начале каждого временного шага токены эмитируются в экосистему, поэтому в модели есть модули поощрения, модули вестинга токенов, модули аирдропа и т. д. Затем эти токены будут распределены по нескольким мета-корзинам, из которых будет происходить более детальное обобщенное перераспределение полезности. Затем определите выплаты вознаграждений и т. д. с помощью этих утилит. Кроме того, как и оффчейн-бизнес, он также учитывает общую ситуацию с финансированием бизнеса, такую как возможность уничтожения или обратного выкупа, а также может измерять принятие пользователями или определять принятие пользователями.
Конечно, выходное качество модели зависит от качества входных данных, поэтому перед использованием QTM необходимо провести достаточное исследование рынка для получения более точной входной информации. Тем не менее, модель QTM уже является очень практичным применением модели, управляемой искусственным интеллектом, в экономической модели Web3, и существует множество проектных сторон, основанных на модели QTM, для создания приложений 2C/2B с более низкой сложностью эксплуатации, снижая порог использования участниками проекта.
3.2 Подвесной агент приложений
Подвесные приложения в основном существуют в виде агентов, которыми могут быть боты, боткиты, виртуальные помощники, интеллектуальные системы поддержки принятия решений, различные автоматизированные средства обработки данных и так далее. Вообще говоря, AI Agent берет за основу общую модель OpenAI, объединяет другие технологии с открытым исходным кодом или собственной разработки, такие как преобразование текста в речь (TTS) и т. д., и добавляет конкретные данные для FineTune (методика обучения в области машинного обучения и глубокого обучения, основная цель — дальнейшая оптимизация модели, которая была предварительно обучена на крупномасштабных данных) для создания ИИ-агента, который работает лучше, чем ChatGPT в определенной области.
В настоящее время наиболее зрелым приложением игрового трека Web3 является NFT Agent. Консенсус на игровом треке заключается в том, что NFT должны быть важной частью игр Web3.
С развитием технологии управления метаданными в экосистеме Ethereum появились программируемые динамические NFT. Создатели NFT могут алгоритмически сделать функциональность NFT более гибкой. Для пользователей может быть больше взаимодействия между пользователями и NFT, а сгенерированные данные о взаимодействии стали источником информации. AI Agent может оптимизировать процесс взаимодействия и расширить сценарии применения данных взаимодействия, привнося больше инноваций и ценности в экосистему NFT.
Случай 1: Например, фреймворк разработки Gelato's позволяет разработчикам настраивать логику для обновления метаданных NFT на основе событий вне сети или определенных временных интервалов. Узлы Gelato будут инициировать изменения метаданных при выполнении определенных условий, что позволит автоматически обновлять ончейн-NFT. Например, эта технология может быть использована для получения данных о матчах в режиме реального времени из спортивных API и автоматического обновления характеристик навыков NFT при определенных условиях, например, когда спортсмен выигрывает матч.
Случай 2: Paima также предоставляет агент приложений для Dynamic NFT. Протокол сжатия NFT Paima чеканит набор минимальных NFT на L1, а затем развивает их в зависимости от состояния игры на L2, предоставляя игрокам более глубокий и интерактивный игровой опыт. Например, NFT могут меняться в зависимости от таких факторов, как очки опыта персонажа, выполнение миссий, снаряжение и так далее.
Кейс 3: Mudulas Labs — очень известный проект ZKML, у которого также есть макет в треке NFT. Mudulas запустил серию NFT zkMon, которая позволяет генерировать NFT с помощью ИИ и публиковать их в цепочке, генерируя при этом zkp, с помощью которого пользователи могут проверить, генерируется ли их NFT из соответствующей модели ИИ. Для получения более подробной информации см.: Глава 7.2: 1-й в мире zkGAN NFT.
3.3 Приложения генеративного ИИ
Как упоминалось ранее, поскольку игра сама по себе является индустрией контента, AI-Agent может генерировать большое количество контента за короткое время и с низкими затратами, включая создание неопределенных, динамичных игровых персонажей и так далее. Таким образом, генеративный ИИ идеально подходит для игровых приложений. В настоящее время применение генеративного ИИ в сфере гейминга можно свести к следующим основным видам:
3.3.1 Роли, сгенерированные искусственным интеллектом
Случай 1: MyShell
MyShell — это платформа для создания ботов, которая позволяет пользователям создавать своих собственных ботов для общения в чате, практики разговорной речи, игры и даже обращения за консультацией в соответствии со своими потребностями. Между тем, Myshell использует технологию преобразования текста в речь (TTS), которая автоматически создает бота, который имитирует чей-либо голос всего за несколько секунд. Кроме того, MyShell использует Auto, который позволяет пользователям инструктировать модели LLM, только описывая свои идеи, закладывая основу для частных больших языковых моделей (LLM).
Пользователи Myshell говорят, что функция голосового чата работает очень плавно, быстрее, чем голосовой чат GPT и Live2D.
Кейс 2: Арена ИИ**
AI Arena — это боевая игра с искусственным интеллектом, в которой пользователи могут использовать модель LLM для непрерывного обучения своих собственных боевых эльфов (NFT), а затем отправлять обученных боевых волшебников в сражения на поле боя PvP/PvE. Боевой режим похож на Nintendo Star Smash Bros., но с обучением ИИ, добавляющим больше соревновательного веселья.
Paradigm возглавила инвестиции в AI Arena, которые теперь начались на этапе открытого бета-тестирования, где игроки могут войти в игру бесплатно или приобрести NFT для увеличения интенсивности тренировок.
Кейс 3: Лила против всего мира**
Leela vs the World — это шахматная игра, разработанная Mudulas Labs. В игре двумя сторонами игры являются ИИ и люди, а ситуация шахматной игры помещается в контракт. Игроки оперируют (взаимодействуют с контрактами) через свои кошельки. Искусственный интеллект считывает новую шахматную ситуацию, выносит суждение и генерирует zkp для всего процесса вычислений, оба из которых выполняются в облаке AWS, а zkp проверяется контрактом в цепочке, и после успешной проверки шахматный контракт вызывается для «игры в шахматы».
3.3.2 Игровой контент, созданный искусственным интеллектом
Кейс 1: Город ИИ
AI Town — это совместный проект a16z и его портфельной компании Convex Dev, вдохновленный статьей Стэнфордского университета о генеративном агенте. AI Town — это виртуальный город, в котором каждый ИИ в городе может создать свою собственную историю, основанную на взаимодействиях и опыте.
Для этого используются технологические стеки, такие как бессерверная платформа Convex backend, векторное хранилище Pinecone, аутентификация Clerk, генерация текста на естественном языке OpenAI и развертывание Fly. Кроме того, AI Town имеет открытый исходный код и позволяет внутриигровым разработчикам настраивать различные компоненты, включая данные о функциях, таблицы спрайтов, визуальную среду Tilemap, подсказки для генерации текста, правила игры и логику и многое другое. В дополнение к обычным игрокам, которые могут испытать AI Town, разработчики также могут использовать исходный код для разработки различных функций в игре и даже вне игры, и эта гибкость делает AI Town подходящим для множества различных типов приложений.
Таким образом, AI Town сама по себе является контентной игрой, созданной искусственным интеллектом, но это также экология развития и даже инструмент разработки.
Случай 2: Павел
Пол — это генератор историй с искусственным интеллектом, который специализируется на предоставлении решения для полноцепочечных игр, чтобы генерировать истории с искусственным интеллектом и переходить непосредственно в цепочку. Логика реализации заключается в том, чтобы ввести большое количество априорных правил в LLM, а затем игрок может автоматически генерировать вторичный контент на основе правил.
В настоящее время существует протокол игры Straylight, опубликованный с использованием Пола Зайдлера, Straylight — многопользовательская NFT-игра, основной игровой процесс — полноцепочечная игровая версия «Minecraft», игроки могут автоматически чеканить NFT, а затем конструировать свой собственный мир в соответствии с основными правилами ввода модели.
3.3.3 Игровые сцены, сгенерированные искусственным интеллектом
Кейс 1: Pahdo Labs
Pahdo Labs — студия разработки игр, в настоящее время работающая над Halcyon Zero, платформой для создания аниме, фэнтези, ролевых игр и онлайн-игр, построенной на движке Godot. Действие игры происходит в неземном фэнтезийном мире, сосредоточенном вокруг шумного городка, который служит социальным центром.
Что делает эту игру особенной, так это то, что игроки могут использовать инструменты создания ИИ, предоставляемые игрой, чтобы быстро создавать больше фонов с 3D-эффектами и вводить в игру своих любимых персонажей, что действительно предоставляет инструменты и игровые сцены для популярной игры UGC.
Случай 2: Каэдим
Компания Kaedim разработала инструмент генеративной генерации 3D-моделей на основе искусственного интеллекта для Game Studio, который может быстро помочь Game Studio создавать внутриигровые 3D-сцены/ассеты, отвечающие их потребностям. Общий продукт Kaedim все еще находится в стадии разработки и, как ожидается, будет доступен Game Studio в 2024 году.
Основная логика продуктов Kaedim точно такая же, как и у AI-Agent, используя общую большую модель в качестве основы, а затем художники внутри команды будут продолжать вводить хорошие данные, а затем давать обратную связь выходным данным агента, непрерывно обучать модель с помощью машинного обучения и, наконец, позволить AI-Agent выводить 3D-сцены, соответствующие требованиям.
04 Резюме
В этой статье мы сделали подробный анализ и резюме применения ИИ в сфере гейминга. В целом, в будущем появятся звездные проекты единорогов общих моделей и применения генеративного ИИ в играх. Несмотря на то, что ров применения подвесных пультов невелик, преимущество первопроходца сильно, и если на преимущество первопроходца можно положиться для создания сетевых эффектов и повышения прилипчивости пользователя, пространство для воображения огромно. Кроме того, генеративный ИИ естественным образом подходит для индустрии контента игр, и уже есть много команд, пробующих применение GA в играх, и этот цикл с большой вероятностью приведет к появлению популярной игры с использованием GA.
Помимо некоторых направлений, упомянутых в статье, в будущем появятся и другие углы исследования. Как что:
(1) Трек данных + прикладной уровень: Трек данных ИИ породил некоторые проекты-единороги, оцениваемые в миллиарды долларов, а связь данных + прикладной уровень также полна воображения.
(2) Интеграция с Socialfi: например, предоставление инновационных способов социального взаимодействия; Используйте агент ИИ для оптимизации аутентификации и управления удостоверениями сообщества; Или более умные персонализированные рекомендации и т.д.
(3) С автоматизацией и зрелостью агентов, будут ли основными участниками в Autonomous World люди или боты? Возможно ли, что автономный мир в цепочке может быть похож на Uniswap, где 80%+ DAU — боты? Если это так, то агенты управления в сочетании с концепциями управления Web3 также заслуживают изучения.