1.AI Agent es una herramienta basada en el modelo general de gran tamaño de LLM, para que desarrolladores y usuarios construyan directamente aplicaciones que puedan interactuar de forma independiente.
2.AI El patrón principal del futuro de la pista puede ser: "modelo grande general + aplicación colgante"; El nicho ecológico del Agente de IA es el middleware que conecta el modelo grande general y la Dapp, por lo que el Agente de IA tiene un foso bajo, y es necesario construir efectos de red y mejorar la adherencia del usuario para mejorar la competitividad a largo plazo.
3. Este artículo revisa el desarrollo de "modelos grandes generales, agentes de aplicaciones colgantes y aplicaciones de IA generativa" en la pista de juegos Web3. Entre ellos, combinado con la tecnología de IA generativa, tiene un gran potencial para dar en el clavo a corto plazo.
01 Resumen técnico
En la explosiva tecnología de inteligencia artificial general AGI (Artificial General Intelligence) de este año, el Gran Modelo de Lenguaje (LLM) es el protagonista absoluto. Los tecnólogos centrales de OpenAI, Andrej Karpathy y Lilian Weng, también dijeron que los agentes de IA basados en LLM son la próxima dirección de desarrollo importante en el campo de AGI, y muchos equipos también están desarrollando sistemas de agentes de IA impulsados por LLM (AI-Agents). En términos simples, un agente de IA es un programa informático que utiliza grandes cantidades de datos y algoritmos complejos para simular el pensamiento humano y el proceso de toma de decisiones con el fin de realizar diversas tareas e interacciones, como la conducción autónoma, el reconocimiento de voz y la estrategia de juego. La imagen de Abacus.ai presenta claramente el principio básico del agente de IA, y los pasos son los siguientes:
Percepción y recogida de datos: Entrada de datos, o Agente de IA a través de sistemas de percepción (sensores, cámaras, micrófonos, etc.) para obtener información y datos, como el estado del juego, imágenes, sonido, etc. **
Representación de estado: Los datos deben procesarse y representarse en una forma que el agente pueda entender, como convertirse en vectores o tensores, para que puedan ingresarse fácilmente en una red neuronal. **
Modelos de redes neuronales: Los modelos de redes neuronales profundas se utilizan comúnmente para la toma de decisiones y el aprendizaje, como las redes neuronales convolucionales (CNN) para el procesamiento de imágenes, las redes neuronales recurrentes (RNN) para el procesamiento de datos de secuencias o modelos más avanzados como los mecanismos de autoatención (Transformers). **
Aprendizaje por refuerzo: Los agentes aprenden las mejores estrategias de acción a través de la interacción con el entorno. Además, los principios operativos del agente incluyen la creación de redes estratégicas, la creación de redes de valor, la formación y optimización, y la exploración y utilización. Por ejemplo, en el escenario de juego, la red de estrategia puede introducir el estado del juego y, a continuación, generar la distribución de probabilidad de acción; La red de valores es capaz de estimar el valor del estado; Los agentes pueden reforzar continuamente los algoritmos de aprendizaje interactuando con el entorno para optimizar las políticas y las redes de valor y obtener mejores resultados. **
En resumen, los agentes de IA son entidades inteligentes que entienden, deciden y actúan, y pueden desempeñar un papel importante en una variedad de campos, incluidos los juegos. "LLM Powered Autonomous Agents" de Lilian Weng, técnica central de OpenAI, proporciona una introducción muy completa a los principios de los agentes de IA, incluido un experimento muy interesante: los agentes generativos.
Generative Agents (GA) está inspirado en los juegos de Los Sims, que utiliza la tecnología LLM para generar 25 personajes virtuales, cada uno controlado por un agente impulsado por LLM, que viven e interactúan en un entorno sandbox. GA está inteligentemente diseñado para combinar LLM con capacidades de memoria, planificación y reflexión, lo que permite a los programas de agentes tomar decisiones basadas en la experiencia previa e interactuar con otros agentes.
En el artículo se detalla cómo el agente entrena y optimiza continuamente las rutas de decisión en función de las redes de políticas, las redes de valor y las interacciones con el entorno.
El principio es el siguiente: donde Memory Stream (Memory Stram) es un módulo de memoria a largo plazo que registra todas las experiencias de interacción del agente. El modelo de recuperación proporciona recuerdos recuperados basados en la relevancia, la frescura y la importancia para ayudar al agente a tomar una decisión. El mecanismo de reflexión resume los eventos pasados y guía las acciones futuras del agente. Planificar y Reflexionar trabajan juntos para ayudar a los agentes a traducir la reflexión y la información ambiental en actos accionables.
Este interesante experimento nos muestra las capacidades de los agentes de IA, como la generación de nuevos comportamientos sociales, la difusión de información, la memoria relacional (como dos personajes virtuales que continúan discutiendo un tema) y la coordinación de actividades sociales (como celebrar una fiesta e invitar a otros personajes virtuales), etc. Con todo, AI-Agent es una herramienta muy interesante, y vale la pena explorar en profundidad su aplicación en los juegos.
02 Tendencias tecnológicas
2.1 Tendencias de seguimiento de IA
Lao Bai, socio de investigación de inversiones de ABCDE, resumió una vez el juicio de la comunidad de capital de riesgo de Silicon Valley sobre el próximo desarrollo de la IA:
** Sin modelo vertical, solo modelo grande + aplicación vertical; **
Los datos en dispositivos periféricos, como los teléfonos móviles, pueden ser una barrera, y la IA basada en dispositivos periféricos también puede ser una oportunidad; **
La longitud del contexto puede causar cambios cualitativos en el futuro (las bases de datos vectoriales ahora se utilizan como memoria de IA, pero la longitud del contexto aún no es suficiente). **
** Es decir, desde la perspectiva de la ley de desarrollo general de la industria, debido a que el modo de modelo de modelo general a gran escala es demasiado pesado y tiene una fuerte universalidad, no es necesario construir ruedas constantemente en el campo de los modelos generales a gran escala, sino que debe centrarse más en aplicar modelos generales a gran escala al campo de los colgantes. **
Al mismo tiempo, los dispositivos periféricos se refieren a dispositivos finales que generalmente no dependen de centros de computación en la nube o servidores remotos, sino que realizan el procesamiento de datos y la toma de decisiones localmente. Debido a la diversidad de dispositivos perimetrales, la forma de implementar agentes de IA para que se ejecuten en los dispositivos y obtengan correctamente los datos de los dispositivos es un desafío, pero también es una nueva oportunidad.
Por último, la cuestión del contexto también ha llamado mucho la atención. En pocas palabras, el contexto en el contexto de LLM se puede entender como la cantidad de información, y la longitud del contexto se puede entender como la cantidad de dimensiones que tienen los datos. Supongamos que tiene un modelo de big data de un sitio web de comercio electrónico que se utiliza para predecir la probabilidad de que un usuario compre un determinado producto. En este caso, el contexto puede incluir información como el historial de navegación del usuario, el historial de compras, el historial de búsqueda, los atributos del usuario, etc. La longitud del contexto se refiere a la dimensión de la superposición de información de características, como el historial de compras de productos de la competencia de usuarios masculinos de 30 años en Shanghái, la frecuencia de compras recientes y el historial de navegación reciente. El aumento en la longitud del contexto puede ayudar al modelo a comprender de manera más completa los factores que influyen en la decisión de compra del usuario.
El consenso actual es que, aunque el uso actual de bases de datos vectoriales como memoria de la IA hace que la longitud del contexto sea insuficiente, la longitud del contexto cambiará cualitativamente en el futuro, y el modelo post-LLM puede buscar métodos más avanzados para procesar y comprender información de contexto más larga y compleja. Han surgido más escenarios de aplicación más allá de la imaginación.
2.2 Tendencias de los agentes de IA
Folius Ventures resumió el modelo de aplicación de AI Agent en la pista del juego, como se muestra a continuación:
La figura 1 es el modelo LLM, que es el principal responsable de convertir la intención del usuario de la entrada tradicional de teclado/clic a la entrada de lenguaje natural, lo que reduce la barrera de entrada para los usuarios.
La Figura 2 es una Dapp front-end integrada con un agente de IA que proporciona a los usuarios servicios funcionales mientras recopila los hábitos y datos de los usuarios del terminal.
Los 3 de la figura son varios agentes de IA, que pueden existir directamente en forma de funciones dentro de la aplicación, bots, etc.
En general, como herramienta basada en código, AI Agent puede actuar como el programa subyacente para que las Dapps amplíen la funcionalidad de la aplicación y como un catalizador de crecimiento para la plataforma, es decir, middleware que vincula grandes modelos y aplicaciones verticales.
En cuanto a los escenarios de usuario, es probable que la Dapp que integre AI Agent sea lo suficientemente abierta para aplicaciones sociales, chatbots y juegos; O transformar el portal de tráfico Web2 existente en una entrada de IA+web3 más sencilla y accesible a través del Agente de IA; Es decir, la industria ha estado discutiendo para reducir el umbral de usuarios de Web3.
Según la ley de desarrollo de la industria, la capa de middleware en la que se encuentra el agente de IA a menudo se convierte en una pista altamente competitiva casi sin foso. Por lo tanto, además de mejorar continuamente la experiencia para que coincida con las necesidades de B2C, los agentes de IA pueden mejorar sus fosos mediante la creación de efectos de red o la creación de adherencia del usuario.
03 Mapa de pistas
Ha habido varios intentos diferentes de aplicaciones de IA en los juegos Web3, que se pueden agrupar en las siguientes categorías:
Modelos generales: Algunos proyectos se centran en la creación de modelos generales de IA, la búsqueda de arquitecturas de redes neuronales adecuadas y modelos generales para las necesidades de los proyectos Web3. **
Aplicaciones verticales: Las aplicaciones colgantes están diseñadas para resolver problemas específicos en los juegos o proporcionar servicios específicos, generalmente en forma de agentes, bots y botkits. **
** Aplicación de IA generativa: la aplicación más directa correspondiente al modelo grande es la generación de contenido, y la pista del juego en sí es la industria del contenido, por lo que la aplicación de IA generativa en el campo del juego es muy digna de atención. Desde la generación automática de elementos, personajes, misiones o historias en el mundo virtual, hasta la generación automática de estrategias de juego, decisiones e incluso la evolución automática de la ecología del juego, se ha hecho posible, haciendo que el juego sea más diverso y profundo. **
Juegos .AI: En la actualidad, ya hay muchos juegos que integran tecnología AI y tienen diferentes escenarios de aplicación, que se ilustrarán a continuación. **
3.1 Modelo grande universal
En la actualidad, Web3 ya cuenta con modelos de simulación para el diseño de modelos económicos y el desarrollo ecológico económico, como el modelo cuantitativo de tokens QTM. El Dr. Achim Struve de Outlier Venture mencionó algunas ideas para el diseño de modelos económicos en su charla en ETHCC. Por ejemplo, teniendo en cuenta la robustez del sistema económico, el equipo del proyecto puede crear un gemelo digital Gemelo digital a través del modelo LLM para simular todo el ecosistema 1:1.
El QTM (Quantized Token Model) de la siguiente figura es un modelo de inferencia impulsado por IA. QTM utiliza un tiempo de simulación fijo de 10 años, y cada paso de tiempo mide un mes. Al comienzo de cada paso de tiempo, los tokens se emiten al ecosistema, por lo que hay módulos de incentivos, módulos de adquisición de tokens, módulos de airdrop, etc. en el modelo. A continuación, estos tokens se colocarán en varios metacubos, a partir de los cuales se llevará a cabo una redistribución generalizada de la utilidad más granular. Luego, defina los pagos de recompensas, etc. de estas herramientas de utilidad. Además, al igual que los negocios fuera de la cadena, esto también tiene en cuenta la situación general de financiación del negocio, como la posibilidad de destrucción o recompra, y también puede medir la adopción por parte de los usuarios o definir la adopción por parte de los usuarios.
Por supuesto, la calidad de salida del modelo depende de la calidad de la entrada, por lo que antes de usar QTM, es necesario realizar suficiente investigación de mercado para obtener información de entrada más precisa. Sin embargo, el modelo QTM ya es una aplicación muy práctica del modelo impulsado por IA en el modelo económico Web3, y hay muchas partes del proyecto basadas en el modelo QTM para realizar aplicaciones 2C/2B con menor dificultad de operación, lo que reduce el umbral para que las partes del proyecto lo utilicen.
3.2 Agente de aplicación colgante
Las aplicaciones colgantes existen principalmente en forma de agentes, que pueden ser bots, botkits, asistentes virtuales, sistemas inteligentes de apoyo a la toma de decisiones, diversas herramientas de procesamiento automatizado de datos, etc. En términos generales, AI Agent toma como base el modelo general de OpenAI, combina otras tecnologías de código abierto o de desarrollo propio, como text-to-speech (TTS), etc., y agrega datos específicos para FineTune (una técnica de entrenamiento en el campo del aprendizaje automático y el aprendizaje profundo, el objetivo principal es optimizar aún más un modelo que ha sido preentrenado con datos a gran escala) para crear un AI Agent que funcione mejor que ChatGPT en un campo específico.
En la actualidad, la aplicación más madura de la pista de juegos Web3 es NFT Agent. El consenso en el ámbito de los juegos es que los NFT deben ser una parte importante de los juegos Web3.
Con el desarrollo de la tecnología de gestión de metadatos en el ecosistema Ethereum, han surgido NFT dinámicos programables. Para los creadores de NFT, pueden flexibilizar algorítmicamente la funcionalidad de NFT. Para los usuarios, puede haber más interacción entre los usuarios y los NFT, y los datos de interacción generados se han convertido en una fuente de información. AI Agent puede optimizar el proceso de interacción y ampliar los escenarios de aplicación de los datos de interacción, inyectando más innovación y valor en el ecosistema NFT.
Caso 1: Por ejemplo, el marco de desarrollo de Gelato permite a los desarrolladores personalizar la lógica para actualizar los metadatos de NFT en función de eventos fuera de la cadena o intervalos de tiempo específicos. Los nodos de Gelato activarán cambios en los metadatos cuando se cumplan ciertas condiciones, lo que permitirá actualizaciones automáticas de los NFT en cadena. Por ejemplo, esta tecnología podría utilizarse para obtener datos de partidos en tiempo real de las API deportivas y actualizar automáticamente las características de habilidad del NFT en determinadas condiciones, como cuando un atleta gana un partido.
Caso 2: Paima también proporciona un agente de aplicación para NFT dinámico. El protocolo de compresión de NFT de Paima acuña un conjunto de NFT mínimos en L1 y luego los evoluciona en función del estado del juego en L2, brindando a los jugadores una experiencia de juego más profunda e interactiva. Por ejemplo, los NFT pueden cambiar según factores como los puntos de experiencia del personaje, la finalización de la misión, el equipo, etc.
Caso 3: Mudulas Labs es un proyecto ZKML muy conocido, que también tiene un diseño en la pista NFT. Mudulas lanzó la serie NFT zkMon, que permite generar NFT a través de IA y publicarse en la cadena, a la vez que genera un zkp, a través del cual los usuarios pueden comprobar si su NFT se genera a partir del modelo de IA correspondiente. Para obtener información más completa, consulte: Capítulo 7.2: Los primeros NFT de zkGAN del mundo.
3.3 Aplicaciones de IA generativa
Como se mencionó anteriormente, debido a que el juego en sí es una industria de contenido, AI-Agent puede generar una gran cantidad de contenido en poco tiempo y a bajo costo, incluida la creación de personajes de juego inciertos y dinámicos, etc. Por lo tanto, la IA generativa es perfecta para aplicaciones de juegos. En la actualidad, la aplicación de la IA generativa en el ámbito del gaming se puede resumir en los siguientes tipos principales:
**Clase de personaje de juego generada por IA: como jugar contra IA, o la IA es responsable de simular y controlar a los NPC en el juego, o incluso usar directamente la IA para generar personajes. **
**Clase de contenido de juego generado por IA: Varios contenidos generados directamente por IA, como misiones, historias, accesorios, mapas, etc. **
** Clase de escena de juego generada por IA: admite el uso, la optimización o la expansión automática del terreno, el paisaje y la atmósfera del mundo del juego con IA. **
3.3.1 Roles generados por IA
Caso 1: MyShell
MyShell es una plataforma de creación de bots que permite a los usuarios crear sus propios bots para chatear, practicar el habla, jugar e incluso buscar asesoramiento según sus necesidades. Por su parte, Myshell utiliza la tecnología de texto a voz (TTS), que crea automáticamente un bot que imita la voz de cualquier persona en solo unos segundos. Además, MyShell usa Auto, lo que permite a los usuarios instruir modelos LLM solo describiendo sus ideas, sentando las bases para modelos privados de lenguaje grande (LLM).
Los usuarios de Myshell dicen que su función de chat de voz es muy fluida, más rápida que el chat de voz de GPT y Live2D.
Caso 2: AI Arena**
AI Arena es un juego de batalla de IA en el que los usuarios pueden usar el modelo LLM para entrenar continuamente a sus propios elfos de batalla (NFT) y luego enviar a los magos de batalla entrenados a las batallas en el campo de batalla PvP / PvE. El modo de batalla es similar al de Nintendo Star Smash Bros., pero con entrenamiento de IA que agrega más diversión competitiva.
Paradigm lideró la inversión en AI Arena, que ahora ha comenzado en la fase beta abierta, donde los jugadores pueden ingresar al juego de forma gratuita o comprar NFT para aumentar la intensidad del entrenamiento.
Estudio de caso 3: Leela contra el mundo**
Leela vs the World es un juego de ajedrez desarrollado por Mudulas Labs. En el juego, los dos lados del juego son la IA y las personas, y la situación del juego de ajedrez se coloca en el contrato. Los jugadores operan (interactúan con contratos) a través de sus billeteras. La IA lee la nueva situación del juego de ajedrez, hace un juicio y genera zkp para todo el proceso de cálculo, los cuales se completan en la nube de AWS, y zkp es verificado por el contrato en la cadena, y después de una verificación exitosa, el contrato de ajedrez se llama a "jugar al ajedrez".
3.3.2 Contenido de juego generado por IA
Caso 1: Ciudad de la IA
AI Town es una colaboración entre a16z y su empresa de cartera, Convex Dev, inspirada en el artículo Generative Agent de la Universidad de Stanford. AI Town es una ciudad virtual en la que cada IA de la ciudad puede construir su propia historia basada en interacciones y experiencias.
Para ello se utilizan pilas de tecnología como el marco sin servidor de backend convexo, el almacenamiento vectorial de Pinecone, la autenticación de Clerk, la generación de texto en lenguaje natural de OpenAI y la implementación de Fly. Además, AI Town es de código abierto y permite a los desarrolladores del juego personalizar varios componentes, incluidos los datos de las características, las tablas de sprites, el entorno visual de Tilemap, las indicaciones de generación de texto, las reglas y la lógica del juego, y mucho más. Además de los jugadores habituales que pueden experimentar AI Town, los desarrolladores también pueden usar el código fuente para desarrollar una variedad de funciones dentro e incluso fuera del juego, y esta flexibilidad hace que AI Town sea adecuado para una variedad de diferentes tipos de aplicaciones.
Por lo tanto, AI Town en sí mismo es un juego de contenido generado por IA, pero también es una ecología de desarrollo e incluso una herramienta de desarrollo.
Caso 2: Pablo
Paul es un generador de historias de IA que se especializa en proporcionar una ruta de solución para que los juegos de cadena completa generen historias de IA y vayan directamente a la cadena. La lógica de implementación consiste en introducir un gran número de reglas anteriores en LLM y, a continuación, el reproductor puede generar automáticamente contenido secundario basado en las reglas.
Actualmente hay un protocolo de juego Straylight publicado con Paul Seidler, Straylight es un juego NFT multijugador, el juego principal es la versión de juego de cadena completa de "Minecraft", los jugadores pueden acuñar NFT automáticamente y luego construir su propio mundo de acuerdo con las reglas básicas de entrada del modelo.
3.3.3 Escenas de juego generadas por IA
Caso 1: Laboratorios Pahdo
Pahdo Labs es un estudio de desarrollo de juegos que actualmente trabaja en Halcyon Zero, una plataforma de anime, fantasía, juegos de rol y creación de juegos en línea basada en el motor Godot. El juego tiene lugar en un mundo de fantasía etéreo centrado en una bulliciosa ciudad que sirve como centro social.
Lo que hace que este juego sea muy especial es que los jugadores pueden usar las herramientas de creación de IA proporcionadas por el juego para crear rápidamente más fondos de efectos 3D y traer a sus personajes favoritos al juego, lo que realmente proporciona herramientas y escenas de juego para el popular juego UGC.
Caso 2: Kaedim
Kaedim ha desarrollado una herramienta de generación de modelos 3D basada en IA generativa para Game Studio, que puede ayudar rápidamente a Game Studio a generar por lotes escenas/activos 3D en el juego que satisfagan sus necesidades. El producto general de Kaedim aún está en desarrollo y se espera que esté disponible para Game Studio en 2024.
La lógica central de los productos Kaedim es exactamente la misma que la de AI-Agent, utilizando un modelo general grande como base, y luego los artistas dentro del equipo continuarán ingresando buenos datos y luego retroalimentarán la salida del Agente, entrenarán continuamente el modelo a través del aprendizaje automático y, finalmente, dejarán que AI-Agent genere escenas 3D que cumplan con los requisitos.
04 Resumen
En este artículo, hemos realizado un análisis detallado y un resumen de la aplicación de la IA en el campo de los juegos. En general, habrá proyectos estrella de unicornios en el futuro de modelos generales y la aplicación de la IA generativa en los juegos. Aunque el foso de las aplicaciones colgantes es bajo, la ventaja de ser el primero en moverse es fuerte, y si se puede confiar en la ventaja del primer movimiento para crear efectos de red y mejorar la adherencia del usuario, el espacio de imaginación es enorme. Además, la IA generativa es naturalmente adecuada para la industria de contenidos de los juegos, y ya hay muchos equipos que prueban la aplicación de GA en los juegos, y es muy probable que este ciclo parezca un juego popular utilizando GA.
Además de algunas de las direcciones mencionadas en el artículo, hay otros ángulos de exploración en el futuro. Como qué:
(1) Pista de datos + capa de aplicación: La pista de datos de IA ha dado lugar a algunos proyectos unicornio valorados en miles de millones de dólares, y la vinculación de la capa de datos + aplicación también está llena de imaginación.
(2) Integración con Socialfi: como proporcionar formas innovadoras de interacción social; Utilice AI Agent para optimizar la autenticación de identidades de la comunidad y la gobernanza de la comunidad; O recomendaciones personalizadas más inteligentes, etc.
(3) Con la automatización y madurez de los agentes, ¿los principales participantes en Mundo Autónomo serán personas o bots? ¿Es posible que el mundo autónomo de la cadena pueda ser como Uniswap, donde el 80%+ de los DAU son bots? Si es así, también vale la pena explorar los agentes de gobernanza combinados con los conceptos de gobernanza de Web3.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Los agentes de IA redefinen el camino hacia la innovación en los juegos Web3
Ideas clave
1.AI Agent es una herramienta basada en el modelo general de gran tamaño de LLM, para que desarrolladores y usuarios construyan directamente aplicaciones que puedan interactuar de forma independiente. 2.AI El patrón principal del futuro de la pista puede ser: "modelo grande general + aplicación colgante"; El nicho ecológico del Agente de IA es el middleware que conecta el modelo grande general y la Dapp, por lo que el Agente de IA tiene un foso bajo, y es necesario construir efectos de red y mejorar la adherencia del usuario para mejorar la competitividad a largo plazo. 3. Este artículo revisa el desarrollo de "modelos grandes generales, agentes de aplicaciones colgantes y aplicaciones de IA generativa" en la pista de juegos Web3. Entre ellos, combinado con la tecnología de IA generativa, tiene un gran potencial para dar en el clavo a corto plazo.
01 Resumen técnico
En la explosiva tecnología de inteligencia artificial general AGI (Artificial General Intelligence) de este año, el Gran Modelo de Lenguaje (LLM) es el protagonista absoluto. Los tecnólogos centrales de OpenAI, Andrej Karpathy y Lilian Weng, también dijeron que los agentes de IA basados en LLM son la próxima dirección de desarrollo importante en el campo de AGI, y muchos equipos también están desarrollando sistemas de agentes de IA impulsados por LLM (AI-Agents). En términos simples, un agente de IA es un programa informático que utiliza grandes cantidades de datos y algoritmos complejos para simular el pensamiento humano y el proceso de toma de decisiones con el fin de realizar diversas tareas e interacciones, como la conducción autónoma, el reconocimiento de voz y la estrategia de juego. La imagen de Abacus.ai presenta claramente el principio básico del agente de IA, y los pasos son los siguientes:
En resumen, los agentes de IA son entidades inteligentes que entienden, deciden y actúan, y pueden desempeñar un papel importante en una variedad de campos, incluidos los juegos. "LLM Powered Autonomous Agents" de Lilian Weng, técnica central de OpenAI, proporciona una introducción muy completa a los principios de los agentes de IA, incluido un experimento muy interesante: los agentes generativos.
Generative Agents (GA) está inspirado en los juegos de Los Sims, que utiliza la tecnología LLM para generar 25 personajes virtuales, cada uno controlado por un agente impulsado por LLM, que viven e interactúan en un entorno sandbox. GA está inteligentemente diseñado para combinar LLM con capacidades de memoria, planificación y reflexión, lo que permite a los programas de agentes tomar decisiones basadas en la experiencia previa e interactuar con otros agentes.
En el artículo se detalla cómo el agente entrena y optimiza continuamente las rutas de decisión en función de las redes de políticas, las redes de valor y las interacciones con el entorno.
El principio es el siguiente: donde Memory Stream (Memory Stram) es un módulo de memoria a largo plazo que registra todas las experiencias de interacción del agente. El modelo de recuperación proporciona recuerdos recuperados basados en la relevancia, la frescura y la importancia para ayudar al agente a tomar una decisión. El mecanismo de reflexión resume los eventos pasados y guía las acciones futuras del agente. Planificar y Reflexionar trabajan juntos para ayudar a los agentes a traducir la reflexión y la información ambiental en actos accionables.
Este interesante experimento nos muestra las capacidades de los agentes de IA, como la generación de nuevos comportamientos sociales, la difusión de información, la memoria relacional (como dos personajes virtuales que continúan discutiendo un tema) y la coordinación de actividades sociales (como celebrar una fiesta e invitar a otros personajes virtuales), etc. Con todo, AI-Agent es una herramienta muy interesante, y vale la pena explorar en profundidad su aplicación en los juegos.
02 Tendencias tecnológicas
2.1 Tendencias de seguimiento de IA
Lao Bai, socio de investigación de inversiones de ABCDE, resumió una vez el juicio de la comunidad de capital de riesgo de Silicon Valley sobre el próximo desarrollo de la IA:
** Es decir, desde la perspectiva de la ley de desarrollo general de la industria, debido a que el modo de modelo de modelo general a gran escala es demasiado pesado y tiene una fuerte universalidad, no es necesario construir ruedas constantemente en el campo de los modelos generales a gran escala, sino que debe centrarse más en aplicar modelos generales a gran escala al campo de los colgantes. **
Al mismo tiempo, los dispositivos periféricos se refieren a dispositivos finales que generalmente no dependen de centros de computación en la nube o servidores remotos, sino que realizan el procesamiento de datos y la toma de decisiones localmente. Debido a la diversidad de dispositivos perimetrales, la forma de implementar agentes de IA para que se ejecuten en los dispositivos y obtengan correctamente los datos de los dispositivos es un desafío, pero también es una nueva oportunidad.
Por último, la cuestión del contexto también ha llamado mucho la atención. En pocas palabras, el contexto en el contexto de LLM se puede entender como la cantidad de información, y la longitud del contexto se puede entender como la cantidad de dimensiones que tienen los datos. Supongamos que tiene un modelo de big data de un sitio web de comercio electrónico que se utiliza para predecir la probabilidad de que un usuario compre un determinado producto. En este caso, el contexto puede incluir información como el historial de navegación del usuario, el historial de compras, el historial de búsqueda, los atributos del usuario, etc. La longitud del contexto se refiere a la dimensión de la superposición de información de características, como el historial de compras de productos de la competencia de usuarios masculinos de 30 años en Shanghái, la frecuencia de compras recientes y el historial de navegación reciente. El aumento en la longitud del contexto puede ayudar al modelo a comprender de manera más completa los factores que influyen en la decisión de compra del usuario.
El consenso actual es que, aunque el uso actual de bases de datos vectoriales como memoria de la IA hace que la longitud del contexto sea insuficiente, la longitud del contexto cambiará cualitativamente en el futuro, y el modelo post-LLM puede buscar métodos más avanzados para procesar y comprender información de contexto más larga y compleja. Han surgido más escenarios de aplicación más allá de la imaginación.
2.2 Tendencias de los agentes de IA
Folius Ventures resumió el modelo de aplicación de AI Agent en la pista del juego, como se muestra a continuación:
La figura 1 es el modelo LLM, que es el principal responsable de convertir la intención del usuario de la entrada tradicional de teclado/clic a la entrada de lenguaje natural, lo que reduce la barrera de entrada para los usuarios.
La Figura 2 es una Dapp front-end integrada con un agente de IA que proporciona a los usuarios servicios funcionales mientras recopila los hábitos y datos de los usuarios del terminal.
Los 3 de la figura son varios agentes de IA, que pueden existir directamente en forma de funciones dentro de la aplicación, bots, etc.
En general, como herramienta basada en código, AI Agent puede actuar como el programa subyacente para que las Dapps amplíen la funcionalidad de la aplicación y como un catalizador de crecimiento para la plataforma, es decir, middleware que vincula grandes modelos y aplicaciones verticales.
En cuanto a los escenarios de usuario, es probable que la Dapp que integre AI Agent sea lo suficientemente abierta para aplicaciones sociales, chatbots y juegos; O transformar el portal de tráfico Web2 existente en una entrada de IA+web3 más sencilla y accesible a través del Agente de IA; Es decir, la industria ha estado discutiendo para reducir el umbral de usuarios de Web3.
Según la ley de desarrollo de la industria, la capa de middleware en la que se encuentra el agente de IA a menudo se convierte en una pista altamente competitiva casi sin foso. Por lo tanto, además de mejorar continuamente la experiencia para que coincida con las necesidades de B2C, los agentes de IA pueden mejorar sus fosos mediante la creación de efectos de red o la creación de adherencia del usuario.
03 Mapa de pistas
Ha habido varios intentos diferentes de aplicaciones de IA en los juegos Web3, que se pueden agrupar en las siguientes categorías:
3.1 Modelo grande universal
En la actualidad, Web3 ya cuenta con modelos de simulación para el diseño de modelos económicos y el desarrollo ecológico económico, como el modelo cuantitativo de tokens QTM. El Dr. Achim Struve de Outlier Venture mencionó algunas ideas para el diseño de modelos económicos en su charla en ETHCC. Por ejemplo, teniendo en cuenta la robustez del sistema económico, el equipo del proyecto puede crear un gemelo digital Gemelo digital a través del modelo LLM para simular todo el ecosistema 1:1.
El QTM (Quantized Token Model) de la siguiente figura es un modelo de inferencia impulsado por IA. QTM utiliza un tiempo de simulación fijo de 10 años, y cada paso de tiempo mide un mes. Al comienzo de cada paso de tiempo, los tokens se emiten al ecosistema, por lo que hay módulos de incentivos, módulos de adquisición de tokens, módulos de airdrop, etc. en el modelo. A continuación, estos tokens se colocarán en varios metacubos, a partir de los cuales se llevará a cabo una redistribución generalizada de la utilidad más granular. Luego, defina los pagos de recompensas, etc. de estas herramientas de utilidad. Además, al igual que los negocios fuera de la cadena, esto también tiene en cuenta la situación general de financiación del negocio, como la posibilidad de destrucción o recompra, y también puede medir la adopción por parte de los usuarios o definir la adopción por parte de los usuarios.
Por supuesto, la calidad de salida del modelo depende de la calidad de la entrada, por lo que antes de usar QTM, es necesario realizar suficiente investigación de mercado para obtener información de entrada más precisa. Sin embargo, el modelo QTM ya es una aplicación muy práctica del modelo impulsado por IA en el modelo económico Web3, y hay muchas partes del proyecto basadas en el modelo QTM para realizar aplicaciones 2C/2B con menor dificultad de operación, lo que reduce el umbral para que las partes del proyecto lo utilicen.
3.2 Agente de aplicación colgante
Las aplicaciones colgantes existen principalmente en forma de agentes, que pueden ser bots, botkits, asistentes virtuales, sistemas inteligentes de apoyo a la toma de decisiones, diversas herramientas de procesamiento automatizado de datos, etc. En términos generales, AI Agent toma como base el modelo general de OpenAI, combina otras tecnologías de código abierto o de desarrollo propio, como text-to-speech (TTS), etc., y agrega datos específicos para FineTune (una técnica de entrenamiento en el campo del aprendizaje automático y el aprendizaje profundo, el objetivo principal es optimizar aún más un modelo que ha sido preentrenado con datos a gran escala) para crear un AI Agent que funcione mejor que ChatGPT en un campo específico.
En la actualidad, la aplicación más madura de la pista de juegos Web3 es NFT Agent. El consenso en el ámbito de los juegos es que los NFT deben ser una parte importante de los juegos Web3.
Con el desarrollo de la tecnología de gestión de metadatos en el ecosistema Ethereum, han surgido NFT dinámicos programables. Para los creadores de NFT, pueden flexibilizar algorítmicamente la funcionalidad de NFT. Para los usuarios, puede haber más interacción entre los usuarios y los NFT, y los datos de interacción generados se han convertido en una fuente de información. AI Agent puede optimizar el proceso de interacción y ampliar los escenarios de aplicación de los datos de interacción, inyectando más innovación y valor en el ecosistema NFT.
Caso 1: Por ejemplo, el marco de desarrollo de Gelato permite a los desarrolladores personalizar la lógica para actualizar los metadatos de NFT en función de eventos fuera de la cadena o intervalos de tiempo específicos. Los nodos de Gelato activarán cambios en los metadatos cuando se cumplan ciertas condiciones, lo que permitirá actualizaciones automáticas de los NFT en cadena. Por ejemplo, esta tecnología podría utilizarse para obtener datos de partidos en tiempo real de las API deportivas y actualizar automáticamente las características de habilidad del NFT en determinadas condiciones, como cuando un atleta gana un partido.
Caso 2: Paima también proporciona un agente de aplicación para NFT dinámico. El protocolo de compresión de NFT de Paima acuña un conjunto de NFT mínimos en L1 y luego los evoluciona en función del estado del juego en L2, brindando a los jugadores una experiencia de juego más profunda e interactiva. Por ejemplo, los NFT pueden cambiar según factores como los puntos de experiencia del personaje, la finalización de la misión, el equipo, etc.
Caso 3: Mudulas Labs es un proyecto ZKML muy conocido, que también tiene un diseño en la pista NFT. Mudulas lanzó la serie NFT zkMon, que permite generar NFT a través de IA y publicarse en la cadena, a la vez que genera un zkp, a través del cual los usuarios pueden comprobar si su NFT se genera a partir del modelo de IA correspondiente. Para obtener información más completa, consulte: Capítulo 7.2: Los primeros NFT de zkGAN del mundo.
3.3 Aplicaciones de IA generativa
Como se mencionó anteriormente, debido a que el juego en sí es una industria de contenido, AI-Agent puede generar una gran cantidad de contenido en poco tiempo y a bajo costo, incluida la creación de personajes de juego inciertos y dinámicos, etc. Por lo tanto, la IA generativa es perfecta para aplicaciones de juegos. En la actualidad, la aplicación de la IA generativa en el ámbito del gaming se puede resumir en los siguientes tipos principales:
3.3.1 Roles generados por IA
Caso 1: MyShell
MyShell es una plataforma de creación de bots que permite a los usuarios crear sus propios bots para chatear, practicar el habla, jugar e incluso buscar asesoramiento según sus necesidades. Por su parte, Myshell utiliza la tecnología de texto a voz (TTS), que crea automáticamente un bot que imita la voz de cualquier persona en solo unos segundos. Además, MyShell usa Auto, lo que permite a los usuarios instruir modelos LLM solo describiendo sus ideas, sentando las bases para modelos privados de lenguaje grande (LLM).
Los usuarios de Myshell dicen que su función de chat de voz es muy fluida, más rápida que el chat de voz de GPT y Live2D.
Caso 2: AI Arena**
AI Arena es un juego de batalla de IA en el que los usuarios pueden usar el modelo LLM para entrenar continuamente a sus propios elfos de batalla (NFT) y luego enviar a los magos de batalla entrenados a las batallas en el campo de batalla PvP / PvE. El modo de batalla es similar al de Nintendo Star Smash Bros., pero con entrenamiento de IA que agrega más diversión competitiva.
Paradigm lideró la inversión en AI Arena, que ahora ha comenzado en la fase beta abierta, donde los jugadores pueden ingresar al juego de forma gratuita o comprar NFT para aumentar la intensidad del entrenamiento.
Estudio de caso 3: Leela contra el mundo**
Leela vs the World es un juego de ajedrez desarrollado por Mudulas Labs. En el juego, los dos lados del juego son la IA y las personas, y la situación del juego de ajedrez se coloca en el contrato. Los jugadores operan (interactúan con contratos) a través de sus billeteras. La IA lee la nueva situación del juego de ajedrez, hace un juicio y genera zkp para todo el proceso de cálculo, los cuales se completan en la nube de AWS, y zkp es verificado por el contrato en la cadena, y después de una verificación exitosa, el contrato de ajedrez se llama a "jugar al ajedrez".
3.3.2 Contenido de juego generado por IA
Caso 1: Ciudad de la IA
AI Town es una colaboración entre a16z y su empresa de cartera, Convex Dev, inspirada en el artículo Generative Agent de la Universidad de Stanford. AI Town es una ciudad virtual en la que cada IA de la ciudad puede construir su propia historia basada en interacciones y experiencias.
Para ello se utilizan pilas de tecnología como el marco sin servidor de backend convexo, el almacenamiento vectorial de Pinecone, la autenticación de Clerk, la generación de texto en lenguaje natural de OpenAI y la implementación de Fly. Además, AI Town es de código abierto y permite a los desarrolladores del juego personalizar varios componentes, incluidos los datos de las características, las tablas de sprites, el entorno visual de Tilemap, las indicaciones de generación de texto, las reglas y la lógica del juego, y mucho más. Además de los jugadores habituales que pueden experimentar AI Town, los desarrolladores también pueden usar el código fuente para desarrollar una variedad de funciones dentro e incluso fuera del juego, y esta flexibilidad hace que AI Town sea adecuado para una variedad de diferentes tipos de aplicaciones.
Por lo tanto, AI Town en sí mismo es un juego de contenido generado por IA, pero también es una ecología de desarrollo e incluso una herramienta de desarrollo.
Caso 2: Pablo
Paul es un generador de historias de IA que se especializa en proporcionar una ruta de solución para que los juegos de cadena completa generen historias de IA y vayan directamente a la cadena. La lógica de implementación consiste en introducir un gran número de reglas anteriores en LLM y, a continuación, el reproductor puede generar automáticamente contenido secundario basado en las reglas.
Actualmente hay un protocolo de juego Straylight publicado con Paul Seidler, Straylight es un juego NFT multijugador, el juego principal es la versión de juego de cadena completa de "Minecraft", los jugadores pueden acuñar NFT automáticamente y luego construir su propio mundo de acuerdo con las reglas básicas de entrada del modelo.
3.3.3 Escenas de juego generadas por IA
Caso 1: Laboratorios Pahdo
Pahdo Labs es un estudio de desarrollo de juegos que actualmente trabaja en Halcyon Zero, una plataforma de anime, fantasía, juegos de rol y creación de juegos en línea basada en el motor Godot. El juego tiene lugar en un mundo de fantasía etéreo centrado en una bulliciosa ciudad que sirve como centro social.
Lo que hace que este juego sea muy especial es que los jugadores pueden usar las herramientas de creación de IA proporcionadas por el juego para crear rápidamente más fondos de efectos 3D y traer a sus personajes favoritos al juego, lo que realmente proporciona herramientas y escenas de juego para el popular juego UGC.
Caso 2: Kaedim
Kaedim ha desarrollado una herramienta de generación de modelos 3D basada en IA generativa para Game Studio, que puede ayudar rápidamente a Game Studio a generar por lotes escenas/activos 3D en el juego que satisfagan sus necesidades. El producto general de Kaedim aún está en desarrollo y se espera que esté disponible para Game Studio en 2024.
La lógica central de los productos Kaedim es exactamente la misma que la de AI-Agent, utilizando un modelo general grande como base, y luego los artistas dentro del equipo continuarán ingresando buenos datos y luego retroalimentarán la salida del Agente, entrenarán continuamente el modelo a través del aprendizaje automático y, finalmente, dejarán que AI-Agent genere escenas 3D que cumplan con los requisitos.
04 Resumen
En este artículo, hemos realizado un análisis detallado y un resumen de la aplicación de la IA en el campo de los juegos. En general, habrá proyectos estrella de unicornios en el futuro de modelos generales y la aplicación de la IA generativa en los juegos. Aunque el foso de las aplicaciones colgantes es bajo, la ventaja de ser el primero en moverse es fuerte, y si se puede confiar en la ventaja del primer movimiento para crear efectos de red y mejorar la adherencia del usuario, el espacio de imaginación es enorme. Además, la IA generativa es naturalmente adecuada para la industria de contenidos de los juegos, y ya hay muchos equipos que prueban la aplicación de GA en los juegos, y es muy probable que este ciclo parezca un juego popular utilizando GA.
Además de algunas de las direcciones mencionadas en el artículo, hay otros ángulos de exploración en el futuro. Como qué:
(1) Pista de datos + capa de aplicación: La pista de datos de IA ha dado lugar a algunos proyectos unicornio valorados en miles de millones de dólares, y la vinculación de la capa de datos + aplicación también está llena de imaginación.
(2) Integración con Socialfi: como proporcionar formas innovadoras de interacción social; Utilice AI Agent para optimizar la autenticación de identidades de la comunidad y la gobernanza de la comunidad; O recomendaciones personalizadas más inteligentes, etc.
(3) Con la automatización y madurez de los agentes, ¿los principales participantes en Mundo Autónomo serán personas o bots? ¿Es posible que el mundo autónomo de la cadena pueda ser como Uniswap, donde el 80%+ de los DAU son bots? Si es así, también vale la pena explorar los agentes de gobernanza combinados con los conceptos de gobernanza de Web3.