"No hacemos modelos para competir con otros modelos".
Crédito de la imagen: Generado por herramientas Unbounded AI
Durante la Conferencia Mundial de Inteligencia Artificial de 2023, el CTO de Alibaba Cloud, Zhou Jingren, dijo esto. Esto parece ser algo diferente de la "Guerra de los Cien Modelos" de la que mucha gente habla ¿No es cierto que tanto los grandes como los pequeños fabricantes están desarrollando sus propios modelos y luego compiten entre sí? Alibaba Cloud también es uno de ellos.
Esta representación de obsesionado con los juegos de suma cero es en realidad un poco crudo y una ilusión. Ignora la esencia de Alibaba Cloud como proveedor de computación en la nube y lo que realmente está construyendo paso a paso después de proponer el modelo como un modelo de servicio.
Es decir, los servicios de computación en la nube son el punto de partida de todas sus acciones.
Los modelos de la serie Tongyi son solo una parte de ellos. Además, Zhou Jingren recordó a las personas que presten atención a la lógica del modelo de Alibaba Cloud. "Tenemos múltiples identidades", dijo Zhou Jingren. "Nuestro propio modelo grande es servir a las empresas y los ISV en la nube, para que puedan llamar al modelo más fácilmente o integrar el modelo grande en su sistema comercial, para que podamos esperar la explosión de aplicaciones. Al mismo tiempo , también Para servir a los innovadores y desarrolladores de modelos de modelos de desarrollo propio, proporcionarles herramientas y ecología”.
Independientemente de si es para satisfacer directamente las necesidades de los clientes existentes en su propia plataforma, o para proporcionar a más creadores de modelos una infraestructura de alta calidad, como herramientas y potencia informática, en última instancia, Alibaba Cloud quiere hacer que el ecosistema sea próspero al bajando el umbral Deje que el modelo realmente funcione para resolver problemas reales. Nadie quiere hacer del gran modelo más que un concepto que se discute, se deifica o se demoniza.
más bloques
Para lograr este objetivo, una de las prácticas de Alibaba Cloud es utilizar varias herramientas para hacer que el desarrollo y el uso del modelo sean tan fáciles como los bloques de construcción.
El mismo día, Zhou Jingren anunció más "bloques de construcción" proporcionados por Alibaba Cloud.
En primer lugar, es un nuevo bloque de construcción del sistema generalizado de modelos a gran escala, y el modelo del diagrama vicenciano es universal.
Junto con Tongyi Qianwen y Tongyi Tingwu, que aparecieron antes, forman la propia serie de modelos a gran escala de Alibaba Cloud, y los miembros definitivamente continuarán expandiéndose, continuando a lo largo de la ruta establecida de la multimodalidad de Alibaba Cloud.
Según los informes, Tongyi Wanxiang se basa en Composer, un modelo de generación combinada desarrollado por Ali. En pocas palabras, controla la estabilidad de la generación desmantelando los elementos de la imagen. Este es un marco de generación combinada basado en el modelo de difusión. . Los documentos relacionados con Composer en los que participó Zhou Jingren se han incluido en ICML 2023, la principal conferencia internacional de IA.
Bajo una idea tan nueva, además de proporcionar la función de diagrama de Vincent tradicional basada en palabras rápidas en el lado del producto, también proporciona la generación de diagramas de similitud, que puede proporcionar imágenes del estilo deseado para ayudar a generar; y la función de migración de estilo, que puede ser más intuitivo Implementa el estilo de una imagen dada sobre otra imagen generada. Estos abordan claramente los problemas de estabilidad y usabilidad de las imágenes generadas por los usuarios.
Además del sistema de desarrollo propio, Alibaba Cloud también está construyendo bloques de construcción para el mercado de 100 modelos, como la plataforma de servicio modelo Lingji.
Proporciona una interfaz de nube estándar para creadores de modelos y un SDK unificado para desarrolladores de aplicaciones que desean usar el modelo.
Para los modelos, proporciona una serie de enlaces de herramientas de nube de modelos automatizados, admite el acceso independiente de los modelos y los lleva a varias capacidades de servicio acumuladas por Alibaba Cloud, como el razonamiento del modelo, el ajuste y la expansión, y la implementación elástica adaptativa. implementación o implementación exclusiva definida por el usuario, etc. Esto permite que el modelo no solo se integre a través de la API de inferencia, sino que también logre la personalización del modelo a través de la API de entrenamiento y ajuste.
Para los desarrolladores de IA, se pueden obtener fácilmente diferentes modelos a través de un SDK unificado e integrarlos en sus propias aplicaciones.
Actualmente, la plataforma Lingji alberga muchos modelos de lenguaje grande líderes en la industria Además del propio Tongyi Qianwen de Alibaba Cloud, hay más modelos tripartitos como ChatGLM-v2, Baichuan, Jiang Ziya y Dolly.
Detrás de Lingji se encuentra la poderosa potencia informática y la plataforma de desarrollo de inteligencia artificial de Alibaba Cloud, que incluye el legendario clúster de computación inteligente nacional más sólido con 100 000 GPU y PAI, una plataforma de aprendizaje automático a escala de capacitación distribuida de una sola tarea que admite 10 000 tarjetas.
Estos componentes básicos reducirán el umbral para el desarrollo y uso de modelos grandes y harán que la ecología del mercado modelo de China sea más libre y activa. La comunidad de desarrolladores de IA Mota es un anticipo del futuro mercado libre para modelos grandes.
Una vista previa del modelo de mercado libre
Mota Community es una comunidad de modelos de IA lanzada por Ali el año pasado. Ha crecido asombrosamente desde su lanzamiento. Se ha convertido en la comunidad de modelos de IA más grande de China en poco más de medio año. En la actualidad, ha reunido a más de 1,8 millones de desarrolladores. y más de los modelos de IA de alta calidad de 900. Estos modelos están compuestos por 20 Aportados por varias de las principales instituciones de inteligencia artificial, las descargas acumuladas superaron los 36 millones. Entre ellos, hay alrededor de 100 modelos grandes con una escala de parámetros de más de mil millones.
En Mota, todos los productores de modelos pueden cargar modelos, verificar las capacidades técnicas de los modelos y explorar los escenarios de aplicación y los modelos de comercialización de los modelos. La comunidad Mota ha abierto el enlace de implementación con la plataforma Lingji y apoya el modelo de la comunidad para realizar el servicio a través de Lingji.
El día de la conferencia, Alibaba Cloud lanzó una nueva herramienta, ModelScope GPT (Magic GPT), que puede combinar y programar libremente todos los modelos de todos los tamaños en la plataforma Mota.
Mota GPT es una herramienta que entiende el lenguaje humano. Solo necesita hablar con él y plantear sus necesidades, y puede usar el modelo grande central para encontrar y llamar al modelo pequeño, y formar un equipo para completar las tareas que le dé.
De hecho, también es una especie de ruta de tecnología AI Agent que cada vez más desarrolladores de modelos valoran hoy en día.En pocas palabras, es un asistente que puede tomar decisiones autónomas basadas en la comprensión.
"También es un modelo, más de un Agente de IA, que puede desensamblar información compleja de manera más inteligente a través de la comprensión de otros modelos, e incluso otras herramientas de todo Internet, combinado con lenguaje natural y capacidades multimodales. Problemas relacionados con llamadas modelos en cada subproblema a resolver", dijo Zhou Jingren.
"Necesitamos un Agente de propósito general que combine el poder del modelo para ayudarnos a completar varias tareas. Creo que este espacio de imaginación es muy grande", dijo.
ModelScope GPT puede considerarse como una especie de "prueba". Basado en la base ecológica de la comunidad Mota, se desarrolla una herramienta para aumentar la interacción entre los desarrolladores y la comunidad modelo, aumentar el flujo de elementos en la comunidad modelo y estimular innovación en toda la comunidad.
Según los informes, ModelScope GPT ahora puede llamar a las API de más de diez modelos principales de IA en la comunidad de Mota, incluida la resolución de direcciones, la extracción de información, la traducción, la síntesis de audio y video, etc. En el futuro, su lista de API modelo continuará. para expandirse, y sus capacidades también continuarán mejorando.
Alibaba Cloud decidió abrir el conjunto de datos GPT de ModelScope y el programa de capacitación para que los desarrolladores puedan comenzar, crear herramientas prácticas de llamada de modelos y usarlas donde quieran.
Con la ecología, naturalmente habrá comercialización
En la Conferencia de Inteligencia Artificial de este año, los modelos grandes se han convertido en el foco absoluto. Encontrará que el concepto de MaaS (Modelo como Servicio) es omnipresente en el área de exposición y el foro.
En noviembre del año pasado, Alibaba Cloud tomó la iniciativa al proponer el concepto de "Modelo como servicio" en la industria y, al mismo tiempo, lanzó la creación mágica de la comunidad del modelo de IA. En ese momento, no había muchos respondedores en la industria, pero hoy ha derivado varios entendimientos.
Los grandes modelos están remodelando la industria de la computación en la nube. Los proveedores de servicios de computación en la nube deben proporcionar una gama completa de servicios que incluyen capacitación, razonamiento, implementación, ajuste, evaluación e implementación de productos en torno al centro del modelo de IA.
"Alibaba Cloud está practicando el paradigma de desarrollo de MaaS, redefiniendo y diseñando todos los aspectos de los productos en la nube en torno al modelo de IA", dijo Zhou Jingren.
Hasta cierto punto, bajo la idea de MaaS, la plataforma Alibaba Cloud no solo sirve modelos de desarrollo propio, sino que es más como un "Tmall" de modelos grandes. Esta es una plataforma a través de la cual todos los modelos se pueden proporcionar directamente a los potenciales. usuarios En lugar de centrarse en el autoempleo, todas las demás cosas sirven al autoempleo.
"Alibaba Cloud tomará la promoción de la prosperidad de la ecología modelo a gran escala de China como su objetivo principal y proporcionará una gama completa de servicios a las empresas emergentes a gran escala", dijo Zhou Jingren. Solo permitiendo verdaderamente que las capacidades técnicas aportadas por el modelo lleguen a las masas y resuelvan problemas reales, puede florecer la ecología.
Es posible que el paradigma MaaS no conduzca directamente a un modelo comercial específico. Zhou Jingren cree que cuando la ecología del mercado libre modelo comience a prosperar, y cuando realmente comencemos a usar modelos grandes para resolver problemas prácticos, los modelos comerciales surgirán naturalmente, y este proceso debe basarse en la ruta de la nube pública.
“Hoy esperamos que un modelo pueda llegar a más desarrolladores, o generar más valor real, y solo puede llegar a toda la sociedad a través de la nube pública. Cómo aprovechar las ventajas técnicas y el valor de la nube pública hoy, es un aspecto importante para que las empresas y los desarrolladores logren avances comerciales".
La computación en la nube es para permitir que más personas disfruten del poder de cómputo en forma de infraestructura. En el análisis final, el modelo a gran escala también es una mejora en el poder de cómputo y permite que más personas obtengan nuevo poder de cómputo traído por las nuevas tecnologías a un precio umbral más bajo es lo que deben hacer los fabricantes de la nube.
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Bajo la Guerra de los Cien Modelos, Alibaba Cloud está más preocupada por la ecología
Autor|Xuan Ning
Fuente丨Pinwan
"No hacemos modelos para competir con otros modelos".
Durante la Conferencia Mundial de Inteligencia Artificial de 2023, el CTO de Alibaba Cloud, Zhou Jingren, dijo esto. Esto parece ser algo diferente de la "Guerra de los Cien Modelos" de la que mucha gente habla ¿No es cierto que tanto los grandes como los pequeños fabricantes están desarrollando sus propios modelos y luego compiten entre sí? Alibaba Cloud también es uno de ellos.
Esta representación de obsesionado con los juegos de suma cero es en realidad un poco crudo y una ilusión. Ignora la esencia de Alibaba Cloud como proveedor de computación en la nube y lo que realmente está construyendo paso a paso después de proponer el modelo como un modelo de servicio.
Es decir, los servicios de computación en la nube son el punto de partida de todas sus acciones.
Los modelos de la serie Tongyi son solo una parte de ellos. Además, Zhou Jingren recordó a las personas que presten atención a la lógica del modelo de Alibaba Cloud. "Tenemos múltiples identidades", dijo Zhou Jingren. "Nuestro propio modelo grande es servir a las empresas y los ISV en la nube, para que puedan llamar al modelo más fácilmente o integrar el modelo grande en su sistema comercial, para que podamos esperar la explosión de aplicaciones. Al mismo tiempo , también Para servir a los innovadores y desarrolladores de modelos de modelos de desarrollo propio, proporcionarles herramientas y ecología”.
Independientemente de si es para satisfacer directamente las necesidades de los clientes existentes en su propia plataforma, o para proporcionar a más creadores de modelos una infraestructura de alta calidad, como herramientas y potencia informática, en última instancia, Alibaba Cloud quiere hacer que el ecosistema sea próspero al bajando el umbral Deje que el modelo realmente funcione para resolver problemas reales. Nadie quiere hacer del gran modelo más que un concepto que se discute, se deifica o se demoniza.
más bloques
Para lograr este objetivo, una de las prácticas de Alibaba Cloud es utilizar varias herramientas para hacer que el desarrollo y el uso del modelo sean tan fáciles como los bloques de construcción.
El mismo día, Zhou Jingren anunció más "bloques de construcción" proporcionados por Alibaba Cloud.
En primer lugar, es un nuevo bloque de construcción del sistema generalizado de modelos a gran escala, y el modelo del diagrama vicenciano es universal.
Junto con Tongyi Qianwen y Tongyi Tingwu, que aparecieron antes, forman la propia serie de modelos a gran escala de Alibaba Cloud, y los miembros definitivamente continuarán expandiéndose, continuando a lo largo de la ruta establecida de la multimodalidad de Alibaba Cloud.
Según los informes, Tongyi Wanxiang se basa en Composer, un modelo de generación combinada desarrollado por Ali. En pocas palabras, controla la estabilidad de la generación desmantelando los elementos de la imagen. Este es un marco de generación combinada basado en el modelo de difusión. . Los documentos relacionados con Composer en los que participó Zhou Jingren se han incluido en ICML 2023, la principal conferencia internacional de IA.
Bajo una idea tan nueva, además de proporcionar la función de diagrama de Vincent tradicional basada en palabras rápidas en el lado del producto, también proporciona la generación de diagramas de similitud, que puede proporcionar imágenes del estilo deseado para ayudar a generar; y la función de migración de estilo, que puede ser más intuitivo Implementa el estilo de una imagen dada sobre otra imagen generada. Estos abordan claramente los problemas de estabilidad y usabilidad de las imágenes generadas por los usuarios.
Además del sistema de desarrollo propio, Alibaba Cloud también está construyendo bloques de construcción para el mercado de 100 modelos, como la plataforma de servicio modelo Lingji.
Proporciona una interfaz de nube estándar para creadores de modelos y un SDK unificado para desarrolladores de aplicaciones que desean usar el modelo.
Para los modelos, proporciona una serie de enlaces de herramientas de nube de modelos automatizados, admite el acceso independiente de los modelos y los lleva a varias capacidades de servicio acumuladas por Alibaba Cloud, como el razonamiento del modelo, el ajuste y la expansión, y la implementación elástica adaptativa. implementación o implementación exclusiva definida por el usuario, etc. Esto permite que el modelo no solo se integre a través de la API de inferencia, sino que también logre la personalización del modelo a través de la API de entrenamiento y ajuste.
Para los desarrolladores de IA, se pueden obtener fácilmente diferentes modelos a través de un SDK unificado e integrarlos en sus propias aplicaciones.
Actualmente, la plataforma Lingji alberga muchos modelos de lenguaje grande líderes en la industria Además del propio Tongyi Qianwen de Alibaba Cloud, hay más modelos tripartitos como ChatGLM-v2, Baichuan, Jiang Ziya y Dolly.
Detrás de Lingji se encuentra la poderosa potencia informática y la plataforma de desarrollo de inteligencia artificial de Alibaba Cloud, que incluye el legendario clúster de computación inteligente nacional más sólido con 100 000 GPU y PAI, una plataforma de aprendizaje automático a escala de capacitación distribuida de una sola tarea que admite 10 000 tarjetas.
Estos componentes básicos reducirán el umbral para el desarrollo y uso de modelos grandes y harán que la ecología del mercado modelo de China sea más libre y activa. La comunidad de desarrolladores de IA Mota es un anticipo del futuro mercado libre para modelos grandes.
Una vista previa del modelo de mercado libre
Mota Community es una comunidad de modelos de IA lanzada por Ali el año pasado. Ha crecido asombrosamente desde su lanzamiento. Se ha convertido en la comunidad de modelos de IA más grande de China en poco más de medio año. En la actualidad, ha reunido a más de 1,8 millones de desarrolladores. y más de los modelos de IA de alta calidad de 900. Estos modelos están compuestos por 20 Aportados por varias de las principales instituciones de inteligencia artificial, las descargas acumuladas superaron los 36 millones. Entre ellos, hay alrededor de 100 modelos grandes con una escala de parámetros de más de mil millones.
En Mota, todos los productores de modelos pueden cargar modelos, verificar las capacidades técnicas de los modelos y explorar los escenarios de aplicación y los modelos de comercialización de los modelos. La comunidad Mota ha abierto el enlace de implementación con la plataforma Lingji y apoya el modelo de la comunidad para realizar el servicio a través de Lingji.
El día de la conferencia, Alibaba Cloud lanzó una nueva herramienta, ModelScope GPT (Magic GPT), que puede combinar y programar libremente todos los modelos de todos los tamaños en la plataforma Mota.
Mota GPT es una herramienta que entiende el lenguaje humano. Solo necesita hablar con él y plantear sus necesidades, y puede usar el modelo grande central para encontrar y llamar al modelo pequeño, y formar un equipo para completar las tareas que le dé.
De hecho, también es una especie de ruta de tecnología AI Agent que cada vez más desarrolladores de modelos valoran hoy en día.En pocas palabras, es un asistente que puede tomar decisiones autónomas basadas en la comprensión.
"También es un modelo, más de un Agente de IA, que puede desensamblar información compleja de manera más inteligente a través de la comprensión de otros modelos, e incluso otras herramientas de todo Internet, combinado con lenguaje natural y capacidades multimodales. Problemas relacionados con llamadas modelos en cada subproblema a resolver", dijo Zhou Jingren.
"Necesitamos un Agente de propósito general que combine el poder del modelo para ayudarnos a completar varias tareas. Creo que este espacio de imaginación es muy grande", dijo.
ModelScope GPT puede considerarse como una especie de "prueba". Basado en la base ecológica de la comunidad Mota, se desarrolla una herramienta para aumentar la interacción entre los desarrolladores y la comunidad modelo, aumentar el flujo de elementos en la comunidad modelo y estimular innovación en toda la comunidad.
Según los informes, ModelScope GPT ahora puede llamar a las API de más de diez modelos principales de IA en la comunidad de Mota, incluida la resolución de direcciones, la extracción de información, la traducción, la síntesis de audio y video, etc. En el futuro, su lista de API modelo continuará. para expandirse, y sus capacidades también continuarán mejorando.
Alibaba Cloud decidió abrir el conjunto de datos GPT de ModelScope y el programa de capacitación para que los desarrolladores puedan comenzar, crear herramientas prácticas de llamada de modelos y usarlas donde quieran.
Con la ecología, naturalmente habrá comercialización
En la Conferencia de Inteligencia Artificial de este año, los modelos grandes se han convertido en el foco absoluto. Encontrará que el concepto de MaaS (Modelo como Servicio) es omnipresente en el área de exposición y el foro.
En noviembre del año pasado, Alibaba Cloud tomó la iniciativa al proponer el concepto de "Modelo como servicio" en la industria y, al mismo tiempo, lanzó la creación mágica de la comunidad del modelo de IA. En ese momento, no había muchos respondedores en la industria, pero hoy ha derivado varios entendimientos.
Los grandes modelos están remodelando la industria de la computación en la nube. Los proveedores de servicios de computación en la nube deben proporcionar una gama completa de servicios que incluyen capacitación, razonamiento, implementación, ajuste, evaluación e implementación de productos en torno al centro del modelo de IA.
Hasta cierto punto, bajo la idea de MaaS, la plataforma Alibaba Cloud no solo sirve modelos de desarrollo propio, sino que es más como un "Tmall" de modelos grandes. Esta es una plataforma a través de la cual todos los modelos se pueden proporcionar directamente a los potenciales. usuarios En lugar de centrarse en el autoempleo, todas las demás cosas sirven al autoempleo.
"Alibaba Cloud tomará la promoción de la prosperidad de la ecología modelo a gran escala de China como su objetivo principal y proporcionará una gama completa de servicios a las empresas emergentes a gran escala", dijo Zhou Jingren. Solo permitiendo verdaderamente que las capacidades técnicas aportadas por el modelo lleguen a las masas y resuelvan problemas reales, puede florecer la ecología.
“Hoy esperamos que un modelo pueda llegar a más desarrolladores, o generar más valor real, y solo puede llegar a toda la sociedad a través de la nube pública. Cómo aprovechar las ventajas técnicas y el valor de la nube pública hoy, es un aspecto importante para que las empresas y los desarrolladores logren avances comerciales".
La computación en la nube es para permitir que más personas disfruten del poder de cómputo en forma de infraestructura. En el análisis final, el modelo a gran escala también es una mejora en el poder de cómputo y permite que más personas obtengan nuevo poder de cómputo traído por las nuevas tecnologías a un precio umbral más bajo es lo que deben hacer los fabricantes de la nube.