Esta revolución del lado terminal, más cercana a los usuarios, es la clave para democratizar la IA generativa.

Fuente original: Corazón de la Máquina

En un momento en que la IA generativa es cada vez más prometedora y buscada ampliamente, su implementación más amplia requiere hacerla más grande, mejor y más fuerte en el lado terminal.

Fuente de la imagen: Generada por Unbounded AI‌

Hoy, han pasado casi 10 meses desde que OpenAI lanzó ChatGPT y la ola de IA generativa provocada por él ha permitido a la gente común sentir "más de cerca" el encanto de la inteligencia artificial. Ya sea un motor de búsqueda en tiempo real estilo chat impulsado por modelos grandes o una herramienta de pintura que genera imágenes ingresando texto, la IA generativa ha ingresado lentamente y ha cambiado sutilmente el trabajo diario, el entretenimiento y los hábitos creativos de las personas.

Junto con los modelos grandes y la IA generativa, los fabricantes de teléfonos móviles y chips están llevando a cabo una "revolución del lado del dispositivo" con gran fanfarria. En mayo de este año, Google lanzó el modelo de lenguaje grande PaLM 2, incluida una versión liviana Gecko que puede ejecutarse en dispositivos móviles. También en mayo, Qualcomm publicó el documento técnico "La IA híbrida es el futuro de la IA". En agosto, Xiaomi Lei Jun anunció su adopción total de modelos grandes e inicialmente ejecutó con éxito un modelo grande de 1.3 mil millones de parámetros en el teléfono móvil. Xiao Ai también recibió una actualización en las capacidades de los modelos grandes.

No podemos evitar preguntarnos: ¿por qué los principales fabricantes se apresuran a introducir grandes modelos de IA general y generativa en terminales, especialmente en teléfonos móviles? Sabemos que los productos terminales inteligentes, como teléfonos inteligentes, PC, XR y automóviles, son los más cercanos a la gente común, especialmente los teléfonos móviles, y les dedicamos cada vez más tiempo. En abril de 2023, la organización de investigación de mercado Electronics Hub publicó un informe que muestra que los usuarios de algunos países miran fijamente las pantallas de los teléfonos móviles durante más de 7 horas al día. Los teléfonos móviles están evolucionando gradualmente hasta convertirse en el núcleo de la vida inteligente, preparando un "semillero" para el desarrollo de la IA generativa en los terminales.

Sin embargo, la inclinación actual de los grandes modelos de IA generativa hacia el lado terminal no se produjo de la noche a la mañana: el método de implementación está experimentando una transformación de la nube a la colaboración terminal-nube.

La tendencia de que la IA generativa basada en terminales y en la nube vayan de la mano es cada vez más prominente

Sabemos que los parámetros de los grandes modelos de IA generativa a menudo ascienden a miles de millones, cientos o incluso cientos de miles de millones, lo que impone requisitos extremadamente altos a la infraestructura en términos de optimización del entrenamiento del modelo e inferencia de ejecución. Al principio, solo la nube podía proporcionar una potencia informática de IA tan enorme, por lo que los fabricantes a menudo optaban por implementar y ejecutar sus propios modelos grandes en la nube.

Tomando ChatGPT como ejemplo, su capacitación y operación requieren una gran cantidad de almacenamiento de datos y recursos informáticos, y las solicitudes masivas de usuarios generan altos costos de potencia informática, lo que requiere una potente plataforma de servicios en la nube. Los usuarios pueden acceder a ChatGPT y otros productos de IA generativa (como CodeX) a través del servicio en la nube Microsoft Azure OpenAI. Amazon, otro importante proveedor de servicios en la nube, también lanzó un servicio similar de alojamiento en la nube de IA generativa. Los usuarios pueden acceder a modelos básicos previamente capacitados de nuevas empresas como AI21Labs, Anthropic y Stability AI a través de API.

Obviamente, las plataformas de servicios en la nube han acelerado esta ola de tecnología de IA generativa que está arrasando el mundo, proporcionando a los grandes fabricantes de modelos la potencia informática necesaria para el entrenamiento y la inferencia de modelos. Sin embargo, la inferencia de modelos grandes en la nube requiere altos costos y, con el creciente número de usuarios y solicitudes de uso, el costo es cada vez mayor. Como resultado, ante el continuo aumento de los costes operativos, los fabricantes necesitan encontrar otra salida fuera de la nube.

A medida que pasa el tiempo, por un lado, las tecnologías de compresión de modelos grandes (como la cuantificación, la poda de redes y la destilación de conocimientos) son cada vez más abundantes y efectivas, y por otro lado, los dispositivos terminales inteligentes como teléfonos móviles, PC, XR. , y los automóviles tienen IA La potencia informática sigue aumentando y las condiciones técnicas para implementar IA generativa en terminales están madurando rápidamente. La tendencia de que terminales y nubes vayan de la mano es cada vez más evidente.

Las principales empresas de tecnología han captado con entusiasmo estos cambios y han realizado una serie de intentos de implementar grandes modelos de IA generativa en teléfonos inteligentes y otros terminales. Por ejemplo, el lanzamiento de las versiones ChatGPT para iOS y Android permite a los usuarios comunes experimentar conversaciones de chat generativas con solo levantar su teléfono móvil. Habrá momentos más importantes como este en el futuro.

Además, en comparación con la nube, implementar y ejecutar IA generativa en el lado del terminal también tiene ventajas en términos de costo, seguridad, privacidad y operación confiable.

La primera es la ventaja de costos. Anteriormente, los medios informaron que OpenAI quemó aproximadamente 700.000 dólares al día sólo para mantener ChatGPT en funcionamiento, lo que significa que es posible que se hayan gastado casi 200 millones de dólares en ChatGPT. Un costo tan alto es demasiado alto incluso para que OpenAI lo soporte, lo que dificulta alcanzar el punto de equilibrio, y mucho menos obtener ganancias. El lado del terminal es diferente, el costo se reduce considerablemente, la implementación del modelo liviano comprimido solo necesita pagar el costo del hardware, sin considerar otros problemas como el ancho de banda, el consumo de energía y la transmisión de la red.

En segundo lugar, ejecutar IA generativa en el terminal puede proteger los datos privados con mayor confianza, a diferencia del riesgo potencial de fuga de información en la nube. Esto no es infundado: en abril de este año, se reveló que los empleados del departamento de semiconductores subieron datos a la nube cuando usaban ChatGPT, lo que provocó la filtración de datos confidenciales, y posteriormente anunciaron una prohibición. El funcionamiento del terminal no requiere cargar texto, imágenes, vídeos y otra información en la nube, lo que evita este riesgo y garantiza que no se filtre la privacidad y se mejore la seguridad.

La baja latencia también es una gran ventaja en el lado del terminal. La nube necesita transmitir los datos a la nube para su procesamiento antes de que se puedan devolver los resultados. Durante el proceso, la transmisión de la red inevitablemente provocará retrasos. El lado del terminal no necesita cargar información al servidor en la nube o al centro de datos, se mejora la velocidad de respuesta y se reduce el retraso. Al mismo tiempo, el funcionamiento local es más fiable y, en ocasiones, puede ejecutarse sin conexión, lo que reduce en cierta medida la dependencia de los servicios en la nube y las conexiones de red.

El lado del terminal también tiene escenarios de aplicaciones e información situacional más ricos que la nube, lo que brinda una interacción y una experiencia más personalizadas. Los usuarios pueden ajustar y personalizar los parámetros y funciones del modelo para diferentes escenarios de aplicación o diferentes necesidades en el mismo escenario, dándoles total flexibilidad.

Con estas ventajas, el camino para implementar la IA generativa en el lado de la terminal es cada vez más claro y cada vez se la coloca en una posición tan importante como la nube. Como dijo el vicepresidente global de Qualcomm, Hou Mingjuan, en la conferencia de prensa fuera de línea del documento técnico "La IA híbrida es el futuro de la IA", "la IA del lado terminal es la clave para realizar una arquitectura de IA híbrida y expandir la IA generativa a una gama más amplia de mundo."

Hou Mingjuan

Qualcomm lo dijo y así lo hizo. En esta revolución del lado terminal relacionada con la IA generativa, Qualcomm tomó la iniciativa y se convirtió en uno de los principales promotores de la revolución de la IA del lado terminal, y formó una ruta de desarrollo de IA híbrida en la que la nube y los terminales trabajan juntos en el diseño. Esta elección de ruta refleja aún más la visión y el liderazgo de Qualcomm en IA del lado terminal y capacidades de tecnología de IA generativa.

Disponga la IA generativa del lado del terminal un paso por delante

La llamada IA híbrida opera principalmente de dos maneras: primero, en algunos escenarios, la computación se centra principalmente en el terminal y descarga tareas a la nube cuando es necesario. En segundo lugar, en un escenario centrado en la nube, las terminales comparten parte de la carga de trabajo de la nube cuando es posible en función de sus propias capacidades. La nube y el terminal realizan cada uno sus propias funciones y se ayudan mutuamente.

En comparación con la nube, el mayor beneficio de la IA híbrida es asignar y coordinar de manera más eficiente las cargas de trabajo de la IA en diferentes escenarios y tiempos, mejorar la eficiencia en la utilización de recursos y reducir los costos operativos.

En el diseño de la IA híbrida de Qualcomm, ya sea centrada en el terminal, basada en la percepción del terminal o en el procesamiento colaborativo del terminal y la nube, se enfatiza que las capacidades de IA del lado del terminal son la clave para potenciar la IA híbrida y permitir que la IA generativa logre una expansión a escala global. . . Especialmente para la IA generativa, la IA híbrida significa aprovechar al máximo la potencia informática del terminal para admitir aplicaciones de IA generativa, como ChatGPT en los teléfonos móviles.

Sin embargo, implementar y ejecutar con éxito grandes modelos de IA generativa en terminales es más fácil de decir que de hacer: el requisito previo para la implementación son sólidas capacidades de IA en las terminales. Como fabricante de chips ascendentes, Qualcomm siempre ha sido líder en IA del lado terminal y ha formado una optimización de IA de pila completa, desde chips hasta software, algoritmos y ecosistemas, de modo que ni el software ni el hardware se vean obstaculizados, y el lado terminal Se puede lograr la aceleración de la inferencia de IA.

Optimización de IA de pila completa de Qualcomm

En primer lugar, a nivel de chip de hardware, desde la plataforma insignia anterior Snapdragon 888 y el Snapdragon 8 de primera generación hasta el Snapdragon 7 de segunda generación de gama alta y el Snapdragon 8 insignia de segunda generación lanzados el año pasado, las capacidades de IA continúan. Para evolucionar, con la mejora, las capacidades de IA del lado terminal mejorarán en consecuencia. Entre ellos, el Qualcomm AI Engine (actualmente de octava generación) en constante actualización juega un papel importante. Su procesador Hexagon, su GPU Qualcomm Adreno y su CPU Qualcomm Kryo están diseñados para ejecutar de manera eficiente aplicaciones de IA en el terminal y optimizar a los usuarios de AI en el terminal. a través de métodos de computación heterogéneos.

Se espera que se mejore aún más la potencia informática de IA del Snapdragon 8 de tercera generación, que se lanzará en octubre de este año, y estamos aún más emocionados de ver qué tipo de funciones de IA del lado del terminal puede admitir.

Además de la aceleración continua del hardware, el mayor desafío para la IA del lado terminal reside en el software, que debe garantizar que se puedan ejecutar varios modelos de procesamiento neuronal y que los cálculos sean lo suficientemente rápidos y eficientes. La pila de software de IA de Qualcomm ayuda a los desarrolladores a crear, optimizar e implementar aplicaciones de IA en hardware de manera más eficiente, logrando el efecto de desarrollo único y implementación múltiple de aplicaciones. Como puede ver en la figura siguiente, esta pila de software mejora la eficiencia del desarrollo desde múltiples niveles, incluidos marcos de IA compatibles, kits de desarrollo de software de inferencia, bibliotecas y servicios para desarrolladores, software de sistema y sistemas operativos.

Pila de software de IA de Qualcomm

Además, en cuanto a desarrollo de algoritmos y modelos se apuesta por mejorar la eficiencia sin sacrificar la precisión, en este sentido existen algoritmos basados en el modelo Q-SRNet, soluciones de cuantificación INT4, etc. Por ejemplo, Snapdragon 8 Gen2 admite por primera vez el formato de precisión de IA INT4, lo que aporta una mejora del 60 % en la eficiencia energética y una mejora del 90 % en el rendimiento de inferencia de IA en comparación con INT8.

Qualcomm también sigue esforzándose a nivel ecológico, y sus ventajas técnicas en móviles se pueden extender a otros terminales como coches, PC, XR e Internet de las Cosas. Al mismo tiempo, basándose en IP y tecnología distribuida en diversos campos, Qualcomm puede llevar a cabo una cooperación profunda en múltiples ecosistemas, como el campo de PC y Microsoft, el campo XR y Meta, y lograr rápidamente una expansión a gran escala a través de buena cooperación ecológica.

Se puede decir que las poderosas y completas capacidades de IA del lado terminal de Qualcomm, especialmente la arquitectura de aceleración de hardware de IA y la pila de software que pueden hacer frente a cambios potenciales en la arquitectura del modelo generativo de IA, han liderado el camino en el razonamiento y la inteligencia artificial del lado terminal. sentó una base sólida para la expansión de la IA generativa a los terminales. La base técnica hace posible que las aplicaciones de IA generativa se ejecuten en dispositivos terminales como teléfonos móviles. Al mismo tiempo, Qualcomm también mira hacia el futuro en términos de explorar la IA generativa.

Desde las primeras investigaciones sobre el método de compresión de modelos de IA generativa, utilizando VAE para crear códecs de video y voz para controlar el tamaño del modelo por debajo de 100 millones de parámetros, hasta el uso de IA generativa para reemplazar modelos de canales en el campo inalámbrico para mejorar la eficiencia de la comunicación de los teléfonos móviles. Qualcomm siempre ha tenido como objetivo avanzar en la IA generativa.

Por supuesto, los resultados también son muy significativos: en los últimos seis meses, las noticias sobre Qualcomm ejecutando grandes modelos de IA generativa en teléfonos móviles han provocado acaloradas discusiones, incluida la ejecución del modelo de gráfico Vincent de mil millones de parámetros Stable Diffusion y el modelo de gráfico Vincent de 1.500 millones de parámetros. Generación de imágenes modelo de imagen ControlNet.Espera. Además de demostrar las capacidades de pintura de IA en dispositivos móviles, Qualcomm también está explorando más a fondo la extensión de las capacidades de IA generativa en otras direcciones técnicas, como los humanos digitales.

*ControlNet en el teléfono móvil completa el renderizado en 12 segundos. *

En el futuro, basándose en la experiencia acumulada en operación de teléfonos móviles de Qualcomm y en la mejora adicional de la potencia informática del chip SoC, la operación de terminales de más modelos de parámetros está a la vuelta de la esquina. Ziad Asghar, vicepresidente senior de gestión de productos y jefe de IA de Qualcomm, dijo en una entrevista que este año se ejecutarán en teléfonos móviles modelos de IA generativa que pueden admitir 10 mil millones de parámetros. Además, cooperará con Meta para lanzar una versión móvil de Llama 2 el próximo año. Todo esto hace que el futuro de la IA generativa sea más prometedor.

En nuestra opinión, la mayor importancia de la IA del lado terminal es mostrar grandes modelos de IA generativa en manos de todos, lo que es más beneficioso para la expansión y popularización a gran escala de la IA generativa y también puede generar beneficios comerciales. Tomando como ejemplo la pintura con IA generativa, si puede ser como la cámara Miaoya que se hizo popular en WeChat Moments hace algún tiempo, ejecutar IA generativa en teléfonos móviles producirá efectos de tráfico inconmensurables.

Sin embargo, el diseño de IA generativa de Qualcomm definitivamente no es para el efecto de tráfico temporal, sino con la ayuda de teléfonos móviles, PC móviles, dispositivos portátiles XR, hogares inteligentes, automóviles y otros posibles portadores de aplicaciones de IA generativa, de una manera más cercana. a los usuarios, permitiendo que más personas disfruten de la nueva experiencia de IA de forma rápida y cómoda. Como dice la portada de su libro blanco, "hacer que la IA esté a nuestro alcance". Qualcomm hace que esto ya no esté muy lejos.

Conclusión

Desde ChatGPT, la IA generativa se ha convertido en una tendencia de desarrollo imparable. En vista de la gran comodidad que traerá a nuestras vidas, es imperativo acelerar la popularización de la IA generativa. Afortunadamente, Qualcomm ha sentado las bases. Descubrimos que Qualcomm ha estado profundamente involucrado en el campo de la IA durante más de 15 años, especialmente en el campo de la informática móvil, y ha formado un profundo liderazgo técnico. Actualmente hay miles de millones de dispositivos terminales inteligentes equipados con plataformas Snapdragon y Qualcomm en todo el mundo, lo que lleva las capacidades de prueba y error de IA del lado del terminal y el potencial de aplicación de IA generativa a alturas incomparables.

Al mismo tiempo, al ampliar y profundizar el empoderamiento de la IA en el lado terminal y extender la IA generativa a más campos y escenarios, no solo puede brindar a los usuarios comunes una experiencia de IA más diversa, divertida y conveniente, sino que también puede crear más oportunidades de mercado para sus socios del ecosistema de terminales inteligentes y realmente desbloquear su valor.

Para Qualcomm, la IA generativa del lado del terminal tiene una importancia de gran alcance. En el Foro de la Cumbre de Fronteras y Tendencias de Desarrollo del Comercio Digital de la Feria Comercial de Servicios de China, Meng Pu, presidente de Qualcomm China, pronunció un discurso de apertura, enfatizando la estrecha cooperación con el ecosistema global para explorar conjuntamente tecnologías como 5G, IA e Internet. de las cosas. Nuevas aplicaciones y experiencias móviles. Como tecnología de IA generativa que se encuentra actualmente a la vanguardia, su fuerza, cantidad y dificultad determinarán en gran medida si se pueden implementar con éxito.

El funcionamiento de la IA generativa en el lado del terminal es imperativo, y las empresas ecológicas y de habilitación de usuarios como Qualcomm también se destacarán por su fortaleza.

Link de referencia:

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)