Esta es una entrevista en la que la pregunta solo se puede "captar" acelerando la velocidad del habla y aumentando el decibelio.
En la tarde del 7 de julio, antes del Foro Tencent de la Conferencia Mundial de Inteligencia Artificial de 2023, en una sala de conferencias pequeña y ruidosa, Wu Yunsheng, vicepresidente de Tencent Cloud, jefe de Tencent Cloud Intelligence y jefe de Youtu Lab, aceptó una entrevista grupal de los medios Hace casi 20 días, Tencent anunció oficialmente el panorama de MaaS, abriéndose camino en la "pista de modelos a gran escala" con modelos industriales a gran escala. Un camino que parece más "realista".
"Lo que necesitan las empresas es resolver verdaderamente un determinado problema en un escenario real, en lugar de resolver el 70%-80% del problema en 100 escenarios". Wu Yunsheng dijo que, desde la perspectiva de la estrategia de la empresa, Tencent está más centrado en resolver el problema real de los problemas de aterrizaje, y el modelo grande general no puede resolver completamente todos los problemas de los usuarios.
Tencent, que tiene la mayor cantidad de usuarios individuales en China, dio el primer paso en la transformación de Internet industrial a IA cuando llegó la nueva ola de inteligencia artificial.
Actualización de Tencent Cloud MaaS
El 19 de junio, Tencent Cloud anunció por primera vez el progreso de investigación y desarrollo de los modelos industriales a gran escala de Tencent Cloud. Proporcionó más de 50 soluciones industriales a gran escala para más de 10 industrias como medios, turismo cultural, asuntos gubernamentales y finanzas.
En la Conferencia Mundial de Inteligencia Artificial, Tencent Cloud anunció una vez más una serie de actualizaciones.
Entre ellos, la red informática de alto rendimiento Xingmai de desarrollo propio Tencent Cloud recientemente actualizada puede aumentar la utilización de la GPU en un 40 %, ahorrar entre un 30 % y un 60 % en los costos de capacitación de modelos y brindar una mejora de 10 veces en el rendimiento de la comunicación para modelos grandes de IA. . Basado en el clúster de potencia informática de nueva generación HCC de Tencent Cloud, puede admitir una escala informática súper grande de 100.000 tarjetas. La base de datos de vectores nativos de IA de Tencent Cloud admite una escala de recuperación de vectores de hasta mil millones de niveles, y el retraso se controla en el nivel de milisegundos. En comparación con la base de datos de complemento independiente tradicional, la escala de recuperación es 10 veces mayor, y también tiene una capacidad máxima de millones de consultas por segundo (QPS).
En términos de innovación de aplicaciones, las capacidades del modelo industrial a gran escala de Tencent Cloud se han aplicado a escenarios como el control de riesgos financieros, la traducción interactiva y el servicio al cliente digital inteligente, lo que ha mejorado en gran medida la eficiencia de las aplicaciones inteligentes.
La solución de control de riesgos financieros respaldada por el modelo a gran escala de la industria tiene 10 veces la eficiencia en comparación con la anterior. A través de la acumulación de Tencent de más de 20 años de experiencia en confrontación de producción negra y gris y miles de escenarios comerciales reales, el anti- el efecto de fraude es 20 veces mayor que el modelo tradicional, un aumento de alrededor del %. En el campo de los humanos digitales, Tencent Cloud lanzó este año una fábrica humana digital de muestra pequeña, que puede reproducir clones digitales 2D en 24 horas con solo una pequeña cantidad de datos, lo que reduce en gran medida el costo de los servicios humanos digitales de aplicaciones empresariales.
"De hecho, durante más de medio año, hemos estado pensando y explorando cuál es la lógica más esencial detrás de la combinación de modelos grandes y varias industrias. En realidad, solo hay dos puntos: uno es que el punto de partida fundamental de la tecnología es para resolver problemas prácticos, y el otro es Si no puedes profundizar en la industria, no puedes realmente resolver los problemas que enfrenta la industria ". La "prueba" que trajo la escena real al gran modelo hizo que Wu Yunsheng se sintiera mucho.
El servicio al cliente inteligente es reconocido como la industria más aplicable para LLM (modelo de lenguaje a gran escala). En esta conferencia, Tencent creó un modelo de industria a gran escala para una empresa OTA de viajes en línea.El modelo específico del cliente ajustado puede resolver problemas comerciales de principio a fin sin configurar procesos de diálogo. Mejore la tasa de finalización de tareas y reduzca el costo de construcción del diálogo. Pero, de hecho, no es tan simple como se imagina que el modelo grande comprenda verdaderamente los problemas del cliente.
"Durante el proceso de comunicación, el pensamiento del cliente salta y cambia. Por ejemplo, solo propuso reservar el hotel el día 10, pero antes de que la máquina respondiera, de repente dijo, déjame revisar el hotel y el vuelo el día 11, cuando la IA todavía está dando retroalimentación sobre el segundo requisito, él puede decir, muéstrame la habitación doble ". Wu Yunsheng señaló que todavía es bastante difícil para el modelo grande realizar el reconocimiento de múltiples intenciones, y el modelo grande general can Es una solución simple, pero necesita combinarse con la escena, especialmente la interacción con el sistema del cliente para reconstruir algunos modelos muy complejos.
La era de las "modelos grupales bailando juntas" está aquí
Después del ajetreo y el bullicio iniciales, cómo comercializar modelos grandes de IA, cómo los clientes empresariales pueden disfrutar de esta ronda de dividendos de IA y resolver la "ansiedad de IA" se han convertido en temas candentes en esta Conferencia Mundial de Inteligencia Artificial.
Zheng Qingsheng, socio de Sequoia Capital China, ha entrado en el campo de la inversión desde la mitad del término de Internet para PC. En su opinión, los ganadores de cada era se derivan de la tecnología original de esa era. Por ejemplo, en Internet para PC. era, la gente valora el comercio electrónico y las redes sociales El software se ha convertido en el mayor ganador; desde la era de Internet móvil, la gente ha prestado atención al software social y a los videos largos, pero los videos cortos ocupan la mayor parte del tiempo. "Ahora no sabemos qué escenas originales generadas por la propia IA cambiarán nuestra vida. Comportamiento básico".
Aunque aún se desconoce cuándo aparecerá el "asesino" nativo de AI, "ingresar al juego" debe ser el primer paso. Entre los más de 30 modelos a gran escala presentados en WAIC esta vez, a excepción de la primera ronda de modelos a gran escala de uso general como Baidu Wenxin Yiyan, Ali Tongyi, Xunfei Xinghuo y Shangtang Ririxin, los recién llegados se centran básicamente en el modelo grande de la industria.
"Para los clientes, es más probable que se acepten los modelos grandes específicos de la empresa con pocos parámetros, baja inversión y resultados rápidos, y su disposición a pagar es relativamente clara", dijo un expositor de una empresa nueva al "IT Times". reportero que algunos ya están usando modelos grandes.Los clientes bancarios que transforman el sistema de servicio al cliente generalmente eligen un método de implementación de dominio privado que integra software y hardware, y usan sus gráficos de conocimiento y datos existentes para entrenar e implementar el razonamiento, lo que no solo garantiza la seguridad de los datos , pero también reduce el costo de la potencia de cómputo, "si solo se necesita inferir y generar una escena, la placa de potencia de cómputo se puede hacer incluso en un solo dígito".
"Los escenarios industriales se han convertido en el mejor campo de entrenamiento", dijo Tang Daosheng, vicepresidente ejecutivo sénior de Tencent Group y director ejecutivo de Cloud and Smart Industry Business Group, en la reunión plenaria de WAIC-Foro de Desarrollo Industrial, eligiendo un modelo de industria integral. La cooperación de proveedores de nube con capacidades de servicio para construir sus propios modelos exclusivos basados en modelos de grandes industrias puede ser un camino factible para que las empresas exploren la práctica de aplicación de modelos grandes.
Esto significa que el futuro será una era de "coexistencia de todos los modelos", y cada empresa tendrá su propio modelo grande, y Tencent ha decidido ser el facilitador de la nueva era.
En el panorama del servicio MaaS publicado por Tencent Cloud el mes pasado, se señaló que, con base en la plataforma Tencent Cloud TI, se puede construir una tienda seleccionada modelo industrial a gran escala Tencent Cloud puede proporcionar 10 industrias principales, como finanzas, turismo cultural , asuntos gubernamentales, atención médica, medios de comunicación y educación. Al mismo tiempo, Tencent Cloud lanzó una solución de ajuste fino de modelos de gran tamaño para ayudar a los desarrolladores de modelos e ingenieros de algoritmos a resolver tareas como la invocación de modelos, la gestión de datos y etiquetas, el ajuste fino de modelos, las pruebas de evaluación y la implementación en una sola parada, y reducir la presión de crear modelos grandes.
Sobre la base de estos modelos y plataformas de herramientas, las empresas pueden generar rápidamente sus propios "modelos exclusivos" solo agregando sus propios datos de escena.
"Todavía se encuentra en la etapa inicial del desarrollo de modelos a gran escala. Personalmente, espero que florezcan cien flores y que todos prueben diferentes posibilidades en diferentes campos". proyecto, que requiere conocimiento común y también requiere una organización de conocimiento profesional, profundo y autorizado, y se necesitan los esfuerzos conjuntos de todas las partes para permitir que la tecnología realmente sirva a la industria.
AI for Science captura el "parpadeo" cósmico
Por supuesto, además de ejercer efectos en la transformación digital de las industrias, el modelo de industria a gran escala de Tencent Cloud también acelera la aplicación de tecnologías de IA como modelos grandes en el campo de la computación científica.
A partir de 2021, Tencent, el Observatorio Astronómico Nacional y la Escuela de Informática y Tecnología de la Universidad de Fudan lanzaron conjuntamente el "Proyecto de exploración de estrellas", utilizando la nube + IA para ayudar a China Tianyan a procesar RÁPIDAMENTE la gran cantidad de datos recibidos todos los días. y encuentre ráfagas de radio rápidas y pulsos a través del análisis visual de IA.Según las pistas estelares, hasta ahora se han descubierto 30 púlsares.
En el WAIC de este año, Tencent anunció que el programa de exploración de estrellas ha avanzado más y, por primera vez, descubrió 2 ráfagas de radio rápidas a través de la tecnología de IA.
Las ráfagas de radio rápidas son un fenómeno astronómico misterioso. Cada 1 milisegundo, se emitirá la energía liberada por el sol durante todo el año, "parpadeando" el universo. Sin embargo, su frecuencia de "parpadeo" es extremadamente baja y el tiempo es extremadamente corto. Es fácil de ignorar en los datos masivos y extremadamente difícil de capturar. No fue hasta 2007 que los humanos descubrieron el primer púlsar, 40 años después del descubrimiento. de púlsares.
En comparación con la exploración de púlsares, para descubrir ráfagas de radio rápidas que ocurren a una frecuencia más baja en datos masivos, se requiere que los modelos de IA tengan una mayor precisión y una velocidad de cálculo más rápida. Para mejorar la velocidad de cálculo, Tencent diseñó especialmente un conjunto de algoritmos de IA de extremo a extremo completamente nuevos para la exploración de ráfagas de radio rápidas. Bajo el mismo poder de cómputo, este nuevo paradigma de procesamiento de datos astronómicos promueve que la eficiencia de procesamiento de señales sea 1800 veces más rápida que el proceso de procesamiento convencional.
Anteriormente, antes de que la IA pudiera entender el mapa, era necesario realizar complicados preprocesamientos astrofísicos en el mapa de señales, como la transformada de Fourier, la dispersión cromática... Estas tareas son profesionales y complicadas. Ahora Tencent Youtu ha creado un "algoritmo de IA de extremo a extremo" para el procesamiento de datos astronómicos, que puede omitir los pasos de preprocesamiento e ingresar directamente al reconocimiento de IA, lo que mejora en gran medida la eficiencia.
FAST genera cientos de terabytes de datos todos los días y decenas de millones de mapas de señales cada semana. Frente a datos masivos, Tencent Cloud puede ubicar e identificar rápidamente información útil en los datos a través del "método de aprendizaje de múltiples instancias + mecanismo de atención", y proporcionar un poderoso soporte de potencia informática subyacente.
Hoy, Tencent Cloud y FAST continúan detectando las señales de radio de M31 Andromeda a 2,5 millones de años luz de distancia, y se espera que se capturen más "destellos cósmicos" en el futuro cercano.
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
El realismo del modelo grande de Tencent: resolver la "ansiedad de la IA" de las empresas en la escena
Fuente original: TI Times
Autor: Hao Junhui
Esta es una entrevista en la que la pregunta solo se puede "captar" acelerando la velocidad del habla y aumentando el decibelio.
En la tarde del 7 de julio, antes del Foro Tencent de la Conferencia Mundial de Inteligencia Artificial de 2023, en una sala de conferencias pequeña y ruidosa, Wu Yunsheng, vicepresidente de Tencent Cloud, jefe de Tencent Cloud Intelligence y jefe de Youtu Lab, aceptó una entrevista grupal de los medios Hace casi 20 días, Tencent anunció oficialmente el panorama de MaaS, abriéndose camino en la "pista de modelos a gran escala" con modelos industriales a gran escala. Un camino que parece más "realista".
"Lo que necesitan las empresas es resolver verdaderamente un determinado problema en un escenario real, en lugar de resolver el 70%-80% del problema en 100 escenarios". Wu Yunsheng dijo que, desde la perspectiva de la estrategia de la empresa, Tencent está más centrado en resolver el problema real de los problemas de aterrizaje, y el modelo grande general no puede resolver completamente todos los problemas de los usuarios.
Actualización de Tencent Cloud MaaS
El 19 de junio, Tencent Cloud anunció por primera vez el progreso de investigación y desarrollo de los modelos industriales a gran escala de Tencent Cloud. Proporcionó más de 50 soluciones industriales a gran escala para más de 10 industrias como medios, turismo cultural, asuntos gubernamentales y finanzas.
En la Conferencia Mundial de Inteligencia Artificial, Tencent Cloud anunció una vez más una serie de actualizaciones.
Entre ellos, la red informática de alto rendimiento Xingmai de desarrollo propio Tencent Cloud recientemente actualizada puede aumentar la utilización de la GPU en un 40 %, ahorrar entre un 30 % y un 60 % en los costos de capacitación de modelos y brindar una mejora de 10 veces en el rendimiento de la comunicación para modelos grandes de IA. . Basado en el clúster de potencia informática de nueva generación HCC de Tencent Cloud, puede admitir una escala informática súper grande de 100.000 tarjetas. La base de datos de vectores nativos de IA de Tencent Cloud admite una escala de recuperación de vectores de hasta mil millones de niveles, y el retraso se controla en el nivel de milisegundos. En comparación con la base de datos de complemento independiente tradicional, la escala de recuperación es 10 veces mayor, y también tiene una capacidad máxima de millones de consultas por segundo (QPS).
En términos de innovación de aplicaciones, las capacidades del modelo industrial a gran escala de Tencent Cloud se han aplicado a escenarios como el control de riesgos financieros, la traducción interactiva y el servicio al cliente digital inteligente, lo que ha mejorado en gran medida la eficiencia de las aplicaciones inteligentes.
La solución de control de riesgos financieros respaldada por el modelo a gran escala de la industria tiene 10 veces la eficiencia en comparación con la anterior. A través de la acumulación de Tencent de más de 20 años de experiencia en confrontación de producción negra y gris y miles de escenarios comerciales reales, el anti- el efecto de fraude es 20 veces mayor que el modelo tradicional, un aumento de alrededor del %. En el campo de los humanos digitales, Tencent Cloud lanzó este año una fábrica humana digital de muestra pequeña, que puede reproducir clones digitales 2D en 24 horas con solo una pequeña cantidad de datos, lo que reduce en gran medida el costo de los servicios humanos digitales de aplicaciones empresariales.
"De hecho, durante más de medio año, hemos estado pensando y explorando cuál es la lógica más esencial detrás de la combinación de modelos grandes y varias industrias. En realidad, solo hay dos puntos: uno es que el punto de partida fundamental de la tecnología es para resolver problemas prácticos, y el otro es Si no puedes profundizar en la industria, no puedes realmente resolver los problemas que enfrenta la industria ". La "prueba" que trajo la escena real al gran modelo hizo que Wu Yunsheng se sintiera mucho.
El servicio al cliente inteligente es reconocido como la industria más aplicable para LLM (modelo de lenguaje a gran escala). En esta conferencia, Tencent creó un modelo de industria a gran escala para una empresa OTA de viajes en línea.El modelo específico del cliente ajustado puede resolver problemas comerciales de principio a fin sin configurar procesos de diálogo. Mejore la tasa de finalización de tareas y reduzca el costo de construcción del diálogo. Pero, de hecho, no es tan simple como se imagina que el modelo grande comprenda verdaderamente los problemas del cliente.
"Durante el proceso de comunicación, el pensamiento del cliente salta y cambia. Por ejemplo, solo propuso reservar el hotel el día 10, pero antes de que la máquina respondiera, de repente dijo, déjame revisar el hotel y el vuelo el día 11, cuando la IA todavía está dando retroalimentación sobre el segundo requisito, él puede decir, muéstrame la habitación doble ". Wu Yunsheng señaló que todavía es bastante difícil para el modelo grande realizar el reconocimiento de múltiples intenciones, y el modelo grande general can Es una solución simple, pero necesita combinarse con la escena, especialmente la interacción con el sistema del cliente para reconstruir algunos modelos muy complejos.
La era de las "modelos grupales bailando juntas" está aquí
Después del ajetreo y el bullicio iniciales, cómo comercializar modelos grandes de IA, cómo los clientes empresariales pueden disfrutar de esta ronda de dividendos de IA y resolver la "ansiedad de IA" se han convertido en temas candentes en esta Conferencia Mundial de Inteligencia Artificial.
Zheng Qingsheng, socio de Sequoia Capital China, ha entrado en el campo de la inversión desde la mitad del término de Internet para PC. En su opinión, los ganadores de cada era se derivan de la tecnología original de esa era. Por ejemplo, en Internet para PC. era, la gente valora el comercio electrónico y las redes sociales El software se ha convertido en el mayor ganador; desde la era de Internet móvil, la gente ha prestado atención al software social y a los videos largos, pero los videos cortos ocupan la mayor parte del tiempo. "Ahora no sabemos qué escenas originales generadas por la propia IA cambiarán nuestra vida. Comportamiento básico".
Aunque aún se desconoce cuándo aparecerá el "asesino" nativo de AI, "ingresar al juego" debe ser el primer paso. Entre los más de 30 modelos a gran escala presentados en WAIC esta vez, a excepción de la primera ronda de modelos a gran escala de uso general como Baidu Wenxin Yiyan, Ali Tongyi, Xunfei Xinghuo y Shangtang Ririxin, los recién llegados se centran básicamente en el modelo grande de la industria.
"Para los clientes, es más probable que se acepten los modelos grandes específicos de la empresa con pocos parámetros, baja inversión y resultados rápidos, y su disposición a pagar es relativamente clara", dijo un expositor de una empresa nueva al "IT Times". reportero que algunos ya están usando modelos grandes.Los clientes bancarios que transforman el sistema de servicio al cliente generalmente eligen un método de implementación de dominio privado que integra software y hardware, y usan sus gráficos de conocimiento y datos existentes para entrenar e implementar el razonamiento, lo que no solo garantiza la seguridad de los datos , pero también reduce el costo de la potencia de cómputo, "si solo se necesita inferir y generar una escena, la placa de potencia de cómputo se puede hacer incluso en un solo dígito".
"Los escenarios industriales se han convertido en el mejor campo de entrenamiento", dijo Tang Daosheng, vicepresidente ejecutivo sénior de Tencent Group y director ejecutivo de Cloud and Smart Industry Business Group, en la reunión plenaria de WAIC-Foro de Desarrollo Industrial, eligiendo un modelo de industria integral. La cooperación de proveedores de nube con capacidades de servicio para construir sus propios modelos exclusivos basados en modelos de grandes industrias puede ser un camino factible para que las empresas exploren la práctica de aplicación de modelos grandes.
En el panorama del servicio MaaS publicado por Tencent Cloud el mes pasado, se señaló que, con base en la plataforma Tencent Cloud TI, se puede construir una tienda seleccionada modelo industrial a gran escala Tencent Cloud puede proporcionar 10 industrias principales, como finanzas, turismo cultural , asuntos gubernamentales, atención médica, medios de comunicación y educación. Al mismo tiempo, Tencent Cloud lanzó una solución de ajuste fino de modelos de gran tamaño para ayudar a los desarrolladores de modelos e ingenieros de algoritmos a resolver tareas como la invocación de modelos, la gestión de datos y etiquetas, el ajuste fino de modelos, las pruebas de evaluación y la implementación en una sola parada, y reducir la presión de crear modelos grandes.
Sobre la base de estos modelos y plataformas de herramientas, las empresas pueden generar rápidamente sus propios "modelos exclusivos" solo agregando sus propios datos de escena.
"Todavía se encuentra en la etapa inicial del desarrollo de modelos a gran escala. Personalmente, espero que florezcan cien flores y que todos prueben diferentes posibilidades en diferentes campos". proyecto, que requiere conocimiento común y también requiere una organización de conocimiento profesional, profundo y autorizado, y se necesitan los esfuerzos conjuntos de todas las partes para permitir que la tecnología realmente sirva a la industria.
AI for Science captura el "parpadeo" cósmico
Por supuesto, además de ejercer efectos en la transformación digital de las industrias, el modelo de industria a gran escala de Tencent Cloud también acelera la aplicación de tecnologías de IA como modelos grandes en el campo de la computación científica.
A partir de 2021, Tencent, el Observatorio Astronómico Nacional y la Escuela de Informática y Tecnología de la Universidad de Fudan lanzaron conjuntamente el "Proyecto de exploración de estrellas", utilizando la nube + IA para ayudar a China Tianyan a procesar RÁPIDAMENTE la gran cantidad de datos recibidos todos los días. y encuentre ráfagas de radio rápidas y pulsos a través del análisis visual de IA.Según las pistas estelares, hasta ahora se han descubierto 30 púlsares.
En el WAIC de este año, Tencent anunció que el programa de exploración de estrellas ha avanzado más y, por primera vez, descubrió 2 ráfagas de radio rápidas a través de la tecnología de IA.
Las ráfagas de radio rápidas son un fenómeno astronómico misterioso. Cada 1 milisegundo, se emitirá la energía liberada por el sol durante todo el año, "parpadeando" el universo. Sin embargo, su frecuencia de "parpadeo" es extremadamente baja y el tiempo es extremadamente corto. Es fácil de ignorar en los datos masivos y extremadamente difícil de capturar. No fue hasta 2007 que los humanos descubrieron el primer púlsar, 40 años después del descubrimiento. de púlsares.
En comparación con la exploración de púlsares, para descubrir ráfagas de radio rápidas que ocurren a una frecuencia más baja en datos masivos, se requiere que los modelos de IA tengan una mayor precisión y una velocidad de cálculo más rápida. Para mejorar la velocidad de cálculo, Tencent diseñó especialmente un conjunto de algoritmos de IA de extremo a extremo completamente nuevos para la exploración de ráfagas de radio rápidas. Bajo el mismo poder de cómputo, este nuevo paradigma de procesamiento de datos astronómicos promueve que la eficiencia de procesamiento de señales sea 1800 veces más rápida que el proceso de procesamiento convencional.
Anteriormente, antes de que la IA pudiera entender el mapa, era necesario realizar complicados preprocesamientos astrofísicos en el mapa de señales, como la transformada de Fourier, la dispersión cromática... Estas tareas son profesionales y complicadas. Ahora Tencent Youtu ha creado un "algoritmo de IA de extremo a extremo" para el procesamiento de datos astronómicos, que puede omitir los pasos de preprocesamiento e ingresar directamente al reconocimiento de IA, lo que mejora en gran medida la eficiencia.
FAST genera cientos de terabytes de datos todos los días y decenas de millones de mapas de señales cada semana. Frente a datos masivos, Tencent Cloud puede ubicar e identificar rápidamente información útil en los datos a través del "método de aprendizaje de múltiples instancias + mecanismo de atención", y proporcionar un poderoso soporte de potencia informática subyacente.
Hoy, Tencent Cloud y FAST continúan detectando las señales de radio de M31 Andromeda a 2,5 millones de años luz de distancia, y se espera que se capturen más "destellos cósmicos" en el futuro cercano.