Fondos de "volumen" para atraer talentos, comprender el panorama competitivo de los modelos domésticos de IA a gran escala en un artículo

Fuente original: Titanium Media

Montaje: Liu Yaning, Sun Cheng

Fuente de la imagen: Generada por Unbounded AI‌

El 29 de junio, Meituan emitió un anuncio en la Bolsa de Valores de Hong Kong, anunciando la adquisición de la compañía de modelos a gran escala "Light Years Beyond" fundada por Wang Huiwen, lo que también dejó especulaciones sobre el mercado de modelos a gran escala de IA. No solo en China, la cantidad de visitas a ChatGPT ha disminuido recientemente. Según los datos, las visitas globales de ChatGPT en junio cayeron un 9,7% mensual y la cantidad de visitantes únicos cayó un 5,7% mensual. Además, la duración de los usuarios que utilizan ChatGPT también está disminuyendo. La duración de cada visita disminuyó un 8,5 % en mayo. AIGC parece haber marcado el comienzo de un período de reflexión.

Pero, por otro lado, el 4 de julio, se lanzó oficialmente la compañía de modelos a gran escala "Zero One Creation" organizada por el mismo Kai-Fu Lee, y se lanzó la aplicación de modelos de lenguaje a gran escala "Wen Xin Yi Yan" desarrollada por Baidu. lanzado en Apple App Market, y el editor de verificación empresarial verifica el modelo grande - "Conociendo al enemigo alfa"... Varias compañías están haciendo movimientos frecuentes en el campo de los modelos grandes, y están en pleno apogeo.

¿Qué tan caliente es el negocio de modelos grandes de IA? ¿Cuál es el diseño de inversión del mercado de capitales para esta salida? ¿Cómo es el rendimiento de los modelos domésticos a gran escala de hoy? Este número de Titanium Media·Tidu Tuwen intenta resolver el estado de desarrollo actual de los modelos domésticos a gran escala a partir del nivel de datos.

Los gigantes de la tecnología de "pelea de hadas" de modelo a gran escala de inteligencia artificial nacional están compitiendo para disparar

Desde marzo de este año, los modelos domésticos de IA han brotado como hongos después de la lluvia. El "Informe de investigación de mapas de modelos grandes de inteligencia artificial de China" muestra que, a fines de mayo de 2023, se lanzaron al menos 79 modelos grandes básicos nacionales con una escala de parámetros de mil millones o más.

Desde una perspectiva global, Estados Unidos ocupa el primer lugar en el número de modelos a gran escala en el mundo. Ya en 2020, Estados Unidos ha lanzado 15 modelos a gran escala, incluido GPT-3. En China, a partir de 2020, los modelos a gran escala también han entrado en una etapa de rápido desarrollo. En 2021, se lanzarán 30 modelos a gran escala, 28 modelos a gran escala se lanzarán en 2022 y 19 modelos a gran escala se lanzarán se lanzará en los primeros cinco meses de 2023, superando los 18 modelos en EE.UU. modelo grande. Hoy en día, la cantidad de modelos a gran escala en China y los Estados Unidos representa casi el 90% de la cantidad total de modelos a gran escala en el mundo, y la cantidad de modelos a gran escala en China ha ingresado al primer escalón.

La pista de modelos domésticos a gran escala es muy animada. Los "jugadores" involucrados en la pista de modelos a gran escala de IA incluyen gigantes de Internet representados por Ali, Tencent, Baidu, etc. El 16 de marzo, Baidu abrió el camino y lanzó la versión china de ChatGPT "文心一言". Posteriormente, modelos grandes como Ali, Huawei, Tencent y 360 aparecieron uno tras otro.

Además, hay empresas de tecnología de IA representadas por SenseTime e iFLYTEK, empresas educativas como Kidswant, empresas financieras como Flush y empresas inmobiliarias como I Love My Home. Además, los modelos grandes también son muy populares en el mundo académico. En febrero de este año, la Universidad de Fudan lanzó MOSS, el primer modelo similar a ChatGPT en China.

Vale la pena señalar que con la popularidad de ChatGPT, también ha habido un auge en el emprendimiento a gran escala de IA en China. Muchos líderes tecnológicos y ejecutivos de las principales empresas se han dedicado a modelos a gran escala y han comenzado a volver a emprender.

En febrero de 2023, Wang Huiwen, ex cofundador de Meituan, lanzó la "Lista de héroes de IA", una entrada de alto perfil en el modelo grande de IA; también entró de alto perfil Li Kaifu, director ejecutivo de Sinovation Empresas El 19 de marzo, Li Kaifu anunció en el círculo de amigos Estableció la compañía Proyecto AI 2.0 e ingresó al modelo de IA a gran escala; posteriormente, el fundador de Sogou, Wang Xiaochuan, el ex pionero de negocios de IA de JD.com, Zhou Bowen, y Momenwen El director ejecutivo Li Zhifei también se unió al auge empresarial del modelo a gran escala de IA.

Además de estos gigantes tecnológicos, muchos ejecutivos de las principales empresas de Internet también se han sumado a la competencia. Por ejemplo, Li Yan, una antigua figura central de IA de Kuaishou, estableció la empresa de IA Yuanshi Technology para llevar a cabo la investigación y el desarrollo de modelos grandes multimodales, el "discípulo cerrado" de Li Kaifu y el No. Remodelar el modelo de humano de Yitu Technology. -Interacción con la computadora. Hoy en día, la "pelea de hadas" a gran escala de la IA doméstica, la pista de la industria es muy animada.

Las instituciones de inversión son cautelosas y el mercado recluta talentos en el campo de modelos grandes con salarios altos

Para ingresar al modelo grande, primero debe preparar dinero.Después de todo, una empresa emergente modelo grande lanza un modelo relativamente maduro, que necesita invertir en el costo de la infraestructura del modelo de lenguaje grande, capacitación y talentos de I + D. Para las empresas emergentes, la financiación es la única forma de sobrevivir.

Según las estadísticas incompletas de Titanium Media·Tidu Tuwen, al 4 de julio de 2023, el monto de financiamiento de las empresas emergentes a gran escala de IA que han obtenido financiamiento este año es generalmente entre decenas y cientos de millones. Entre ellos, MiniMax, una empresa de puesta en marcha modelo a gran escala que recibió la mayor parte de la financiación, completó una nueva ronda de financiación superior a los 250 millones de dólares el 1 de junio. La valoración actual de la empresa supera los 1.200 millones de dólares y se denomina "la primera inversión. Título "Emprendimiento".

Además, Guangnianwai, que acaba de ser adquirida por Meituan, completó su ronda A de financiamiento de US$230 millones el 5 de junio, pero luego de completar la adquisición por parte de Meituan, esta ronda de financiamiento también se devolvió en su totalidad. Vale la pena mencionar que Xihu Xinchen, establecida en 2021, completó dos financiamientos consecutivos en marzo y abril de este año, y la velocidad de financiamiento es muy rápida.

En el modelo de inversión a gran escala de IA, los principales VC como IDG Capital, Matrix Partners y ZhenFund han hecho menos movimientos.

Según las estadísticas incompletas de Titanium Media y Titanium News, Tencent Investment, Innovation Works, Qiji Chuangtan y Sequoia China son las instituciones de inversión más activas, con tres empresas de inversión, seguidas de BV Baidu Ventures y Zhipu AI, las empresas de inversión son 2 respectivamente. , y la mayoría de las instituciones invierten en solo 1 empresa, y Hillhouse Venture Capital y Shenzhen Venture Capital, que siempre han estado activos, no tienen datos públicos que demuestren que han invertido en pistas de modelos a gran escala de IA. Se puede ver que los inversores están interesados en La pista del emprendimiento modelo a gran escala es más cautelosa.

Además de la financiación, las capacidades técnicas también están en el centro de la competencia de modelos a gran escala. Los modelos grandes tienen altos requisitos de algoritmos, poder de cómputo y datos. Los modelos grandes de IA requieren altos costos de capacitación e inversión en I + D. Algunas de las principales empresas de Internet y empresas de tecnología tienen mayores reservas técnicas y de capital.

Según las estadísticas incompletas de Titanium Media·Tidu Tuwen, en 2022, Huawei invertirá 161.500 millones de yuanes en gastos de I+D, convirtiéndose en la empresa con más fondos de inversión en I+D; en segundo lugar, Tencent ocupa el segundo lugar con 61.400 millones de yuanes y Ali con 55,5 mil millones de yuanes tercero. Los gigantes de Internet invierten decenas de miles de millones de dólares en investigación y desarrollo cada año. Además, también tienen un sólido equipo de investigación y desarrollo. Son jugadores de "primer escalón" bien merecidos en la pista de modelos a gran escala.

Además del capital y la tecnología, el talento también es una parte indispensable de la competencia de modelos a gran escala.

En el primer trimestre de este año, varias empresas lanzaron un concurso para los mejores talentos de IA. Wang Huiwen dijo que usaría el 75% de las acciones para invitar a los mejores talentos de I + D. Li Kaifu pidió reclutar talentos de clase mundial en todo el mundo. Baidu reclutó ingenieros de algoritmos de modelos a gran escala de IA con un salario de 25-40k / mes, y contrató ingenieros de arquitectura de modelos con un salario de 20-40k/mes; Ali contrata ingenieros de formación de modelos y algoritmos a gran escala con un salario de 40-70k/mes, y las principales empresas están ansiosas por talentos.

Datos relevantes muestran que en el primer trimestre de este año, el número de puestos relacionados con modelos grandes de IA aumentó un 10,16% interanual, que es el campo con mayor crecimiento relacionado con ChatGPT, entre ellos, el salario medio anual. de ingenieros de algoritmos y aprendizaje automático ha alcanzado más de 400.000 yuanes. .

Los desafíos de desarrollo de modelos a gran escala fabricados en China todavía tienen algunas áreas que superan a los modelos internacionales

En los últimos seis meses, se han lanzado modelos grandes uno tras otro. ¿Cuál es su fuerza actual? De acuerdo con la evaluación de 10 modelos de IA a gran escala en el país y en el extranjero por parte de instituciones relevantes, ChatGPT tiene una ventaja general relativamente obvia, ocupando el primer lugar en términos de datos completos. En términos de subsectores, el modelo doméstico a gran escala supera al modelo extranjero en términos de comprensión de palabras y oraciones y preguntas de conocimiento, es decir, el modelo doméstico de IA a gran escala tiene una cognición básica más sólida y una capacidad de aprendizaje para el texto.

Entre los seis modelos domésticos a gran escala, el rendimiento integral de los datos de "Wen Xin Yi Yan" es relativamente excelente, especialmente liderando los modelos domésticos de lenguaje grande en términos de comprensión de palabras y oraciones, programación, preguntas de conocimiento y traducción; en términos de negocios escritura, los productos nacionales funcionan mejor El mejor es "Xunfei Xinghuo"; en términos de preguntas de literatura, el producto nacional "Tiangong 3.5" tiene la tasa de puntuación más alta de 88.33%, que está a la par con ChatGPT; en términos de razonamiento lógico, "Wenxinyiyan" y "Xunfei "Spark" se desempeñaron bastante bien.

Los modelos domésticos a gran escala funcionan muy bien en algunos campos subdivididos, pero todavía hay una cierta brecha con los productos extranjeros del mismo tipo, y todavía hay mucho margen de mejora en las tecnologías centrales, como los datos y los escenarios de aterrizaje.

A nivel de datos, el desarrollo de modelos grandes requiere conjuntos de datos de entrenamiento de alta calidad. En la actualidad, la cantidad total de datos chinos necesarios para el entrenamiento de modelos a gran escala basados en la semántica china en China es insuficiente y la calidad no es alta. La escasez de corpus de entrenamiento de modelos chinos a gran escala de alta calidad también amplía la brecha.

En términos de poder de cómputo, según la capacidad del centro de datos, las empresas líderes en este campo en 2022 son Google, Microsoft, Amazon y Meta. Estas cuatro plataformas de centros de datos representan más del 70% de la capacidad total de datos de construcción propia. centros en el mundo; y En la actualidad, aunque algunas empresas tecnológicas líderes como Alibaba, Baidu y Tencent han completado la construcción de centros de datos en China, todavía existe una cierta brecha en términos de capacidad en comparación con países extranjeros.

En términos de escenarios de aterrizaje, el costo de aterrizar en diferentes escenarios de subdivisión también es un problema. Para obtener un modelo grande lo suficientemente efectivo y fácil de usar, se debe invertir un corpus suficiente y específico, lo que significa que la implementación de diferentes escenarios de subdivisión requiere una gran inversión de costos.

Se estima que el costo de entrenar un modelo grande está entre US$2 millones y US$12 millones. Debido a los altos costos de capacitación, la empresa de desarrollo de inteligencia artificial OpenAI perderá alrededor de 540 millones de dólares estadounidenses en 2022. Por lo tanto, llevará tiempo la realización comercial de modelos grandes de IA.

En esta pista altamente competitiva, aunque hay muchas dificultades, los grandes modelos domésticos se están moviendo hacia una dirección técnica más perfecta. Además, la competencia en la pista también acelerará el ritmo de desarrollo de la tecnología de modelos domésticos a gran escala y promoverá la mejora tecnológica general de la industria de IA de China.

*Fuente de datos: Investigación de estructura, Centro de investigación InfoQ, Big Data de Liepin, "Informe de investigación de mapa de modelo grande de inteligencia artificial de China" y otra información pública no están completamente compilados.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)