Qiming Venture Partners: GPT4 nacerá en China a más tardar en 2024, y el texto largo es la clave para modelos de idiomas grandes

Autor: Zhao Ying

Fuente de la imagen: Generada por la herramienta de IA Unbounded

El viernes 7 de julio, segundo día de la Conferencia Mundial de Inteligencia Artificial, Zhou Zhifeng, socio de Qiming Venture Partners, compartió sobre el modelo de IA y la tendencia de desarrollo de toda la industria.

Qiming Venture Capital es una de las primeras instituciones de capital de riesgo en China que presta atención y es más activa en el campo de la IA. Sus empresas de inversión están ubicadas a lo largo de toda la cadena ecológica de la IA. Las etapas ascendente, intermedia y descendente en realidad tienen diseños, como chips, software básico y como modelos grandes y aplicaciones verticales posteriores, etc.

El primer principio de los modelos grandes es comprimir el conocimiento, la información y los datos digitales

Zhou Zhifeng enfatizó que el poder de cómputo a gran escala y los datos a gran escala son muy importantes para el desarrollo futuro de la IA. **

**El primer principio del entrenamiento a gran escala es comprimir toda la información y los datos del conocimiento digitalizado en el mundo humano a gran escala. ** Puede ver en este primer principio que el poder de cómputo a gran escala y los datos a gran escala son muy importantes para el desarrollo futuro de la IA y, de hecho, el poder de cómputo a gran escala y los datos a gran escala son los chips de los seres humanos en el pasado. 40 años Estas tecnologías se acumulan continuamente en varios campos de los grandes datos de Internet y luego promueven la explosión de la IA. Generación de aprendizaje previo a la capacitación a gran escala, la lógica subyacente de toda la tendencia es realmente muy clara y continuará desarrollándose a gran velocidad en el futuro.La industria del capital de riesgo llama AI1.0 al aprendizaje profundo, principalmente porque está dirigido a una pequeña tarea específica. Un pequeño modelo entrenado a partir de un pequeño conjunto de datos específico, y es principalmente reconocimiento de patrones, como reconocimiento facial y reconocimiento de voz. El aprendizaje del campo del habla a gran escala de hoy en día se conoce más comúnmente como AI2. 0, principalmente porque es general El gran modelo entrenado por los datos tiene la capacidad de generar toma de decisiones.

La ola de AI2.0 reconstruirá toda la estructura industrial

Zhou Zhifeng señaló además que la nueva ola de AI2.0 reconstruirá toda la estructura industrial. Toda la estructura ecológica se dividirá en tres capas, la capa inferior es la capa de infraestructura, el lado derecho proporciona potencia de cómputo, como el motor de volcán aws, Alibaba Cloud, etc. están proporcionando tales plataformas de centro de cómputo, el lado derecho es la herramienta cadena, y principalmente para modelos grandes Optimice el entrenamiento, el razonamiento y la implementación.

La capa intermedia es la más importante. La primera capa es la capa del modelo. La capa del modelo también tiene varios modos. El primero es proporcionar el modelo base del modelo básico, luego exportar el modelo al mundo exterior y personalizar el modelo a través de la API.

Luego hay otro tipo de modelo grande autoconstruido. Después de hacer su propio modelo grande, lo optimizará para un escenario específico de la industria y luego proporcionará una solución integral desde el modelo hasta la aplicación.

En la tercera capa de la capa de aplicación, se trata de implementar directamente la aplicación vertical a través de modelos construidos por ellos mismos. Quizás el 80~90 % de las empresas de la izquierda son aquellas que usan las capacidades de modelos de terceros para construir escenarios familiares o industrias Una aplicación, **Esta es la arquitectura de tres niveles que entendemos. De hecho, esta nueva arquitectura también ha provocado grandes cambios en la forma en que todo el mundo construye productos. ** El lado izquierdo es en realidad las últimas décadas. Ya sea un automóvil o un software social de Internet, en realidad es una estructura de este tipo, es decir, el gerente de producto obtiene las necesidades del usuario y el desarrollador obtiene el diseño del gerente de producto, y luego el usuario lo usa Productos desarrollados para usar.

En el pasado, Tencent hizo un buen trabajo, Alibaba hizo un buen trabajo y cualquier empresa hizo un buen trabajo. En cierto sentido, dijo que giró el volante de manera más efectiva y pudo iterar continuamente el volante.

Hay dos tipos de empresas futuras: +AI, AI+

En lo que respecta al desarrollo industrial, Zhou Zhifeng señaló que las futuras empresas se dividirán en dos tipos: +AI e AI+.

En el futuro, se tratará más de poner las capacidades de la nueva generación de IA en el flujo de trabajo, **en realidad es una mejora de la escena anterior. ** Hay otra categoría en la que usará esta habilidad para crear un nuevo producto, que en realidad es una aplicación de la llamada IA nativa, que yo llamo la remodelación de escenas antiguas o la creación de nuevas escenas. **

En la actualidad, todavía hay algunas empresas de IA muy líderes, principalmente porque la IA no se ha dado cuenta de una situación tan real de empoderamiento de todas las industrias, y su industrialización no es satisfactoria. Zhou Zhifeng dijo:

ChatGTP ha reavivado la ola de AI 2.0. Puede ver que todo el monto global de financiamiento ha experimentado un tremendo desarrollo. Esta vez será una burbuja que dura dos años y luego se desploma, o realmente avanzará y se desarrollará Para una inteligencia artificial general, creo que esta es una pregunta muy valiosa.

El modelo grande definitivamente se volverá cada vez más poderoso. El CEO de OpenAI también dijo que pueden involucrarse en productos como Microsoft y hacer un producto de productividad de oficina. También anhelan un espacio más amplio. ¿Podemos encontrar un modelo dorado? canal para iniciar su propio negocio, y finalmente ir a un vasto mundo?

Tal vez la realidad sea así, el camino que tenemos que recorrer puede ser un cañón de la muerte, ambos lados estarán constantemente exprimidos, su tecnología está cambiando dinámicamente, ¿cómo podemos atravesar este cañón de la muerte? Tenemos que usar nuestro pensamiento racional y trabajar duro para pensar.

Cada ola de tecnología definitivamente dará a luz a nuevos reyes y nuevas grandes empresas.

Perspectivas para diez tendencias de desarrollo de IA

Mirando hacia el futuro, Qiming Venture Partners se asoció con Unfinished Research para publicar conjuntamente un informe de gran éxito "IA generativa" | Estado de la IA generativa 2023 y resumió diez tendencias de desarrollo:

Primero, según la información que hemos visto sobre las empresas en las que Qiming invirtió, sabemos que en 2024 o incluso antes, China definitivamente tendrá un modelo multilingüe comparable a GTP 4. Hemos visto claramente el progreso de varias empresas en esta dirección.

En segundo lugar, el contexto largo definitivamente será un punto clave en el desarrollo de la próxima generación de modelos de lenguaje a gran escala. Veremos que en realidad puede tener una comunicación contextual con un modelo grande durante varios días y meses, en lugar de solo hablar durante 3 rondas y 5 rondas hoy.

Tercero, creemos que hay varias formas de hacer un modelo vertical grande, de hecho, hemos resumido 5 métodos.

En cuarto lugar, creemos que aunque la difusión estable actual es una arquitectura de modelo de difusión muy buena, creemos que ya sea estabilidad u otras empresas, surgirá un nuevo modelo en los próximos dos años.

Quinto, el modelo de texto a imagen será más controlable en el futuro, y hemos visto que muchos de los mejores equipos de la industria han hecho algunos avances científicos en esta área.

**Sexto, el tercer y cuarto trimestre de este año serán un punto de avance para la generación de música **Creemos que habrá un gran avance en la generación de v6 y 3D el próximo año.

Séptimo, habrá un gran desarrollo en la inteligencia de cómo combinar grandes modelos de lenguaje con robots de control del espacio físico real y robots humanoides.

Octavo, aunque la transformación es ahora la corriente principal, como dije, el objetivo final de la IA es utilizar el mejor método para comprimir la información digital de todos los seres humanos. **La transformación definitivamente no es el final, y aparecerán arquitecturas más avanzadas. . ** Noveno, desde una perspectiva comercial, creemos que en los próximos tres años, las capacidades y aplicaciones del modelo no se pueden desacoplar, y las aplicaciones verdaderamente disruptivas deben provenir de aquellas empresas que han dominado las capacidades básicas de investigación y desarrollo del modelo subyacente, en lugar de empresas puras de aplicaciones. , me refiero a aplicaciones disruptivas, porque no vemos esta posibilidad de desacoplamiento en tres años.

Décimo, todavía es un período dorado que puede producir empresas de plataforma. Creemos que algunas empresas de nueva creación establecidas en los próximos tres años pueden convertirse en una empresa con un valor de mercado de 100 mil millones de billones.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)