Pensamiento frío de IA bajo el auge de la "guerra de los mil modelos"

Fuente original: Noticias financieras internacionales

Aunque la Conferencia Mundial de Inteligencia Artificial de 2023 ha finalizado, el auge de los modelos a gran escala iniciado por ChatGPT seguirá aumentando, y el diseño y la exploración de la inteligencia artificial también serán un tema importante en los últimos años. "Ir primero a la mesa" y "dar el primer paso" son el consenso de la industria que desencadenó esta ronda de aumento de la "guerra de los 100 modelos" y llevó a la industria a la "guerra de los 1000 modelos".

Fuente de la imagen: Generada por Unbounded AI‌

A principios de julio, hubo un auge de la inteligencia artificial en Shanghái. La **Conferencia Mundial de Inteligencia Artificial 2023 ha alcanzado el mayor número de expositores y área de exposición de la historia. Muchas empresas anunciaron en la conferencia que lanzarán grandes modelos de IA. ** La alta temperatura y el fuerte clima convectivo no lograron disipar el entusiasmo de todos. La puerta de la exposición una vez atrajo revendedores para vender boletos, y muchas personas ayudaron a los viejos y jóvenes a explorar la tendencia de desarrollo de vanguardia de la inteligencia artificial.

Bajo el auge, ** también debería ver con calma que el modelo grande aún enfrenta problemas centrales como la solidez, el cumplimiento y la credibilidad. **En comparación con los países desarrollados, mi país todavía tiene una brecha en chips, poder de cómputo, datos, etc. La escasez de datos es un problema importante que afecta la aplicación de modelos grandes. Entre ellos, la dificultad de obtener datos corpus chinos de alta calidad grandes modelos domésticos un factor importante en el desarrollo.

En la etapa actual, cuando aún no se han superado los problemas centrales y se está cerrando la brecha, ¿qué tipo de camino de desarrollo debería explorar el desarrollo de la IA de China? Durante el foro de tres días y las entrevistas con muchos expertos de la industria participantes, la mayoría de las respuestas que obtuvo el reportero fueron "integración vertical" y "aplicación de aterrizaje". Tendencia de desarrollo de IA.

"Ve primero a la mesa"

En la actualidad, el desarrollo de la economía digital se ha convertido en un consenso mundial. Como tecnología emergente estratégica, la inteligencia artificial se está convirtiendo cada vez más en la fuerza motriz principal para la modernización industrial y la mejora de la productividad. En noviembre de 2022, OpenAI lanzó ChatGPT, un modelo de inteligencia artificial de propósito general conversacional a gran escala. Se lanzó una nueva ronda de auge de la innovación de IA en todo el mundo.

**En la Conferencia Mundial de Inteligencia Artificial de 2023, el modelo grande es el papel principal. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General y modelos grandes verticales como Tuotian y Daguan "Cao Zhi" son vertiginosos.

Lin Jianming, fundador y presidente de Samoyed Cloud Technology Group, señaló en una entrevista con un reportero de International Finance News que **IA se encuentra en el punto de partida de una nueva ronda de tendencias industriales. ** Desde la perspectiva del diseño del modelo grande, Baidu, Ali, Huawei y otros "jugadores de gama alta" llevan a cabo un diseño "cuatro en uno" desde la capa de potencia informática, la capa de plataforma, la capa de modelo y capa de aplicación; las instituciones de investigación científica y las empresas de tecnología de puesta en marcha han encontrado otra forma, el punto de entrada es desarrollar algoritmos modelo a gran escala y aplicaciones de campo subdivididas.

Lin Jianming dijo que los parámetros del modelo doméstico a gran escala actual están básicamente en la escala de 100 mil millones o más. En términos de dirección de la aplicación, la mayoría de las empresas se enfocan en las aplicaciones internas en la etapa inicial y se extienden gradualmente a las empresas B-end. **La tecnología de inteligencia artificial continúa logrando avances. Los grandes fabricantes y las pequeñas y medianas empresas de tecnología compiten por modelos grandes. Naturalmente, nadie quiere perderse la gran ola de esta era. Solo al "ir primero a la mesa" puede captar la "carta de triunfo" de las reglas. En el contexto de la disminución de los dividendos de Internet móvil, se espera que la elección de adoptar modelos grandes traiga nuevos puntos de crecimiento.

Zhou Bowen, miembro de IEEE/CAAI, profesor titular de la cátedra Huiyan de la Universidad de Tsinghua, profesor titular del Departamento de Electrónica y fundador de Lianyuan Technology, dijo al reportero de "International Finance News" que **China debería adoptar un sistema a gran escala basado en sobre "innovación independiente, seguridad y capacidad de control". La ruta de desarrollo del modelo de lenguaje y la tecnología de inteligencia artificial generativa se centra en promover la amplia aplicación de modelos grandes con capacidades de propósito general en industrias verticales. **Además, las aplicaciones comerciales, la innovación académica y la ecología tecnológica deben diversificarse y no pueden concentrarse completamente en un modelo grande, ni deben usar una sola forma de pensar para hacer las cosas.

Múltiples desafíos

Bajo el auge de la IA, los modelos grandes aún enfrentan múltiples desafíos, como la solidez, el cumplimiento y la credibilidad. Lin Jianming dijo sin rodeos que, en comparación con el mundo, especialmente con Estados Unidos, todavía tenemos una cierta brecha en chips de IA, patentes, investigación de algoritmos y un ecosistema de innovación maduro. **Los principales factores que restringen el desarrollo de modelos domésticos a gran escala son: primero, los modelos grandes requieren una gran potencia de cómputo, y tenemos deficiencias en los chips y la potencia de cómputo; segundo, la falta de datos corpus chinos de alta calidad y datos de la industria; tercero , el número de profesionales Raro, la innovación en investigación básica no es suficiente.

"La industria financiera es una existencia especial con requisitos muy altos para la gestión de riesgos y la seguridad. Los desafíos del riesgo de confianza, el riesgo de modelo, la ética, la estabilidad, la precisión, la seguridad de los datos, el cumplimiento y otros riesgos que enfrenta la investigación y el desarrollo de grandes modelos financieros son más graves ", señaló Lin Jianming.

Jiang Ning, subdirector general y director de información de Mama Consumer, dijo en una entrevista con un reportero de International Finance News que el modelo grande de **IA aún enfrenta problemas centrales como la adaptabilidad dinámica, la solidez, el cumplimiento y la credibilidad en las decisiones clave. , Cómo eliminar el ruido y los problemas de interferencia, en situaciones repentinas e impredecibles, es especialmente crítico para lograr una estabilidad continua y el cumplimiento y la credibilidad de las decisiones clave. **

Jiang Ning señaló que los modelos domésticos a gran escala carecen de avances originales, y todavía hay brechas en la capacidad de razonamiento del modelo y la capacidad de generación de modelos a gran escala. La dificultad de obtener datos corpus chinos a gran escala y de alta calidad es un factor importante que restringe el desarrollo de modelos a gran escala en China. Específico del campo financiero, también enfrenta muchos desafíos, como la protección de la privacidad, la estabilidad continua, el cumplimiento y la credibilidad.

Zhou Bowen cree que en el entrenamiento actual de grandes modelos de IA, el lado del algoritmo converge con el modelo de red neuronal Transformer, el lado de la potencia de cómputo se basa en clústeres de servidores de IA con capacidades de cómputo paralelo a gran escala, y el lado de los datos necesita alimentar grandes escalar conjuntos de datos con una gran cantidad de datos Desde la perspectiva de los tres elementos de la IA, la escasez de datos es obviamente un problema importante que conduce a la implementación de aplicaciones de modelos a gran escala. Los campos específicos, como la industria financiera, que tienen requisitos extremadamente estrictos para la seguridad de los datos y la protección de la privacidad del usuario, también plantean una serie de desafíos para los modelos grandes, como la confiabilidad, la controlabilidad autónoma y la seguridad sólida.

Zhou Bowen dijo que la industrialización de modelos a gran escala también enfrenta desafíos: primero, la escala de datos es grande y la calidad de los datos es desigual, segundo, el modelo es de gran tamaño y difícil de entrenar; ** Por lo tanto, el desarrollo de modelos grandes depende del soporte integral de datos y poder de cómputo de algoritmos. Los modelos grandes son el foco del futuro desarrollo industrial, pero vale la pena explorar el modelo comercial de los modelos grandes. Debido a que las barreras de costos de los modelos grandes son muy altas, tanto las empresas grandes como las pequeñas tienen sus propias cargas.

Integración vertical

En la etapa actual, cuando aún no se han superado los problemas centrales y se está cerrando la brecha, ¿qué tipo de camino de desarrollo debería explorar el desarrollo de la IA de China? ¿Qué otras oportunidades de desarrollo hay? Jiang Ning señaló que la construcción de un sistema de IA combinado es una tendencia de desarrollo, que combina de manera efectiva la usabilidad y la profesionalidad de los modelos discriminativos en varios campos verticales, y las características del aprendizaje de transferencia y las capacidades de generalización de los grandes modelos generativos, para que sea verdaderamente popular. en la industria Aproveche la capacidad de generalización de modelos grandes.

Lin Jianming señaló que, en el futuro, los modelos a gran escala tendrán un gran potencial en el proceso de inteligencia digital de ciudades, industrias y empresas. El diseño nacional de los modelos grandes debe fortalecer las capacidades de innovación independientes, mejorar la competitividad central de los modelos grandes desde varios niveles, como el poder de cómputo, los algoritmos y los talentos, y también combinar estrechamente las necesidades estratégicas nacionales y las direcciones de desarrollo de la industria para explorar los puntos débiles de la industria y escenarios en profundidad.

Además, "es necesario utilizar su propia tecnología, escenarios, datos de usuario e industria y Know-How de la industria (secretos de la industria) para crear un modelo grande en el campo vertical; use el modelo especial 'modelo general + Know-How de la industria ' para potenciar la economía real y establecer su propia ventaja de barreras." Dijo Lin Jianming.

Zhou Bowen cree que la industria de modelos a gran escala en China debe comenzar de principio a fin y desarrollar iterativamente modelos comerciales más grandes, lo que puede ser un enfoque más adecuado. Sobre la base de tener capacidades generales, la formación continua en campos verticales para mejorar las capacidades profesionales de los modelos grandes es un medio importante para ayudar al desarrollo y progreso de los modelos grandes en el futuro. **

Zhou Bowen señaló que desde una perspectiva teórica y técnica, deben existir diferencias. En el desarrollo de la IA, por un lado, somos receptores a nivel técnico y, por otro lado, es probable que nos convirtamos en innovadores e incluso líderes en el nivel de aplicación. **La IA de China necesita explorar un nuevo camino, es decir, integrarse verticalmente desde el modelo general de desarrollo propio hasta la aplicación y el circuito cerrado de escenario completo del usuario, a fin de realizar el "aterrizaje dual" de la inteligencia artificial generativa tecnología y valor comercial. **

Para la competencia empresarial, Zhou Bowen cree que se puede dividir en tres rutas: la primera ruta es construir un modelo subyacente a gran escala con capacidades generales, desde algoritmos técnicos hasta iteración de modelos y circuito cerrado de escena; la segunda ruta se basa en los modelos de otras personas (como GPT), y luego combinar su propio conocimiento de la industria para hacer capacitación; la tercera ruta es puramente para la aplicación, que es usar el modelo directamente, y esta barrera será menor.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)