Bien que la Conférence mondiale sur l'intelligence artificielle 2023 soit terminée, le boom des modèles à grande échelle initié par ChatGPT va continuer à augmenter, et la mise en page et l'exploration de l'intelligence artificielle seront également un thème majeur ces dernières années. "Allez d'abord à la table" et "faites le premier pas" sont le consensus de l'industrie qui a déclenché cette recrudescence de la "guerre des 100 modèles" et conduit l'industrie dans la "guerre des 1000 modèles".
Source de l'image : générée par l'IA illimitée
Début juillet, il y a eu un boom de l'intelligence artificielle à Shanghai. La Conférence mondiale sur l'intelligence artificielle 2023 a atteint le plus grand nombre d'exposants et de surface d'exposition jamais enregistré. De nombreuses entreprises ont annoncé lors de la conférence qu'elles publieraient de grands modèles d'IA. ** La température élevée et la forte convection n'ont pas réussi à dissiper l'enthousiasme de tous. La porte de l'exposition attirait autrefois les scalpeurs pour vendre des billets, et de nombreuses personnes ont aidé les jeunes et les moins jeunes à explorer la tendance de développement de pointe de l'intelligence artificielle.
Sous la recrudescence, ** devrait également voir sereinement que le grand modèle est toujours confronté à des problèmes de base tels que la robustesse, la conformité et la crédibilité. **Par rapport aux pays développés, mon pays a encore un déficit de puces, de puissance de calcul, de données, etc. La rareté des données est un problème majeur affectant l'application des grands modèles. les grands modèles domestiques un facteur majeur de développement.
Au stade actuel, alors que les problèmes fondamentaux n'ont pas encore été résolus et que le fossé est en train d'être comblé, quel type de voie de développement le développement de l'IA en Chine devrait-il explorer ? Au cours du forum de trois jours et des entretiens avec de nombreux experts de l'industrie participants, les réponses les plus fréquentes au journaliste ont été "l'intégration verticale" et "l'application d'atterrissage".
"Allez d'abord à la table"
À l'heure actuelle, le développement de l'économie numérique est devenu un consensus mondial. En tant que technologie émergente stratégique, l'intelligence artificielle devient de plus en plus le principal moteur de la modernisation industrielle et de l'amélioration de la productivité. En novembre 2022, OpenAI a lancé ChatGPT, un modèle d'intelligence artificielle conversationnelle à grande échelle à usage général.
** Lors de la Conférence mondiale sur l'intelligence artificielle 2023, le grand modèle tient le rôle principal. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General et grands modèles verticaux tels que Tuotian et Daguan "Cao Zhi" sont vertigineux.
Lin Jianming, fondateur et président du Samoyed Cloud Technology Group, a souligné dans une interview avec un journaliste d'International Finance News que l'IA ** est au point de départ d'un nouveau cycle de tendances industrielles. ** Du point de vue de la disposition du grand modèle, Baidu, Ali, Huawei et d'autres "acteurs haut de gamme" réalisent une disposition "quatre en un" à partir de la couche de puissance de calcul, de la couche de plate-forme, de la couche de modèle et couche d'application ; les instituts de recherche scientifique et les start-ups technologiques ont trouvé un autre moyen, Le point d'entrée est de développer des algorithmes modèles à grande échelle et des applications de terrain subdivisées.
Lin Jianming a déclaré que les paramètres actuels du modèle national à grande échelle sont essentiellement de l'ordre de 100 milliards ou plus.En termes de direction d'application, la plupart des entreprises se concentrent sur les applications internes au stade précoce et s'étendent progressivement aux entreprises B-end. **La technologie de l'intelligence artificielle continue de faire des percées. Les grands fabricants et les petites et moyennes entreprises technologiques se disputent les grands modèles. Naturellement, personne ne veut manquer la grande vague de cette ère. Ce n'est qu'en "passant d'abord à la table" que vous pourrez saisir "l'atout" des règles. Dans le contexte de l'effritement des dividendes de l'Internet mobile, le choix d'embrasser les grands modèles devrait apporter de nouveaux points de croissance.
Zhou Bowen, membre IEEE/CAAI, professeur titulaire de la chaire Huiyan de l'Université Tsinghua, professeur titulaire du département d'électronique et fondateur de Lianyuan Technology, a déclaré au journaliste de "International Finance News" que ** la Chine devrait adopter un système à grande échelle basé sur sur "l'innovation indépendante, la sécurité et la contrôlabilité". La voie de développement du modèle de langage et de la technologie d'intelligence artificielle générative se concentre sur la promotion de l'application à grande échelle de grands modèles dotés de capacités à usage général dans les industries verticales. **En outre, les applications métier, l'innovation académique et l'écologie technologique doivent toutes être diversifiées et ne peuvent pas être complètement concentrées sur un grand modèle, ni utiliser une même façon de penser pour faire les choses.
Défis multiples
Sous la montée en puissance de l'IA, les grands modèles sont toujours confrontés à de multiples défis tels que la robustesse, la conformité et la crédibilité. Lin Jianming a déclaré sans ambages que par rapport au monde, en particulier aux États-Unis, nous avons encore un certain écart en matière de puces d'IA, de brevets, de recherche d'algorithmes et d'un écosystème d'innovation mature. **Les principaux facteurs limitant le développement de modèles nationaux à grande échelle sont : premièrement, les grands modèles nécessitent une grande puissance de calcul, et nous avons des lacunes en matière de puces et de puissance de calcul ; deuxièmement, le manque de données de corpus chinois de haute qualité et de données de l'industrie ; troisièmement , le nombre de professionnels Rare, l'innovation de la recherche fondamentale ne suffit pas.
"L'industrie financière est une existence particulière avec des exigences très élevées en matière de gestion des risques et de sécurité. Les défis du risque de confiance, du risque de modèle, de l'éthique, de la stabilité, de l'exactitude, de la sécurité des données, de la conformité et d'autres risques auxquels sont confrontés la recherche et le développement de grands modèles financiers sont plus sévères. » a souligné Lin Jianming.
Jiang Ning, directeur général adjoint et directeur de l'information de Mama Consumer, a déclaré dans une interview avec un journaliste d'International Finance News que le grand modèle d'IA ** est toujours confronté à des problèmes fondamentaux tels que l'adaptabilité dynamique, la robustesse, la conformité et la crédibilité dans les décisions clés. , Comment éliminer le bruit et les problèmes d'interférence, dans des situations soudaines et imprévisibles, il est particulièrement essentiel d'atteindre une stabilité continue et la conformité et la crédibilité des décisions clés. **
Jiang Ning a souligné que les modèles nationaux à grande échelle manquent de percées originales et qu'il existe encore des lacunes dans la capacité de raisonnement des modèles et la capacité de génération de modèles à grande échelle. La difficulté d'obtenir des données de corpus chinois à grande échelle et de haute qualité est un facteur majeur limitant le développement de modèles à grande échelle en Chine. Spécifique au domaine financier, elle fait également face à de nombreux défis tels que la protection de la vie privée, la stabilité continue, la conformité et la crédibilité.
Zhou Bowen pense que dans la formation actuelle de grands modèles d'IA, le côté algorithme converge vers le modèle de transformateur de réseau neuronal, le côté puissance de calcul repose sur des clusters de serveurs d'IA avec des capacités de calcul parallèle à grande échelle, et le côté données doit alimenter de grandes des ensembles de données à l'échelle avec une énorme quantité de données Du point de vue des trois éléments de l'IA, la rareté des données est évidemment un problème majeur conduisant à la mise en œuvre d'applications de modèles à grande échelle. Des domaines spécifiques tels que l'industrie financière, qui ont des exigences extrêmement strictes en matière de sécurité des données et de protection de la vie privée des utilisateurs, posent également une série de défis aux grands modèles tels que la fiabilité, la contrôlabilité autonome et la sécurité renforcée.
Zhou Bowen a déclaré que l'industrialisation des modèles à grande échelle est également confrontée à des défis : premièrement, l'échelle des données est grande et la qualité des données est inégale ; deuxièmement, le modèle est de grande taille et difficile à former ; ** Par conséquent, le développement de grands modèles dépend de la prise en charge complète de la puissance de calcul des algorithmes et des données. Les grands modèles sont au centre du développement industriel futur, mais le modèle commercial des grands modèles mérite d'être exploré. Parce que les barrières de coûts des grands modèles sont très élevées, les grandes entreprises et les petites entreprises ont leurs propres charges.
Intégration verticale
Au stade actuel, alors que les problèmes fondamentaux n'ont pas encore été résolus et que le fossé est en train d'être comblé, quel type de voie de développement le développement de l'IA en Chine devrait-il explorer ? Quelles sont les autres opportunités de développement ? Jiang Ning a souligné que la construction d'un système d'IA combiné est une tendance de développement, combinant efficacement la convivialité et le professionnalisme des modèles discriminants dans divers domaines verticaux, et les caractéristiques des capacités d'apprentissage par transfert et de généralisation des grands modèles génératifs, de sorte qu'il sera vraiment populaire. Profitez de la capacité de généralisation des grands modèles.
Lin Jianming a souligné qu'à l'avenir, les modèles à grande échelle auront un grand potentiel dans le processus d'intelligence numérique des villes, des industries et des entreprises. La disposition nationale des grands modèles doit renforcer les capacités d'innovation indépendantes, améliorer la compétitivité de base des grands modèles à différents niveaux tels que la puissance de calcul, les algorithmes et les talents, et également combiner étroitement les besoins stratégiques nationaux et les orientations de développement de l'industrie pour explorer les points faibles de l'industrie et scénarios en profondeur.
De plus, "il est nécessaire d'utiliser sa propre technologie, ses scénarios, ses données d'utilisateur et d'industrie et son savoir-faire industriel (secrets industriels) pour créer un grand modèle dans le domaine vertical ; utiliser le modèle spécial "modèle général + savoir-faire industriel". ' pour renforcer l'économie réelle et établir son propre avantage en matière de barrières", a déclaré Lin Jianming.
Zhou Bowen estime que l'industrie du modèle à grande échelle en Chine devrait commencer de bout en bout et développer de manière itérative des modèles commerciaux plus importants, ce qui pourrait être une approche plus appropriée. Sur la base d'avoir des capacités générales, la formation continue dans le domaine vertical pour améliorer les capacités professionnelles des grands modèles est un moyen important pour aider le développement et le progrès des grands modèles à l'avenir. **
Zhou Bowen a souligné que d'un point de vue théorique et technique, des différences doivent exister. Dans le développement de l'IA, d'une part, nous sommes un catcheur au niveau technique, et d'autre part, nous sommes susceptibles de devenir des innovateurs et même des leaders au niveau applicatif. ** L'IA chinoise doit explorer une nouvelle voie, c'est-à-dire s'intégrer verticalement du modèle général auto-développé à l'application et à la boucle fermée du scénario complet de l'utilisateur, afin de réaliser le "double atterrissage" de l'intelligence artificielle générative la technologie et la valeur commerciale. **
Pour la concurrence entrepreneuriale, Zhou Bowen estime qu'elle peut être divisée en trois voies : la première voie consiste à construire un modèle sous-jacent à grande échelle avec des capacités générales, des algorithmes techniques à l'itération du modèle, et la scène en boucle fermée ; la deuxième voie est basée sur les modèles d'autres personnes (tels que GPT), puis combiner leur propre savoir-faire industriel pour faire de la formation ; la troisième voie est purement pour l'application, qui consiste à utiliser le modèle directement, et cette barrière sera plus faible.
Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Pensée froide de l'IA sous la recrudescence de la "guerre des mille modèles"
Source originale : International Finance News
Début juillet, il y a eu un boom de l'intelligence artificielle à Shanghai. La Conférence mondiale sur l'intelligence artificielle 2023 a atteint le plus grand nombre d'exposants et de surface d'exposition jamais enregistré. De nombreuses entreprises ont annoncé lors de la conférence qu'elles publieraient de grands modèles d'IA. ** La température élevée et la forte convection n'ont pas réussi à dissiper l'enthousiasme de tous. La porte de l'exposition attirait autrefois les scalpeurs pour vendre des billets, et de nombreuses personnes ont aidé les jeunes et les moins jeunes à explorer la tendance de développement de pointe de l'intelligence artificielle.
Sous la recrudescence, ** devrait également voir sereinement que le grand modèle est toujours confronté à des problèmes de base tels que la robustesse, la conformité et la crédibilité. **Par rapport aux pays développés, mon pays a encore un déficit de puces, de puissance de calcul, de données, etc. La rareté des données est un problème majeur affectant l'application des grands modèles. les grands modèles domestiques un facteur majeur de développement.
Au stade actuel, alors que les problèmes fondamentaux n'ont pas encore été résolus et que le fossé est en train d'être comblé, quel type de voie de développement le développement de l'IA en Chine devrait-il explorer ? Au cours du forum de trois jours et des entretiens avec de nombreux experts de l'industrie participants, les réponses les plus fréquentes au journaliste ont été "l'intégration verticale" et "l'application d'atterrissage".
"Allez d'abord à la table"
À l'heure actuelle, le développement de l'économie numérique est devenu un consensus mondial. En tant que technologie émergente stratégique, l'intelligence artificielle devient de plus en plus le principal moteur de la modernisation industrielle et de l'amélioration de la productivité. En novembre 2022, OpenAI a lancé ChatGPT, un modèle d'intelligence artificielle conversationnelle à grande échelle à usage général.
** Lors de la Conférence mondiale sur l'intelligence artificielle 2023, le grand modèle tient le rôle principal. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General et grands modèles verticaux tels que Tuotian et Daguan "Cao Zhi" sont vertigineux.
Lin Jianming, fondateur et président du Samoyed Cloud Technology Group, a souligné dans une interview avec un journaliste d'International Finance News que l'IA ** est au point de départ d'un nouveau cycle de tendances industrielles. ** Du point de vue de la disposition du grand modèle, Baidu, Ali, Huawei et d'autres "acteurs haut de gamme" réalisent une disposition "quatre en un" à partir de la couche de puissance de calcul, de la couche de plate-forme, de la couche de modèle et couche d'application ; les instituts de recherche scientifique et les start-ups technologiques ont trouvé un autre moyen, Le point d'entrée est de développer des algorithmes modèles à grande échelle et des applications de terrain subdivisées.
Lin Jianming a déclaré que les paramètres actuels du modèle national à grande échelle sont essentiellement de l'ordre de 100 milliards ou plus.En termes de direction d'application, la plupart des entreprises se concentrent sur les applications internes au stade précoce et s'étendent progressivement aux entreprises B-end. **La technologie de l'intelligence artificielle continue de faire des percées. Les grands fabricants et les petites et moyennes entreprises technologiques se disputent les grands modèles. Naturellement, personne ne veut manquer la grande vague de cette ère. Ce n'est qu'en "passant d'abord à la table" que vous pourrez saisir "l'atout" des règles. Dans le contexte de l'effritement des dividendes de l'Internet mobile, le choix d'embrasser les grands modèles devrait apporter de nouveaux points de croissance.
Zhou Bowen, membre IEEE/CAAI, professeur titulaire de la chaire Huiyan de l'Université Tsinghua, professeur titulaire du département d'électronique et fondateur de Lianyuan Technology, a déclaré au journaliste de "International Finance News" que ** la Chine devrait adopter un système à grande échelle basé sur sur "l'innovation indépendante, la sécurité et la contrôlabilité". La voie de développement du modèle de langage et de la technologie d'intelligence artificielle générative se concentre sur la promotion de l'application à grande échelle de grands modèles dotés de capacités à usage général dans les industries verticales. **En outre, les applications métier, l'innovation académique et l'écologie technologique doivent toutes être diversifiées et ne peuvent pas être complètement concentrées sur un grand modèle, ni utiliser une même façon de penser pour faire les choses.
Défis multiples
Sous la montée en puissance de l'IA, les grands modèles sont toujours confrontés à de multiples défis tels que la robustesse, la conformité et la crédibilité. Lin Jianming a déclaré sans ambages que par rapport au monde, en particulier aux États-Unis, nous avons encore un certain écart en matière de puces d'IA, de brevets, de recherche d'algorithmes et d'un écosystème d'innovation mature. **Les principaux facteurs limitant le développement de modèles nationaux à grande échelle sont : premièrement, les grands modèles nécessitent une grande puissance de calcul, et nous avons des lacunes en matière de puces et de puissance de calcul ; deuxièmement, le manque de données de corpus chinois de haute qualité et de données de l'industrie ; troisièmement , le nombre de professionnels Rare, l'innovation de la recherche fondamentale ne suffit pas.
"L'industrie financière est une existence particulière avec des exigences très élevées en matière de gestion des risques et de sécurité. Les défis du risque de confiance, du risque de modèle, de l'éthique, de la stabilité, de l'exactitude, de la sécurité des données, de la conformité et d'autres risques auxquels sont confrontés la recherche et le développement de grands modèles financiers sont plus sévères. » a souligné Lin Jianming.
Jiang Ning, directeur général adjoint et directeur de l'information de Mama Consumer, a déclaré dans une interview avec un journaliste d'International Finance News que le grand modèle d'IA ** est toujours confronté à des problèmes fondamentaux tels que l'adaptabilité dynamique, la robustesse, la conformité et la crédibilité dans les décisions clés. , Comment éliminer le bruit et les problèmes d'interférence, dans des situations soudaines et imprévisibles, il est particulièrement essentiel d'atteindre une stabilité continue et la conformité et la crédibilité des décisions clés. **
Jiang Ning a souligné que les modèles nationaux à grande échelle manquent de percées originales et qu'il existe encore des lacunes dans la capacité de raisonnement des modèles et la capacité de génération de modèles à grande échelle. La difficulté d'obtenir des données de corpus chinois à grande échelle et de haute qualité est un facteur majeur limitant le développement de modèles à grande échelle en Chine. Spécifique au domaine financier, elle fait également face à de nombreux défis tels que la protection de la vie privée, la stabilité continue, la conformité et la crédibilité.
Zhou Bowen pense que dans la formation actuelle de grands modèles d'IA, le côté algorithme converge vers le modèle de transformateur de réseau neuronal, le côté puissance de calcul repose sur des clusters de serveurs d'IA avec des capacités de calcul parallèle à grande échelle, et le côté données doit alimenter de grandes des ensembles de données à l'échelle avec une énorme quantité de données Du point de vue des trois éléments de l'IA, la rareté des données est évidemment un problème majeur conduisant à la mise en œuvre d'applications de modèles à grande échelle. Des domaines spécifiques tels que l'industrie financière, qui ont des exigences extrêmement strictes en matière de sécurité des données et de protection de la vie privée des utilisateurs, posent également une série de défis aux grands modèles tels que la fiabilité, la contrôlabilité autonome et la sécurité renforcée.
Zhou Bowen a déclaré que l'industrialisation des modèles à grande échelle est également confrontée à des défis : premièrement, l'échelle des données est grande et la qualité des données est inégale ; deuxièmement, le modèle est de grande taille et difficile à former ; ** Par conséquent, le développement de grands modèles dépend de la prise en charge complète de la puissance de calcul des algorithmes et des données. Les grands modèles sont au centre du développement industriel futur, mais le modèle commercial des grands modèles mérite d'être exploré. Parce que les barrières de coûts des grands modèles sont très élevées, les grandes entreprises et les petites entreprises ont leurs propres charges.
Intégration verticale
Au stade actuel, alors que les problèmes fondamentaux n'ont pas encore été résolus et que le fossé est en train d'être comblé, quel type de voie de développement le développement de l'IA en Chine devrait-il explorer ? Quelles sont les autres opportunités de développement ? Jiang Ning a souligné que la construction d'un système d'IA combiné est une tendance de développement, combinant efficacement la convivialité et le professionnalisme des modèles discriminants dans divers domaines verticaux, et les caractéristiques des capacités d'apprentissage par transfert et de généralisation des grands modèles génératifs, de sorte qu'il sera vraiment populaire. Profitez de la capacité de généralisation des grands modèles.
Lin Jianming a souligné qu'à l'avenir, les modèles à grande échelle auront un grand potentiel dans le processus d'intelligence numérique des villes, des industries et des entreprises. La disposition nationale des grands modèles doit renforcer les capacités d'innovation indépendantes, améliorer la compétitivité de base des grands modèles à différents niveaux tels que la puissance de calcul, les algorithmes et les talents, et également combiner étroitement les besoins stratégiques nationaux et les orientations de développement de l'industrie pour explorer les points faibles de l'industrie et scénarios en profondeur.
De plus, "il est nécessaire d'utiliser sa propre technologie, ses scénarios, ses données d'utilisateur et d'industrie et son savoir-faire industriel (secrets industriels) pour créer un grand modèle dans le domaine vertical ; utiliser le modèle spécial "modèle général + savoir-faire industriel". ' pour renforcer l'économie réelle et établir son propre avantage en matière de barrières", a déclaré Lin Jianming.
Zhou Bowen estime que l'industrie du modèle à grande échelle en Chine devrait commencer de bout en bout et développer de manière itérative des modèles commerciaux plus importants, ce qui pourrait être une approche plus appropriée. Sur la base d'avoir des capacités générales, la formation continue dans le domaine vertical pour améliorer les capacités professionnelles des grands modèles est un moyen important pour aider le développement et le progrès des grands modèles à l'avenir. **
Zhou Bowen a souligné que d'un point de vue théorique et technique, des différences doivent exister. Dans le développement de l'IA, d'une part, nous sommes un catcheur au niveau technique, et d'autre part, nous sommes susceptibles de devenir des innovateurs et même des leaders au niveau applicatif. ** L'IA chinoise doit explorer une nouvelle voie, c'est-à-dire s'intégrer verticalement du modèle général auto-développé à l'application et à la boucle fermée du scénario complet de l'utilisateur, afin de réaliser le "double atterrissage" de l'intelligence artificielle générative la technologie et la valeur commerciale. **
Pour la concurrence entrepreneuriale, Zhou Bowen estime qu'elle peut être divisée en trois voies : la première voie consiste à construire un modèle sous-jacent à grande échelle avec des capacités générales, des algorithmes techniques à l'itération du modèle, et la scène en boucle fermée ; la deuxième voie est basée sur les modèles d'autres personnes (tels que GPT), puis combiner leur propre savoir-faire industriel pour faire de la formation ; la troisième voie est purement pour l'application, qui consiste à utiliser le modèle directement, et cette barrière sera plus faible.