Combien de volumes fait "Battle of the Megamodels" ?

Question

**Source :** Conférence mondiale sur InternetLe 31 août, le premier lot chinois de produits modèles à grande échelle a adopté pour enregistrement les « Mesures provisoires pour la gestion des services d'intelligence artificielle générative » et peut être officiellement lancé pour fournir des services au public. Le premier lot de 8 modèles à grande échelle lancés comprend Baidu Wenxin Yiyan, le modèle à grande échelle Skylark de Byte, le modèle à grande échelle Baichuan de Baichuan Intelligent et Zhipu Qingyan sous la société d'IA basée à Tsinghua, Zhipu Huazhang.Depuis le début de cette année, les modèles à grande échelle extrêmement populaires ont toujours été la voie de la concurrence pour les fabricants mondiaux. Toutes les grandes entreprises technologiques ont lancé leurs propres modèles à grande échelle, présentant une grande occasion de « Cent guerres de modèles ».## Le grand modèle, moteur du développement de l'économie numériqueÀ partir du 31 août, les utilisateurs peuvent télécharger « l'application Wenxin Yiyan » dans l'App Store ou se connecter au « site officiel de Wenxin Yiyan » pour en faire l'expérience. Baidu ouvrira également un lot d'applications natives d'IA nouvellement reconstruites, permettant aux utilisateurs de découvrir les quatre capacités principales de l'IA générative : compréhension, génération, logique et mémoire.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d0fa6514d6-dd1a6f-6d2ef1) Source : site officiel de WenxinyiyanRobin Li, fondateur, président et PDG de Baidu, a déclaré un jour que les grands modèles pénétreraient de plus en plus de domaines.L'économie numérique, dirigée par les grands modèles comme clé, sera profondément intégrée à l'économie réelle et deviendra plus forte, meilleure et une économie plus grande, créent une valeur supplémentaire considérable et entraînent un développement économique et social ainsi que de profonds changements dans l'industrie.Il est entendu qu'au cours des dix dernières années, Baidu a investi plus de 140 milliards de yuans dans la recherche et le développement cumulés, devenant ainsi une société d'IA dotée d'une configuration full-stack à quatre couches d'applications, de modèles, de cadres et de puces, atteignant ainsi ses objectifs finaux. optimisation de bout en bout et avoir la clé pour diriger l'industrie à tous les niveaux.Technologie auto-développée.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2e46ac1e8f-dd1a6f-6d2ef1) *Source : « Rapport de recherche sur les cartes à grand modèle d'intelligence artificielle en Chine »*Toujours tôt le matin du 31, Baichuan Intelligence a également annoncé que son grand modèle avait été enregistré dans le cadre des « Mesures provisoires pour la gestion des services d'intelligence artificielle générative » et qu'il était ouvert au public. Les utilisateurs peuvent se connecter au site officiel pour vis-Le.Baichuan Intelligence a été fondée le 10 avril 2023 par l'ancien PDG de Sogou, Wang Xiaochuan. L'équipe principale est composée des meilleurs talents en IA issus d'entreprises technologiques bien connues telles que Sogou, Baidu, Huawei, Microsoft, Byte et Tencent. Quatre mois seulement après sa création, Baichuan Intelligent a publié trois grands modèles de langage à usage général, dont Baichuan-7B, le premier grand modèle de langage open source du pays avec 7 milliards de paramètres pouvant être commercialisés gratuitement, et Baichuan-53B, un grand modèle de langage. modèle de langage avec 53 milliards de paramètres.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-3f187723ad-dd1a6f-6d2ef1) *Source : Site officiel de Baichuan Intelligent*iFlytek a officiellement lancé le « iFlytek Spark Cognitive Large Model » le 6 mai de cette année. iFlytek a déclaré que d'ici le 24 octobre de cette année, iFlytek Spark réaliserait une analyse comparative universelle du modèle par rapport à ChatGPT. Dans le rapport d'évaluation du modèle à grande échelle publié par le MIT Technology Review China le 17 août, Xunfei Xinghuo V2.0 s'est classé premier avec un score total de 81,5 points et a été qualifié de modèle à grande échelle « le plus intelligent » de Chine.## Le grand modèle mondial s'épanouit davantageL'intelligence artificielle passe du cloud au terminal. D'un point de vue mondial, des fabricants tels que Google, Microsoft et Apple développent également de grands modèles de terminaux, et l'allègement est devenu une direction de développement importante pour le déploiement de grands modèles dans les terminaux.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d3d505232f-dd1a6f-6d2ef1) *Source : DragonImages*En mai de cette année, Google a lancé PaLM2, un grand modèle adapté au Edge. Plus précisément, le grand modèle PaLM2 a quatre spécifications, à savoir Gecko (Gecko), Otter (Otter), Bison (Bison) et Unicorn (Licorne). Parmi eux, Gecko est très léger et fonctionne sur les appareils mobiles. Un modèle plus léger mais de meilleure qualité peut améliorer considérablement l'efficacité de l'inférence et réduire les coûts de service, permettant à l'application en aval du modèle de s'adapter à davantage d'applications et d'utilisateurs, rendant ainsi possible le déploiement de l'IA en périphérie.En juillet, Apple a officiellement annoncé le lancement du développement d'AppleGPT et a rejoint la bataille des grands modèles d'IA de terminal. Il est entendu qu'AppleGPT est un outil d'IA développé par Apple sur la base de son framework Ajax auto-développé et qui est actuellement testé à petite échelle au sein d'Apple.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9682614d49-dd1a6f-6d2ef1) *Source : Pixabay*Dans le même temps, Microsoft a rendu open source le modèle de formation DeepSpeedChat et Meta open source LLaMA, ce qui a rapidement fait naître une tendance à la formation basée sur LLaMA parmi les développeurs d'IA, accélérant la pénétration de méthodes de formation telles que Lora. Il est entendu que les modèles Deepspeed et Lora fournissent aux développeurs de petite et moyenne taille des outils complets pour une formation rapide et peu coûteuse de leurs propres « petits modèles », accélérant ainsi l'établissement de modèles de distribution de gradient pour les grands modèles.En ce qui concerne les fabricants de puces, Qualcomm a publié la première démonstration au monde côté terminal à diffusion stable fonctionnant sur un téléphone Android lors de la conférence MWC 2023. Selon les rapports, les paramètres du modèle de diffusion stable dépassent le milliard. Qualcomm utilise sa pile logicielle d'IA pour quantifier, compiler et optimiser l'accélération matérielle du modèle, afin qu'il puisse fonctionner avec succès sur les téléphones mobiles équipés de la plate-forme mobile Snapdragon 8 de deuxième génération. .![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c4eb152acd-dd1a6f-6d2ef1) *Source : Pixabay*## "Application" et "supervision" grand modèle vont de pairEn mars de cette année, le nouvel outil de chatbot IA ChatGPT 3.5 lancé par la startup de la Silicon Valley OPEN AI a démontré des capacités conversationnelles étonnantes. En seulement deux mois, le nombre d’utilisateurs actifs mensuels de ChatGPT a atteint 100 millions, ce qui en fait l’application grand public connaissant la croissance la plus rapide de l’histoire.Face aux opportunités et aux défis posés par l’IA générative, les pays ont des opinions différentes sur la manière de réglementer l’IA. La Chine, les États-Unis, l’Union européenne et d’autres pays ou régions ont réagi rapidement, tandis que Singapour et l’Inde ont annoncé qu’ils n’envisageaient pas de réglementer l’IA pour le moment.Le 15 août, les « Mesures provisoires pour la gestion des services d’intelligence artificielle générative » ont été officiellement mises en œuvre en Chine, considérées comme la première législation mondiale sur l’IA générative.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b14f04e560-dd1a6f-6d2ef1) *Source : Pixabay*Tout en mettant en œuvre les règles et réglementations, les « Mesures » encouragent en outre l'application innovante de la technologie de l'intelligence artificielle générative dans divers secteurs et domaines, et soutiennent diverses organisations dans l'innovation technologique de l'intelligence artificielle générative, la construction, la transformation et l'application des ressources de données, la prévention des risques, etc. Collaborer pour promouvoir la construction d’infrastructures d’intelligence artificielle générative et de plateformes publiques de ressources de données de formation.Les gens de l'industrie ont déclaré qu'avec la mise en œuvre des « Mesures », le grand modèle d'IA devrait progressivement entrer dans la phase de concurrence pour les applications natives et de lutte pour la mise en œuvre industrielle de la concurrence des paramètres.