L'ère de l'IA traditionnelle finira-t-elle par passer ?

Auteur : Wufang

Source : Renifleur de tigre

Crédit image : Généré par les outils Unbounded AI

L'IA générative génère beaucoup d'élan et continue de montrer de plus en plus de potentiel. Par exemple, laissez l'IA concevoir automatiquement des puces ou laissez l'IA consulter un médecin.

Afin de s'emparer de la position de leader, les entreprises pressées font non seulement de leur mieux pour libérer leur propre force technique, mais rendent également les modèles d'IA de plus en plus gros, afin d'obtenir l'effet de puissantes briques volantes et de réaliser l'émergence de l'intelligence.

Le "Rapport de recherche sur la carte de grand modèle d'intelligence artificielle de la Chine" du Centre de recherche sur le développement de l'intelligence artificielle de nouvelle génération du ministère des Sciences et de la Technologie montre que jusqu'à présent, la Chine a publié 79 grands modèles avec une échelle de paramètres de plus d'un milliard, et le La bataille des grands modèles est progressivement entrée dans la seconde moitié.Plus de gens ont commencé à prêter attention à la combinaison de grands modèles et d'industries réelles, et les entreprises ont également montré les scénarios d'application de leurs produits les uns après les autres.

Mais en toute honnêteté, les applications qui utilisent à l'origine la technologie d'IA traditionnelle ont-elles vraiment besoin d'utiliser de grands modèles ? De quels types de grands modèles l'industrie a-t-elle besoin ? Lors de la conférence des développeurs Huawei 2023 (HDC.Cloud 2023), Huawei Cloud a présenté ses dernières avancées en matière d'"IA pour les industries" et le modèle Pangu, et a proposé de laisser l'IA remodeler des milliers d'industries.

Les modèles industriels à grande échelle sont devenus une nouvelle tendance

Aucune entreprise ne veut être laissée pour compte dans la recrudescence des modèles à grande échelle. Si vous chantez, j'apparaîtrai sur scène. Ces derniers mois, il y aura des nouvelles sur un modèle à grande échelle tous les quelques jours. Dans le cadre de la rotation du marché, les entreprises ont déjà saisi l'opportunité et lancé des modèles à grande échelle à usage général, et se sont progressivement tournées vers des modèles industriels à grande échelle pour montrer la praticabilité de leurs propres produits, y compris des démonstrations de machines réelles et des démonstrations de programmes.

La raison pour laquelle le grand modèle est bien connu du public est que les produits C tels que ChatGPT permettent aux gens d'apprécier vraiment la valeur de la technologie. En fait, la clé d'un grand modèle n'est pas sa taille, ni la force de sa capacité universelle, mais sa capacité à résoudre les problèmes des applications existantes acceptées par les gens.

Partout dans le monde, en raison de défis tels que les coûts de puissance de calcul élevés, les fuites d'informations et la supervision des politiques, le processus de commercialisation des modèles à grande échelle vers C est plus lent. La plupart des entreprises choisissent d'être pragmatiques et orientées vers les clients d'entreprise B-end pour répondre les exigences de scénarios industriels spécifiques. . On peut dire qu'il est devenu un consensus général pour construire un modèle industriel à grande échelle.

L'IA traditionnelle de petit modèle ne peut généralement effectuer que des tâches spécifiques ou des problèmes spécifiques.Pour l'industrie B, les grands modèles peuvent non seulement connecter les informations système traditionnelles, mais également réaliser une prise de décision et une planification plus complexes.

Mais il n'est pas facile de faire un modèle à grande échelle de l'industrie et de nombreuses entreprises qui veulent appliquer l'IA doivent finalement abandonner.

Tout d'abord, les scénarios commerciaux des entreprises sont complexes et la plupart d'entre eux doivent être personnalisés. Il est nécessaire de traiter diverses tâches telles que du texte, des images, de l'audio, de la vidéo et des mécanismes. Contrairement à cela, la plupart des entreprises manquent d'échantillons de données. .

Deuxièmement, les grands modèles sont un jeu qui brûle de l'argent. Non seulement vous devez utiliser une grande puissance de calcul à partir d'une kilocalorie dans la phase de formation, mais vous avez également besoin de talents professionnels hautement qualifiés en développement d'applications d'IA.

Enfin, les données et les connaissances sont les principaux actifs des entreprises, et il est nécessaire d'assurer la confidentialité, la sécurité et la conformité des données d'entreprise.

Les choses professionnelles doivent être confiées à des professionnels, et il en va de même pour les grands modèles, au lieu de laisser les entreprises effectuer des travaux de base tels que la fabrication de vis, de roulements et d'engrenages.

Huawei Cloud, en tant qu'entreprise qui a sorti le modèle de base à grande échelle de Pangu dès 2021, n'est en aucun cas un novice dans le domaine des modèles à grande échelle.A l'époque, il visait l'industrialisation de l'IA. Aujourd'hui, HUAWEI CLOUD lance officiellement le service cloud Pangu 3.0 et Ascend AI, devenant le premier modèle d'IA indépendant à pile complète de Chine, adhérant à la direction de l'IA pour les industries et intégrant profondément l'IA à tous les horizons de la vie.

Comme l'a mentionné le directeur exécutif de Huawei et PDG de Huawei Cloud, Zhang Pinganfa, le modèle Pangu ne compose pas de poésie, mais fait seulement des choses. Il se concentre sur des scénarios de l'industrie et s'engage à approfondir les affaires gouvernementales, les finances, la fabrication, les mines de charbon, les chemins de fer, les produits pharmaceutiques, météorologie et autres industries.

Le changement causé par le remplacement du petit par le grand

En fait, le grand modèle est depuis longtemps sorti du stade du concept, mais change tranquillement tout dans la vie.

La météorologie est indissociable de l'être humain, et elle apporte aussi beaucoup de dégâts à notre développement. Par exemple, chaque année, environ 80 typhons sont générés dans le monde, dont environ 25 affectent l'océan Pacifique nord-ouest et la mer de Chine méridionale, et une moyenne de 7 atterrira dans mon pays. En 2022, les pertes économiques directes causées par les catastrophes du typhon seront de 5,42 milliards de yuans.

Les prévisions météorologiques traditionnelles sont majoritairement calculées par des calculateurs HPC performants.Pour prédire la trajectoire d'un typhon dans les 10 prochains jours, il faut passer plusieurs heures sur un supercalculateur avec plus de 3 000 nœuds de simulation. Avec la tendance croissante de la puissance de calcul et la complexité des modèles physiques, le goulot d'étranglement de la prévision numérique traditionnelle est devenu important.

Le grand modèle météorologique de Pangu n'a besoin que d'une seule machine et d'une seule carte, et peut compléter une prévision météorologique en 10 secondes. Il s'agit du premier modèle d'IA au monde dont la précision dépasse les méthodes de prévision traditionnelles. Il peut parcourir la trajectoire d'un typhon dans les 10 prochains jours en quelques secondes. La précision de la prédiction de la trajectoire d'un typhon est la première au monde, qui est d'environ 20 % supérieure à celle de l'Agence météorologique européenne.

Le même changement s'est produit dans le domaine des produits pharmaceutiques.

Les antibiotiques ont sauvé d'innombrables vies, mais depuis la découverte de la daptomycine en 1987, aucun nouvel antibiotique n'a été découvert depuis près de 40 ans. Non seulement la résistance aux médicaments menace la santé de chacun, mais elle pourrait également réduire le PIB d'au moins 3 400 milliards de dollars par an d'ici 2030 et plonger 24 millions de personnes dans l'extrême pauvreté. Le monde a besoin de toute urgence d'une nouvelle classe d'antibiotiques pour changer la situation où les patients n'ont pas de médicaments disponibles lorsqu'ils sont confrontés à des infections par des "bactéries super résistantes aux médicaments".

La recherche d'un nouveau médicament n'est pas facile. Pendant longtemps, le développement de nouveaux médicaments n'a pas pu échapper à la malédiction de la "loi du double 10", c'est-à-dire que le coût moyen dépasse 1 milliard de dollars américains et que le cycle de recherche et développement est plus long. de 10 ans. Non seulement cela, mais c'est le meilleur format commercial.En réalité, il faut en moyenne 10 à 15 ans pour qu'un nouveau médicament soit approuvé pour la commercialisation, ce qui coûte plus de 2,6 milliards de dollars américains, et le taux de réussite clinique est inférieur à dix%.

Le Huawei Cloud Pangu Drug Molecular Large Model utilise une nouvelle architecture de réseau d'apprentissage en profondeur pour générer 100 millions de bibliothèques de petites molécules de type médicament avec des structures 100 % nouvelles. Par rapport aux méthodes traditionnelles, la précision de la prédiction de la pharmacobilité peut être augmentée de 20 %.

Le professeur Liu Bing du premier hôpital affilié de l'université Xi'an Jiaotong a utilisé le service de conception de médicaments assisté par l'IA basé sur le grand modèle moléculaire du médicament Pangu sur Huawei Cloud dans la recherche et le développement de nouveaux médicaments, et a développé un médicament super antibactérien. X (cinnamoylmycine), qui devrait devenir presque la première nouvelle cible et nouvelle classe d'antibiotiques en 40 ans, raccourcir le cycle de R&D des médicaments phares de plusieurs années à un mois, réduire les coûts de R&D de 70 % et briser le " Double Ten Law" dans l'industrie pharmaceutique.

Il n'y a pas que les patients qui changent.

Sous la mine obscure se trouve la vie des ouvriers. Les travailleurs qui descendent dans le puits sont depuis longtemps dans un environnement à haut risque et à haute pression, non seulement piégés par l'ombre de la mort, mais également accompagnés de blessures à vie. Mais au contraire, les 300 mètres de sous-sol actuels nécessitent encore un grand nombre de personnel pour travailler sur place, et ils ont besoin de plus de soins techniques et humanistes.

L'IA est un bon moyen d'assurer la sécurité des opérations souterraines et peut apporter une aide précieuse aux processus manuels incertains. Cependant, il n'est pas aussi simple qu'on l'imaginait pour l'IA d'entrer dans l'industrie minière du charbon. L'environnement d'exploitation de fond de trou est difficile et nécessite une grande précision dans la reconnaissance d'images et de vidéos. De plus, les différences entre les mines sont importantes et les opérations sur site sont compliquées, de sorte que le modèle ne peut pas être facilement réutilisé. Dans le même temps, l'industrie minière du charbon manque de talents d'intelligence artificielle de haute qualité.

Le grand modèle de la mine de Pangu n'a besoin que d'importer une grande quantité de données de scènes minières non étiquetées pour la pré-formation, puis il peut effectuer un apprentissage indépendant non supervisé. Un grand modèle peut couvrir l'exploitation minière, l'excavation, les machines, le transport, le transport, le lavage et Plus de 1 000 scénarios subdivisés peuvent réaliser des inspections à temps plein, aider le personnel à trouver les problèmes à temps, éviter les accidents de sécurité causés par des inspections manquées, raccourcir les temps d'arrêt et améliorer l'efficacité du travail du personnel d'inspection souterrain. À l'heure actuelle, il a été utilisé dans 8 mines à travers le pays.

D'innombrables grandes, moyennes et petites villes sont reliées en série par des chemins de fer. Jusqu'à présent, les chemins de fer de mon pays ont un kilométrage de 155 000 kilomètres et plus d'un million de wagons de marchandises. Avec l'amélioration du niveau de sécurité ferroviaire de mon pays, de nombreuses pannes se sont rarement produites, et la plupart des gens ne les ont jamais vues, mais une fois qu'une panne se produit, c'est généralement une panne majeure. Par exemple, si la plaque centrale de la traverse est sortie, un seul échantillon défectueux a été trouvé dans tout le pays.

Derrière la sécurité se cache le travail acharné d'innombrables personnes. Limité par le développement technologique, le TFDS (Truck Operation Fault Dynamic Image Detection System) actuellement largement utilisé utilise encore des méthodes manuelles pour l'identification des défauts. Si l'on prend l'exemple de l'atelier d'inspection 5T d'une certaine gare pivot, près de 800 trains et plus de 40 000 véhicules sont inspectés en moyenne chaque jour, et le système TFDS prend plus de 2,8 millions de photos. les défauts du train.

Grâce au grand modèle de Pangu, il était auparavant nécessaire d'identifier manuellement 4 000 images, mais maintenant il suffit de revérifier plus de 170 images, et l'intensité de travail des travailleurs a chuté de 95,75 %. Dans l'application pratique, il peut identifier avec précision plus de 430 types de divers défauts de 67 types de camions, une identification à 100 % des défauts anormaux majeurs et le taux de dépistage des images non défectueuses atteint 95 %, dépassant les attentes des clients.

De tels exemples sont trop nombreux pour être énumérés. En fait, chaque fois que j'utilise One Netcom pour faire des affaires et utiliser des produits intelligents, c'est peut-être le mérite du grand modèle. Nous profitons directement ou indirectement des dividendes apportés par les mises à niveau technologiques. .

En quoi le modèle Pangu est-il différent ?

Aujourd'hui, le champ des modèles à grande échelle est encore très chaud.Les joueurs nationaux ont organisé une "bataille de cent modèles".

Tout d'abord, HUAWEI CLOUD a des centaines de projets dans le domaine de l'IA et adhère à AI for Industries.Combinant son expérience accumulée dans l'industrie depuis plus de 30 ans et la culture continue de plus de 10 corps de l'industrie, Huawei Cloud a accumulé riche savoir-faire des clients et partenaires de l'industrie.Intégration avec le grand modèle, de sorte que le grand modèle ait la connaissance et l'expérience de l'industrie.

Deuxièmement, en plus d'apprendre beaucoup de connaissances générales, le modèle Pangu a également appris des données publiques de plus de 10 industries, couvrant la finance, les affaires gouvernementales, la météorologie, les soins médicaux, la santé, Internet, l'éducation, l'automobile, la vente au détail, etc.

Plus important encore, le grand modèle Pangu a réalisé une innovation indépendante de la puce sous-jacente à l'ensemble de la plate-forme de processus. Vous savez, dans la montée en puissance de l'IA, le GPU est devenu une denrée rare, mais sous les multiples influences des frictions géopolitiques et des pénuries d'approvisionnement, déployer des cartes informatiques hautes performances ne sera que difficile.Par conséquent, l'innovation indépendante est devenue un consensus général dans L'industrie.

Passer en revue l'histoire des modèles à grande échelle de Pangea est un processus visant à répondre en permanence aux besoins de l'industrie. En mars 2020, Tian Qi a rejoint Huawei Cloud et a commencé à constituer une équipe ; en avril 2021, le grand modèle Pangu a été officiellement publié, y compris le grand modèle NLP et le grand modèle CV ; en septembre 2021, Huawei Cloud a publié le grand modèle de calcul scientifique et Un grand modèle de molécules médicamenteuses ; en juin 2022, Huawei Cloud a publié un grand modèle de la mine Pangu ; en novembre 2022, Huawei Cloud a publié un grand modèle de météo.

À l'époque, HUAWEI CLOUD a officiellement publié le Pangu Large Model 3.0 et a publié de grands modèles d'affaires gouvernementales, de finances et de fabrication en même temps. Le grand modèle était extrêmement populaire il y a quelque temps, pourquoi Huawei Cloud a-t-il choisi ce moment pour annoncer l'avancée du grand modèle Pangu ?

En fait, face aux nouvelles technologies et tendances de l'industrie, HUAWEI CLOUD donne la priorité aux besoins de l'industrie, et ce n'est que lorsque la technologie sera suffisamment mature qu'elle introduira de nouvelles technologies sur le marché. Du point de vue de Pangu Large Model 3.0, Huawei Cloud a cette fois clarifié le positionnement industriel de ses produits, intégré les grands modèles précédents, réorganisé la structure et élargi le réseau à travers le nouveau grand modèle, pour couvrir toutes les industries.

Hu Houkun, le président tournant de Huawei, a également souligné lors de la Conférence mondiale sur l'intelligence artificielle de 2023 que la clé du développement de l'intelligence artificielle est d'« aller en profondeur et solidement » pour permettre la modernisation industrielle. Au stade actuel, Huawei a deux points de mire sur le développement de l'intelligence artificielle : premièrement, construire une base informatique solide pour soutenir le développement de l'industrie de l'intelligence artificielle en Chine. Deuxièmement, des modèles à grande échelle à usage général aux modèles à grande échelle à l'échelle de l'industrie, laissez l'intelligence artificielle bien servir des milliers d'industries et de recherche scientifique.

Pangu Large Model 3.0 adopte une conception en couches, y compris une structure à trois niveaux 5 + N + X: 5 grands modèles de base à grande échelle de niveau L0 fournissent diverses compétences générales, les modèles à grande échelle de l'industrie de niveau N L1 aident les entreprises à construire leur propre grande Les modèles à grande échelle et les modèles de scénarios massifs de niveau L2 se concentrent sur des scénarios d'application spécifiques ou des entreprises spécifiques, et fournissent aux clients des services de modèles prêts à l'emploi.

La puissance de calcul est la nourriture des grands modèles. Pendant le processus de formation, chaque série de grands modèles de Pangu a presque besoin de centaines, voire de milliers de puces Ascend pour la formation. Le service cloud Ascend AI est la base des grands modèles de Pangu, lui fournissant un solide Base.

Le service cloud Ascend AI à cluster unique de HUAWEI CLOUD avec une puissance de calcul de 2000P Flops a été lancé simultanément à Ulanqab et Gui'an.Le centre de données HUAWEI CLOUD utilisant la plate-forme refroidie par liquide de Tiancheng peut garantir un taux de stabilité à long terme de 30 jours de 90% pour l'entraînement kilocalorie Le temps de récupération des points ne dépasse pas 10 minutes.

« Afin d'aider les clients, partenaires et développeurs mondiaux à former et à utiliser de grands modèles, nous nous engageons à créer un autre pôle de l'IA mondiale pour les clients mondiaux et à offrir de nouveaux choix à tous les développeurs d'IA », a déclaré Zhang Ping'an.

Pour de nombreuses entreprises, la conformité à la sécurité des données est la principale considération. En plus du modèle de déploiement de cloud public, le grand modèle Pangea peut en outre fournir une grande zone de cloud modèle et établir un pool de ressources spécifiques au cloud pour la formation et le raisonnement des grands modèles afin de garantir que les données conformité de sécurité. Pour les exigences de localisation des données plus strictes, un déploiement de cloud hybride est également fourni pour aider les clients à former de grands modèles sur leur propre HCS privé.

Pour un produit, la facilité d'utilisation est la clé. HUAWEI CLOUD fournit une boîte à outils de modèles à grande échelle facile à utiliser et fiable, Kaitian aPaaS qui rassemble un grand nombre d'API de scènes multi-industries, et une communauté exclusive pour les modèles à grande échelle qui comprend des cours et des techniques riches et de haute qualité. certifications pour aider les développeurs à se développer rapidement.

Il est vrai que la technologie elle-même est révolutionnaire, mais pour que le grand modèle de Pangu pénètre dans des milliers d'industries, il faut encore lui laisser le temps de s'enraciner dans l'industrie.

Comme Andrew Ng, l'un des quatre rois de l'IA, l'a déclaré : « Il est difficile d'imaginer une grande industrie qui ne sera pas modifiée par l'intelligence artificielle. Les grandes industries comprennent la santé, l'éducation, les transports, la vente au détail, les communications et l'agriculture. Intelligence artificielle sera dans ces industries Cette tendance est très évidente. » À l'avenir, chaque industrie peut être modifiée par les grands modèles de diverses industries.

Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)