Laissez des modèles tels que ChatGPT apprendre à penser par eux-mêmes! Cadre technologique révolutionnaire de « cognition autonome »

Source originale : AIGC Open Community

Source de l’image : Généré par Unbounded AI

ChatGPT, Baidu Wenxin Yiyan, Bard et d’autres grands modèles de langage ont démontré une capacité super créative et accéléré le processus d’application de l’IA générative. Cependant, les modèles d’IA ne peuvent effectuer que diverses tâches basées sur des données d’entraînement et ne peuvent pas utiliser les connaissances de la vie et l’expérience passée pour un raisonnement et une prise de décision complexes comme les humains.

Par exemple, lorsqu’ils jouent à un jeu, les humains peuvent utiliser une variété d’indices, de bon sens, d’expérience et de compréhension des règles du jeu pour prendre les meilleures décisions. L’IA ne peut apprendre le mode du jeu qu’à travers un grand nombre de formations, et n’a pas de fonction de compréhension humanisée. Une fois que les règles du jeu ou l’environnement changent, il est difficile pour l’IA de faire le bon choix.

Pour résoudre ces problèmes, le laboratoire d’IA de l’Université de Clemson a proposé l’entité cognitive autonome (ACE). Grâce aux six conceptions hiérarchiques de l’éthique, de la stratégie globale, du modèle d’agence, de l’exécution, du contrôle cognitif et de l’exécution des tâches, les modèles d’IA peuvent réaliser l’architecture cognitive de la « prise de décision autonome » et du raisonnement moral**.

Pendant longtemps, la capacité de faire en sorte que les modèles d’IA aient un « raisonnement de bon sens » a été une priorité absolue dans la communauté de la recherche scientifique. **Le cadre ACE est considéré comme une étude révolutionnaire innovante pour résoudre ce problème.

En fait, le concept d’ACE est similaire au cadre technique de « communication de pensée » proposé par l’Institut d’automatisation de l’Académie chinoise des sciences et de l’Université de Yale il n’y a pas si longtemps, qui permet aux grands modèles d’apprendre à utiliser l’expérience passée pour améliorer les capacités de raisonnement complexes pour faire face à de nouveaux problèmes, mais la superposition du raisonnement est plus spécifique et les restrictions de l’éthique sont ajoutées pour assurer la sécurité du contenu de sortie.

Adresse papier :

Le cadre technologique ACE a été reconnu par de nombreux leaders technologiques de l’industrie. John Etchemendy, professeur au département d’informatique de l’Université de Stanford, a déclaré que le cadre ACE marque un nouveau paradigme pour la recherche en IA, et que son abstraction hiérarchique et sa conception de retour d’information sont très utiles pour parvenir à un raisonnement artificiel de bon sens.

Daniela Rus, directrice du laboratoire d’IA du MIT, estime que le cadre ACE construit une structure complète qui intègre des principes éthiques, cognitifs et informatiques, fournissant une nouvelle direction de recherche pour le raisonnement artificiel de bon sens.

L’objectif global du cadre ACE est de parvenir à un système d’IA à la fois hautement énergétique et éthique. Son innovation principale réside dans l’intégration du raisonnement éthique abstrait au niveau supérieur et la réalisation de tâches spécifiques au bas de l’échelle pour construire un système cognitif complet et en boucle fermée.

ACE est principalement composé de 6 couches: éthique, stratégie globale, modèle d’agence, exécution, contrôle cognitif et exécution des tâches, chaque couche se concentre sur différentes fonctions, la couche supérieure traite du raisonnement abstrait et la couche inférieure est responsable de l’exécution de tâches spécifiques.

Couche morale

Le niveau éthique le plus élevé détermine la direction et les principes de l’ensemble du système, et sa fonction est de définir les valeurs fondamentales et les principes éthiques d’un agent autonome, qui se compose de 3 parties.

(1) Principes éthiques de base: Il s’agit d’un code moral intuitif qui assure la conformité de base du système.

(2) Principes secondaires : Fournir des orientations spécifiques telles que les obligations en matière de droits de l’homme.

(3) Énoncé de mission : Définir les objectifs et les intentions de base de l’agent.

Couche de stratégie globale

Après avoir reçu des missions abstraites de la couche morale, la couche de stratégie globale formulera un plan à long terme pour réaliser ces missions en combinaison avec la situation spécifique, qui se compose de deux parties.

(1) Fusion du contexte: absorber les informations environnementales et comprendre la situation spécifique à laquelle l’agent est confronté.

(2) Document de stratégie : Document d’orientation sur les résultats visant à fournir des orientations sur les mesures à prendre pour les niveaux inférieurs.

Couche de modèle d’agent

Il s’engage à comprendre les paramètres de capacité, la structure du système, les contraintes, etc. d’un agent dans un environnement donné, et à construire un « auto-modèle » pour fournir une base pour la prise de décision, comprenant 4 parties.

(1) Paramètres de fonctionnement: données de télémétrie obtenues par surveillance.

(2) Informations de configuration : architecture logicielle et matérielle, version, etc.

(3) Étendue de la compétence: choses qui peuvent être achevées et choses qui ne peuvent pas être achevées.

(4) Limitations : Contraintes qui ne peuvent fonctionner que dans des conditions spécifiques.

Couche fonctionnelle exécutive

La couche fonctionnelle exécutive agit comme un « chef de projet », traduisant les missions stratégiques du sommet en une feuille de route claire pour le plan. La feuille de route fournit toutes les étapes spécifiques de mise en œuvre, en tenant compte de l’allocation des ressources et de la gestion des risques, pour faire de la stratégie une réalité, composée de quatre parties.

(1) Définir les étapes de la tâche: Décomposer les tâches stratégiques en opérations à granularité fine.

(2) Définir des points de contrôle : Définissez des résultats intermédiaires importants pour accepter les progrès.

(3) Allouer les ressources : Optimiser l’utilisation des ressources pour assurer la bonne exécution du plan.

(4) Évaluer les risques : prévoir les problèmes possibles et planifier les contre-mesures à l’avance.

Couche de contrôle cognitif**

La couche de contrôle cognitif joue le rôle de « gestion des tâches », qui sélectionne et planifie dynamiquement les tâches appropriées en fonction de l’environnement actuel et de la rétroaction, qui se compose de quatre parties.

(1) Sélection de la tâche : sélectionnez la tâche suivante en fonction de la priorité, de l’environnement, etc.

(2) Changement de tâche: Basculez en douceur entre les tâches pour optimiser les commandes.

(3) Perception de la frustration : Si la tâche est répétée et échoue, elle produira des changements proactifs.

(4) Ajustement interne: pensez aux avantages et aux inconvénients des différentes options.

Couche d’exécution des tâches

La couche d’exécution de la tâche finale interagit directement avec l’environnement pour effectuer des tâches spécifiques assignées par la couche de contrôle cognitif. Selon le type de tâche, vous pouvez appeler l’interface API, contrôler le mécanisme et mener un dialogue, qui se compose de trois parties.

(1) Communication numérique : utiliser des langages de programmation et des appels d’interface pour mettre en œuvre des tâches numériques

(2) Collaboration physique : contrôler des robots et des capteurs pour accomplir des tâches physiques

(3) Suivi des résultats : comparer les résultats aux attentes, et envoyer des commentaires sur les succès ou les échecs

Cette conception multicouche avec une division claire du travail présente de nombreux avantages: premièrement, différents niveaux peuvent travailler en parallèle en même temps, ce qui améliore l’efficacité; Deuxièmement, l’encapsulation en couches et la dissimulation de l’information améliorent la sécurité et l’interprétabilité du système;

Troisièmement, la superposition permet au système d’être mis à niveau de manière itérative modulaire sans nécessiter de refactorisation complète ; Quatrièmement, le niveau supérieur peut surveiller le fonctionnement de la couche inférieure et, lorsque les écarts d’Einmal peuvent être corrigés, afin d’assurer la contrôlabilité du système.

En outre, une autre innovation du framework ACE est l’utilisation intelligente des grands modèles de langage populaires actuels, tels que ChatGPT, Bard, etc.

En apprenant des quantités massives de données textuelles, ces modèles ont démontré une compréhension du langage et des capacités de génération de langage proches des humains. Le framework ACE intègre la couche linguistique dans chaque couche, de sorte que le modèle de langage ne fonctionne plus seul, mais devient un élément clé sous-jacent à l’ensemble de l’architecture cognitive**.

De la couche morale à la couche des tâches, les modèles de langage aident à comprendre des concepts abstraits, à faire un raisonnement stratégique, à construire des modèles d’auto-modélisation, et même finalement à contrôler la façon dont les robots effectuent des tâches linguistiques.

Cette fusion fournit un contexte clair et des conseils au modèle linguistique, ce qui rend la sortie qu’elle produit plus précise et évite le problème de « parler à soi-même ».

Cela montre également que les grands modèles linguistiques peuvent également jouer un rôle important au niveau du système, plutôt que de simplement effectuer des tâches linguistiques individuelles. Le cadre ACE montre comment mieux exploiter le potentiel des grands modèles linguistiques en tant que moteur central du développement cognitif et alimenter le raisonnement artificiel de bon sens.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)