Нехай такі моделі, як ChatGPT, навчаться думати самостійно! Новаторська технологія «автономного пізнання»

Першоджерело: AIGC Open Community

Джерело зображення: Створено Unbounded AI

ChatGPT, Baidu Wenxin Yiyan, Bard та інші великі мовні моделі продемонстрували супертворчі здібності та прискорили процес застосування генеративного ШІ. Однак моделі штучного інтелекту можуть виконувати різні завдання лише на основі навчальних даних і не можуть використовувати життєві знання та минулий досвід для складних міркувань та прийняття рішень, як люди.

Наприклад, граючи в гру, люди можуть використовувати різноманітні підказки, здоровий глузд, досвід і розуміння правил гри, щоб приймати найкращі рішення. ШІ може вивчити режим гри лише за допомогою великої кількості тренувань, і не має функції гуманізованого розуміння. Як тільки правила гри або оточення змінюються, штучному інтелекту важко зробити правильний вибір.

Щоб вирішити ці проблеми, лабораторія штучного інтелекту в Університеті Клемсона запропонувала автономну когнітивну сутність (ACE). Завдяки шести ієрархічним конструкціям етики, глобальної стратегії, агентської моделі, виконання, когнітивного контролю та виконання завдань, моделі штучного інтелекту можуть реалізувати когнітивну архітектуру «автономного прийняття рішень» та моральних міркувань**.

Протягом тривалого часу здатність створювати моделі штучного інтелекту з «міркуваннями здорового глузду» була головним пріоритетом у спільноті наукових дослідників. **Фреймворк ACE розглядається як інноваційне проривне дослідження для вирішення цієї проблеми.

По суті, концепція ACE схожа на технічну структуру «мислення комунікації», запропоновану Інститутом автоматизації Китайської академії наук і Єльським університетом не так давно, яка дозволяє великим моделям навчитися використовувати минулий досвід для підвищення можливостей складних міркувань для вирішення нових проблем, але нашарування міркувань є більш конкретним, а обмеження етики додаються для забезпечення безпеки вихідного контенту.

Паперова адреса:

Технологічний фреймворк ACE був визнаний багатьма технологічними лідерами в галузі. Джон Етчеменді, професор кафедри комп'ютерних наук Стенфордського університету, сказав, що фреймворк ACE знаменує собою нову парадигму для досліджень штучного інтелекту, а його ієрархічна абстракція та дизайн зворотного зв'язку з інформацією дуже допомагають у досягненні штучних міркувань здорового глузду.

Даніела Рус, директор лабораторії штучного інтелекту Массачусетського технологічного інституту, вважає, що фреймворк ACE будує повну структуру, яка об'єднує етичні, когнітивні та обчислювальні принципи, забезпечуючи новий напрямок досліджень для штучних міркувань здорового глузду.

Загальна мета фреймворку ACE полягає в тому, щоб створити систему штучного інтелекту, яка буде одночасно високоенергетичною та етичною. Його основна інновація полягає в інтеграції абстрактних етичних міркувань на верхньому рівні та реалізації конкретних завдань на нижньому рівні для побудови замкнутого циклу та завершеної когнітивної системи.

ACE в основному складається з 6 рівнів: етика, глобальна стратегія, агентська модель, виконання, когнітивний контроль і виконання завдань, кожен рівень зосереджений на різних функціях, верхній шар займається абстрактними міркуваннями, а нижній рівень відповідає за виконання конкретних завдань.

Моральний шар

Вищий етичний рівень визначає спрямованість і принципи роботи всієї системи, а її функція полягає у визначенні основних цінностей і етичних принципів автономного агента, який складається з 3 частин.

(1) Основні етичні принципи: Це інтуїтивний моральний кодекс, який забезпечує базову відповідність системи.

(2) Другорядні принципи: Надайте конкретні вказівки, такі як зобов'язання щодо прав людини.

(3) Формулювання місії: Визначте основні цілі та наміри агента.

Рівень глобальної стратегії

Отримавши абстрактні місії від морального шару, рівень глобальної стратегії сформулює довгостроковий план досягнення цих місій у поєднанні з конкретною ситуацією, який складається з двох частин.

(1) Злиття контекстів: поглинати інформацію про навколишнє середовище та розуміти конкретну ситуацію, з якою стикається агент.

(2) Стратегічний документ: Вихідний керівний документ для надання вказівок щодо дій для нижчих рівнів.

Рівень моделі агента

Він прагне зрозуміти параметри здібностей, структуру системи, обмеження і т.д. агента в даному середовищі і побудувати «самомодель», щоб забезпечити основу для прийняття рішень, що включає 4 частини.

(1) Робочі параметри: телеметричні дані, отримані за допомогою моніторингу.

(2) Інформація про конфігурацію: програмно-апаратна архітектура, версія тощо.

(3) Сфера компетенції: те, що може бути завершено, і те, що не може бути завершено.

(4) Обмеження: обмеження, які можуть працювати лише за певних умов.

Виконавчий функціональний рівень

Виконавчий функціональний рівень діє як «менеджер проекту», переводячи стратегічні місії зверху в чітку дорожню карту плану. Дорожня карта передбачає всі конкретні кроки реалізації з урахуванням розподілу ресурсів та управління ризиками, щоб стратегія стала реальністю, що складається з чотирьох частин.

(1) Визначте етапи завдання: Розкладіть стратегічні завдання на дрібнозернисті операції.

(2) Встановіть контрольні точки: визначте важливі проміжні результати, щоб прийняти прогрес.

(3) Розподіліть ресурси: Оптимізуйте використання ресурсів для забезпечення безперебійного виконання плану.

(4) Оцініть ризики: Передбачте можливі проблеми та заздалегідь сплануйте контрзаходи.

Рівень когнітивного контролю**

Рівень когнітивного контролю відіграє роль «управління завданнями», який динамічно вибирає та планує відповідні завдання відповідно до поточного середовища та зворотного зв'язку, який складається з чотирьох частин.

(1) Вибір завдання: виберіть наступне завдання на основі пріоритету, середовища тощо.

(2) Перемикання завдань: плавно перемикайтеся між завданнями для оптимізації замовлень.

(3) Сприйняття фрустрації: якщо завдання повторюється і провалюється, воно призведе до активних змін.

(4) Внутрішнє регулювання: подумайте про плюси та мінуси різних варіантів.

Рівень виконання завдань

Кінцевий рівень виконання завдань безпосередньо взаємодіє з навколишнім середовищем для виконання конкретних завдань, призначених рівнем когнітивного контролю. Залежно від типу завдання можна викликати інтерфейс API, керувати механізмом, вести діалог, який складається з трьох частин.

(1) Цифрова комунікація: використовуйте мови програмування та виклики інтерфейсу для реалізації цифрових завдань

(2) Фізична співпраця: керування роботами та датчиками для виконання фізичних завдань

(3) Моніторинг результатів: порівнюйте результати з очікуваннями та надсилайте відгуки про успіх чи невдачу

Така багатошарова конструкція з чітким розподілом праці має безліч переваг: по-перше, різні рівні можуть працювати паралельно одночасно, що підвищує ефективність; По-друге, багаторівнева інкапсуляція та приховування інформації підвищують безпеку та інтерпретованість системи;

По-третє, нашарування дозволяє модульно ітеративно модернізувати систему без необхідності повного рефакторингу; По-четверте, верхній рівень може стежити за роботою нижнього шару, а при Ейнмалі відхилення можна виправляти, забезпечувати керованість системи.

Крім того, ще одним нововведенням фреймворку ACE є розумне використання актуальних популярних великих мовних моделей, таких як ChatGPT, Bard тощо.

Вивчаючи величезні обсяги текстових даних, ці моделі продемонстрували розуміння мови та можливості генерації мови, близькі до людей. Фреймворк ACE інтегрує мовний рівень у кожен шар, завдяки чому мовна модель більше не функціонує самостійно, а стає ключовим компонентом, що лежить в основі всієї когнітивної архітектури**.

Від морального рівня до рівня завдань мовні моделі допомагають розуміти абстрактні концепції, робити стратегічні міркування, будувати власні моделі і навіть в кінцевому підсумку контролювати те, як роботи виконують завдання.

Це злиття забезпечує чіткий контекст і керівництво мовною моделлю, роблячи результат, який вона виробляє, більш точним і уникаючи проблеми «розмови з самим собою».

Це також показує, що великі мовні моделі також можуть відігравати важливу роль на системному рівні, а не просто виконувати окремі мовні завдання. Фреймворк ACE показує, як краще використовувати потенціал великих мовних моделей як основного двигуна для когнітивного розвитку та підсилювати штучні міркування здорового глузду.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити