ChatGPT, Baidu, Wenxin, Yiyan, Bard và các mô hình ngôn ngữ lớn khác đã thể hiện khả năng siêu sáng tạo và đẩy nhanh quá trình ứng dụng AI tạo ra. Tuy nhiên, các mô hình AI chỉ có thể thực hiện các nhiệm vụ khác nhau dựa trên dữ liệu đào tạo và không thể sử dụng kiến thức sống và kinh nghiệm trong quá khứ để suy luận và ra quyết định phức tạp như con người.
Ví dụ khi chơi game, con người có thể sử dụng nhiều manh mối, lẽ thường, kinh nghiệm và hiểu biết về luật chơi để đưa ra quyết định tốt nhất. AI chỉ có thể học chế độ của trò chơi thông qua một số lượng lớn đào tạo và không có chức năng hiểu biết nhân bản. Một khi luật chơi hoặc môi trường thay đổi, AI khó có thể đưa ra lựa chọn đúng đắn.
Để giải quyết những vấn đề này, Phòng thí nghiệm AI tại Đại học Clemson đã đề xuất Thực thể nhận thức tự trị (ACE). Thông qua sáu thiết kế phân cấp về đạo đức, chiến lược toàn cầu, mô hình đại lý, thực thi, kiểm soát nhận thức và thực hiện nhiệm vụ, các mô hình AI có thể nhận ra kiến trúc nhận thức của "ra quyết định tự trị" và lý luận đạo đức **.
Trong một thời gian dài, khả năng tạo ra các mô hình AI có "lý luận thông thường" đã được ưu tiên hàng đầu trong cộng đồng nghiên cứu khoa học. **Khung ACE được xem là một nghiên cứu đột phá sáng tạo để giải quyết vấn đề này.
Trên thực tế, khái niệm ACE tương tự như khung kỹ thuật "truyền thông tư duy" do Viện Tự động hóa thuộc Viện Hàn lâm Khoa học Trung Quốc và Đại học Yale đề xuất cách đây không lâu, cho phép các mô hình lớn học cách sử dụng kinh nghiệm trong quá khứ để tăng cường khả năng suy luận phức tạp để đối phó với các vấn đề mới, nhưng phân lớp lý luận cụ thể hơn và các hạn chế về đạo đức được thêm vào để đảm bảo an toàn cho nội dung đầu ra.
Địa chỉ giấy:
Khung công nghệ ACE đã được nhiều nhà lãnh đạo công nghệ trong ngành công nhận. John Etchemendy, giáo sư tại Khoa Khoa học Máy tính tại Đại học Stanford, nói rằng khung ACE đánh dấu một mô hình mới cho nghiên cứu AI, và thiết kế phản hồi thông tin và trừu tượng phân cấp của nó rất hữu ích trong việc đạt được lý luận thông thường nhân tạo.
Daniela Rus, giám đốc Phòng thí nghiệm AI của MIT, tin rằng khung ACE xây dựng một cấu trúc hoàn chỉnh tích hợp các nguyên tắc đạo đức, nhận thức và tính toán, cung cấp một hướng nghiên cứu mới cho lý luận thông thường nhân tạo.
Mục tiêu tổng thể của khung ACE là đạt được một hệ thống AI vừa tràn đầy năng lượng vừa có đạo đức. Sự đổi mới cốt lõi của nó nằm ở việc tích hợp lý luận đạo đức trừu tượng ở cấp cao nhất và thực hiện các nhiệm vụ cụ thể ở phía dưới để xây dựng một hệ thống nhận thức khép kín và hoàn chỉnh.
ACE chủ yếu bao gồm 6 lớp: đạo đức, chiến lược toàn cầu, mô hình đại lý, thực thi, kiểm soát nhận thức và thực hiện nhiệm vụ, mỗi lớp tập trung vào các chức năng khác nhau, lớp trên liên quan đến lý luận trừu tượng và lớp dưới chịu trách nhiệm thực hiện nhiệm vụ cụ thể.
Lớp đạo đức
Cấp độ đạo đức cao nhất xác định hướng và nguyên tắc của toàn bộ hệ thống, và chức năng của nó là xác định các giá trị cốt lõi và nguyên tắc đạo đức của một tác nhân tự trị, bao gồm 3 phần.
(1) Các nguyên tắc đạo đức cơ bản: Đây là một quy tắc đạo đức trực quan cung cấp sự tuân thủ cơ bản cho hệ thống.
(2) Nguyên tắc thứ yếu: Cung cấp hướng dẫn cụ thể như nghĩa vụ nhân quyền.
(3) Tuyên bố sứ mệnh: Xác định mục tiêu và ý định cốt lõi của đại lý.
Lớp chiến lược toàn cầu
Sau khi nhận được các nhiệm vụ trừu tượng từ tầng lớp đạo đức, lớp chiến lược toàn cầu sẽ xây dựng một kế hoạch dài hạn để đạt được các nhiệm vụ này kết hợp với tình hình cụ thể, bao gồm hai phần.
(1) Hợp nhất bối cảnh: tiếp thu thông tin môi trường và hiểu tình hình cụ thể mà tác nhân phải đối mặt.
(2) Tài liệu chiến lược: Tài liệu hướng dẫn đầu ra để cung cấp hướng dẫn hành động cho các cấp thấp hơn.
**Lớp mô hình tác nhân **
Nó cam kết hiểu các thông số khả năng, cấu trúc hệ thống, ràng buộc, v.v. của một tác nhân trong một môi trường nhất định và xây dựng một "tự mô hình" để cung cấp cơ sở cho việc ra quyết định, bao gồm 4 phần.
(1) Thông số vận hành: dữ liệu đo từ xa thu được thông qua giám sát.
(2) Thông tin cấu hình: kiến trúc phần mềm và phần cứng, phiên bản, v.v.
(3) Phạm vi thẩm quyền: những điều có thể được hoàn thành và những điều không thể hoàn thành.
(4) Hạn chế: Các ràng buộc chỉ có thể hoạt động trong các điều kiện cụ thể.
**Lớp chức năng điều hành **
Lớp chức năng điều hành hoạt động như một "người quản lý dự án", chuyển các nhiệm vụ chiến lược từ cấp cao nhất thành một lộ trình kế hoạch rõ ràng. Lộ trình cung cấp tất cả các bước thực hiện cụ thể, có tính đến phân bổ nguồn lực và quản lý rủi ro, để biến chiến lược thành hiện thực, bao gồm bốn phần.
(1) Xác định các bước nhiệm vụ: Phân tách các nhiệm vụ chiến lược thành các hoạt động chi tiết.
(2) Đặt điểm kiểm tra: Xác định kết quả trung gian quan trọng để chấp nhận tiến độ.
(3) Phân bổ nguồn lực: Tối ưu hóa việc sử dụng các nguồn lực để đảm bảo thực hiện kế hoạch được thông suốt.
(4) Đánh giá rủi ro: Dự đoán các vấn đề có thể xảy ra và lên kế hoạch trước các biện pháp đối phó.
Lớp kiểm soát nhận thức**
Lớp kiểm soát nhận thức đóng vai trò "quản lý nhiệm vụ", tự động chọn và lên lịch các nhiệm vụ phù hợp theo môi trường hiện tại và phản hồi, bao gồm bốn phần.
(1) Lựa chọn nhiệm vụ: Chọn nhiệm vụ tiếp theo dựa trên mức độ ưu tiên, môi trường, v.v.
(2) Chuyển đổi tác vụ: Chuyển đổi trơn tru giữa các tác vụ để tối ưu hóa đơn hàng.
(3) Nhận thức thất vọng: Nếu nhiệm vụ được lặp đi lặp lại và thất bại, nó sẽ tạo ra những thay đổi chủ động.
(4) Điều chỉnh nội bộ: suy nghĩ về ưu và nhược điểm của các tùy chọn khác nhau.
Lớp thực thi tác vụ
Lớp thực hiện tác vụ cuối cùng tương tác trực tiếp với môi trường để thực hiện các nhiệm vụ cụ thể được phân công bởi lớp điều khiển nhận thức. Tùy thuộc vào loại tác vụ, bạn có thể gọi giao diện API, kiểm soát cơ chế và tiến hành đối thoại, bao gồm ba phần.
(1) Giao tiếp kỹ thuật số: sử dụng ngôn ngữ lập trình và các cuộc gọi giao diện để thực hiện các tác vụ kỹ thuật số
(2) Hợp tác vật lý: điều khiển robot và cảm biến để hoàn thành các nhiệm vụ vật lý
(3) Giám sát kết quả: so sánh kết quả với kỳ vọng và gửi phản hồi thành công hay thất bại
Thiết kế nhiều lớp này với sự phân công lao động rõ ràng có nhiều lợi ích: thứ nhất, các cấp độ khác nhau có thể hoạt động song song cùng một lúc, giúp cải thiện hiệu quả; Thứ hai, đóng gói nhiều lớp và ẩn thông tin tăng cường tính bảo mật và khả năng diễn giải của hệ thống;
Thứ ba, phân lớp cho phép hệ thống được nâng cấp lặp đi lặp lại theo mô-đun mà không cần tái cấu trúc hoàn toàn; Thứ tư, cấp trên có thể giám sát hoạt động của lớp dưới, và khi nào có thể sửa sai lệch Einmal, để đảm bảo khả năng điều khiển của hệ thống.
Ngoài ra, một cải tiến khác của khung ACE là việc sử dụng thông minh các mô hình ngôn ngữ lớn phổ biến hiện nay, chẳng hạn như ChatGPT, Bard, v.v.
Bằng cách học một lượng lớn dữ liệu văn bản, các mô hình này đã chứng minh khả năng hiểu ngôn ngữ và tạo ngôn ngữ gần gũi với con người. Khung ACE tích hợp lớp ngôn ngữ vào mỗi lớp, để mô hình ngôn ngữ không còn hoạt động một mình mà trở thành một thành phần chính làm nền tảng cho toàn bộ kiến trúc nhận thức **.
Từ lớp đạo đức đến lớp nhiệm vụ, các mô hình ngôn ngữ giúp hiểu các khái niệm trừu tượng, đưa ra lý luận chiến lược, xây dựng mô hình tự và thậm chí cuối cùng kiểm soát cách robot thực hiện các nhiệm vụ là ngôn ngữ.
Sự hợp nhất này cung cấp bối cảnh và hướng dẫn rõ ràng cho mô hình ngôn ngữ, làm cho đầu ra mà nó tạo ra chính xác hơn và tránh vấn đề "nói chuyện với chính mình".
Điều này cũng cho thấy các mô hình ngôn ngữ lớn cũng có thể đóng một vai trò quan trọng ở cấp hệ thống, thay vì chỉ hoàn thành các nhiệm vụ ngôn ngữ riêng lẻ. Khung ACE cho thấy làm thế nào để khai thác tốt hơn tiềm năng của các mô hình ngôn ngữ lớn như một động cơ cốt lõi để phát triển nhận thức và sức mạnh lý luận thông thường nhân tạo.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Hãy để các mô hình như ChatGPT học cách tự suy nghĩ! Khung công nghệ đột phá "nhận thức tự trị"
Nguồn gốc: Cộng đồng mở AIGC
ChatGPT, Baidu, Wenxin, Yiyan, Bard và các mô hình ngôn ngữ lớn khác đã thể hiện khả năng siêu sáng tạo và đẩy nhanh quá trình ứng dụng AI tạo ra. Tuy nhiên, các mô hình AI chỉ có thể thực hiện các nhiệm vụ khác nhau dựa trên dữ liệu đào tạo và không thể sử dụng kiến thức sống và kinh nghiệm trong quá khứ để suy luận và ra quyết định phức tạp như con người.
Ví dụ khi chơi game, con người có thể sử dụng nhiều manh mối, lẽ thường, kinh nghiệm và hiểu biết về luật chơi để đưa ra quyết định tốt nhất. AI chỉ có thể học chế độ của trò chơi thông qua một số lượng lớn đào tạo và không có chức năng hiểu biết nhân bản. Một khi luật chơi hoặc môi trường thay đổi, AI khó có thể đưa ra lựa chọn đúng đắn.
Để giải quyết những vấn đề này, Phòng thí nghiệm AI tại Đại học Clemson đã đề xuất Thực thể nhận thức tự trị (ACE). Thông qua sáu thiết kế phân cấp về đạo đức, chiến lược toàn cầu, mô hình đại lý, thực thi, kiểm soát nhận thức và thực hiện nhiệm vụ, các mô hình AI có thể nhận ra kiến trúc nhận thức của "ra quyết định tự trị" và lý luận đạo đức **.
Trong một thời gian dài, khả năng tạo ra các mô hình AI có "lý luận thông thường" đã được ưu tiên hàng đầu trong cộng đồng nghiên cứu khoa học. **Khung ACE được xem là một nghiên cứu đột phá sáng tạo để giải quyết vấn đề này.
Trên thực tế, khái niệm ACE tương tự như khung kỹ thuật "truyền thông tư duy" do Viện Tự động hóa thuộc Viện Hàn lâm Khoa học Trung Quốc và Đại học Yale đề xuất cách đây không lâu, cho phép các mô hình lớn học cách sử dụng kinh nghiệm trong quá khứ để tăng cường khả năng suy luận phức tạp để đối phó với các vấn đề mới, nhưng phân lớp lý luận cụ thể hơn và các hạn chế về đạo đức được thêm vào để đảm bảo an toàn cho nội dung đầu ra.
Địa chỉ giấy:
Daniela Rus, giám đốc Phòng thí nghiệm AI của MIT, tin rằng khung ACE xây dựng một cấu trúc hoàn chỉnh tích hợp các nguyên tắc đạo đức, nhận thức và tính toán, cung cấp một hướng nghiên cứu mới cho lý luận thông thường nhân tạo.
Mục tiêu tổng thể của khung ACE là đạt được một hệ thống AI vừa tràn đầy năng lượng vừa có đạo đức. Sự đổi mới cốt lõi của nó nằm ở việc tích hợp lý luận đạo đức trừu tượng ở cấp cao nhất và thực hiện các nhiệm vụ cụ thể ở phía dưới để xây dựng một hệ thống nhận thức khép kín và hoàn chỉnh.
ACE chủ yếu bao gồm 6 lớp: đạo đức, chiến lược toàn cầu, mô hình đại lý, thực thi, kiểm soát nhận thức và thực hiện nhiệm vụ, mỗi lớp tập trung vào các chức năng khác nhau, lớp trên liên quan đến lý luận trừu tượng và lớp dưới chịu trách nhiệm thực hiện nhiệm vụ cụ thể.
Cấp độ đạo đức cao nhất xác định hướng và nguyên tắc của toàn bộ hệ thống, và chức năng của nó là xác định các giá trị cốt lõi và nguyên tắc đạo đức của một tác nhân tự trị, bao gồm 3 phần.
(1) Các nguyên tắc đạo đức cơ bản: Đây là một quy tắc đạo đức trực quan cung cấp sự tuân thủ cơ bản cho hệ thống.
(2) Nguyên tắc thứ yếu: Cung cấp hướng dẫn cụ thể như nghĩa vụ nhân quyền.
(3) Tuyên bố sứ mệnh: Xác định mục tiêu và ý định cốt lõi của đại lý.
Lớp chiến lược toàn cầu
Sau khi nhận được các nhiệm vụ trừu tượng từ tầng lớp đạo đức, lớp chiến lược toàn cầu sẽ xây dựng một kế hoạch dài hạn để đạt được các nhiệm vụ này kết hợp với tình hình cụ thể, bao gồm hai phần.
(1) Hợp nhất bối cảnh: tiếp thu thông tin môi trường và hiểu tình hình cụ thể mà tác nhân phải đối mặt.
(2) Tài liệu chiến lược: Tài liệu hướng dẫn đầu ra để cung cấp hướng dẫn hành động cho các cấp thấp hơn.
Nó cam kết hiểu các thông số khả năng, cấu trúc hệ thống, ràng buộc, v.v. của một tác nhân trong một môi trường nhất định và xây dựng một "tự mô hình" để cung cấp cơ sở cho việc ra quyết định, bao gồm 4 phần.
(1) Thông số vận hành: dữ liệu đo từ xa thu được thông qua giám sát.
(2) Thông tin cấu hình: kiến trúc phần mềm và phần cứng, phiên bản, v.v.
(3) Phạm vi thẩm quyền: những điều có thể được hoàn thành và những điều không thể hoàn thành.
(4) Hạn chế: Các ràng buộc chỉ có thể hoạt động trong các điều kiện cụ thể.
**Lớp chức năng điều hành **
Lớp chức năng điều hành hoạt động như một "người quản lý dự án", chuyển các nhiệm vụ chiến lược từ cấp cao nhất thành một lộ trình kế hoạch rõ ràng. Lộ trình cung cấp tất cả các bước thực hiện cụ thể, có tính đến phân bổ nguồn lực và quản lý rủi ro, để biến chiến lược thành hiện thực, bao gồm bốn phần.
(1) Xác định các bước nhiệm vụ: Phân tách các nhiệm vụ chiến lược thành các hoạt động chi tiết.
(2) Đặt điểm kiểm tra: Xác định kết quả trung gian quan trọng để chấp nhận tiến độ.
(3) Phân bổ nguồn lực: Tối ưu hóa việc sử dụng các nguồn lực để đảm bảo thực hiện kế hoạch được thông suốt.
(4) Đánh giá rủi ro: Dự đoán các vấn đề có thể xảy ra và lên kế hoạch trước các biện pháp đối phó.
Lớp kiểm soát nhận thức đóng vai trò "quản lý nhiệm vụ", tự động chọn và lên lịch các nhiệm vụ phù hợp theo môi trường hiện tại và phản hồi, bao gồm bốn phần.
(2) Chuyển đổi tác vụ: Chuyển đổi trơn tru giữa các tác vụ để tối ưu hóa đơn hàng.
(3) Nhận thức thất vọng: Nếu nhiệm vụ được lặp đi lặp lại và thất bại, nó sẽ tạo ra những thay đổi chủ động.
(4) Điều chỉnh nội bộ: suy nghĩ về ưu và nhược điểm của các tùy chọn khác nhau.
Lớp thực thi tác vụ
Lớp thực hiện tác vụ cuối cùng tương tác trực tiếp với môi trường để thực hiện các nhiệm vụ cụ thể được phân công bởi lớp điều khiển nhận thức. Tùy thuộc vào loại tác vụ, bạn có thể gọi giao diện API, kiểm soát cơ chế và tiến hành đối thoại, bao gồm ba phần.
(1) Giao tiếp kỹ thuật số: sử dụng ngôn ngữ lập trình và các cuộc gọi giao diện để thực hiện các tác vụ kỹ thuật số
(2) Hợp tác vật lý: điều khiển robot và cảm biến để hoàn thành các nhiệm vụ vật lý
(3) Giám sát kết quả: so sánh kết quả với kỳ vọng và gửi phản hồi thành công hay thất bại
Thiết kế nhiều lớp này với sự phân công lao động rõ ràng có nhiều lợi ích: thứ nhất, các cấp độ khác nhau có thể hoạt động song song cùng một lúc, giúp cải thiện hiệu quả; Thứ hai, đóng gói nhiều lớp và ẩn thông tin tăng cường tính bảo mật và khả năng diễn giải của hệ thống;
Thứ ba, phân lớp cho phép hệ thống được nâng cấp lặp đi lặp lại theo mô-đun mà không cần tái cấu trúc hoàn toàn; Thứ tư, cấp trên có thể giám sát hoạt động của lớp dưới, và khi nào có thể sửa sai lệch Einmal, để đảm bảo khả năng điều khiển của hệ thống.
Bằng cách học một lượng lớn dữ liệu văn bản, các mô hình này đã chứng minh khả năng hiểu ngôn ngữ và tạo ngôn ngữ gần gũi với con người. Khung ACE tích hợp lớp ngôn ngữ vào mỗi lớp, để mô hình ngôn ngữ không còn hoạt động một mình mà trở thành một thành phần chính làm nền tảng cho toàn bộ kiến trúc nhận thức **.
Từ lớp đạo đức đến lớp nhiệm vụ, các mô hình ngôn ngữ giúp hiểu các khái niệm trừu tượng, đưa ra lý luận chiến lược, xây dựng mô hình tự và thậm chí cuối cùng kiểm soát cách robot thực hiện các nhiệm vụ là ngôn ngữ.
Sự hợp nhất này cung cấp bối cảnh và hướng dẫn rõ ràng cho mô hình ngôn ngữ, làm cho đầu ra mà nó tạo ra chính xác hơn và tránh vấn đề "nói chuyện với chính mình".
Điều này cũng cho thấy các mô hình ngôn ngữ lớn cũng có thể đóng một vai trò quan trọng ở cấp hệ thống, thay vì chỉ hoàn thành các nhiệm vụ ngôn ngữ riêng lẻ. Khung ACE cho thấy làm thế nào để khai thác tốt hơn tiềm năng của các mô hình ngôn ngữ lớn như một động cơ cốt lõi để phát triển nhận thức và sức mạnh lý luận thông thường nhân tạo.