Meta đưa ra 8 nguyên tắc thiết kế hệ thống AI cho kính AR 24/7

Biên tập viên: Esther

Nguồn: Qingting.com

Như chúng ta đã biết, Meta không chỉ giới hạn ở các tai nghe VR như Quest mà còn tạo ra các loại kính AR nhẹ hơn, với mục tiêu làm cho các sản phẩm được tích hợp tốt hơn vào cuộc sống hàng ngày của mọi người. Ngoài phần cứng nhẹ, nó cũng rất quan trọng về chức năng và trải nghiệm tương tác, chẳng hạn như các phương thức tương tác tự nhiên, chẳng hạn như nhập liệu bằng cử chỉ và trợ lý hình ảnh AI, v.v., không thể tách rời khỏi thị giác máy tính và công nghệ AI.

Công nghệ AI sẽ là một phần quan trọng của kính AR. Bằng cách cung cấp cho người dùng câu trả lời và đề xuất trong thời gian thực (chẳng hạn như tuyến đường điều hướng được đề xuất, lịch trình thậm chí và các món ăn được đề xuất theo sở thích, v.v.) để cải thiện tính khả thi của kính AR, nó sẽ trở thành Meta AR. Một trong những điểm bán hàng của kính. Đặc biệt, khi xem xét khoản đầu tư của Meta vào công nghệ AI trong những năm gần đây, chúng tôi có mọi lý do để tin vào điều này.

Phòng thí nghiệm thực tế đã công bố một nghiên cứu: XAIR, từ đó chúng ta có thể tìm hiểu các nguyên tắc thiết kế của hệ thống AI trong kính AR. Khung dựa trên các nghiên cứu như Khung trí tuệ nhân tạo có thể giải thích (XAI) và Tương tác giữa người với máy tính (HCI), bao gồm 8 nguyên tắc thiết kế chính, có thể cung cấp tài liệu tham khảo có giá trị cho thiết kế AI của kính AR.

**XAI là gì? **

Theo Qingting.com, XAI (AI có thể giải thích) hay còn gọi là AI trong suốt (AI trong suốt), được đặc trưng bởi các hành vi rất dễ hiểu. Hầu hết AI dựa trên máy học hoạt động trong cái gọi là hộp đen và vì nó không thể cung cấp lý do cũng như hiểu biết sâu sắc đằng sau các quyết định, nên AI như vậy rất rủi ro vì không chắc chắn liệu nó đáng tin cậy, đáng tin cậy hay sai lệch.

Khái niệm về XAI có thể bắt nguồn từ hơn 40 năm trước, sau đó, với sự thành công của mô hình hộp đen AI/ML, công nghệ XAI bắt đầu thu hút sự chú ý của các học giả, cơ quan quản lý và các ngành công nghiệp khác. Nghiên cứu cho thấy rằng XAI hy vọng sẽ cung cấp cho người dùng các quyết định rõ ràng và tạo dựng niềm tin. Do đó, trong lĩnh vực công nghiệp, XAI đã bắt đầu được áp dụng cho các tình huống hàng ngày để cải thiện trải nghiệm người dùng.

XAI có thể phục vụ các đối tượng mục tiêu khác nhau và có nhiều mục đích sử dụng khác nhau. Nghiên cứu ban đầu về XAI chỉ tập trung vào các nhà phát triển thuật toán, nhà khoa học dữ liệu và chuyên gia trong lĩnh vực y học lâm sàng. một lý do trang web mua sắm và như vậy. Tuy nhiên, vẫn còn sớm.

Tầm quan trọng của XAI

Làm cho AI được con người hiểu rộng rãi sẽ liên quan đến các nỗ lực nghiên cứu đa ngành. Ví dụ: các nhà nghiên cứu ML đã phát triển các thuật toán tạo ra các mô hình minh bạch (ví dụ: cây quyết định, mô hình Bayes) hoặc sử dụng các kỹ thuật diễn giải hậu kiểm (ví dụ: tầm quan trọng của tính năng, giải thích trực quan) để tạo ra các giải thích. Mặt khác, các nhà nghiên cứu HCI tập trung vào việc cải thiện sự tin tưởng và hiểu biết của người dùng về các giải thích do máy tạo ra. Mặt khác, các nhà nghiên cứu tâm lý học nghiên cứu XAI từ góc độ cơ bản hơn, xem xét cách mọi người tạo ra, giao tiếp và hiểu.

Trí tuệ nhân tạo cởi mở và minh bạch cũng rất quan trọng và nó phù hợp với chiến lược phát triển trong tương lai của hãng trong lĩnh vực AR/VR. Trong nghiên cứu của XAIR, mục đích của XAI là giúp người dùng hiểu rõ ràng và dễ dàng các quyết định và chức năng của AI bằng cách tạo ra các chi tiết hoặc lý do. Meta chỉ ra rằng XAI là một phần quan trọng của hệ thống tương tác do AI điều khiển và nó cũng sẽ đóng một vai trò quan trọng trong các ứng dụng AR hàng ngày trong tương lai, hỗ trợ người dùng tương tác với các dịch vụ thông minh trực quan. XAI có thể hiểu rõ hơn hành vi của các hệ thống thông minh AR, tránh các quyết định AI không mong muốn, nâng cao nhận thức về quyền riêng tư và giành được sự tin tưởng của người dùng.

Tuy nhiên, một thách thức mà Meta hiện đang phải đối mặt là tạo ra trải nghiệm XAI hiệu quả cho các ứng dụng AR hàng ngày. Hầu hết các nghiên cứu XAI hiện có đều tập trung vào việc phân loại các loại diễn giải và kỹ thuật tạo mà không xem xét các đặc điểm của các kịch bản AR hàng ngày, chẳng hạn như thông tin nhận thức do người dùng và ngữ cảnh tạo ra, hoạt động suốt ngày đêm và khả năng thích ứng tốt. Những yếu tố này không chỉ dẫn đến các diễn giải thân thiện với con người hơn mà còn ảnh hưởng đến việc thiết kế các giao diện diễn giải.

Do đó, Meta đã đề xuất khung thiết kế XAIR, mô tả thời điểm và cách giải thích các quyết định của AI trong AR. Để xây dựng khung XAIR, một thử nghiệm với 500 người cũng đã được tiến hành để thu thập sở thích của họ đối với thiết kế trải nghiệm AR. Ngoài ra, những hiểu biết của 12 chuyên gia về tương tác AR cũng được tham khảo.

Trọng tâm của nghiên cứu này là xác định ba câu hỏi:

  • Khi nào AI nên giải thích;
  • những gì có thể được giải thích;
  • Cách giải thích.

Các nghiên cứu trước đây đã khám phá hai vấn đề đầu tiên và mặc dù không dành riêng cho AR, nhưng đã cung cấp một số thông tin hữu ích cho việc thiết kế XAIR.

Hướng dẫn thiết kế XAI

Meta tin rằng nếu kính AR có các dịch vụ thông minh, thì AI sẽ đóng một vai trò quan trọng, chẳng hạn như cung cấp cho người dùng các đề xuất dựa trên ngữ cảnh dựa trên thông tin được thu thập bởi các cảm biến của kính AR. Ngoài ra, sự tương tác giữa AI và người dùng cần dựa trên thiết kế XAI hiệu quả để đảm bảo rằng các quyết định của AI là đáng tin cậy và đáng tin cậy, từ đó cải thiện trải nghiệm người dùng.

Khác với khung XAI hiện có dành cho máy tính và điện thoại di động, thiết kế XAI của AR cần kết hợp thông tin ngữ cảnh sâu hơn và phong phú hơn (thậm chí xem xét trạng thái của người dùng), vì vậy nó cần được thiết kế lại dành riêng cho AR. Hơn nữa, XAI của AR cũng cần có khả năng nhận thức 3D và trực tuyến trong thời gian thực trước khi có thể áp dụng cho các tình huống AR hàng ngày và tích hợp nội dung diễn giải với không gian vật lý. Ví dụ: khi đề xuất công thức nấu ăn, hãy làm nổi bật các thành phần trong tủ lạnh của người dùng cùng một lúc, nghĩa là giải thích quyết định dựa trên bối cảnh của cảnh. Ngược lại, các khung XAI hiện có trên thị trường không thể đáp ứng những nhu cầu này.

Do đó, Meta đã tóm tắt 8 hướng dẫn thiết kế chính thông qua khảo sát người dùng:

  1. Luôn tạo kết quả AI để đảm bảo người dùng có thể dễ dàng tiếp cận khi cần;
  2. Không tự động kích hoạt phần giải thích, trừ khi đáp ứng hai điều kiện—xác định mức độ nhận thức cao, cảm giác cấp bách, v.v. của người dùng hoặc xác định sự ngạc nhiên, bối rối, không quen thuộc, không chắc chắn, v.v. của người dùng;
  3. Ba yếu tố cần được xem xét đối với nội dung giải thích được cá nhân hóa: mục tiêu hệ thống, mục tiêu người dùng và chân dung người dùng;
  4. Ở trạng thái mặc định, ưu tiên giải thích tại sao và chọn giải thích ngắn gọn;
  5. Luôn cung cấp các giải thích chi tiết hơn, cho phép người dùng mở rộng theo nhu cầu của họ thông qua các cửa sổ nhắc nhở nhỏ, v.v.;
  6. Theo mặc định, phương pháp diễn giải tương tự như đầu ra AI được sử dụng (ngoại trừ xúc giác, âm thanh) và khi một chế độ tải cao, một chế độ khác sẽ được chọn;
  7. Nội dung chủ yếu là chữ, nếu là hình thì nên đơn giản hóa hết mức có thể để người dùng dễ hiểu;
  8. Nhúng nội dung giải thích vào hiện trường một cách bí mật nhất có thể hoặc công khai nếu không phù hợp.

Meta kết hợp với hướng dẫn thiết kế, phát triển một số trường hợp ứng dụng và xác minh chúng trong số 10 nhà thiết kế. Do đó, các nhà thiết kế tin rằng XAIR có thể cung cấp tài liệu tham khảo hoặc trợ giúp toàn diện cho thiết kế khung XAI của AR, giúp kích thích tư duy và trí tưởng tượng của nhà thiết kế. 12 người dùng cuối tham gia thử nghiệm cũng báo cáo rằng XAIR có khả năng sử dụng tuyệt vời.

Các ứng dụng

Trong nghiên cứu này, Meta đã thiết kế hai case trình diễn, nếu bạn quan tâm có thể xem qua:

  1. Khi người dùng đang chạy bộ trên đường, kính AR sẽ hiển thị cho người dùng một bản đồ gần đó có tính đến mùa và phong cảnh hiện tại, gợi ý đường vòng đến con đường gần đó để thưởng thức hoa anh đào. Những lời giải thích mà AI có thể cung cấp bao gồm: khung cảnh đẹp hơn, độ dài phù hợp của tuyến đường và lịch trình của người dùng. Các mẫu thuyết minh bao gồm văn bản, hình ảnh hoa anh đào, v.v.

2) Khi người dùng AR trở về nhà sau khi thảo luận về việc làm vườn với hàng xóm, kính AR sẽ hiển thị lời nhắc "bảo dưỡng" trên các cây xung quanh và cung cấp cho người dùng hướng dẫn bón phân cho cây. Người dùng cần kích hoạt đề xuất này theo cách thủ công để tránh nghĩ rằng AI xâm phạm quyền riêng tư và việc kích hoạt thủ công có thể tạo dựng lòng tin tốt hơn. Ngoài ra, AI cũng có thể nhắc nhở: Sau khi hệ thống quét, trên lá cây có những đốm bất thường, cho thấy chúng có thể bị nhiễm nấm hoặc vi khuẩn. Ngoài dạng chữ, dạng thuyết minh còn có thể dùng AR để đánh dấu các điểm bất thường trên lá (dạng chữ là gợi ý rõ ràng, còn gợi ý AR là loại ẩn, được lồng ghép với cảnh).

thẩm quyền giải quyết:

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)