A Meta estabelece oito diretrizes para projetar sistemas de IA para óculos AR 24 horas por dia, 7 dias por semana

Editora: Ester

Fonte: Qingting.com

Como todos sabemos, a Meta não se limita apenas a headsets VR como o Quest, mas também está criando óculos AR mais leves, com o objetivo de tornar os produtos mais integrados ao dia a dia das pessoas. Além do hardware leve, também é crucial em termos de funções e experiência interativa, como métodos de interação natural, como entrada de gestos e assistentes visuais de IA, etc., que são inseparáveis da visão computacional e da tecnologia de IA.

A tecnologia AI será uma parte importante dos óculos AR. Ao fornecer aos usuários respostas e sugestões em tempo real (como rotas de navegação recomendadas, até horários e pratos recomendados de acordo com as preferências etc.) se tornará Meta AR.Um dos pontos de venda de óculos. Especialmente, considerando o investimento da Meta em tecnologia de IA nos últimos anos, temos todos os motivos para acreditar nisso.

Reality Labs lançou um estudo: XAIR, a partir do qual podemos aprender os princípios de design de sistemas de IA em óculos AR. A estrutura é baseada em pesquisas como o Explainable Artificial Intelligence Framework (XAI) e Human-Computer Interaction (HCI), que contém 8 princípios principais de design, que podem fornecer referências valiosas para o design de AI de óculos AR.

**O que é XAI? **

De acordo com o Qingting.com, o XAI (Explainable AI), também conhecido como Transparent AI (IA Transparente), é caracterizado por comportamentos fáceis de entender. A maior parte da IA baseada em aprendizado de máquina opera nas chamadas caixas pretas e, como não pode fornecer as razões e os insights por trás das decisões, essa IA é arriscada porque é incerto se é confiável, confiável ou tendenciosa.

O conceito de XAI pode ser rastreado há mais de quarenta anos.Mais tarde, com o sucesso do modelo AI/ML de caixa preta, a tecnologia XAI começou a atrair a atenção de acadêmicos, agências reguladoras e outras indústrias. A pesquisa mostra que o XAI fornecerá aos usuários decisões claras e criará confiança. Portanto, no campo industrial, o XAI começou a ser aplicado em cenários cotidianos para melhorar a experiência do usuário.

O XAI pode atender diferentes públicos-alvo e ter vários usos. A pesquisa inicial de XAI se concentrou apenas em desenvolvedores de algoritmos, cientistas de dados e especialistas nas áreas de medicina clínica. razões de um site de compras e assim por diante. No entanto, ainda é cedo.

Importância do XAI

Tornar a IA amplamente compreendida pelos humanos envolverá esforços de pesquisa multidisciplinares. Por exemplo, pesquisadores de ML desenvolveram algoritmos que geram modelos transparentes (por exemplo, árvores de decisão, modelos bayesianos) ou usam técnicas de interpretação post-hoc (por exemplo, importância de recursos, explicações visuais) para gerar explicações. Os pesquisadores da HCI, por outro lado, concentram-se em melhorar a confiança do usuário e a compreensão das explicações geradas pela máquina. Os pesquisadores de psicologia, por outro lado, estudam o XAI de uma perspectiva mais fundamental, observando como as pessoas geram, comunicam e compreendem.

A IA aberta e transparente também é muito importante e está alinhada com sua futura estratégia de desenvolvimento no campo de AR/VR. Na pesquisa XAIR, o objetivo do XAI é ajudar os usuários a entender de forma clara e fácil as decisões e funções da IA, gerando detalhes ou razões. A Meta apontou que o XAI é uma parte importante do sistema interativo orientado por IA e também desempenhará um papel importante nos aplicativos AR diários no futuro, ajudando os usuários a interagir com os serviços inteligentes visualizados. O XAI pode entender melhor o comportamento dos sistemas inteligentes de AR, evitar decisões inesperadas de IA, cultivar a consciência de privacidade e ganhar a confiança do usuário.

Um desafio que a Meta enfrenta atualmente, no entanto, é criar experiências XAI eficazes para aplicativos AR diários. A maioria das pesquisas existentes sobre XAI concentra-se em categorizar tipos de interpretação e técnicas de geração, sem considerar as características dos cenários cotidianos de AR, como informações perceptivas geradas por usuários e contexto, execução ininterrupta e boa adaptabilidade. Esses fatores não apenas levam a interpretações mais amigáveis, mas também influenciam o design de interfaces de interpretação.

Portanto, Meta propôs a estrutura de design XAIR, que descreve quando e como explicar as decisões de IA em AR. Para construir a estrutura XAIR, também foi realizado um experimento com 500 pessoas para coletar suas preferências para design de experiência AR. Além disso, também são referidos os insights de 12 especialistas em interação AR.

O foco desta pesquisa é identificar três questões:

  • Quando a IA deve explicar;
  • o que pode ser explicado;
  • Como explicar.

Estudos anteriores exploraram as duas primeiras questões e, embora não sejam específicos para AR, forneceram algumas informações úteis para o projeto de XAIR.

Diretrizes de Projeto XAI

A Meta acredita que, se os óculos AR tiverem serviços inteligentes, a IA desempenhará um papel importante, como fornecer aos usuários sugestões baseadas em contexto com base nas informações capturadas pelos sensores dos óculos AR. Além disso, a interação entre IA e usuários precisa ser baseada em um design XAI eficaz para garantir que as decisões de IA sejam confiáveis e confiáveis, melhorando assim a experiência do usuário.

Diferente da estrutura XAI existente para computadores e telefones celulares, o design XAI do AR precisa incorporar informações contextuais mais profundas e ricas (mesmo considerando o estado do usuário), portanto, precisa ser reprojetado especificamente para AR. Além disso, o XAI do AR também precisa ter recursos de percepção 3D e estar online em tempo real antes de poder ser aplicado a cenários diários de AR e integrar o conteúdo de interpretação ao espaço físico. Por exemplo, ao recomendar receitas, destaque ao mesmo tempo os ingredientes que estão na geladeira do usuário, ou seja, explique a decisão com base no contexto da cena. Em contraste, as estruturas XAI existentes no mercado não podem atender a essas necessidades.

Portanto, Meta resumiu 8 principais diretrizes de design por meio de pesquisas com usuários:

  1. Sempre gere resultados de IA para garantir que os usuários possam acessá-los facilmente quando precisarem;
  2. Não acione automaticamente a explicação, a menos que duas condições sejam atendidas - identifique a alta carga cognitiva do usuário, senso de urgência, etc., ou identifique a surpresa, confusão, falta de familiaridade, incerteza etc. do usuário;
  3. Três fatores precisam ser considerados para conteúdo de explicação personalizada: objetivos do sistema, objetivos do usuário e retratos do usuário;
  4. No estado padrão, dê prioridade à explicação do porquê e escolha uma explicação concisa;
  5. Forneça sempre explicações mais detalhadas, permitindo que o usuário expanda conforme sua necessidade através de pequenas janelas de prompt, etc.;
  6. Por padrão, o mesmo método de interpretação da saída AI é usado (exceto tátil, áudio) e, quando a carga de um modo é alta, outro é selecionado;
  7. O conteúdo é maioritariamente texto, se for uma imagem, deve ser simplificado ao máximo para facilitar a compreensão dos utilizadores;
  8. Incorpore o conteúdo explicativo à cena o mais discretamente possível, ou abertamente, se não for apropriado.

A Meta combinou com as diretrizes de design, desenvolveu alguns casos de aplicação e os verificou entre 10 designers. Como resultado, os designers acreditam que XAIR pode fornecer referência abrangente ou ajuda para o design de framework XAI de AR, o que ajuda a estimular o pensamento e a imaginação de designers. Os 12 usuários finais que participaram do experimento também relataram que o XAIR tem excelente usabilidade.

Formulários

Nesta pesquisa, a Meta projetou dois casos de demonstração, se você estiver interessado, pode dar uma olhada:

  1. Quando o usuário está correndo no caminho, os óculos AR mostrarão ao usuário um mapa próximo considerando a estação e o cenário atual, sugerindo um desvio para a estrada próxima para apreciar as flores de cerejeira. As explicações que a IA pode fornecer incluem: melhor cenário, o comprimento certo da rota e a programação do usuário. Os formulários de explicação incluem texto, imagens de flores de cerejeira e muito mais.

2) Quando o usuário do AR voltar para casa depois de discutir jardinagem com os vizinhos, os óculos AR exibirão um prompt de "manutenção" nas plantas ao redor e fornecerão ao usuário instruções sobre como fertilizar as plantas. Essa sugestão precisa ser acionada manualmente pelo usuário para evitar pensar que a IA invade a privacidade, e o acionamento manual pode gerar mais confiança. Além disso, a IA também pode solicitar: Após a varredura do sistema, há manchas anormais nas folhas das plantas, indicando que elas podem sofrer de infecções fúngicas ou bacterianas. Além do texto, o formulário de explicação também pode usar AR para marcar pontos anormais nas folhas (o texto é uma dica óbvia, enquanto a dica AR é um tipo oculto, que é integrado à cena).

referência:

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)