Recentemente, Andrej Karpathy, o co-fundador da OpenAI, fez um breve discurso em um evento para desenvolvedores, falando sobre as visões internas dele e da OpenAI sobre AI Agents (agentes de inteligência artificial).
Andrej Karpathy comparou as dificuldades no desenvolvimento de AI Agents no passado com as novas oportunidades desenvolvidas sob novas ferramentas tecnológicas e não esqueceu de ridicularizar seu trabalho na Tesla por estar "distraído pelo piloto automático". Ele vê a direção autônoma e a realidade virtual como exemplos de maus agentes de IA.
Para novas oportunidades, Andrej Karpathy acredita que este é o momento de retornar novamente à neurociência e buscar inspiração nela - assim como aconteceu nos primeiros dias do aprendizado profundo.
Por outro lado, Andrej Karpathy acredita que pessoas comuns, empreendedores e geeks têm mais vantagens do que empresas como a OpenAI na construção de agentes de IA. Todos estão atualmente em um estado de competição igualitária, então ele está ansioso para ver os resultados a esse respeito.
O seguinte é o texto completo desta partilha:
Olá pessoal. Fui convidado a falar algumas palavras motivacionais sobre o tema Agentes de IA.
Acho que AI Agents está perto de mim de certa forma, deixe-me começar com uma história, esta é uma história muito antiga do OpenAI, OpenAI talvez apenas uma dúzia de pessoas naquela época, por volta de 2016, naquela época A tendência é realmente RL Agents ( Agentes de Aprendizagem por Reforço). Todo mundo estava muito interessado em construir agentes, mas na época era principalmente baseado em jogos, e a empolgação girava em torno de empresas de jogos como Atari, e meu projeto na OpenAI estava tentando focar Agentes RL em teclados e O mouse é usado no computador , não o jogo. Quero torná-los mais úteis e dar muito trabalho, o projeto se chama World of Bits. Alguns colegas e eu acabamos publicando um artigo.
Não é um artigo incrível, porque na verdade é baseado em métodos de aprendizado por reforço RL. Nossas páginas da web são muito simples e permitem que as pessoas reservem um voo ou peçam comida e assim por diante. Obviamente, nada disso funcionaria porque a tecnologia não estava pronta e não seria sensato fazer essas coisas na época. Os fatos provaram que devemos esquecer completamente os agentes de IA e fazer modelos de linguagem.
Voltamos para cá cinco anos depois e fiquei um pouco distraído com a direção autônoma, mas agora que os agentes de IA voltaram a ser legais, nossa caixa de ferramentas é completamente diferente e a maneira como abordamos esses problemas é completamente diferente. Na verdade, todos vocês estão trabalhando em AI Agents, mas podem não estar usando nenhum método de aprendizado por reforço. É uma loucura, acho que não teríamos previsto isso. Foi muito divertido.
Deixe-me falar um pouco sobre por que os agentes de IA são tão populares. Acho que está claro para muitos que a AGI (inteligência geral artificial) aproveitará ao máximo as capacidades dos Agentes de IA, não um, mas muitos. Talvez haja organizações ou civilizações de entidades digitais, o que eu acho muito inspirador, até um pouco maluco. No entanto, também quero jogar um pouco de água fria nisso. Acho que existe toda uma classe de problemas fáceis de imaginar, fáceis de construir, fáceis de demonstrar, mas muito difíceis de fazer um produto. Muitas coisas se enquadram nessa categoria, acho que a direção autônoma é um exemplo.
A direção autônoma é fácil de imaginar e fácil de construir uma demonstração de um carro dirigindo por um quarteirão, mas levou uma década para transformar isso em um produto. Da mesma forma, acho que é o mesmo com VR, vai levar uma década para fazer funcionar.
Acho que o mesmo é verdade até certo ponto com os agentes de IA. É fácil imaginar cenários para isso e é muito empolgante, mas acho que se você está nele, deve investir uma década para realmente funcionar.
Outra coisa que quero dizer é que acho interessante voltar à neurociência agora e ser inspirado por ela novamente de algumas maneiras, os primeiros dias do aprendizado profundo foram inspirados pela neurociência. É muito interessante pensar sobre a relação entre eles, especialmente acho que muitas pessoas veem os modelos de linguagem como parte da solução, mas como você constrói uma entidade digital completa que possui todas as capacidades cognitivas dos humanos? Claramente, todos nós concordamos que precisamos de algum tipo de sistema subjacente para planejar, pensar e refletir sobre o que estamos fazendo, e é aqui que a neurociência entra em cena.
Por exemplo, o hipocampo é muito importante. O que em AI Agents desempenha o papel do hipocampo, que é usado para armazenar memória, recuperação de marcas, etc.? Temos uma compreensão geral de como construir os córtices visual e auditivo, mas há muitas coisas que não sabemos o que isso significa em AI Agents. Por exemplo, como é um jogo visual em AI Agents? Qual é o equivalente do tálamo, a localização da mente subconsciente, em AI Agents? É muito interessante.
Na verdade, trouxe um livro de neurociência comigo hoje, The Brain and Behavior, de David Eagleman, que achei muito interessante e esclarecedor. Tomando uma inspiração interessante da neurociência, como fizemos nos primeiros dias quando projetamos neurônios individuais, provavelmente deveríamos fazê-lo novamente hoje.
Finalmente, gostaria de terminar com algumas palavras de encorajamento. Uma coisa interessante, mas não óbvia, é que os Agentes de IA que você constrói (referindo-se à audiência ao vivo) estão realmente na vanguarda das capacidades dos Agentes de IA contemporâneos. Todas as grandes instituições LLM, como OpenAI, DeFi, etc., eu duvido que eles estejam na vanguarda. Você está na vanguarda.
Por exemplo, o OpenAI é muito bom no treinamento de grandes modelos de linguagem do Transformer. Se um artigo propõe algum tipo de método de treinamento diferente, a discussão em nosso grupo Slack dentro do OpenAI será como, ah sim, alguém tentou por dois anos e meio e não funcionou, não estamos interessados neste método Muito compreensão dos prós e contras. Mas quando saiu o novo artigo AI Agents, ficamos muito interessados e achamos muito legal, porque nossa equipe não passou cinco anos nisso, não sabemos nada além de vocês, estamos trabalhando com todos vocês As pessoas competem juntas. Essa é a razão para pensar que você está na vanguarda do que os agentes de IA podem fazer.
Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
O cofundador da OpenAI, Karpathy, compartilhou: os agentes de IA podem levar 10 anos para realmente funcionar
Organizar: Conta do Twitter "@GPTDAOCN"
Recentemente, Andrej Karpathy, o co-fundador da OpenAI, fez um breve discurso em um evento para desenvolvedores, falando sobre as visões internas dele e da OpenAI sobre AI Agents (agentes de inteligência artificial).
Andrej Karpathy comparou as dificuldades no desenvolvimento de AI Agents no passado com as novas oportunidades desenvolvidas sob novas ferramentas tecnológicas e não esqueceu de ridicularizar seu trabalho na Tesla por estar "distraído pelo piloto automático". Ele vê a direção autônoma e a realidade virtual como exemplos de maus agentes de IA.
Para novas oportunidades, Andrej Karpathy acredita que este é o momento de retornar novamente à neurociência e buscar inspiração nela - assim como aconteceu nos primeiros dias do aprendizado profundo.
Por outro lado, Andrej Karpathy acredita que pessoas comuns, empreendedores e geeks têm mais vantagens do que empresas como a OpenAI na construção de agentes de IA. Todos estão atualmente em um estado de competição igualitária, então ele está ansioso para ver os resultados a esse respeito.
Olá pessoal. Fui convidado a falar algumas palavras motivacionais sobre o tema Agentes de IA.
Acho que AI Agents está perto de mim de certa forma, deixe-me começar com uma história, esta é uma história muito antiga do OpenAI, OpenAI talvez apenas uma dúzia de pessoas naquela época, por volta de 2016, naquela época A tendência é realmente RL Agents ( Agentes de Aprendizagem por Reforço). Todo mundo estava muito interessado em construir agentes, mas na época era principalmente baseado em jogos, e a empolgação girava em torno de empresas de jogos como Atari, e meu projeto na OpenAI estava tentando focar Agentes RL em teclados e O mouse é usado no computador , não o jogo. Quero torná-los mais úteis e dar muito trabalho, o projeto se chama World of Bits. Alguns colegas e eu acabamos publicando um artigo.
Não é um artigo incrível, porque na verdade é baseado em métodos de aprendizado por reforço RL. Nossas páginas da web são muito simples e permitem que as pessoas reservem um voo ou peçam comida e assim por diante. Obviamente, nada disso funcionaria porque a tecnologia não estava pronta e não seria sensato fazer essas coisas na época. Os fatos provaram que devemos esquecer completamente os agentes de IA e fazer modelos de linguagem.
Voltamos para cá cinco anos depois e fiquei um pouco distraído com a direção autônoma, mas agora que os agentes de IA voltaram a ser legais, nossa caixa de ferramentas é completamente diferente e a maneira como abordamos esses problemas é completamente diferente. Na verdade, todos vocês estão trabalhando em AI Agents, mas podem não estar usando nenhum método de aprendizado por reforço. É uma loucura, acho que não teríamos previsto isso. Foi muito divertido.
Deixe-me falar um pouco sobre por que os agentes de IA são tão populares. Acho que está claro para muitos que a AGI (inteligência geral artificial) aproveitará ao máximo as capacidades dos Agentes de IA, não um, mas muitos. Talvez haja organizações ou civilizações de entidades digitais, o que eu acho muito inspirador, até um pouco maluco. No entanto, também quero jogar um pouco de água fria nisso. Acho que existe toda uma classe de problemas fáceis de imaginar, fáceis de construir, fáceis de demonstrar, mas muito difíceis de fazer um produto. Muitas coisas se enquadram nessa categoria, acho que a direção autônoma é um exemplo.
A direção autônoma é fácil de imaginar e fácil de construir uma demonstração de um carro dirigindo por um quarteirão, mas levou uma década para transformar isso em um produto. Da mesma forma, acho que é o mesmo com VR, vai levar uma década para fazer funcionar.
Acho que o mesmo é verdade até certo ponto com os agentes de IA. É fácil imaginar cenários para isso e é muito empolgante, mas acho que se você está nele, deve investir uma década para realmente funcionar.
Outra coisa que quero dizer é que acho interessante voltar à neurociência agora e ser inspirado por ela novamente de algumas maneiras, os primeiros dias do aprendizado profundo foram inspirados pela neurociência. É muito interessante pensar sobre a relação entre eles, especialmente acho que muitas pessoas veem os modelos de linguagem como parte da solução, mas como você constrói uma entidade digital completa que possui todas as capacidades cognitivas dos humanos? Claramente, todos nós concordamos que precisamos de algum tipo de sistema subjacente para planejar, pensar e refletir sobre o que estamos fazendo, e é aqui que a neurociência entra em cena.
Por exemplo, o hipocampo é muito importante. O que em AI Agents desempenha o papel do hipocampo, que é usado para armazenar memória, recuperação de marcas, etc.? Temos uma compreensão geral de como construir os córtices visual e auditivo, mas há muitas coisas que não sabemos o que isso significa em AI Agents. Por exemplo, como é um jogo visual em AI Agents? Qual é o equivalente do tálamo, a localização da mente subconsciente, em AI Agents? É muito interessante.
Na verdade, trouxe um livro de neurociência comigo hoje, The Brain and Behavior, de David Eagleman, que achei muito interessante e esclarecedor. Tomando uma inspiração interessante da neurociência, como fizemos nos primeiros dias quando projetamos neurônios individuais, provavelmente deveríamos fazê-lo novamente hoje.
Finalmente, gostaria de terminar com algumas palavras de encorajamento. Uma coisa interessante, mas não óbvia, é que os Agentes de IA que você constrói (referindo-se à audiência ao vivo) estão realmente na vanguarda das capacidades dos Agentes de IA contemporâneos. Todas as grandes instituições LLM, como OpenAI, DeFi, etc., eu duvido que eles estejam na vanguarda. Você está na vanguarda.
Por exemplo, o OpenAI é muito bom no treinamento de grandes modelos de linguagem do Transformer. Se um artigo propõe algum tipo de método de treinamento diferente, a discussão em nosso grupo Slack dentro do OpenAI será como, ah sim, alguém tentou por dois anos e meio e não funcionou, não estamos interessados neste método Muito compreensão dos prós e contras. Mas quando saiu o novo artigo AI Agents, ficamos muito interessados e achamos muito legal, porque nossa equipe não passou cinco anos nisso, não sabemos nada além de vocês, estamos trabalhando com todos vocês As pessoas competem juntas. Essa é a razão para pensar que você está na vanguarda do que os agentes de IA podem fazer.