Numa altura em que a IA generativa se está a tornar cada vez mais promissora e amplamente procurada, a sua implementação mais ampla exige torná-la maior, melhor e mais forte no lado terminal.
Fonte da imagem: gerada por Unbounded AI
Hoje, já se passaram quase 10 meses desde que o OpenAI lançou o ChatGPT. A onda de IA generativa desencadeada por ele permitiu que as pessoas comuns sentissem o encanto da inteligência artificial "mais perto". Quer se trate de um mecanismo de pesquisa em tempo real no estilo de bate-papo alimentado por grandes modelos ou de uma ferramenta de pintura que gera imagens por meio da inserção de texto, a IA generativa entrou lentamente e mudou sutilmente o trabalho diário, o entretenimento e os hábitos criativos das pessoas.
Junto com modelos grandes e IA generativa, os fabricantes de telefones celulares e chips estão realizando uma “revolução no lado dos dispositivos” com grande alarde. Em maio deste ano, o Google lançou o modelo de linguagem grande PaLM 2, incluindo uma versão leve do Gecko que pode ser executada em dispositivos móveis. Também em maio, a Qualcomm lançou o white paper “Hybrid AI is the Future of AI”. Em agosto, Xiaomi Lei Jun anunciou a adoção total de modelos grandes e inicialmente executou com sucesso um modelo grande de 1,3 bilhão de parâmetros no telefone celular. Xiao Ai também recebeu uma atualização nas capacidades de modelos grandes.
Não podemos deixar de perguntar: por que os principais fabricantes estão correndo para colocar grandes modelos gerais e generativos de IA em terminais, especialmente telefones celulares? Sabemos que os produtos terminais inteligentes, como smartphones, PCs, XR e carros, estão mais próximos das pessoas comuns, especialmente os telefones celulares, e passamos cada vez mais tempo neles. Em abril de 2023, a organização de pesquisa de mercado Electronics Hub divulgou um relatório mostrando que os usuários em alguns países ficam olhando para as telas dos telefones celulares por mais de 7 horas por dia. Os telefones celulares estão gradualmente evoluindo para o núcleo da vida inteligente, preparando um "viveiro" para o desenvolvimento de IA generativa no lado do terminal.
No entanto, a atual inclinação dos grandes modelos de IA generativa para o lado do terminal não aconteceu da noite para o dia. O método de implantação está passando por uma transformação da nuvem para a colaboração terminal-nuvem.
A tendência de IA generativa baseada em terminal e em nuvem andando de mãos dadas está se tornando cada vez mais proeminente
Sabemos que os parâmetros de grandes modelos generativos de IA muitas vezes chegam a bilhões, centenas ou mesmo centenas de bilhões, o que impõe requisitos extremamente elevados à infraestrutura em termos de otimização de treinamento de modelo e inferência de execução. No início, apenas a nuvem poderia fornecer um poder de computação de IA tão grande, por isso os fabricantes muitas vezes optavam por implantar e executar seus próprios modelos grandes na nuvem.
Tomando o ChatGPT como exemplo, seu treinamento e operação exigem uma grande quantidade de armazenamento de dados e recursos computacionais, e solicitações massivas de usuários geram altos custos de poder computacional, o que requer uma poderosa plataforma de serviços em nuvem. Os usuários podem acessar ChatGPT e outros produtos generativos de IA (como CodeX) por meio do serviço de nuvem Microsoft Azure OpenAI. Amazon, outro grande provedor de serviços em nuvem, também lançou um serviço de hospedagem em nuvem de IA generativa semelhante.Os usuários podem acessar modelos básicos pré-treinados de startups como AI21Labs, Anthropic e Stability AI por meio de APIs.
Obviamente, as plataformas de serviços em nuvem aceleraram esta onda de tecnologia de IA generativa que está varrendo o mundo, fornecendo aos grandes fabricantes de modelos o suporte de poder computacional necessário para treinamento e inferência de modelos. No entanto, a inferência de grandes modelos de nuvem exige custos elevados e, com o número crescente de usuários e solicitações de uso, o custo está cada vez mais alto. Como resultado, face ao aumento contínuo dos custos operacionais, os fabricantes precisam de encontrar outra forma de sair da nuvem.
Com o passar do tempo, por um lado, tecnologias de compressão de grandes modelos (como quantização, poda de rede e destilação de conhecimento) estão se tornando cada vez mais abundantes e eficazes. Por outro lado, dispositivos terminais inteligentes, como telefones celulares, PCs, XR , e os automóveis têm IA O poder da computação continua a aumentar e as condições técnicas para a implantação de IA generativa em terminais estão a amadurecer rapidamente. A tendência de terminais e nuvens andarem de mãos dadas está se tornando cada vez mais evidente.
As principais empresas tecnológicas capturaram estas mudanças e fizeram uma série de tentativas para implementar grandes modelos generativos de IA em smartphones e outros terminais. Por exemplo, o lançamento das versões iOS e Android do ChatGPT permite que usuários comuns experimentem conversas de chat generativas apenas pegando seus celulares. Haverá momentos mais importantes como este no futuro.
Além disso, em comparação com a nuvem, a implantação e execução de IA generativa no lado do terminal também apresenta vantagens em termos de custo, segurança e privacidade, além de operação confiável.
A primeira é a vantagem de custo. Anteriormente, a mídia informou que a OpenAI queimou aproximadamente US$ 700.000 por dia apenas para manter o ChatGPT funcionando, o que significa que quase US$ 200 milhões podem ter sido gastos no ChatGPT. Um custo tão alto é muito alto até mesmo para a OpenAI suportar, tornando difícil atingir o ponto de equilíbrio e muito menos obter lucro. O lado do terminal é diferente, o custo é bastante reduzido, a implantação do modelo leve e compactado só precisa pagar o custo do hardware, sem considerar outras questões, como largura de banda, consumo de energia e transmissão de rede.
Em segundo lugar, a execução de IA generativa no terminal pode proteger dados privados com maior confiança, ao contrário do risco potencial de fuga de informação na nuvem. Isso não é infundado: em abril deste ano, foi revelado que funcionários do departamento de semicondutores carregavam dados para a nuvem ao usar o ChatGPT, resultando no vazamento de dados confidenciais, e posteriormente anunciaram o banimento. A operação do terminal dispensa o upload de textos, imagens, vídeos e outras informações para a nuvem, o que evita esse risco e garante que a privacidade não seja vazada e a segurança seja reforçada.
A baixa latência também é uma grande vantagem no lado do terminal. A nuvem precisa transmitir os dados para a nuvem para processamento antes que os resultados possam ser retornados.Durante o processo, a transmissão da rede inevitavelmente causará atrasos. O lado do terminal não precisa fazer upload de informações para o servidor em nuvem ou data center, a velocidade de resposta é melhorada e o atraso é reduzido. Ao mesmo tempo, a operação local é mais confiável e às vezes pode ser executada offline, o que reduz até certo ponto a dependência de serviços em nuvem e conexões de rede.
O lado do terminal também possui cenários de aplicativos e informações situacionais mais ricos do que a nuvem, trazendo interação e experiência mais personalizadas. Os usuários podem ajustar e personalizar parâmetros e funções do modelo para diferentes cenários de aplicação ou diferentes necessidades no mesmo cenário, proporcionando total flexibilidade.
Com estas vantagens, o caminho para a implementação de IA generativa no lado do terminal está a tornar-se cada vez mais claro, e esta é cada vez mais colocada numa posição igualmente importante como a nuvem. Como disse o vice-presidente global da Qualcomm, Hou Mingjuan, na conferência de imprensa off-line do white paper "IA híbrida é o futuro da IA", "A IA do lado do terminal é a chave para realizar a arquitetura de IA híbrida e expandir a IA generativa para uma gama mais ampla de mundo."
Hou Mingjuan
A Qualcomm disse isso e o fez. Nesta revolução do lado do terminal relacionada à IA generativa, a Qualcomm assumiu a liderança ao tocar a buzina e se tornou um dos principais promotores da revolução da IA do lado do terminal, e formou uma rota de desenvolvimento de IA híbrida na qual a nuvem e os terminais trabalham juntos em o layout. Esta escolha de rota reflete ainda mais a visão e liderança da Qualcomm em IA do lado do terminal e recursos de tecnologia de IA generativa.
Disponibilize a IA generativa do lado do terminal um passo à frente
A chamada IA híbrida opera principalmente de duas maneiras: primeiro, em alguns cenários, a computação é centrada principalmente no terminal e transfere tarefas para a nuvem quando necessário. Em segundo lugar, num cenário centrado na nuvem, os terminais partilham parte da carga de trabalho da nuvem quando possível com base nas suas próprias capacidades. A nuvem e o terminal desempenham, cada um, suas próprias funções e auxiliam-se mutuamente.
Em comparação apenas com a nuvem, o maior benefício da IA híbrida é alocar e coordenar com mais eficiência as cargas de trabalho de IA em diferentes cenários e horários, melhorar a eficiência da utilização de recursos e reduzir custos operacionais.
No layout de IA híbrida da Qualcomm, seja ele centrado no terminal, baseado na percepção do terminal ou no processamento colaborativo de terminal e nuvem, enfatiza-se que os recursos de IA do lado do terminal são a chave para capacitar a IA híbrida e permitir que a IA generativa alcance expansão em escala global . Especialmente para a IA generativa, a IA híbrida significa fazer uso total do poder de computação do lado do terminal para suportar aplicações de IA generativa, tal como o ChatGPT nos telemóveis.
No entanto, é mais fácil falar do que fazer implementar e executar com sucesso grandes modelos de IA generativos em terminais.O pré-requisito para a implementação são fortes capacidades de IA no lado do terminal. Como fabricante de chips upstream, a Qualcomm sempre foi líder em IA do lado do terminal, formando uma otimização de IA full-stack, de chips a software, algoritmos e ecossistema, de modo que nem software nem hardware sejam prejudicados, e o lado do terminal A aceleração da inferência de IA pode ser alcançada.
Otimização de IA full stack da Qualcomm
Em primeiro lugar, no nível do chip de hardware, desde a plataforma principal Snapdragon 888 e o Snapdragon 8 de primeira geração até o Snapdragon 7 de segunda geração de última geração e o Snapdragon 8 de segunda geração lançado no ano passado, os recursos de IA continuam para evoluir, com o aprimoramento, os recursos de IA do lado do terminal serão melhorados de acordo. Entre eles, o Qualcomm AI Engine constantemente atualizado (atualmente a oitava geração) desempenha um papel importante. Seu processador Hexagon, GPU Qualcomm Adreno e CPU Qualcomm Kryo são projetados para executar aplicativos de IA com eficiência no lado do terminal e otimizar os usuários de IA do lado do terminal por meio de métodos de computação heterogêneos.experiência.
Espera-se que o poder de computação de IA do Snapdragon 8 de terceira geração, que será lançado em outubro deste ano, seja ainda mais aprimorado. Estamos ainda mais entusiasmados com o tipo de função de IA do lado do terminal que ele pode suportar.
Além da aceleração contínua do hardware, o maior desafio para a IA do lado do terminal está no software: ele deve garantir que vários modelos de processamento neural possam ser executados e os cálculos devem ser rápidos e eficientes o suficiente. A pilha de software de IA da Qualcomm ajuda os desenvolvedores a criar, otimizar e implantar aplicativos de IA em hardware com mais eficiência, alcançando o efeito de desenvolvimento único e implantação múltipla de aplicativos. Como você pode ver na figura abaixo, esta pilha de software melhora a eficiência do desenvolvimento em vários níveis, incluindo estruturas de IA suportadas, kits de desenvolvimento de software de inferência, bibliotecas e serviços para desenvolvedores, software de sistema e sistemas operacionais.
Pilha de software de IA da Qualcomm
Além disso, em termos de desenvolvimento de algoritmos e modelos, está empenhada em melhorar a eficiência sem sacrificar a precisão.Neste sentido, existem algoritmos baseados no modelo Q-SRNet, soluções de quantização INT4, etc. Por exemplo, o Snapdragon 8 Gen2 suporta pela primeira vez o formato de precisão INT4 AI, que traz uma melhoria de 60% na eficiência energética e uma melhoria de 90% no desempenho de inferência de IA em comparação com INT8.
A Qualcomm também continua a fazer esforços a nível ecológico, e as suas vantagens técnicas nos telemóveis podem ser estendidas a outros terminais, como automóveis, PCs, XR e Internet das Coisas. Ao mesmo tempo, com base em IP e tecnologia distribuída em vários campos, a Qualcomm é capaz de conduzir uma cooperação profunda em vários ecossistemas, como o campo de PC e Microsoft, o campo XR e Meta, e alcançar rapidamente expansão em grande escala através de boa cooperação ecológica.
Pode-se dizer que os poderosos e abrangentes recursos de IA do lado do terminal da Qualcomm, especialmente a arquitetura de aceleração de hardware de IA e a pilha de software que podem lidar com mudanças potenciais na arquitetura do modelo de IA generativo, abriram caminho no raciocínio de IA do lado do terminal e lançou uma base sólida para a expansão da IA generativa para terminais. A base técnica torna possível que aplicações de IA generativa sejam executadas em dispositivos terminais, como telefones celulares. Ao mesmo tempo, a Qualcomm também está voltada para o futuro em termos de exploração de IA generativa.
Desde as primeiras pesquisas sobre o método de compressão de modelos generativos de IA, usando VAE para criar codecs de vídeo e voz para controlar o tamanho do modelo abaixo de 100 milhões de parâmetros, até o uso de IA generativa para substituir modelos de canal no campo sem fio para melhorar a eficiência da comunicação por telefone móvel, A Qualcomm sempre foi direcionada para o avanço da IA generativa.
Claro, os resultados também são muito significativos.Nos últimos seis meses, notícias sobre a Qualcomm executando grandes modelos generativos de IA em telefones celulares desencadearam discussões acaloradas, incluindo a execução do modelo gráfico Vincent de 1 bilhão de parâmetros Stable Diffusion e do modelo de 1,5 bilhão de parâmetros. modelo de imagem de geração de imagem ControlNet. Aguarde. Além de demonstrar capacidades de pintura de IA em dispositivos móveis, a Qualcomm também está explorando ainda mais a extensão das capacidades de IA generativa em outras áreas técnicas, como humanos digitais.
*O ControlNet no celular conclui a renderização em 12 segundos. *
No futuro, com base na experiência acumulada da Qualcomm em operação de telefones móveis e na melhoria adicional do poder de computação do chip SoC, a operação de terminal de mais modelos de parâmetros está ao virar da esquina. Ziad Asghar, vice-presidente sênior de gerenciamento de produtos e chefe de IA da Qualcomm, disse em entrevista que modelos generativos de IA que podem suportar 10 bilhões de parâmetros serão executados em telefones celulares este ano. Além disso, cooperará com a Meta para lançar uma versão móvel do Llama 2 no próximo ano. Isso torna o futuro da IA generativa mais promissor.
Em nossa opinião, o maior significado da IA do lado do terminal é exibir grandes modelos de IA generativa nas mãos de todos, o que é mais benéfico para a expansão e popularização em larga escala da IA generativa e também pode criar benefícios comerciais. Tomando como exemplo a pintura generativa de IA, se for como a câmera Miaoya que se tornou popular no WeChat Moments há algum tempo, a execução de IA generativa em telefones celulares produzirá efeitos de tráfego imensuráveis.
No entanto, o layout de IA generativa da Qualcomm definitivamente não é para o efeito temporário do tráfego, mas com a ajuda de telefones celulares, PCs móveis, dispositivos vestíveis XR, casas inteligentes, carros e outras possíveis operadoras de aplicativos de IA generativa, de uma forma mais próxima aos usuários., permitindo que mais pessoas aproveitem a nova experiência de IA de forma rápida e conveniente. Como diz a capa do seu white paper, “tornar a IA ao seu alcance”. A Qualcomm faz com que isso não esteja mais longe.
Conclusão
Desde o ChatGPT, a IA generativa tornou-se uma tendência de desenvolvimento imparável. Tendo em conta a grande comodidade que trará às nossas vidas, é imperativo acelerar a popularização da IA generativa.Felizmente, a Qualcomm lançou as bases. Aprendemos que a Qualcomm está profundamente envolvida no campo da IA há mais de 15 anos, especialmente no campo da computação móvel, e formou uma profunda liderança técnica. Atualmente, existem bilhões de dispositivos terminais inteligentes equipados com plataformas Snapdragon e Qualcomm em todo o mundo, elevando os recursos de tentativa e erro de IA do lado do terminal e o potencial de aplicação de IA generativa a níveis incomparáveis.
Ao mesmo tempo, ao tornar a capacitação da IA do lado do terminal mais ampla e profunda e ao estender a IA generativa a mais campos e cenários, ela pode não apenas trazer aos usuários comuns uma experiência de IA mais diversificada, divertida e conveniente, mas também pode criar mais oportunidades de mercado para seus parceiros do ecossistema de terminais inteligentes e liberar verdadeiramente seu valor.
Para a Qualcomm, a IA generativa no terminal tem um significado de longo alcance. No Fórum de Tendências de Desenvolvimento do Comércio Digital e Cúpula de Fronteiras da Feira de Serviços da China, Meng Pu, presidente da Qualcomm China, fez um discurso de abertura, enfatizando a estreita cooperação com o ecossistema global para explorar conjuntamente tecnologias como 5G, IA e Internet das Coisas. Novos aplicativos e experiências móveis. Sendo uma tecnologia de IA generativa que está atualmente na vanguarda, a sua força, quantidade e dificuldade determinarão em grande parte se estas podem ser concretizadas com sucesso.
A operação da IA generativa no lado do terminal é imperativa, e empresas ecológicas e capacitadoras para o utilizador, como a Qualcomm, também se destacarão com base na sua força.
Link de referência:
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Esta revolução no lado terminal, mais próxima dos utilizadores, é a chave para democratizar a IA generativa.
Fonte original: Coração da Máquina
Hoje, já se passaram quase 10 meses desde que o OpenAI lançou o ChatGPT. A onda de IA generativa desencadeada por ele permitiu que as pessoas comuns sentissem o encanto da inteligência artificial "mais perto". Quer se trate de um mecanismo de pesquisa em tempo real no estilo de bate-papo alimentado por grandes modelos ou de uma ferramenta de pintura que gera imagens por meio da inserção de texto, a IA generativa entrou lentamente e mudou sutilmente o trabalho diário, o entretenimento e os hábitos criativos das pessoas.
Junto com modelos grandes e IA generativa, os fabricantes de telefones celulares e chips estão realizando uma “revolução no lado dos dispositivos” com grande alarde. Em maio deste ano, o Google lançou o modelo de linguagem grande PaLM 2, incluindo uma versão leve do Gecko que pode ser executada em dispositivos móveis. Também em maio, a Qualcomm lançou o white paper “Hybrid AI is the Future of AI”. Em agosto, Xiaomi Lei Jun anunciou a adoção total de modelos grandes e inicialmente executou com sucesso um modelo grande de 1,3 bilhão de parâmetros no telefone celular. Xiao Ai também recebeu uma atualização nas capacidades de modelos grandes.
Não podemos deixar de perguntar: por que os principais fabricantes estão correndo para colocar grandes modelos gerais e generativos de IA em terminais, especialmente telefones celulares? Sabemos que os produtos terminais inteligentes, como smartphones, PCs, XR e carros, estão mais próximos das pessoas comuns, especialmente os telefones celulares, e passamos cada vez mais tempo neles. Em abril de 2023, a organização de pesquisa de mercado Electronics Hub divulgou um relatório mostrando que os usuários em alguns países ficam olhando para as telas dos telefones celulares por mais de 7 horas por dia. Os telefones celulares estão gradualmente evoluindo para o núcleo da vida inteligente, preparando um "viveiro" para o desenvolvimento de IA generativa no lado do terminal.
No entanto, a atual inclinação dos grandes modelos de IA generativa para o lado do terminal não aconteceu da noite para o dia. O método de implantação está passando por uma transformação da nuvem para a colaboração terminal-nuvem.
A tendência de IA generativa baseada em terminal e em nuvem andando de mãos dadas está se tornando cada vez mais proeminente
Sabemos que os parâmetros de grandes modelos generativos de IA muitas vezes chegam a bilhões, centenas ou mesmo centenas de bilhões, o que impõe requisitos extremamente elevados à infraestrutura em termos de otimização de treinamento de modelo e inferência de execução. No início, apenas a nuvem poderia fornecer um poder de computação de IA tão grande, por isso os fabricantes muitas vezes optavam por implantar e executar seus próprios modelos grandes na nuvem.
Tomando o ChatGPT como exemplo, seu treinamento e operação exigem uma grande quantidade de armazenamento de dados e recursos computacionais, e solicitações massivas de usuários geram altos custos de poder computacional, o que requer uma poderosa plataforma de serviços em nuvem. Os usuários podem acessar ChatGPT e outros produtos generativos de IA (como CodeX) por meio do serviço de nuvem Microsoft Azure OpenAI. Amazon, outro grande provedor de serviços em nuvem, também lançou um serviço de hospedagem em nuvem de IA generativa semelhante.Os usuários podem acessar modelos básicos pré-treinados de startups como AI21Labs, Anthropic e Stability AI por meio de APIs.
Obviamente, as plataformas de serviços em nuvem aceleraram esta onda de tecnologia de IA generativa que está varrendo o mundo, fornecendo aos grandes fabricantes de modelos o suporte de poder computacional necessário para treinamento e inferência de modelos. No entanto, a inferência de grandes modelos de nuvem exige custos elevados e, com o número crescente de usuários e solicitações de uso, o custo está cada vez mais alto. Como resultado, face ao aumento contínuo dos custos operacionais, os fabricantes precisam de encontrar outra forma de sair da nuvem.
Com o passar do tempo, por um lado, tecnologias de compressão de grandes modelos (como quantização, poda de rede e destilação de conhecimento) estão se tornando cada vez mais abundantes e eficazes. Por outro lado, dispositivos terminais inteligentes, como telefones celulares, PCs, XR , e os automóveis têm IA O poder da computação continua a aumentar e as condições técnicas para a implantação de IA generativa em terminais estão a amadurecer rapidamente. A tendência de terminais e nuvens andarem de mãos dadas está se tornando cada vez mais evidente.
Além disso, em comparação com a nuvem, a implantação e execução de IA generativa no lado do terminal também apresenta vantagens em termos de custo, segurança e privacidade, além de operação confiável.
A primeira é a vantagem de custo. Anteriormente, a mídia informou que a OpenAI queimou aproximadamente US$ 700.000 por dia apenas para manter o ChatGPT funcionando, o que significa que quase US$ 200 milhões podem ter sido gastos no ChatGPT. Um custo tão alto é muito alto até mesmo para a OpenAI suportar, tornando difícil atingir o ponto de equilíbrio e muito menos obter lucro. O lado do terminal é diferente, o custo é bastante reduzido, a implantação do modelo leve e compactado só precisa pagar o custo do hardware, sem considerar outras questões, como largura de banda, consumo de energia e transmissão de rede.
Em segundo lugar, a execução de IA generativa no terminal pode proteger dados privados com maior confiança, ao contrário do risco potencial de fuga de informação na nuvem. Isso não é infundado: em abril deste ano, foi revelado que funcionários do departamento de semicondutores carregavam dados para a nuvem ao usar o ChatGPT, resultando no vazamento de dados confidenciais, e posteriormente anunciaram o banimento. A operação do terminal dispensa o upload de textos, imagens, vídeos e outras informações para a nuvem, o que evita esse risco e garante que a privacidade não seja vazada e a segurança seja reforçada.
A baixa latência também é uma grande vantagem no lado do terminal. A nuvem precisa transmitir os dados para a nuvem para processamento antes que os resultados possam ser retornados.Durante o processo, a transmissão da rede inevitavelmente causará atrasos. O lado do terminal não precisa fazer upload de informações para o servidor em nuvem ou data center, a velocidade de resposta é melhorada e o atraso é reduzido. Ao mesmo tempo, a operação local é mais confiável e às vezes pode ser executada offline, o que reduz até certo ponto a dependência de serviços em nuvem e conexões de rede.
O lado do terminal também possui cenários de aplicativos e informações situacionais mais ricos do que a nuvem, trazendo interação e experiência mais personalizadas. Os usuários podem ajustar e personalizar parâmetros e funções do modelo para diferentes cenários de aplicação ou diferentes necessidades no mesmo cenário, proporcionando total flexibilidade.
Com estas vantagens, o caminho para a implementação de IA generativa no lado do terminal está a tornar-se cada vez mais claro, e esta é cada vez mais colocada numa posição igualmente importante como a nuvem. Como disse o vice-presidente global da Qualcomm, Hou Mingjuan, na conferência de imprensa off-line do white paper "IA híbrida é o futuro da IA", "A IA do lado do terminal é a chave para realizar a arquitetura de IA híbrida e expandir a IA generativa para uma gama mais ampla de mundo."
A Qualcomm disse isso e o fez. Nesta revolução do lado do terminal relacionada à IA generativa, a Qualcomm assumiu a liderança ao tocar a buzina e se tornou um dos principais promotores da revolução da IA do lado do terminal, e formou uma rota de desenvolvimento de IA híbrida na qual a nuvem e os terminais trabalham juntos em o layout. Esta escolha de rota reflete ainda mais a visão e liderança da Qualcomm em IA do lado do terminal e recursos de tecnologia de IA generativa.
Disponibilize a IA generativa do lado do terminal um passo à frente
A chamada IA híbrida opera principalmente de duas maneiras: primeiro, em alguns cenários, a computação é centrada principalmente no terminal e transfere tarefas para a nuvem quando necessário. Em segundo lugar, num cenário centrado na nuvem, os terminais partilham parte da carga de trabalho da nuvem quando possível com base nas suas próprias capacidades. A nuvem e o terminal desempenham, cada um, suas próprias funções e auxiliam-se mutuamente.
Em comparação apenas com a nuvem, o maior benefício da IA híbrida é alocar e coordenar com mais eficiência as cargas de trabalho de IA em diferentes cenários e horários, melhorar a eficiência da utilização de recursos e reduzir custos operacionais.
No layout de IA híbrida da Qualcomm, seja ele centrado no terminal, baseado na percepção do terminal ou no processamento colaborativo de terminal e nuvem, enfatiza-se que os recursos de IA do lado do terminal são a chave para capacitar a IA híbrida e permitir que a IA generativa alcance expansão em escala global . Especialmente para a IA generativa, a IA híbrida significa fazer uso total do poder de computação do lado do terminal para suportar aplicações de IA generativa, tal como o ChatGPT nos telemóveis.
No entanto, é mais fácil falar do que fazer implementar e executar com sucesso grandes modelos de IA generativos em terminais.O pré-requisito para a implementação são fortes capacidades de IA no lado do terminal. Como fabricante de chips upstream, a Qualcomm sempre foi líder em IA do lado do terminal, formando uma otimização de IA full-stack, de chips a software, algoritmos e ecossistema, de modo que nem software nem hardware sejam prejudicados, e o lado do terminal A aceleração da inferência de IA pode ser alcançada.
Em primeiro lugar, no nível do chip de hardware, desde a plataforma principal Snapdragon 888 e o Snapdragon 8 de primeira geração até o Snapdragon 7 de segunda geração de última geração e o Snapdragon 8 de segunda geração lançado no ano passado, os recursos de IA continuam para evoluir, com o aprimoramento, os recursos de IA do lado do terminal serão melhorados de acordo. Entre eles, o Qualcomm AI Engine constantemente atualizado (atualmente a oitava geração) desempenha um papel importante. Seu processador Hexagon, GPU Qualcomm Adreno e CPU Qualcomm Kryo são projetados para executar aplicativos de IA com eficiência no lado do terminal e otimizar os usuários de IA do lado do terminal por meio de métodos de computação heterogêneos.experiência.
Espera-se que o poder de computação de IA do Snapdragon 8 de terceira geração, que será lançado em outubro deste ano, seja ainda mais aprimorado. Estamos ainda mais entusiasmados com o tipo de função de IA do lado do terminal que ele pode suportar.
Além da aceleração contínua do hardware, o maior desafio para a IA do lado do terminal está no software: ele deve garantir que vários modelos de processamento neural possam ser executados e os cálculos devem ser rápidos e eficientes o suficiente. A pilha de software de IA da Qualcomm ajuda os desenvolvedores a criar, otimizar e implantar aplicativos de IA em hardware com mais eficiência, alcançando o efeito de desenvolvimento único e implantação múltipla de aplicativos. Como você pode ver na figura abaixo, esta pilha de software melhora a eficiência do desenvolvimento em vários níveis, incluindo estruturas de IA suportadas, kits de desenvolvimento de software de inferência, bibliotecas e serviços para desenvolvedores, software de sistema e sistemas operacionais.
Além disso, em termos de desenvolvimento de algoritmos e modelos, está empenhada em melhorar a eficiência sem sacrificar a precisão.Neste sentido, existem algoritmos baseados no modelo Q-SRNet, soluções de quantização INT4, etc. Por exemplo, o Snapdragon 8 Gen2 suporta pela primeira vez o formato de precisão INT4 AI, que traz uma melhoria de 60% na eficiência energética e uma melhoria de 90% no desempenho de inferência de IA em comparação com INT8.
A Qualcomm também continua a fazer esforços a nível ecológico, e as suas vantagens técnicas nos telemóveis podem ser estendidas a outros terminais, como automóveis, PCs, XR e Internet das Coisas. Ao mesmo tempo, com base em IP e tecnologia distribuída em vários campos, a Qualcomm é capaz de conduzir uma cooperação profunda em vários ecossistemas, como o campo de PC e Microsoft, o campo XR e Meta, e alcançar rapidamente expansão em grande escala através de boa cooperação ecológica.
Pode-se dizer que os poderosos e abrangentes recursos de IA do lado do terminal da Qualcomm, especialmente a arquitetura de aceleração de hardware de IA e a pilha de software que podem lidar com mudanças potenciais na arquitetura do modelo de IA generativo, abriram caminho no raciocínio de IA do lado do terminal e lançou uma base sólida para a expansão da IA generativa para terminais. A base técnica torna possível que aplicações de IA generativa sejam executadas em dispositivos terminais, como telefones celulares. Ao mesmo tempo, a Qualcomm também está voltada para o futuro em termos de exploração de IA generativa.
Desde as primeiras pesquisas sobre o método de compressão de modelos generativos de IA, usando VAE para criar codecs de vídeo e voz para controlar o tamanho do modelo abaixo de 100 milhões de parâmetros, até o uso de IA generativa para substituir modelos de canal no campo sem fio para melhorar a eficiência da comunicação por telefone móvel, A Qualcomm sempre foi direcionada para o avanço da IA generativa.
Claro, os resultados também são muito significativos.Nos últimos seis meses, notícias sobre a Qualcomm executando grandes modelos generativos de IA em telefones celulares desencadearam discussões acaloradas, incluindo a execução do modelo gráfico Vincent de 1 bilhão de parâmetros Stable Diffusion e do modelo de 1,5 bilhão de parâmetros. modelo de imagem de geração de imagem ControlNet. Aguarde. Além de demonstrar capacidades de pintura de IA em dispositivos móveis, a Qualcomm também está explorando ainda mais a extensão das capacidades de IA generativa em outras áreas técnicas, como humanos digitais.
No futuro, com base na experiência acumulada da Qualcomm em operação de telefones móveis e na melhoria adicional do poder de computação do chip SoC, a operação de terminal de mais modelos de parâmetros está ao virar da esquina. Ziad Asghar, vice-presidente sênior de gerenciamento de produtos e chefe de IA da Qualcomm, disse em entrevista que modelos generativos de IA que podem suportar 10 bilhões de parâmetros serão executados em telefones celulares este ano. Além disso, cooperará com a Meta para lançar uma versão móvel do Llama 2 no próximo ano. Isso torna o futuro da IA generativa mais promissor.
Em nossa opinião, o maior significado da IA do lado do terminal é exibir grandes modelos de IA generativa nas mãos de todos, o que é mais benéfico para a expansão e popularização em larga escala da IA generativa e também pode criar benefícios comerciais. Tomando como exemplo a pintura generativa de IA, se for como a câmera Miaoya que se tornou popular no WeChat Moments há algum tempo, a execução de IA generativa em telefones celulares produzirá efeitos de tráfego imensuráveis.
No entanto, o layout de IA generativa da Qualcomm definitivamente não é para o efeito temporário do tráfego, mas com a ajuda de telefones celulares, PCs móveis, dispositivos vestíveis XR, casas inteligentes, carros e outras possíveis operadoras de aplicativos de IA generativa, de uma forma mais próxima aos usuários., permitindo que mais pessoas aproveitem a nova experiência de IA de forma rápida e conveniente. Como diz a capa do seu white paper, “tornar a IA ao seu alcance”. A Qualcomm faz com que isso não esteja mais longe.
Conclusão
Desde o ChatGPT, a IA generativa tornou-se uma tendência de desenvolvimento imparável. Tendo em conta a grande comodidade que trará às nossas vidas, é imperativo acelerar a popularização da IA generativa.Felizmente, a Qualcomm lançou as bases. Aprendemos que a Qualcomm está profundamente envolvida no campo da IA há mais de 15 anos, especialmente no campo da computação móvel, e formou uma profunda liderança técnica. Atualmente, existem bilhões de dispositivos terminais inteligentes equipados com plataformas Snapdragon e Qualcomm em todo o mundo, elevando os recursos de tentativa e erro de IA do lado do terminal e o potencial de aplicação de IA generativa a níveis incomparáveis.
Ao mesmo tempo, ao tornar a capacitação da IA do lado do terminal mais ampla e profunda e ao estender a IA generativa a mais campos e cenários, ela pode não apenas trazer aos usuários comuns uma experiência de IA mais diversificada, divertida e conveniente, mas também pode criar mais oportunidades de mercado para seus parceiros do ecossistema de terminais inteligentes e liberar verdadeiramente seu valor.
Para a Qualcomm, a IA generativa no terminal tem um significado de longo alcance. No Fórum de Tendências de Desenvolvimento do Comércio Digital e Cúpula de Fronteiras da Feira de Serviços da China, Meng Pu, presidente da Qualcomm China, fez um discurso de abertura, enfatizando a estreita cooperação com o ecossistema global para explorar conjuntamente tecnologias como 5G, IA e Internet das Coisas. Novos aplicativos e experiências móveis. Sendo uma tecnologia de IA generativa que está atualmente na vanguarda, a sua força, quantidade e dificuldade determinarão em grande parte se estas podem ser concretizadas com sucesso.
A operação da IA generativa no lado do terminal é imperativa, e empresas ecológicas e capacitadoras para o utilizador, como a Qualcomm, também se destacarão com base na sua força.
Link de referência: