Em 31 de agosto, o primeiro lote de produtos modelo em grande escala da China passou nas "Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa" para registro e pode ser lançado oficialmente para fornecer serviços ao público. O primeiro lote de 8 modelos em grande escala lançados inclui Baidu Wenxin Yiyan, modelo em grande escala Skylark da Byte, modelo em grande escala Baichuan Intelligent da Baichuan Intelligent e Zhipu Qingyan sob a empresa de IA Zhipu Huazhang, sediada em Tsinghua.
Desde o início deste ano, os grandes modelos têm sido extremamente populares e têm sido a pista de competição dos principais fabricantes em todo o mundo. Todas as grandes empresas de tecnologia lançaram seus próprios grandes modelos, apresentando uma grande ocasião de "Batalha dos 100 Modelos".
Grandes modelos impulsionam o desenvolvimento da economia digital
A partir de 31 de agosto, os usuários podem baixar o "Wenxin Yiyan APP" na app store ou fazer login no "site oficial Wenxin Yiyan" para experimentá-lo. O Baidu também abrirá um lote de aplicativos nativos de IA recentemente reconstruídos, permitindo aos usuários experimentar os quatro recursos principais da IA generativa: compreensão, geração, lógica e memória.
Fonte: Site oficial de Wenxinyiyan
Robin Li, fundador, presidente e CEO do Baidu, disse uma vez que os grandes modelos penetrarão cada vez mais campos.A economia digital, impulsionada por grandes modelos como chave, será profundamente integrada com a economia real e se tornará mais forte, melhor e maior., criar um valor incremental considerável e provocar o desenvolvimento económico e social e mudanças profundas na indústria.
Entende-se que nos últimos dez anos, o Baidu investiu mais de 140 bilhões de yuans em pesquisa e desenvolvimento cumulativos, tornando-se uma empresa de IA com um layout full-stack de quatro camadas de aplicativos, modelos, estruturas e chips, alcançando o fim - otimização completa e ter a chave para liderar a indústria em todos os níveis.Tecnologia autodesenvolvida.
Fonte: "Relatório de pesquisa de mapas de grandes modelos de inteligência artificial da China"
Ainda na madrugada do dia 31, a Baichuan Intelligence anunciou também que o seu grande modelo foi registado através das “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Generativa” e está aberto ao público. Os utilizadores podem fazer login no site oficial para experencie.
A Baichuan Intelligence foi fundada em 10 de abril de 2023 pelo ex-CEO da Sogou, Wang Xiaochuan. A equipe principal é composta pelos principais talentos de IA de empresas de tecnologia conhecidas, como Sogou, Baidu, Huawei, Microsoft, Byte e Tencent. Apenas quatro meses após a sua criação, a Baichuan Intelligence lançou sucessivamente três modelos de linguagem grande de uso geral, incluindo o primeiro modelo doméstico de linguagem grande de código aberto com 7 bilhões de parâmetros para uso comercial gratuito, Baichuan-7B, e o modelo de linguagem grande com 53 bilhões de parâmetros, Baichuan-53B espere.
Fonte: Site Oficial Baichuan Smart
HKUST Xunfei lançou oficialmente o "Modelo Cognitivo Xunfei Spark" em 6 de maio deste ano. HKUST Xunfei disse que até 24 de outubro deste ano, Xunfei Xinghuo realizará o benchmarking geral do modelo em relação ao ChatGPT. No relatório de avaliação de modelos grandes divulgado pelo MIT Technology Review China em 17 de agosto, o iFlytek Spark V2.0 ficou em primeiro lugar com uma pontuação total de 81,5 pontos e foi chamado de modelo grande "mais inteligente" da China.
Grandes modelos globais florescem mais
A inteligência artificial está migrando da nuvem para o terminal. De uma perspectiva global, fabricantes como Google, Microsoft e Apple também estão desenvolvendo grandes modelos de terminais, e a redução de peso tornou-se uma importante direção de desenvolvimento para a implantação de grandes modelos em terminais.
Fonte: DragonImages
Em maio deste ano, o Google lançou o PaLM2, um modelo grande adequado para o edge. Especificamente, existem quatro tamanhos de modelos grandes PaLM2, nomeadamente Gecko, Otter, Bison e Unicorn. Entre eles, o Gecko é muito leve e funciona em dispositivos móveis. Um modelo mais leve, mas de maior qualidade, pode melhorar significativamente a eficiência da inferência e reduzir os custos de serviço, permitindo que os aplicativos downstream do modelo se adaptem a mais aplicativos e usuários, tornando possível a implantação de IA na borda.
Em julho, a Apple anunciou oficialmente o lançamento do desenvolvimento do AppleGPT e juntou-se à batalha de grandes modelos de terminal AI. Entende-se que AppleGPT é uma ferramenta de IA desenvolvida pela Apple com base em sua estrutura Ajax autodesenvolvida e atualmente está sendo testada em pequena escala dentro da Apple.
Fonte: Pixabay
Ao mesmo tempo, a Microsoft abriu o código-fonte do modelo de treinamento DeepSpeedChat e do LLaMA de código aberto Meta, que rapidamente gerou uma tendência de treinamento baseado em LLaMA entre os desenvolvedores de IA, acelerando a penetração de métodos de treinamento como Lora. Entende-se que os modelos Deepspeed e Lora fornecem aos desenvolvedores de pequeno e médio porte ferramentas completas para treinamento rápido e de baixo custo de seus próprios "modelos pequenos", acelerando o estabelecimento de padrões de distribuição de gradiente para modelos grandes.
Em termos de fabricantes de chips, a Qualcomm lançou a primeira demonstração do lado do terminal Stable Diffusion rodando em um telefone Android na conferência MWC 2023. Segundo relatos, o modelo de difusão estável tem mais de 1 bilhão de parâmetros. A Qualcomm usa sua pilha de software de IA para quantificar, compilar e otimizar o modelo para aceleração de hardware, fazendo-o funcionar com sucesso em telefones celulares equipados com a plataforma móvel Snapdragon 8 de segunda geração. .
Fonte: Pixabay
"Aplicação" e "supervisão" de modelos grandes andam de mãos dadas
Em março deste ano, a nova ferramenta de chatbot de IA ChatGPT 3.5 lançada pela startup do Vale do Silício, OPEN AI, demonstrou incríveis capacidades de conversação. Em apenas dois meses, o número de usuários ativos mensais do ChatGPT atingiu 100 milhões, tornando-o o aplicativo de consumo que mais cresce na história.
Enfrentando as oportunidades e desafios trazidos pela IA generativa, os países têm opiniões diferentes sobre como regular a IA. A China, os Estados Unidos, a União Europeia e outros países ou regiões responderam rapidamente, enquanto Singapura e a Índia anunciaram que não planeiam regulamentar a IA por enquanto.
Em 15 de agosto, foram oficialmente implementadas as “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa” da China, considerada a primeira legislação de IA generativa do mundo.
Fonte: Pixabay
Ao implementar as regras e regulamentos, as "Medidas" incentivam ainda mais a aplicação inovadora da tecnologia de inteligência artificial generativa em vários setores e campos e apoiam várias organizações na inovação da tecnologia de inteligência artificial generativa, na construção, transformação e aplicação de recursos de dados e na prevenção de riscos. Colaborar para promover a construção de infraestruturas generativas de inteligência artificial e plataformas públicas de recursos de dados de formação.
Pessoas do setor disseram que com a implementação das “Medidas”, espera-se que o grande modelo de IA entre gradualmente na fase de competição por aplicações nativas e de luta pela implementação industrial a partir da competição de parâmetros.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Quantos volumes tem "Batalha dos Grandes Modelos"?
Fonte: Conferência Mundial da Internet
Em 31 de agosto, o primeiro lote de produtos modelo em grande escala da China passou nas "Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa" para registro e pode ser lançado oficialmente para fornecer serviços ao público. O primeiro lote de 8 modelos em grande escala lançados inclui Baidu Wenxin Yiyan, modelo em grande escala Skylark da Byte, modelo em grande escala Baichuan Intelligent da Baichuan Intelligent e Zhipu Qingyan sob a empresa de IA Zhipu Huazhang, sediada em Tsinghua.
Desde o início deste ano, os grandes modelos têm sido extremamente populares e têm sido a pista de competição dos principais fabricantes em todo o mundo. Todas as grandes empresas de tecnologia lançaram seus próprios grandes modelos, apresentando uma grande ocasião de "Batalha dos 100 Modelos".
Grandes modelos impulsionam o desenvolvimento da economia digital
A partir de 31 de agosto, os usuários podem baixar o "Wenxin Yiyan APP" na app store ou fazer login no "site oficial Wenxin Yiyan" para experimentá-lo. O Baidu também abrirá um lote de aplicativos nativos de IA recentemente reconstruídos, permitindo aos usuários experimentar os quatro recursos principais da IA generativa: compreensão, geração, lógica e memória.
Robin Li, fundador, presidente e CEO do Baidu, disse uma vez que os grandes modelos penetrarão cada vez mais campos.A economia digital, impulsionada por grandes modelos como chave, será profundamente integrada com a economia real e se tornará mais forte, melhor e maior., criar um valor incremental considerável e provocar o desenvolvimento económico e social e mudanças profundas na indústria.
Entende-se que nos últimos dez anos, o Baidu investiu mais de 140 bilhões de yuans em pesquisa e desenvolvimento cumulativos, tornando-se uma empresa de IA com um layout full-stack de quatro camadas de aplicativos, modelos, estruturas e chips, alcançando o fim - otimização completa e ter a chave para liderar a indústria em todos os níveis.Tecnologia autodesenvolvida.
Ainda na madrugada do dia 31, a Baichuan Intelligence anunciou também que o seu grande modelo foi registado através das “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Generativa” e está aberto ao público. Os utilizadores podem fazer login no site oficial para experencie.
A Baichuan Intelligence foi fundada em 10 de abril de 2023 pelo ex-CEO da Sogou, Wang Xiaochuan. A equipe principal é composta pelos principais talentos de IA de empresas de tecnologia conhecidas, como Sogou, Baidu, Huawei, Microsoft, Byte e Tencent. Apenas quatro meses após a sua criação, a Baichuan Intelligence lançou sucessivamente três modelos de linguagem grande de uso geral, incluindo o primeiro modelo doméstico de linguagem grande de código aberto com 7 bilhões de parâmetros para uso comercial gratuito, Baichuan-7B, e o modelo de linguagem grande com 53 bilhões de parâmetros, Baichuan-53B espere.
HKUST Xunfei lançou oficialmente o "Modelo Cognitivo Xunfei Spark" em 6 de maio deste ano. HKUST Xunfei disse que até 24 de outubro deste ano, Xunfei Xinghuo realizará o benchmarking geral do modelo em relação ao ChatGPT. No relatório de avaliação de modelos grandes divulgado pelo MIT Technology Review China em 17 de agosto, o iFlytek Spark V2.0 ficou em primeiro lugar com uma pontuação total de 81,5 pontos e foi chamado de modelo grande "mais inteligente" da China.
Grandes modelos globais florescem mais
A inteligência artificial está migrando da nuvem para o terminal. De uma perspectiva global, fabricantes como Google, Microsoft e Apple também estão desenvolvendo grandes modelos de terminais, e a redução de peso tornou-se uma importante direção de desenvolvimento para a implantação de grandes modelos em terminais.
Em maio deste ano, o Google lançou o PaLM2, um modelo grande adequado para o edge. Especificamente, existem quatro tamanhos de modelos grandes PaLM2, nomeadamente Gecko, Otter, Bison e Unicorn. Entre eles, o Gecko é muito leve e funciona em dispositivos móveis. Um modelo mais leve, mas de maior qualidade, pode melhorar significativamente a eficiência da inferência e reduzir os custos de serviço, permitindo que os aplicativos downstream do modelo se adaptem a mais aplicativos e usuários, tornando possível a implantação de IA na borda.
Em julho, a Apple anunciou oficialmente o lançamento do desenvolvimento do AppleGPT e juntou-se à batalha de grandes modelos de terminal AI. Entende-se que AppleGPT é uma ferramenta de IA desenvolvida pela Apple com base em sua estrutura Ajax autodesenvolvida e atualmente está sendo testada em pequena escala dentro da Apple.
Ao mesmo tempo, a Microsoft abriu o código-fonte do modelo de treinamento DeepSpeedChat e do LLaMA de código aberto Meta, que rapidamente gerou uma tendência de treinamento baseado em LLaMA entre os desenvolvedores de IA, acelerando a penetração de métodos de treinamento como Lora. Entende-se que os modelos Deepspeed e Lora fornecem aos desenvolvedores de pequeno e médio porte ferramentas completas para treinamento rápido e de baixo custo de seus próprios "modelos pequenos", acelerando o estabelecimento de padrões de distribuição de gradiente para modelos grandes.
Em termos de fabricantes de chips, a Qualcomm lançou a primeira demonstração do lado do terminal Stable Diffusion rodando em um telefone Android na conferência MWC 2023. Segundo relatos, o modelo de difusão estável tem mais de 1 bilhão de parâmetros. A Qualcomm usa sua pilha de software de IA para quantificar, compilar e otimizar o modelo para aceleração de hardware, fazendo-o funcionar com sucesso em telefones celulares equipados com a plataforma móvel Snapdragon 8 de segunda geração. .
"Aplicação" e "supervisão" de modelos grandes andam de mãos dadas
Em março deste ano, a nova ferramenta de chatbot de IA ChatGPT 3.5 lançada pela startup do Vale do Silício, OPEN AI, demonstrou incríveis capacidades de conversação. Em apenas dois meses, o número de usuários ativos mensais do ChatGPT atingiu 100 milhões, tornando-o o aplicativo de consumo que mais cresce na história.
Enfrentando as oportunidades e desafios trazidos pela IA generativa, os países têm opiniões diferentes sobre como regular a IA. A China, os Estados Unidos, a União Europeia e outros países ou regiões responderam rapidamente, enquanto Singapura e a Índia anunciaram que não planeiam regulamentar a IA por enquanto.
Em 15 de agosto, foram oficialmente implementadas as “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa” da China, considerada a primeira legislação de IA generativa do mundo.
Ao implementar as regras e regulamentos, as "Medidas" incentivam ainda mais a aplicação inovadora da tecnologia de inteligência artificial generativa em vários setores e campos e apoiam várias organizações na inovação da tecnologia de inteligência artificial generativa, na construção, transformação e aplicação de recursos de dados e na prevenção de riscos. Colaborar para promover a construção de infraestruturas generativas de inteligência artificial e plataformas públicas de recursos de dados de formação.
Pessoas do setor disseram que com a implementação das “Medidas”, espera-se que o grande modelo de IA entre gradualmente na fase de competição por aplicações nativas e de luta pela implementação industrial a partir da competição de parâmetros.