Quantos volumes tem "Batalha dos Grandes Modelos"?

Question

**Fonte:** Conferência Mundial da InternetEm 31 de agosto, o primeiro lote de produtos modelo em grande escala da China passou nas "Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa" para registro e pode ser lançado oficialmente para fornecer serviços ao público. O primeiro lote de 8 modelos em grande escala lançados inclui Baidu Wenxin Yiyan, modelo em grande escala Skylark da Byte, modelo em grande escala Baichuan Intelligent da Baichuan Intelligent e Zhipu Qingyan sob a empresa de IA Zhipu Huazhang, sediada em Tsinghua.Desde o início deste ano, os grandes modelos têm sido extremamente populares e têm sido a pista de competição dos principais fabricantes em todo o mundo. Todas as grandes empresas de tecnologia lançaram seus próprios grandes modelos, apresentando uma grande ocasião de "Batalha dos 100 Modelos".## Grandes modelos impulsionam o desenvolvimento da economia digitalA partir de 31 de agosto, os usuários podem baixar o "Wenxin Yiyan APP" na app store ou fazer login no "site oficial Wenxin Yiyan" para experimentá-lo. O Baidu também abrirá um lote de aplicativos nativos de IA recentemente reconstruídos, permitindo aos usuários experimentar os quatro recursos principais da IA generativa: compreensão, geração, lógica e memória.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d0fa6514d6-dd1a6f-6d2ef1) Fonte: Site oficial de WenxinyiyanRobin Li, fundador, presidente e CEO do Baidu, disse uma vez que os grandes modelos penetrarão cada vez mais campos.A economia digital, impulsionada por grandes modelos como chave, será profundamente integrada com a economia real e se tornará mais forte, melhor e maior., criar um valor incremental considerável e provocar o desenvolvimento económico e social e mudanças profundas na indústria.Entende-se que nos últimos dez anos, o Baidu investiu mais de 140 bilhões de yuans em pesquisa e desenvolvimento cumulativos, tornando-se uma empresa de IA com um layout full-stack de quatro camadas de aplicativos, modelos, estruturas e chips, alcançando o fim - otimização completa e ter a chave para liderar a indústria em todos os níveis.Tecnologia autodesenvolvida.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2e46ac1e8f-dd1a6f-6d2ef1) *Fonte: "Relatório de pesquisa de mapas de grandes modelos de inteligência artificial da China"*Ainda na madrugada do dia 31, a Baichuan Intelligence anunciou também que o seu grande modelo foi registado através das “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Generativa” e está aberto ao público. Os utilizadores podem fazer login no site oficial para experencie.A Baichuan Intelligence foi fundada em 10 de abril de 2023 pelo ex-CEO da Sogou, Wang Xiaochuan. A equipe principal é composta pelos principais talentos de IA de empresas de tecnologia conhecidas, como Sogou, Baidu, Huawei, Microsoft, Byte e Tencent. Apenas quatro meses após a sua criação, a Baichuan Intelligence lançou sucessivamente três modelos de linguagem grande de uso geral, incluindo o primeiro modelo doméstico de linguagem grande de código aberto com 7 bilhões de parâmetros para uso comercial gratuito, Baichuan-7B, e o modelo de linguagem grande com 53 bilhões de parâmetros, Baichuan-53B espere.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-3f187723ad-dd1a6f-6d2ef1) *Fonte: Site Oficial Baichuan Smart*HKUST Xunfei lançou oficialmente o "Modelo Cognitivo Xunfei Spark" em 6 de maio deste ano. HKUST Xunfei disse que até 24 de outubro deste ano, Xunfei Xinghuo realizará o benchmarking geral do modelo em relação ao ChatGPT. No relatório de avaliação de modelos grandes divulgado pelo MIT Technology Review China em 17 de agosto, o iFlytek Spark V2.0 ficou em primeiro lugar com uma pontuação total de 81,5 pontos e foi chamado de modelo grande "mais inteligente" da China.## Grandes modelos globais florescem maisA inteligência artificial está migrando da nuvem para o terminal. De uma perspectiva global, fabricantes como Google, Microsoft e Apple também estão desenvolvendo grandes modelos de terminais, e a redução de peso tornou-se uma importante direção de desenvolvimento para a implantação de grandes modelos em terminais.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d3d505232f-dd1a6f-6d2ef1) *Fonte: DragonImages*Em maio deste ano, o Google lançou o PaLM2, um modelo grande adequado para o edge. Especificamente, existem quatro tamanhos de modelos grandes PaLM2, nomeadamente Gecko, Otter, Bison e Unicorn. Entre eles, o Gecko é muito leve e funciona em dispositivos móveis. Um modelo mais leve, mas de maior qualidade, pode melhorar significativamente a eficiência da inferência e reduzir os custos de serviço, permitindo que os aplicativos downstream do modelo se adaptem a mais aplicativos e usuários, tornando possível a implantação de IA na borda.Em julho, a Apple anunciou oficialmente o lançamento do desenvolvimento do AppleGPT e juntou-se à batalha de grandes modelos de terminal AI. Entende-se que AppleGPT é uma ferramenta de IA desenvolvida pela Apple com base em sua estrutura Ajax autodesenvolvida e atualmente está sendo testada em pequena escala dentro da Apple.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9682614d49-dd1a6f-6d2ef1) *Fonte: Pixabay*Ao mesmo tempo, a Microsoft abriu o código-fonte do modelo de treinamento DeepSpeedChat e do LLaMA de código aberto Meta, que rapidamente gerou uma tendência de treinamento baseado em LLaMA entre os desenvolvedores de IA, acelerando a penetração de métodos de treinamento como Lora. Entende-se que os modelos Deepspeed e Lora fornecem aos desenvolvedores de pequeno e médio porte ferramentas completas para treinamento rápido e de baixo custo de seus próprios "modelos pequenos", acelerando o estabelecimento de padrões de distribuição de gradiente para modelos grandes.Em termos de fabricantes de chips, a Qualcomm lançou a primeira demonstração do lado do terminal Stable Diffusion rodando em um telefone Android na conferência MWC 2023. Segundo relatos, o modelo de difusão estável tem mais de 1 bilhão de parâmetros. A Qualcomm usa sua pilha de software de IA para quantificar, compilar e otimizar o modelo para aceleração de hardware, fazendo-o funcionar com sucesso em telefones celulares equipados com a plataforma móvel Snapdragon 8 de segunda geração. .![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c4eb152acd-dd1a6f-6d2ef1) *Fonte: Pixabay*## "Aplicação" e "supervisão" de modelos grandes andam de mãos dadasEm março deste ano, a nova ferramenta de chatbot de IA ChatGPT 3.5 lançada pela startup do Vale do Silício, OPEN AI, demonstrou incríveis capacidades de conversação. Em apenas dois meses, o número de usuários ativos mensais do ChatGPT atingiu 100 milhões, tornando-o o aplicativo de consumo que mais cresce na história.Enfrentando as oportunidades e desafios trazidos pela IA generativa, os países têm opiniões diferentes sobre como regular a IA. A China, os Estados Unidos, a União Europeia e outros países ou regiões responderam rapidamente, enquanto Singapura e a Índia anunciaram que não planeiam regulamentar a IA por enquanto.Em 15 de agosto, foram oficialmente implementadas as “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Gerativa” da China, considerada a primeira legislação de IA generativa do mundo.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b14f04e560-dd1a6f-6d2ef1) *Fonte: Pixabay*Ao implementar as regras e regulamentos, as "Medidas" incentivam ainda mais a aplicação inovadora da tecnologia de inteligência artificial generativa em vários setores e campos e apoiam várias organizações na inovação da tecnologia de inteligência artificial generativa, na construção, transformação e aplicação de recursos de dados e na prevenção de riscos. Colaborar para promover a construção de infraestruturas generativas de inteligência artificial e plataformas públicas de recursos de dados de formação.Pessoas do setor disseram que com a implementação das “Medidas”, espera-se que o grande modelo de IA entre gradualmente na fase de competição por aplicações nativas e de luta pela implementação industrial a partir da competição de parâmetros.