Embora a Conferência Mundial de Inteligência Artificial de 2023 tenha terminado, o boom de modelos em larga escala iniciado pelo ChatGPT continuará a crescer, e o layout e a exploração da inteligência artificial também serão um tema importante nos últimos anos. "Vá para a mesa primeiro" e "dê o primeiro passo" são o consenso da indústria que desencadeou esta rodada de aumento da "guerra de 100 modelos" e levou a indústria à "guerra de 1000 modelos".
Fonte da imagem: Gerada por Unbounded AI
No início de julho, houve um boom de inteligência artificial em Xangai. A **Conferência Mundial de Inteligência Artificial de 2023 atingiu o maior número de expositores e área de exposição de todos os tempos. Muitas empresas anunciaram na conferência que lançarão grandes modelos de IA. **A alta temperatura e o forte clima convectivo não conseguiram dissipar o entusiasmo de todos. O portão da exposição já atraiu cambistas para vender ingressos, e muitas pessoas ajudaram velhos e jovens a explorar a tendência de desenvolvimento de ponta da inteligência artificial.
Sob o aumento, ** também deve ver com calma que o modelo grande ainda enfrenta problemas centrais, como robustez, conformidade e credibilidade. **Em comparação com os países desenvolvidos, meu país ainda tem uma lacuna em chips, poder de computação, dados, etc. A escassez de dados é um grande problema que afeta a aplicação de grandes modelos. grandes modelos domésticos um fator importante no desenvolvimento.
No estágio atual, quando as questões centrais ainda precisam ser superadas e a lacuna está sendo preenchida, que tipo de caminho de desenvolvimento o desenvolvimento de IA da China deve explorar? Durante o fórum de três dias e entrevistas com muitos especialistas participantes do setor, a maioria das respostas que o repórter obteve foi "integração vertical" e "aplicação de pouso".Tendência de desenvolvimento de IA.
"Vá para a mesa primeiro"
Atualmente, o desenvolvimento da economia digital tornou-se um consenso global. Como uma tecnologia emergente estratégica, a inteligência artificial está se tornando cada vez mais a principal força motriz para a modernização industrial e melhoria da produtividade. Em novembro de 2022, a OpenAI lançou o ChatGPT, um modelo de inteligência artificial conversacional de uso geral em grande escala. Uma nova rodada de boom de inovação em IA foi lançada em todo o mundo.
**Na Conferência Mundial de Inteligência Artificial de 2023, o grande modelo é o papel principal. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General e modelos verticais grandes como Tuotian e Daguan "Cao Zhi" são vertiginosos.
Lin Jianming, fundador e presidente do Samoyed Cloud Technology Group, destacou em entrevista a um repórter do International Finance News que **IA está no ponto de partida de uma nova rodada de tendências industriais. ** Do ponto de vista do layout do modelo grande, "jogadores de ponta", como Baidu, Ali e Huawei, realizam um layout "quatro em um" da camada de poder de computação, camada de plataforma, camada de modelo, e camada de aplicação; O ponto de entrada é desenvolver algoritmos de modelo em larga escala e aplicações de campo subdividido.
Lin Jianming disse que os atuais parâmetros do modelo doméstico de grande escala estão basicamente na escala de 100 bilhões ou mais.Em termos de direção de aplicação, a maioria das empresas se concentra em aplicações internas no estágio inicial e gradualmente se estende para empresas B-end. **A tecnologia de inteligência artificial continua a fazer avanços. Grandes fabricantes e pequenas e médias empresas de tecnologia estão competindo por grandes modelos. Naturalmente, ninguém quer perder a grande onda desta era. Somente "indo para a mesa primeiro" você pode entender o "trunfo" das regras. No contexto dos dividendos cada vez menores da Internet móvel, a opção por abraçar grandes modelos deverá trazer novos pontos de crescimento.
Zhou Bowen, IEEE/CAAI Fellow, Huiyan Chair Professor da Tsinghua University, professor titular do Departamento de Eletrônica e fundador da Lianyuan Technology, disse ao repórter do "International Finance News" que **a China deveria adotar um sistema de larga escala baseado em "inovação independente, segurança e controlabilidade". A rota de desenvolvimento do modelo de linguagem e tecnologia de inteligência artificial generativa concentra-se em promover a ampla aplicação de grandes modelos com capacidades de uso geral em indústrias verticais. **Além disso, aplicações de negócios, inovação acadêmica e ecologia tecnológica precisam ser diversificadas e não podem ser totalmente concentradas em um modelo grande, nem devem usar uma maneira de pensar para fazer as coisas.
Vários desafios
Sob o aumento da IA, grandes modelos ainda enfrentam vários desafios, como robustez, conformidade e credibilidade. Lin Jianming disse sem rodeios que, em comparação com o mundo, especialmente os Estados Unidos, ainda temos uma certa lacuna em chips de IA, patentes, pesquisa de algoritmos e um ecossistema de inovação maduro. **Os principais fatores que restringem o desenvolvimento de modelos domésticos de grande escala são: primeiro, modelos grandes requerem grande poder de computação e temos deficiências em chips e poder de computação; segundo, falta de dados de corpus chineses de alta qualidade e dados da indústria; terceiro , o número de profissionais Raro, a inovação da pesquisa básica não é suficiente.
"O setor financeiro é uma existência especial com requisitos muito altos para gerenciamento de risco e segurança. Os desafios de risco de confiança, risco de modelo, ética, estabilidade, precisão, segurança de dados, conformidade e outros riscos enfrentados pela pesquisa e desenvolvimento de grandes modelos financeiros são mais graves.” Lin Jianming apontou.
Jiang Ning, vice-gerente geral e diretor de informações da Mama Consumer, disse em entrevista a um repórter do International Finance News que o **grande modelo de IA ainda enfrenta questões centrais, como adaptabilidade dinâmica, robustez, conformidade e credibilidade em decisões importantes , Como eliminar ruídos e interferências, em situações repentinas e imprevisíveis, é especialmente crítico alcançar estabilidade contínua e conformidade e credibilidade de decisões importantes. **
Jiang Ning apontou que os modelos domésticos de grande escala carecem de avanços originais e ainda há lacunas na capacidade de raciocínio do modelo e na capacidade de geração de modelos em grande escala. A dificuldade de obter dados de corpus chineses de grande escala e alta qualidade é um fator importante que restringe o desenvolvimento de modelos de grande escala na China. Específico para o campo financeiro, também enfrenta muitos desafios, como proteção de privacidade, estabilidade contínua, conformidade e credibilidade.
Zhou Bowen acredita que no treinamento atual de grandes modelos de IA, o lado do algoritmo converge para o modelo de transformador de rede neural, o lado do poder de computação depende de clusters de servidores de IA com recursos de computação paralela em larga escala e o lado dos dados precisa alimentar grandes dimensionar conjuntos de dados com uma enorme quantidade de dados. Do ponto de vista dos três elementos da IA, a escassez de dados é obviamente um grande problema que leva à implementação de aplicativos de modelo em larga escala. Campos específicos, como o setor financeiro, que possuem requisitos extremamente rígidos para segurança de dados e proteção da privacidade do usuário, também apresentam uma série de desafios para grandes modelos, como confiabilidade, controlabilidade autônoma e forte segurança.
Zhou Bowen disse que a industrialização de modelos de grande escala também enfrenta desafios: primeiro, a escala de dados é grande e a qualidade dos dados é desigual; segundo, o modelo é grande e difícil de treinar; ** Portanto, o desenvolvimento de grandes modelos depende do suporte abrangente do poder de computação do algoritmo e dos dados. Modelos grandes são o foco do desenvolvimento industrial futuro, mas vale a pena explorar o modelo de negócios de modelos grandes. Como as barreiras de custo dos grandes modelos são muito altas, tanto as grandes quanto as pequenas empresas têm seus próprios encargos.
Integração vertical
No estágio atual, quando as questões centrais ainda precisam ser superadas e a lacuna está sendo preenchida, que tipo de caminho de desenvolvimento o desenvolvimento de IA da China deve explorar? Que outras oportunidades de desenvolvimento existem? Jiang Ning apontou que a construção de um sistema de IA combinado é uma tendência de desenvolvimento, combinando efetivamente a usabilidade e o profissionalismo de modelos discriminativos em vários campos verticais e as características de aprendizado de transferência e capacidades de generalização de grandes modelos generativos, para que seja verdadeiramente popular na indústria. Aproveite a capacidade de generalização de grandes modelos.
Lin Jianming destacou que, no futuro, modelos de grande escala terão grande potencial no processo de inteligência digital de cidades, indústrias e empresas. O layout doméstico de grandes modelos precisa fortalecer as capacidades de inovação independentes, aumentar a competitividade central de grandes modelos de vários níveis, como poder de computação, algoritmos e talentos, e também combinar estreitamente as necessidades estratégicas nacionais e as direções de desenvolvimento da indústria para explorar os pontos problemáticos da indústria e cenários em profundidade.
Além disso, "é necessário usar sua própria tecnologia, cenários, dados do usuário e da indústria e Know-How da indústria (segredos da indústria) para criar um grande modelo no campo vertical; use o 'modelo geral + modelo especial da indústria Know-How ' para capacitar a economia real e estabelecer sua própria vantagem de barreiras." Lin Jianming disse.
Zhou Bowen acredita que a indústria de modelos em grande escala na China deve começar de ponta a ponta e desenvolver de forma iterativa modelos de negócios maiores, o que pode ser uma abordagem mais adequada. Com base nas capacidades gerais, a formação contínua no campo vertical para melhorar as capacidades profissionais de grandes modelos é um meio importante para ajudar no desenvolvimento e progresso de grandes modelos no futuro. **
Zhou Bowen apontou que, de uma perspectiva teórica e técnica, devem existir diferenças. No desenvolvimento da IA, por um lado, somos um apanhador no nível técnico e, por outro lado, provavelmente nos tornaremos inovadores e até líderes no nível do aplicativo. **A IA da China precisa explorar um novo caminho, ou seja, integrar-se verticalmente do modelo geral autodesenvolvido ao aplicativo e ao circuito fechado de cenário completo do usuário, de modo a realizar o "pouso duplo" da inteligência artificial generativa tecnologia e valor comercial. **
Para a competição empresarial, Zhou Bowen acredita que pode ser dividida em três rotas: a primeira rota é construir um modelo subjacente de grande escala com capacidades gerais, de algoritmos técnicos à iteração do modelo e circuito fechado de cena; a segunda rota é baseada em modelos de outras pessoas (como GPT) e, em seguida, combinar seu próprio know-how da indústria para fazer treinamento; a terceira rota é puramente para aplicação, que é usar o modelo diretamente, e essa barreira será menor.
Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
Pensamento frio da IA sob o surgimento da "guerra dos mil modelos"
Fonte original: International Finance News
No início de julho, houve um boom de inteligência artificial em Xangai. A **Conferência Mundial de Inteligência Artificial de 2023 atingiu o maior número de expositores e área de exposição de todos os tempos. Muitas empresas anunciaram na conferência que lançarão grandes modelos de IA. **A alta temperatura e o forte clima convectivo não conseguiram dissipar o entusiasmo de todos. O portão da exposição já atraiu cambistas para vender ingressos, e muitas pessoas ajudaram velhos e jovens a explorar a tendência de desenvolvimento de ponta da inteligência artificial.
Sob o aumento, ** também deve ver com calma que o modelo grande ainda enfrenta problemas centrais, como robustez, conformidade e credibilidade. **Em comparação com os países desenvolvidos, meu país ainda tem uma lacuna em chips, poder de computação, dados, etc. A escassez de dados é um grande problema que afeta a aplicação de grandes modelos. grandes modelos domésticos um fator importante no desenvolvimento.
No estágio atual, quando as questões centrais ainda precisam ser superadas e a lacuna está sendo preenchida, que tipo de caminho de desenvolvimento o desenvolvimento de IA da China deve explorar? Durante o fórum de três dias e entrevistas com muitos especialistas participantes do setor, a maioria das respostas que o repórter obteve foi "integração vertical" e "aplicação de pouso".Tendência de desenvolvimento de IA.
"Vá para a mesa primeiro"
Atualmente, o desenvolvimento da economia digital tornou-se um consenso global. Como uma tecnologia emergente estratégica, a inteligência artificial está se tornando cada vez mais a principal força motriz para a modernização industrial e melhoria da produtividade. Em novembro de 2022, a OpenAI lançou o ChatGPT, um modelo de inteligência artificial conversacional de uso geral em grande escala. Uma nova rodada de boom de inovação em IA foi lançada em todo o mundo.
**Na Conferência Mundial de Inteligência Artificial de 2023, o grande modelo é o papel principal. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General e modelos verticais grandes como Tuotian e Daguan "Cao Zhi" são vertiginosos.
Lin Jianming, fundador e presidente do Samoyed Cloud Technology Group, destacou em entrevista a um repórter do International Finance News que **IA está no ponto de partida de uma nova rodada de tendências industriais. ** Do ponto de vista do layout do modelo grande, "jogadores de ponta", como Baidu, Ali e Huawei, realizam um layout "quatro em um" da camada de poder de computação, camada de plataforma, camada de modelo, e camada de aplicação; O ponto de entrada é desenvolver algoritmos de modelo em larga escala e aplicações de campo subdividido.
Lin Jianming disse que os atuais parâmetros do modelo doméstico de grande escala estão basicamente na escala de 100 bilhões ou mais.Em termos de direção de aplicação, a maioria das empresas se concentra em aplicações internas no estágio inicial e gradualmente se estende para empresas B-end. **A tecnologia de inteligência artificial continua a fazer avanços. Grandes fabricantes e pequenas e médias empresas de tecnologia estão competindo por grandes modelos. Naturalmente, ninguém quer perder a grande onda desta era. Somente "indo para a mesa primeiro" você pode entender o "trunfo" das regras. No contexto dos dividendos cada vez menores da Internet móvel, a opção por abraçar grandes modelos deverá trazer novos pontos de crescimento.
Zhou Bowen, IEEE/CAAI Fellow, Huiyan Chair Professor da Tsinghua University, professor titular do Departamento de Eletrônica e fundador da Lianyuan Technology, disse ao repórter do "International Finance News" que **a China deveria adotar um sistema de larga escala baseado em "inovação independente, segurança e controlabilidade". A rota de desenvolvimento do modelo de linguagem e tecnologia de inteligência artificial generativa concentra-se em promover a ampla aplicação de grandes modelos com capacidades de uso geral em indústrias verticais. **Além disso, aplicações de negócios, inovação acadêmica e ecologia tecnológica precisam ser diversificadas e não podem ser totalmente concentradas em um modelo grande, nem devem usar uma maneira de pensar para fazer as coisas.
Vários desafios
Sob o aumento da IA, grandes modelos ainda enfrentam vários desafios, como robustez, conformidade e credibilidade. Lin Jianming disse sem rodeios que, em comparação com o mundo, especialmente os Estados Unidos, ainda temos uma certa lacuna em chips de IA, patentes, pesquisa de algoritmos e um ecossistema de inovação maduro. **Os principais fatores que restringem o desenvolvimento de modelos domésticos de grande escala são: primeiro, modelos grandes requerem grande poder de computação e temos deficiências em chips e poder de computação; segundo, falta de dados de corpus chineses de alta qualidade e dados da indústria; terceiro , o número de profissionais Raro, a inovação da pesquisa básica não é suficiente.
"O setor financeiro é uma existência especial com requisitos muito altos para gerenciamento de risco e segurança. Os desafios de risco de confiança, risco de modelo, ética, estabilidade, precisão, segurança de dados, conformidade e outros riscos enfrentados pela pesquisa e desenvolvimento de grandes modelos financeiros são mais graves.” Lin Jianming apontou.
Jiang Ning, vice-gerente geral e diretor de informações da Mama Consumer, disse em entrevista a um repórter do International Finance News que o **grande modelo de IA ainda enfrenta questões centrais, como adaptabilidade dinâmica, robustez, conformidade e credibilidade em decisões importantes , Como eliminar ruídos e interferências, em situações repentinas e imprevisíveis, é especialmente crítico alcançar estabilidade contínua e conformidade e credibilidade de decisões importantes. **
Jiang Ning apontou que os modelos domésticos de grande escala carecem de avanços originais e ainda há lacunas na capacidade de raciocínio do modelo e na capacidade de geração de modelos em grande escala. A dificuldade de obter dados de corpus chineses de grande escala e alta qualidade é um fator importante que restringe o desenvolvimento de modelos de grande escala na China. Específico para o campo financeiro, também enfrenta muitos desafios, como proteção de privacidade, estabilidade contínua, conformidade e credibilidade.
Zhou Bowen acredita que no treinamento atual de grandes modelos de IA, o lado do algoritmo converge para o modelo de transformador de rede neural, o lado do poder de computação depende de clusters de servidores de IA com recursos de computação paralela em larga escala e o lado dos dados precisa alimentar grandes dimensionar conjuntos de dados com uma enorme quantidade de dados. Do ponto de vista dos três elementos da IA, a escassez de dados é obviamente um grande problema que leva à implementação de aplicativos de modelo em larga escala. Campos específicos, como o setor financeiro, que possuem requisitos extremamente rígidos para segurança de dados e proteção da privacidade do usuário, também apresentam uma série de desafios para grandes modelos, como confiabilidade, controlabilidade autônoma e forte segurança.
Zhou Bowen disse que a industrialização de modelos de grande escala também enfrenta desafios: primeiro, a escala de dados é grande e a qualidade dos dados é desigual; segundo, o modelo é grande e difícil de treinar; ** Portanto, o desenvolvimento de grandes modelos depende do suporte abrangente do poder de computação do algoritmo e dos dados. Modelos grandes são o foco do desenvolvimento industrial futuro, mas vale a pena explorar o modelo de negócios de modelos grandes. Como as barreiras de custo dos grandes modelos são muito altas, tanto as grandes quanto as pequenas empresas têm seus próprios encargos.
Integração vertical
No estágio atual, quando as questões centrais ainda precisam ser superadas e a lacuna está sendo preenchida, que tipo de caminho de desenvolvimento o desenvolvimento de IA da China deve explorar? Que outras oportunidades de desenvolvimento existem? Jiang Ning apontou que a construção de um sistema de IA combinado é uma tendência de desenvolvimento, combinando efetivamente a usabilidade e o profissionalismo de modelos discriminativos em vários campos verticais e as características de aprendizado de transferência e capacidades de generalização de grandes modelos generativos, para que seja verdadeiramente popular na indústria. Aproveite a capacidade de generalização de grandes modelos.
Lin Jianming destacou que, no futuro, modelos de grande escala terão grande potencial no processo de inteligência digital de cidades, indústrias e empresas. O layout doméstico de grandes modelos precisa fortalecer as capacidades de inovação independentes, aumentar a competitividade central de grandes modelos de vários níveis, como poder de computação, algoritmos e talentos, e também combinar estreitamente as necessidades estratégicas nacionais e as direções de desenvolvimento da indústria para explorar os pontos problemáticos da indústria e cenários em profundidade.
Além disso, "é necessário usar sua própria tecnologia, cenários, dados do usuário e da indústria e Know-How da indústria (segredos da indústria) para criar um grande modelo no campo vertical; use o 'modelo geral + modelo especial da indústria Know-How ' para capacitar a economia real e estabelecer sua própria vantagem de barreiras." Lin Jianming disse.
Zhou Bowen acredita que a indústria de modelos em grande escala na China deve começar de ponta a ponta e desenvolver de forma iterativa modelos de negócios maiores, o que pode ser uma abordagem mais adequada. Com base nas capacidades gerais, a formação contínua no campo vertical para melhorar as capacidades profissionais de grandes modelos é um meio importante para ajudar no desenvolvimento e progresso de grandes modelos no futuro. **
Zhou Bowen apontou que, de uma perspectiva teórica e técnica, devem existir diferenças. No desenvolvimento da IA, por um lado, somos um apanhador no nível técnico e, por outro lado, provavelmente nos tornaremos inovadores e até líderes no nível do aplicativo. **A IA da China precisa explorar um novo caminho, ou seja, integrar-se verticalmente do modelo geral autodesenvolvido ao aplicativo e ao circuito fechado de cenário completo do usuário, de modo a realizar o "pouso duplo" da inteligência artificial generativa tecnologia e valor comercial. **
Para a competição empresarial, Zhou Bowen acredita que pode ser dividida em três rotas: a primeira rota é construir um modelo subjacente de grande escala com capacidades gerais, de algoritmos técnicos à iteração do modelo e circuito fechado de cena; a segunda rota é baseada em modelos de outras pessoas (como GPT) e, em seguida, combinar seu próprio know-how da indústria para fazer treinamento; a terceira rota é puramente para aplicação, que é usar o modelo diretamente, e essa barreira será menor.