Em 29 de junho, a Meituan emitiu um anúncio na Bolsa de Valores de Hong Kong, anunciando a aquisição da "Light Years Beyond", uma empresa de modelos em grande escala fundada por Wang Huiwen, que também deixou especulações no mercado de modelos em grande escala de IA . Não apenas na China, o número de visitas ao ChatGPT caiu recentemente. Segundo dados, as visitas globais do ChatGPT em junho caíram 9,7% mês a mês, e o número de visitantes únicos caiu 5,7% mês a mês. Além disso, a duração dos utilizadores do ChatGPT também está a diminuir: a duração de cada visita diminuiu 8,5% em maio. O AIGC parece ter iniciado um período de reflexão.
Mas, por outro lado, em 4 de julho, a empresa modelo em grande escala "Zero One Creation" organizada pelo próprio Kai-Fu Lee foi lançada oficialmente, e o modelo de linguagem em grande escala "Wen Xin Yi Yan" APP desenvolvido pela Baidu foi lançado no Apple App Market, e o editor de cheques corporativos cheque Grande modelo - "Conhecendo o Inimigo Alfa"... Várias empresas estão fazendo movimentos frequentes no campo de modelos grandes e estão em pleno andamento.
Quão quente é o negócio de grandes modelos de IA? Qual é o layout de investimento do mercado de capitais para este canal? Como é o desempenho dos modelos domésticos de grande escala de hoje? Esta edição da Titanium Media·Tidu Tuwen tenta separar o status atual de desenvolvimento de modelos domésticos de grande escala a partir do nível de dados.
Os gigantes da tecnologia de "luta de fadas" do modelo doméstico de IA em grande escala estão competindo para filmar
Desde março deste ano, os modelos domésticos de IA surgiram como cogumelos depois da chuva. O "Relatório de pesquisa de mapas de grandes modelos de inteligência artificial da China" mostra que, até o final de maio de 2023, pelo menos 79 grandes modelos básicos domésticos com uma escala de parâmetros de 1 bilhão ou mais foram lançados.
Do ponto de vista global, os Estados Unidos ocupam o primeiro lugar no número de modelos de grande escala no mundo. Já em 2020, os Estados Unidos lançaram 15 modelos de grande escala, incluindo o GPT-3. Na China, a partir de 2020, os modelos de grande escala também entraram em um estágio de rápido desenvolvimento. Em 2021, serão lançados 30 modelos de grande escala, 28 modelos de grande escala serão lançados em 2022 e 19 modelos de grande escala serão lançados ser lançado nos primeiros cinco meses de 2023, superando os 18 modelos de grande porte nos Estados Unidos. Hoje, o número de modelos em grande escala na China e nos Estados Unidos representa quase 90% do número total de modelos em grande escala no mundo, e o número de modelos em grande escala na China entrou no primeiro escalão.
A pista de modelo em grande escala doméstica é muito animada. Os "jogadores" envolvidos na pista de modelo em grande escala de IA incluem gigantes da Internet representados por Ali, Tencent, Baidu, etc. Em 16 de março, o Baidu liderou o caminho e lançou a versão chinesa do ChatGPT "文心一言". Posteriormente, grandes modelos como Ali, Huawei, Tencent e 360 surgiram um após o outro.
Além disso, existem empresas de tecnologia de IA representadas por SenseTime, HKUST Xunfei, etc., empresas de educação como Kidswant, empresas financeiras como Flush e empresas imobiliárias como I Love My Home. Além disso, modelos grandes também são muito populares na academia. Já em fevereiro deste ano, a Fudan University lançou o MOSS, o primeiro modelo do tipo ChatGPT na China.
Vale a pena notar que, com a popularidade do ChatGPT, também houve um boom no empreendedorismo de IA em grande escala na China. Muitos líderes de tecnologia e executivos de grandes empresas se dedicaram a modelos de grande escala e começaram o reempreendedorismo.
Em fevereiro de 2023, Wang Huiwen, o ex-cofundador da Meituan, lançou a "AI Hero List", uma entrada de destaque no modelo grande de IA; também uma entrada de destaque foi Li Kaifu, CEO da Sinovation Em 19 de março, Li Kaifu anunciou no círculo de amigos que estabeleceu a empresa Project AI 2.0 e entrou no modelo de IA em grande escala; posteriormente, o fundador da Sogou, Wang Xiaochuan, o ex-pioneiro de negócios da JD.com AI, Zhou Bowen, e Momenwen O CEO Li Zhifei também se juntou ao boom empresarial do modelo de IA em larga escala.
Além desses gigantes da tecnologia, muitos executivos de grandes empresas de Internet também se juntaram à competição. Por exemplo, Li Yan, uma ex-figura do núcleo de IA de Kuaishou, estabeleceu a empresa de IA Yuanshi Technology para conduzir pesquisa e desenvolvimento de grandes modelos multimodais; "discípulo fechado" de Li Kaifu e nº da Yitu Technology. -interação do computador. Hoje, a "luta de fadas" doméstica em larga escala da IA, a trilha da indústria é muito animada.
Instituições de investimento são cautelosas e o mercado recruta talentos na área de grandes modelos com altos salários
Para entrar no modelo grande, você deve primeiro preparar o dinheiro, afinal, uma empresa iniciante de grande modelo lança um modelo relativamente maduro, que precisa investir no custo de infraestrutura de modelo de linguagem grande, treinamento e talentos de P&D. Para start-ups, o financiamento é a única maneira de sobreviver.
De acordo com as estatísticas incompletas da Titanium Media·Tidu Tuwen, em 4 de julho de 2023, o valor do financiamento de empresas iniciantes de IA de grande escala que obtiveram financiamento este ano geralmente está entre dezenas de milhões e centenas de milhões. Entre eles, a MiniMax, uma empresa start-up modelo em grande escala que recebeu mais financiamento, concluiu uma nova rodada de financiamento superior a US$ 250 milhões em 1º de junho. A avaliação atual da empresa excede US$ 1,2 bilhão e é apelidada de "a primeira investimento Título "Empreendedorismo".
Além disso, a Light Years, que acabou de ser adquirida pela Meituan, concluiu seu financiamento A-round de US$ 230 milhões em 5 de junho, mas esta rodada de financiamento também foi devolvida integralmente após a conclusão da aquisição pela Meituan. Vale ressaltar que a Xihu Xinchen, fundada em 2021, concluiu dois financiamentos consecutivos em março e abril deste ano, e a velocidade do financiamento é muito rápida.
No investimento em modelos de IA em larga escala, os principais VCs, como IDG Capital, Matrix Partners e ZhenFund, fizeram menos movimentos.
De acordo com as estatísticas incompletas da Titanium Media e Titanium News, Tencent Investment, Innovation Works, Qiji Chuangtan e Sequoia China são as instituições de investimento mais ativas, com três empresas de investimento, seguidas por BV Baidu Ventures e Zhipu AI, empresas de investimento são 2 respectivamente , e a maioria das instituições investe em apenas 1 empresa. A Hillhouse Venture Capital e a Shenzhen Venture Capital, que sempre estiveram ativas, não têm dados públicos mostrando que investiram em trilhas de modelo de IA em grande escala. Pode-se ver que os investidores estão interessados em A trilha do modelo de empreendedorismo em larga escala é mais cautelosa.
Além do financiamento, as capacidades técnicas também estão no centro da competição de modelos em grande escala. Modelos grandes têm altos requisitos de algoritmos, poder de computação e dados. Modelos grandes de IA exigem altos custos de treinamento e investimento em P&D. Algumas grandes empresas de Internet e empresas de tecnologia têm reservas técnicas e de capital mais profundas.
De acordo com as estatísticas incompletas da Titanium Media·Tidu Tuwen, em 2022, a Huawei investirá 161,5 bilhões de yuans em despesas de P&D, tornando-se a empresa com mais fundos de investimento em P&D; em segundo lugar, a Tencent ocupa o segundo lugar com 61,4 bilhões de yuans e a Ali com 55,5 bilhões de yuans terceiro. Os gigantes da Internet investem dezenas de bilhões em P & D todos os anos. Além disso, eles também têm uma forte equipe de P & D. Eles são jogadores merecidos do "primeiro escalão" na pista de modelagem em grande escala.
Além de capital e tecnologia, o talento também é uma parte indispensável da competição de modelos em grande escala.
No primeiro trimestre deste ano, várias empresas lançaram uma competição para os melhores talentos de IA. Wang Huiwen disse que usaria 75% das ações para convidar os principais talentos de P&D. Li Kaifu convocou o recrutamento de talentos de classe mundial em todo o mundo. e recrutou arquitetura de modelo com um salário de 20-40k/mês Engenheiro; Ali recruta engenheiros de treinamento e algoritmo em grande escala com um salário de 40-70k/mês, e grandes empresas estão ávidas por talentos.
Dados relevantes mostram que no primeiro trimestre deste ano, o número de cargos relacionados a modelos grandes de IA aumentou 10,16% ano a ano, sendo o campo com o maior crescimento relacionado ao ChatGPT. Entre eles, o salário médio anual de engenheiros de aprendizado de máquina e algoritmo atingiu mais de 400.000 yuan. .
Desafios de desenvolvimento de modelos em grande escala fabricados na China ainda têm algumas áreas que superam os modelos internacionais
Nos últimos seis meses, grandes modelos foram lançados um após o outro. Qual é a sua força atual? De acordo com a avaliação de 10 modelos de IA de grande escala no país e no exterior por instituições relevantes, o ChatGPT tem uma clara vantagem geral, ocupando o primeiro lugar em termos de dados abrangentes. Em termos de setores, os modelos domésticos de grande escala superam os modelos estrangeiros em termos de compreensão de palavras e frases e questões de conhecimento, ou seja, os modelos domésticos de IA de grande escala têm uma cognição básica mais forte e capacidade de aprendizado de texto.
Entre os seis modelos domésticos de grande escala, o desempenho abrangente de dados de "Wen Xin Yi Yan" é relativamente excelente, especialmente liderando os grandes modelos de linguagem doméstica em termos de compreensão de palavras e frases, programação, questões de conhecimento e tradução; em termos de negócios escrita, produtos domésticos têm o melhor desempenho O melhor é "Xunfei Xinghuo"; em termos de questões de literatura, o produto doméstico "Tiangong 3.5" tem a maior taxa de pontuação de 88,33%, que está no mesmo nível do ChatGPT; em termos de raciocínio lógico, "Wenxinyiyan" e "Xunfei "Spark" tiveram um desempenho bastante bom.
Os modelos nacionais de grande escala funcionam muito bem em alguns campos subdivididos, mas ainda há uma certa lacuna com produtos estrangeiros do mesmo tipo, e ainda há muito espaço para melhorias em tecnologias essenciais, como dados e cenários de pouso.
No nível dos dados, o desenvolvimento de grandes modelos requer conjuntos de dados de treinamento de alta qualidade. Atualmente, a quantidade total de dados chineses necessários para treinamento de modelos em larga escala com base na semântica chinesa na China é insuficiente e a qualidade não é alta. A escassez de corpus de treinamento de modelos chineses em grande escala de alta qualidade também aumenta a lacuna.
Em termos de poder de computação, com base na capacidade do data center, as empresas líderes nesse campo em 2022 são Google, Microsoft, Amazon e Meta. Essas quatro plataformas de data center respondem por mais de 70% da capacidade total de dados autoconstruídos centros no mundo; e Atualmente, embora algumas empresas líderes em tecnologia, como Alibaba, Baidu e Tencent, tenham concluído a construção de centros de dados na China, ainda há uma certa lacuna em termos de capacidade em comparação com países estrangeiros.
Em termos de cenários de pouso, o custo de pouso em diferentes cenários de subdivisão também é um problema. Para obter um modelo grande suficientemente eficaz e fácil de usar, corpus suficiente e direcionado precisa ser investido, o que significa que a implementação de diferentes cenários de subdivisão requer muito investimento de custo.
Estima-se que o custo de treinamento de um grande modelo esteja entre US$ 2 milhões e US$ 12 milhões. Devido aos altos custos de treinamento, a empresa de desenvolvimento de inteligência artificial OpenAI perderá cerca de 540 milhões de dólares americanos em 2022. Portanto, levará tempo para a realização comercial de grandes modelos de IA.
Nessa trilha altamente competitiva, mesmo com muitas dificuldades, os grandes modelos nacionais caminham para uma direção técnica mais perfeita. Além disso, a competição na pista também acelerará o ritmo de desenvolvimento da tecnologia doméstica de modelos em grande escala e promoverá a atualização tecnológica geral da indústria de IA da China.
*Fonte de dados: Structure Research, InfoQ Research Center, Liepin Big Data, "China Artificial Intelligence Large Model Map Research Report" e outras informações públicas não são completamente compiladas.
Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
Fundos de "volume" para atrair talentos, entender o cenário competitivo dos modelos domésticos de IA em grande escala em um artigo
Fonte original: Titanium Media
Editor: Liu Yaning, Sun Cheng
Em 29 de junho, a Meituan emitiu um anúncio na Bolsa de Valores de Hong Kong, anunciando a aquisição da "Light Years Beyond", uma empresa de modelos em grande escala fundada por Wang Huiwen, que também deixou especulações no mercado de modelos em grande escala de IA . Não apenas na China, o número de visitas ao ChatGPT caiu recentemente. Segundo dados, as visitas globais do ChatGPT em junho caíram 9,7% mês a mês, e o número de visitantes únicos caiu 5,7% mês a mês. Além disso, a duração dos utilizadores do ChatGPT também está a diminuir: a duração de cada visita diminuiu 8,5% em maio. O AIGC parece ter iniciado um período de reflexão.
Mas, por outro lado, em 4 de julho, a empresa modelo em grande escala "Zero One Creation" organizada pelo próprio Kai-Fu Lee foi lançada oficialmente, e o modelo de linguagem em grande escala "Wen Xin Yi Yan" APP desenvolvido pela Baidu foi lançado no Apple App Market, e o editor de cheques corporativos cheque Grande modelo - "Conhecendo o Inimigo Alfa"... Várias empresas estão fazendo movimentos frequentes no campo de modelos grandes e estão em pleno andamento.
Quão quente é o negócio de grandes modelos de IA? Qual é o layout de investimento do mercado de capitais para este canal? Como é o desempenho dos modelos domésticos de grande escala de hoje? Esta edição da Titanium Media·Tidu Tuwen tenta separar o status atual de desenvolvimento de modelos domésticos de grande escala a partir do nível de dados.
Os gigantes da tecnologia de "luta de fadas" do modelo doméstico de IA em grande escala estão competindo para filmar
Desde março deste ano, os modelos domésticos de IA surgiram como cogumelos depois da chuva. O "Relatório de pesquisa de mapas de grandes modelos de inteligência artificial da China" mostra que, até o final de maio de 2023, pelo menos 79 grandes modelos básicos domésticos com uma escala de parâmetros de 1 bilhão ou mais foram lançados.
Do ponto de vista global, os Estados Unidos ocupam o primeiro lugar no número de modelos de grande escala no mundo. Já em 2020, os Estados Unidos lançaram 15 modelos de grande escala, incluindo o GPT-3. Na China, a partir de 2020, os modelos de grande escala também entraram em um estágio de rápido desenvolvimento. Em 2021, serão lançados 30 modelos de grande escala, 28 modelos de grande escala serão lançados em 2022 e 19 modelos de grande escala serão lançados ser lançado nos primeiros cinco meses de 2023, superando os 18 modelos de grande porte nos Estados Unidos. Hoje, o número de modelos em grande escala na China e nos Estados Unidos representa quase 90% do número total de modelos em grande escala no mundo, e o número de modelos em grande escala na China entrou no primeiro escalão.
Além disso, existem empresas de tecnologia de IA representadas por SenseTime, HKUST Xunfei, etc., empresas de educação como Kidswant, empresas financeiras como Flush e empresas imobiliárias como I Love My Home. Além disso, modelos grandes também são muito populares na academia. Já em fevereiro deste ano, a Fudan University lançou o MOSS, o primeiro modelo do tipo ChatGPT na China.
Vale a pena notar que, com a popularidade do ChatGPT, também houve um boom no empreendedorismo de IA em grande escala na China. Muitos líderes de tecnologia e executivos de grandes empresas se dedicaram a modelos de grande escala e começaram o reempreendedorismo.
Em fevereiro de 2023, Wang Huiwen, o ex-cofundador da Meituan, lançou a "AI Hero List", uma entrada de destaque no modelo grande de IA; também uma entrada de destaque foi Li Kaifu, CEO da Sinovation Em 19 de março, Li Kaifu anunciou no círculo de amigos que estabeleceu a empresa Project AI 2.0 e entrou no modelo de IA em grande escala; posteriormente, o fundador da Sogou, Wang Xiaochuan, o ex-pioneiro de negócios da JD.com AI, Zhou Bowen, e Momenwen O CEO Li Zhifei também se juntou ao boom empresarial do modelo de IA em larga escala.
Além desses gigantes da tecnologia, muitos executivos de grandes empresas de Internet também se juntaram à competição. Por exemplo, Li Yan, uma ex-figura do núcleo de IA de Kuaishou, estabeleceu a empresa de IA Yuanshi Technology para conduzir pesquisa e desenvolvimento de grandes modelos multimodais; "discípulo fechado" de Li Kaifu e nº da Yitu Technology. -interação do computador. Hoje, a "luta de fadas" doméstica em larga escala da IA, a trilha da indústria é muito animada.
Instituições de investimento são cautelosas e o mercado recruta talentos na área de grandes modelos com altos salários
Para entrar no modelo grande, você deve primeiro preparar o dinheiro, afinal, uma empresa iniciante de grande modelo lança um modelo relativamente maduro, que precisa investir no custo de infraestrutura de modelo de linguagem grande, treinamento e talentos de P&D. Para start-ups, o financiamento é a única maneira de sobreviver.
De acordo com as estatísticas incompletas da Titanium Media·Tidu Tuwen, em 4 de julho de 2023, o valor do financiamento de empresas iniciantes de IA de grande escala que obtiveram financiamento este ano geralmente está entre dezenas de milhões e centenas de milhões. Entre eles, a MiniMax, uma empresa start-up modelo em grande escala que recebeu mais financiamento, concluiu uma nova rodada de financiamento superior a US$ 250 milhões em 1º de junho. A avaliação atual da empresa excede US$ 1,2 bilhão e é apelidada de "a primeira investimento Título "Empreendedorismo".
Além disso, a Light Years, que acabou de ser adquirida pela Meituan, concluiu seu financiamento A-round de US$ 230 milhões em 5 de junho, mas esta rodada de financiamento também foi devolvida integralmente após a conclusão da aquisição pela Meituan. Vale ressaltar que a Xihu Xinchen, fundada em 2021, concluiu dois financiamentos consecutivos em março e abril deste ano, e a velocidade do financiamento é muito rápida.
De acordo com as estatísticas incompletas da Titanium Media e Titanium News, Tencent Investment, Innovation Works, Qiji Chuangtan e Sequoia China são as instituições de investimento mais ativas, com três empresas de investimento, seguidas por BV Baidu Ventures e Zhipu AI, empresas de investimento são 2 respectivamente , e a maioria das instituições investe em apenas 1 empresa. A Hillhouse Venture Capital e a Shenzhen Venture Capital, que sempre estiveram ativas, não têm dados públicos mostrando que investiram em trilhas de modelo de IA em grande escala. Pode-se ver que os investidores estão interessados em A trilha do modelo de empreendedorismo em larga escala é mais cautelosa.
De acordo com as estatísticas incompletas da Titanium Media·Tidu Tuwen, em 2022, a Huawei investirá 161,5 bilhões de yuans em despesas de P&D, tornando-se a empresa com mais fundos de investimento em P&D; em segundo lugar, a Tencent ocupa o segundo lugar com 61,4 bilhões de yuans e a Ali com 55,5 bilhões de yuans terceiro. Os gigantes da Internet investem dezenas de bilhões em P & D todos os anos. Além disso, eles também têm uma forte equipe de P & D. Eles são jogadores merecidos do "primeiro escalão" na pista de modelagem em grande escala.
No primeiro trimestre deste ano, várias empresas lançaram uma competição para os melhores talentos de IA. Wang Huiwen disse que usaria 75% das ações para convidar os principais talentos de P&D. Li Kaifu convocou o recrutamento de talentos de classe mundial em todo o mundo. e recrutou arquitetura de modelo com um salário de 20-40k/mês Engenheiro; Ali recruta engenheiros de treinamento e algoritmo em grande escala com um salário de 40-70k/mês, e grandes empresas estão ávidas por talentos.
Dados relevantes mostram que no primeiro trimestre deste ano, o número de cargos relacionados a modelos grandes de IA aumentou 10,16% ano a ano, sendo o campo com o maior crescimento relacionado ao ChatGPT. Entre eles, o salário médio anual de engenheiros de aprendizado de máquina e algoritmo atingiu mais de 400.000 yuan. .
Desafios de desenvolvimento de modelos em grande escala fabricados na China ainda têm algumas áreas que superam os modelos internacionais
Nos últimos seis meses, grandes modelos foram lançados um após o outro. Qual é a sua força atual? De acordo com a avaliação de 10 modelos de IA de grande escala no país e no exterior por instituições relevantes, o ChatGPT tem uma clara vantagem geral, ocupando o primeiro lugar em termos de dados abrangentes. Em termos de setores, os modelos domésticos de grande escala superam os modelos estrangeiros em termos de compreensão de palavras e frases e questões de conhecimento, ou seja, os modelos domésticos de IA de grande escala têm uma cognição básica mais forte e capacidade de aprendizado de texto.
Entre os seis modelos domésticos de grande escala, o desempenho abrangente de dados de "Wen Xin Yi Yan" é relativamente excelente, especialmente liderando os grandes modelos de linguagem doméstica em termos de compreensão de palavras e frases, programação, questões de conhecimento e tradução; em termos de negócios escrita, produtos domésticos têm o melhor desempenho O melhor é "Xunfei Xinghuo"; em termos de questões de literatura, o produto doméstico "Tiangong 3.5" tem a maior taxa de pontuação de 88,33%, que está no mesmo nível do ChatGPT; em termos de raciocínio lógico, "Wenxinyiyan" e "Xunfei "Spark" tiveram um desempenho bastante bom.
No nível dos dados, o desenvolvimento de grandes modelos requer conjuntos de dados de treinamento de alta qualidade. Atualmente, a quantidade total de dados chineses necessários para treinamento de modelos em larga escala com base na semântica chinesa na China é insuficiente e a qualidade não é alta. A escassez de corpus de treinamento de modelos chineses em grande escala de alta qualidade também aumenta a lacuna.
Em termos de poder de computação, com base na capacidade do data center, as empresas líderes nesse campo em 2022 são Google, Microsoft, Amazon e Meta. Essas quatro plataformas de data center respondem por mais de 70% da capacidade total de dados autoconstruídos centros no mundo; e Atualmente, embora algumas empresas líderes em tecnologia, como Alibaba, Baidu e Tencent, tenham concluído a construção de centros de dados na China, ainda há uma certa lacuna em termos de capacidade em comparação com países estrangeiros.
Estima-se que o custo de treinamento de um grande modelo esteja entre US$ 2 milhões e US$ 12 milhões. Devido aos altos custos de treinamento, a empresa de desenvolvimento de inteligência artificial OpenAI perderá cerca de 540 milhões de dólares americanos em 2022. Portanto, levará tempo para a realização comercial de grandes modelos de IA.
Nessa trilha altamente competitiva, mesmo com muitas dificuldades, os grandes modelos nacionais caminham para uma direção técnica mais perfeita. Além disso, a competição na pista também acelerará o ritmo de desenvolvimento da tecnologia doméstica de modelos em grande escala e promoverá a atualização tecnológica geral da indústria de IA da China.
*Fonte de dados: Structure Research, InfoQ Research Center, Liepin Big Data, "China Artificial Intelligence Large Model Map Research Report" e outras informações públicas não são completamente compiladas.