Sob a Guerra dos Cem Modelos, o Alibaba Cloud está mais preocupado com a ecologia

Autor|Xuan Ning

Fonte丨Pinwan

"Não fazemos modelos para competir com outros modelos."

Crédito da imagem: Gerado por ferramentas Unbounded AI

Durante a Conferência Mundial de Inteligência Artificial de 2023, o Alibaba Cloud CTO Zhou Jingren disse isso. Isso parece ser um pouco diferente da "Guerra dos Cem Modelos" de que muitas pessoas falam.Não é verdade que tanto os grandes quanto os pequenos fabricantes estão desenvolvendo seus próprios modelos e depois competindo entre si? O Alibaba Cloud também é um deles.

Esse retrato de obcecado por jogos de soma zero é, na verdade, um pouco grosseiro e ilusório. Ele ignora a essência do Alibaba Cloud como fornecedor de computação em nuvem e o que realmente está construindo passo a passo depois de propor o modelo como um modelo de serviço.

Ou seja, os serviços de computação em nuvem são o ponto de partida de todas as suas ações.

Os modelos da série Tongyi são apenas parte deles. Além disso, Zhou Jingren lembrou às pessoas que devem prestar atenção à lógica do modelo do Alibaba Cloud. "Temos várias identidades", disse Zhou Jingren. "Nosso próprio modelo grande é atender empresas e ISVs na nuvem, para que eles possam chamar o modelo com mais facilidade ou integrar o modelo grande em seu sistema de negócios, para que possamos esperar a explosão de aplicativos. Ao mesmo tempo , também Para atender inovadores e desenvolvedores de modelos autodesenvolvidos, fornecemos ferramentas e ecologia.”

Independentemente de atender diretamente às necessidades dos clientes existentes em sua própria plataforma ou fornecer a mais criadores de modelos uma infraestrutura de alta qualidade, como poder de computação e ferramentas, em última análise, o Alibaba Cloud deseja tornar o ecossistema próspero diminuindo o limite. Deixe o modelo realmente funcionar para resolver problemas reais. Ninguém quer fazer do grande modelo mais do que um conceito que se discute, diviniza ou demoniza.

mais blocos

Para atingir esse objetivo, uma das práticas do Alibaba Cloud é usar várias ferramentas para tornar o desenvolvimento e o uso do modelo tão fácil quanto os blocos de construção.

No mesmo dia, Zhou Jingren anunciou mais "blocos de construção" fornecidos pelo Alibaba Cloud.

Em primeiro lugar, é um novo bloco de construção do sistema generalizado de modelos em grande escala, e o modelo do diagrama vicentino é universal.

Juntamente com Tongyi Qianwen e Tongyi Tingwu, que apareceram antes, eles formam a própria série de modelos em grande escala do Alibaba Cloud, e os membros definitivamente continuarão a se expandir, continuando ao longo da rota estabelecida da multimodalidade do Alibaba Cloud.

Segundo relatos, Tongyi Wanxiang é baseado no Composer, um modelo de geração combinada desenvolvido por Ali. Simplificando, ele controla a estabilidade da geração desmontando os elementos da imagem. Esta é uma estrutura de geração combinada baseada no modelo de difusão. . Os documentos relacionados ao Composer dos quais Zhou Jingren participou foram incluídos no ICML 2023, a principal conferência internacional de IA.

Sob essa nova ideia, além de fornecer a função tradicional de diagrama de Vincent com base em palavras de prompt no lado do produto, também fornece geração de diagrama de similaridade, que pode fornecer imagens do estilo desejado para ajudar a gerar; e a função de migração de estilo, que pode ser mais intuitivo Implementa o estilo de uma determinada imagem em outra imagem gerada. Estes estão claramente abordando questões de estabilidade e usabilidade de imagens geradas pelo usuário.

Além do sistema autodesenvolvido, o Alibaba Cloud também está construindo blocos de construção para o mercado de 100 modelos, como a plataforma de serviço modelo Lingji.

Ele fornece uma interface de nuvem padrão para criadores de modelos e um SDK unificado para desenvolvedores de aplicativos que desejam usar o modelo.

Para modelos, ele fornece uma série de links de ferramentas de nuvem de modelos automatizados, suporta acesso independente de modelos e os leva a vários recursos de serviço acumulados pelo Alibaba Cloud, como raciocínio de modelo, ajuste fino e expansão e implantação elástica adaptativa. implantação ou implantação exclusiva definida pelo usuário, etc. Isso permite que o modelo não apenas seja integrado por meio da API de inferência, mas também obtenha a personalização do modelo por meio da API de treinamento e ajuste fino.

Para desenvolvedores de IA, diferentes modelos podem ser facilmente obtidos por meio de um SDK unificado e integrados em seus próprios aplicativos.

Atualmente, a plataforma Lingji hospeda muitos modelos de linguagem grandes líderes do setor. Além do próprio Tongyi Qianwen do Alibaba Cloud, existem mais modelos tripartidos, como ChatGLM-v2, Baichuan, Jiang Ziya e Dolly.

Por trás do Lingji está o poderoso poder de computação da Alibaba Cloud e a plataforma de desenvolvimento de IA, incluindo o lendário cluster doméstico de computação inteligente mais forte com 100.000 GPUs e o PAI, uma plataforma de aprendizado de máquina em escala de treinamento distribuído de tarefa única que suporta 10.000 cartões.

Esses blocos de construção reduzirão o limite para o desenvolvimento e uso de modelos grandes e tornarão a ecologia do mercado de modelos da China mais livre e mais ativa. A comunidade de desenvolvedores de IA Mota é uma prévia do futuro mercado livre para modelos grandes.

Uma prévia do modelo mercado livre

Mota Community é uma comunidade de modelos de IA lançada por Ali no ano passado. Ela cresceu incrivelmente desde o seu lançamento. Tornou-se a maior comunidade de modelos de IA na China em pouco mais de meio ano. Atualmente, reúne mais de 1,8 milhão de desenvolvedores e mais de 900 modelos de IA de alta qualidade. Esses modelos são compostos por 20. Contribuídos por várias das principais instituições de inteligência artificial, os downloads cumulativos ultrapassaram 36 milhões. Entre eles, existem cerca de 100 grandes modelos com uma escala de parâmetros de mais de 1 bilhão.

No Mota, todos os produtores de modelos podem fazer upload de modelos, verificar as capacidades técnicas dos modelos e explorar os cenários de aplicação e modelos de comercialização dos modelos. A comunidade Mota abriu o link de implantação com a plataforma Lingji e apóia o modelo da comunidade para realizar o serviço por meio do Lingji.

No dia da conferência, o Alibaba Cloud lançou uma nova ferramenta, ModelScope GPT (Magic GPT), que pode combinar e agendar livremente todos os modelos de todos os tamanhos na plataforma Mota.

O Mota GPT é uma ferramenta que entende a linguagem humana, você só precisa falar com ela e expor suas necessidades, podendo usar o modelo grande central para encontrar e chamar o modelo pequeno, e formar uma equipe para realizar as tarefas que você der.

Na verdade, é também um tipo de rota de tecnologia AI Agent que é valorizada por mais e mais desenvolvedores de modelos hoje. Simplificando, é um assistente que pode tomar decisões autônomas com base no entendimento.

“Também é um modelo, mais um Agente de IA, que consegue desmontar informações complexas de forma mais inteligente através do entendimento de outros modelos, e até de outras ferramentas de toda a Internet, combinadas com linguagem natural e capacidades multimodais. modelos em cada sub-problema para resolver." disse Zhou Jingren.

"Precisamos de um agente de uso geral que combine o poder do modelo para nos ajudar a concluir várias tarefas. Acredito que esse espaço de imaginação é muito grande", disse ele.

ModelScope GPT pode ser considerado como uma espécie de "prova". Com base na base ecológica da comunidade Mota, uma ferramenta é desenvolvida para aumentar a interação entre desenvolvedores e a comunidade modelo, aumentar o fluxo de elementos na comunidade modelo e estimular inovação em toda a comunidade.

Segundo relatos, o ModelScope GPT agora é capaz de chamar APIs de mais de dez modelos principais de IA na comunidade Mota, incluindo resolução de endereços, extração de informações, tradução, síntese de áudio e vídeo, etc. para expandir, e suas capacidades também continuarão aprimoradas.

O Alibaba Cloud decidiu abrir o conjunto de dados ModelScope GPT e o programa de treinamento para que os desenvolvedores comecem, criem ferramentas úteis de chamada de modelo e usem-nas onde quiserem.

Com ecologia, naturalmente haverá comercialização

Na Conferência de Inteligência Artificial deste ano, grandes modelos se tornaram o foco absoluto.Você descobrirá que o conceito de MaaS (Model as a Service) é onipresente na área de exposição e no fórum.

Em novembro do ano passado, o Alibaba Cloud assumiu a liderança ao propor o conceito de "Modelo como serviço" no setor e, ao mesmo tempo, lançou a criação mágica da comunidade de modelos de IA. Naquela época, não havia muitos respondentes na indústria, mas hoje deriva de vários entendimentos.

Grandes modelos estão remodelando o setor de computação em nuvem. Os provedores de serviços de computação em nuvem precisam fornecer uma gama completa de serviços, incluindo treinamento de modelos, raciocínio, implantação, ajuste fino, avaliação e implementação de produtos em torno do centro do modelo de IA.

"A Alibaba Cloud está praticando o paradigma de desenvolvimento MaaS, redefinindo e projetando todos os aspectos dos produtos em nuvem em torno do modelo de IA", disse Zhou Jingren.

Até certo ponto, sob a ideia de MaaS, a plataforma Alibaba Cloud não serve apenas modelos autodesenvolvidos, mas é mais como um "Tmall" de grandes modelos. Esta é uma plataforma através da qual todos os modelos podem ser fornecidos diretamente a potenciais Em vez de focar no autoemprego, todas as outras coisas servem ao autoemprego.

"A Alibaba Cloud terá como objetivo principal a promoção da prosperidade da ecologia de modelos em grande escala da China e fornecerá uma gama completa de serviços para empresas iniciantes de grande escala", disse Zhou Jingren. Somente permitindo verdadeiramente que as capacidades técnicas trazidas pelo modelo cheguem às massas e resolvam problemas reais, a ecologia pode florescer.

O paradigma MaaS pode não levar diretamente a um modelo de negócios específico. Zhou Jingren acredita que quando a ecologia do modelo de mercado livre começar a prosperar e quando realmente começarmos a usar grandes modelos para resolver problemas práticos, os modelos comerciais surgirão naturalmente, e esse processo deve ser baseado na rota da nuvem pública.

"Hoje esperamos que um modelo possa chegar a mais desenvolvedores, ou gerar mais valor real, e só pode atingir toda a sociedade por meio da nuvem pública. Como aproveitar as vantagens técnicas e o valor da nuvem pública hoje, é um aspecto importante para empresas e desenvolvedores alcançarem avanços nos negócios."

A computação em nuvem é permitir que mais pessoas desfrutem do poder de computação na forma de infraestrutura. Em última análise, o modelo de grande escala também é uma melhoria no poder de computação e permite que mais pessoas obtenham novo poder de computação trazido por novas tecnologias em um limite inferior é o que os fabricantes de nuvem devem fazer. funções desempenhadas.

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)