70 bilhões de parâmetros! A IBM fornecerá o modelo de código aberto semelhante ao ChatGPT Llama 2

Fonte: AIGC Open Community

Fonte da imagem: Gerada por Unbounded AI

Em 10 de agosto, a IBM anunciou em seu site oficial que fornecerá o Llama 2, um grande modelo de linguagem de código aberto com 70 bilhões de parâmetros, em watsonx.ai e plataformas de dados. (Endereço de teste gratuito:

O Llama 2 é um modelo de linguagem grande semelhante ao ChatGPT, de código aberto pela gigante tecnológica e social Meta no mês passado e permitido para comercialização. O Llama 2 é construído com base no Llama. Ele possui três parâmetros de 7 bilhões, 13 bilhões e 70 bilhões, que podem ser usados para desenvolver vários produtos generativos de IA. Atualmente, é um dos mais poderosos modelos de linguagem aberta de código aberto.

watsonx.ai pertence a watsonx, que é o grande modelo de linguagem e plataforma de desenvolvimento de IA generativa da IBM, fornecendo uma plataforma de desenvolvimento completa para pré-treinamento, ajuste fino, verificação de dados, implantação e desenvolvimento de modelo básico. Não muito tempo atrás, a NASA cooperou com a IBM para treinar e ajustar o grande modelo geoespacial Prithvi na plataforma watsonx.ai.

Com a popularidade do ChatGPT fora do círculo, modelos grandes de IA de código aberto surgiram e se desenvolveram rapidamente, e um grande número de produtos é carregado no Hugging Face, GitHub e outras plataformas de código aberto todos os dias.

Mas como usar e desenvolver esses modelos de forma eficiente não é fácil para PMEs e desenvolvedores individuais. Para ajudar os desenvolvedores a simplificar o ambiente de desenvolvimento e melhorar a eficiência do desenvolvimento, a IBM lançou o watsonx.ai.

watsonx.ai é composto principalmente por quatro blocos principais: modelo básico, laboratório de dicas, ciência de dados e MLOp e Tuning Studio (em breve).

Modelo básico: esta função simplifica a seleção e o download de modelos. Os usuários podem acessar diretamente modelos grandes populares de IA de código aberto na plataforma Hugging Face em watsonx.ai, por exemplo, Llama 2 fornecido desta vez, bem como diferentes usos e tamanhos de IBM auto-treinamento , o modelo da arquitetura.

Hint Lab: ajuda os desenvolvedores a treinar e ajustar as dicas geradas do modelo. Uma variedade de ajustes finos de processamento de linguagem natural, como resposta a perguntas de texto, geração de conteúdo, resumo, classificação e extração de texto, pode ser feita com apenas alguns exemplos ou mesmo sem dados.

Ciência de dados e MLOp: ao conectar-se a várias APIs, SDKs e bibliotecas de modelos, ele pode automatizar todo o ciclo de vida do modelo de IA, desde o desenvolvimento até a implantação, simplificando bastante a configuração do desenvolvimento e a conexão de recursos.

Tuning Studio: Esta é uma função rápida de ajuste fino que ajusta a precisão e o desempenho do modelo básico usando dados rotulados. Esse recurso será lançado em uma versão subseqüente do watsonx.ai em breve.

A IBM afirmou que, para ajudar ainda mais as empresas a acelerar a aplicação de IA generativa e modelos grandes, foi estabelecido um "Centro de Excelência em IA" com mais de 1.000 especialistas profissionais em IA generativa, que pode fornecer desenvolvimento completo, como modelos refinados ajuste, implantação e manutenção. E a IBM colocará a privacidade do usuário e a segurança dos dados em primeiro lugar e fornecerá serviços de IA seguros e confiáveis.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)