O realismo do grande modelo da Tencent: resolvendo a "ansiedade da IA" das empresas do cenário

Fonte original: IT Times

Autor: Hao Junhui

Fonte da imagem: Gerada por Unbounded AI‌

Esta é uma entrevista em que a pergunta só pode ser "agarrada" acelerando a velocidade da fala e aumentando o decibel.

Na tarde de 7 de julho, antes do Fórum Tencent da Conferência Mundial de Inteligência Artificial de 2023, em uma pequena e barulhenta sala de conferências, Wu Yunsheng, vice-presidente da Tencent Cloud, chefe da Tencent Cloud Intelligence e chefe do Youtu Lab, aceitou uma entrevista em grupo da mídia. Quase 20 dias atrás, a Tencent anunciou oficialmente o panorama MaaS, cortando a quente "trilha do modelo grande" com grandes modelos da indústria. Um caminho que parece mais "realista".

"O que as empresas precisam é realmente resolver um determinado problema em um cenário real, em vez de resolver 70% a 80% do problema em 100 cenários." Wu Yunsheng disse que, do ponto de vista da estratégia da empresa, a Tencent está mais focada em resolver o problema real dos problemas de pouso, e o modelo geral grande não pode resolver completamente todos os problemas dos usuários.

A Tencent, que tem o maior número de usuários individuais na China, está dando o primeiro passo para mudar a Internet industrial para IA quando uma nova onda de inteligência artificial chegar.

Atualização Tencent Cloud MaaS

Em 19 de junho, a Tencent Cloud anunciou pela primeira vez o progresso de pesquisa e desenvolvimento dos modelos industriais de grande escala da Tencent Cloud. Forneceu mais de 50 soluções industriais de grande escala para mais de 10 setores, como mídia, turismo cultural, assuntos governamentais e finança.

Na Conferência Mundial de Inteligência Artificial, a Tencent Cloud anunciou mais uma vez uma série de atualizações.

Entre eles, a recém-atualizada rede de computação de alto desempenho Xingmai, autodesenvolvida pela Tencent Cloud, pode aumentar a utilização da GPU em 40%, economizar de 30% a 60% dos custos de treinamento do modelo e trazer uma melhoria de 10 vezes no desempenho da comunicação para grandes modelos de IA . Com base no HCC de cluster de poder de computação de nova geração da Tencent Cloud, ele pode suportar uma escala de computação supergrande de 100.000 cartões. O banco de dados de vetores nativos de IA da Tencent Cloud suporta escala de recuperação de vetores de até 1 bilhão de níveis, e o atraso é controlado no nível de milissegundos, que é 10 vezes maior do que a escala de recuperação de banco de dados de plug-in autônomo tradicional e tem uma capacidade de pico de milhões de consultas por segundo (QPS).

Em termos de inovação de aplicativos, os recursos de modelo de indústria em grande escala da Tencent Cloud foram aplicados a cenários como controle de risco financeiro, tradução interativa e atendimento digital inteligente ao cliente, o que melhorou muito a eficiência de aplicativos inteligentes.

A solução de controle de risco financeiro suportada pelo modelo de grande escala da indústria tem 10 vezes a eficiência em comparação com a anterior. Através do acúmulo da Tencent de mais de 20 anos de experiência em confronto de produção em preto e cinza e milhares de cenários de negócios reais, o anti- efeito de fraude é 20 vezes maior do que o modelo tradicional, um aumento de cerca de %. No campo de humanos digitais, a Tencent Cloud lançou este ano uma fábrica humana digital de pequena amostra, que pode reproduzir clones digitais 2D em 24 horas com apenas uma pequena quantidade de dados, reduzindo bastante o custo dos serviços humanos digitais de aplicativos corporativos.

"Na verdade, há mais de meio ano, pensamos e exploramos qual é a lógica mais essencial por trás da combinação de grandes modelos e várias indústrias? Na verdade, existem apenas dois pontos: um é que o ponto de partida fundamental da tecnologia é para resolver problemas práticos, e o outro é Se você não pode se aprofundar na indústria, você não pode realmente resolver os problemas enfrentados pela indústria.” O “teste” trazido pela cena real para o grande modelo fez Wu Yunsheng sentir bastante.

O atendimento ao cliente inteligente é reconhecido como a indústria mais aplicável para LLM (Large-Scale Language Model). Nesta conferência, a Tencent criou um modelo de indústria em grande escala para uma empresa OTA de viagens on-line. O modelo específico do cliente ajustado pode resolver problemas de negócios de ponta a ponta sem configurar processos de diálogo. Melhore a taxa de conclusão da tarefa e reduza o custo da construção do diálogo. Mas, na verdade, não é tão simples quanto imaginado para o grande modelo entender verdadeiramente os problemas do cliente.

"Durante o processo de comunicação, o pensamento do cliente está pulando e mudando. Por exemplo, ele apenas propôs reservar o hotel no dia 10, mas antes que a máquina atendesse, ele disse de repente, deixe-me verificar o hotel e o voo no dia 11, quando a IA ainda está dando feedback sobre o segundo requisito, ele pode dizer, mostre-me o quarto duplo. não é uma solução simples, mas precisa ser combinada com a cena, especialmente a interação com o sistema do cliente para reconstruir alguns modelos muito complexos.

A era dos "modelos de grupo dançando juntos" chegou

Após a agitação inicial, como comercializar grandes modelos de IA, como os clientes corporativos podem aproveitar esta rodada de dividendos de IA e resolver a "ansiedade da IA" tornaram-se tópicos importantes nesta Conferência Mundial de Inteligência Artificial.

Zheng Qingsheng, sócio da Sequoia Capital China, entrou no campo de investimentos desde o meio termo da Internet para PC. Em sua opinião, os vencedores de cada era são derivados da tecnologia original daquela época. Por exemplo, na Internet para PC era, as pessoas valorizam o comércio eletrônico e as redes sociais O software se tornou o maior vencedor; desde a era da Internet móvel, as pessoas prestam atenção ao software social e aos vídeos longos, mas os vídeos curtos ocupam mais tempo. "Agora não sabemos quais cenas originais geradas pela própria IA mudarão nossa vida. comportamento básico."

Embora ainda não se saiba quando o "assassino" nativo da IA aparecerá, "entrar no jogo" deve ser o primeiro passo. Entre os mais de 30 modelos de grande escala revelados no WAIC desta vez, exceto para a primeira rodada de modelos de grande escala de uso geral, como Baidu Wenxin Yiyan, Ali Tongyi, Xunfei Xinghuo e Shangtang Ririxin, os retardatários se concentram basicamente no grande modelo da indústria.

"Para os clientes, modelos grandes específicos da empresa com poucos parâmetros, baixo investimento e resultados rápidos têm maior probabilidade de serem aceitos, e sua disposição de pagar é relativamente clara." Um expositor de uma empresa iniciante disse ao "IT Times" repórter que alguns já estão usando modelos grandes. Os clientes do banco que transformam o sistema de atendimento ao cliente geralmente escolhem um método de implantação de domínio privado que integra software e hardware e usam seus gráficos e dados de conhecimento existentes para treinar e implementar o raciocínio, o que não apenas garante a segurança dos dados , mas também reduz o custo do poder de computação, " Se apenas uma cena precisa ser inferida e produzida, a placa de poder de computação pode até mesmo ser feita em um dígito."

"Cenários industriais se tornaram o melhor campo de treinamento", disse Tang Daosheng, vice-presidente executivo sênior do Tencent Group e CEO do Cloud and Smart Industry Business Group, na reunião plenária WAIC - Fórum de Desenvolvimento Industrial, escolhendo um modelo de indústria único A cooperação de fornecedores de nuvem com recursos de serviço para construir seus próprios modelos exclusivos com base em grandes modelos da indústria pode ser um caminho viável para as empresas explorarem a prática de aplicação de grandes modelos.

Isso significa que o futuro será uma era de "coexistência de todos os modelos", e cada empresa terá seu próprio grande modelo, e a Tencent decidiu ser o facilitador da nova era.

No panorama do serviço MaaS divulgado pela Tencent Cloud no mês passado, foi apontado que, com base na plataforma Tencent Cloud TI, uma loja selecionada de modelo de indústria em grande escala pode ser construída. A Tencent Cloud pode fornecer 10 grandes indústrias, como finanças, turismo cultural , assuntos governamentais, assistência médica, mídia e educação. Ao mesmo tempo, a Tencent Cloud lançou uma solução de ajuste fino de modelos grandes da indústria para ajudar desenvolvedores de modelos e engenheiros de algoritmos a resolver tarefas como invocação de modelos, gerenciamento de dados e rótulos, ajuste fino de modelos, testes de avaliação e implantação em uma parada e reduzir a pressão de criar grandes modelos.

Com base nesses modelos e plataformas de ferramentas, as empresas podem gerar rapidamente seus próprios "modelos exclusivos" apenas adicionando seus próprios dados de cena.

"Ainda está no estágio inicial do desenvolvimento de modelos em grande escala. Pessoalmente, espero que cem flores desabrochem e todos tentem diferentes possibilidades em diferentes campos." Wu Yunsheng acredita que o desenvolvimento da inteligência artificial é um enorme volume de dados projeto, que requer conhecimento comum e também requer uma organização de conhecimento profissional, profundo e autoritário, e os esforços conjuntos de todas as partes são necessários para realmente permitir que a tecnologia sirva à indústria.

AI for Science captura "Flicker" cósmico

É claro que, além de exercer efeitos na transformação digital das indústrias, o modelo de indústria em grande escala da Tencent Cloud também acelera a aplicação de tecnologias de IA, como grandes modelos no campo da computação científica.

A partir de 2021, a Tencent, o Observatório Astronômico Nacional e a Escola de Ciência e Tecnologia da Computação da Universidade de Fudan lançaram em conjunto o "Projeto de Exploração Estelar", usando nuvem + IA para ajudar a China Tianyan FAST a processar a enorme quantidade de dados recebidos todos os dias, e encontre rajadas e pulsos de rádio rápidos por meio de análise visual de IA.De acordo com pistas estelares, 30 pulsares foram descobertos até agora.

No WAIC deste ano, a Tencent anunciou que o programa de exploração estelar fez mais progressos e, pela primeira vez, descobriu 2 rajadas rápidas de rádio por meio da tecnologia AI.

As rajadas rápidas de rádio são um fenômeno astronômico misterioso. A cada 1 milissegundo, a energia liberada pelo sol ao longo do ano será emitida, "cintilando" o universo. No entanto, sua frequência de "piscar" é extremamente baixa e o tempo é extremamente curto. É fácil ignorar nos dados massivos e extremamente difícil de capturar. Foi somente em 2007 que os humanos descobriram o primeiro pulsar, 40 anos depois da descoberta de pulsares.

Em comparação com a exploração de pulsar, para descobrir rajadas de rádio rápidas que ocorrem em uma frequência mais baixa em dados massivos, os modelos de IA precisam ter maior precisão e velocidade de cálculo mais rápida. Para melhorar a velocidade de cálculo, a Tencent projetou especialmente um conjunto de novos algoritmos de IA de ponta a ponta para a exploração de rajadas rápidas de rádio. Sob o mesmo poder de computação, este novo paradigma de processamento de dados astronômicos promove a eficiência do processamento de sinal para ser 1800 vezes mais rápido do que o processo de processamento convencional.

Anteriormente, antes que a IA pudesse entender o mapa, era necessário concluir o complicado pré-processamento astrofísico no mapa de sinal, como a transformada de Fourier, dispersão cromática... Essas tarefas são profissionais e complicadas. Agora, a Tencent Youtu criou um "algoritmo de IA de ponta a ponta" para processamento de dados astronômicos, que pode pular as etapas de pré-processamento e inserir diretamente o reconhecimento de IA, melhorando bastante a eficiência.

O FAST gera centenas de terabytes de dados todos os dias e dezenas de milhões de mapas de sinais todas as semanas. Diante de dados massivos, a Tencent Cloud pode localizar e identificar rapidamente informações úteis nos dados por meio do "método de aprendizado de várias instâncias + mecanismo de atenção" e fornecer um poderoso suporte de poder de computação subjacente.

Hoje, Tencent Cloud e FAST continuam a detectar os sinais de rádio de M31 Andromeda a 2,5 milhões de anos-luz de distância, e espera-se que mais "flashes cósmicos" sejam capturados em um futuro próximo.

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)