Realisme model besar Tencent: memecahkan "kecemasan AI" perusahaan di tempat kejadian

Sumber asli: IT Times

Pengarang: Hao Junhui

Sumber gambar: Dihasilkan oleh AI‌ Tak Terbatas

Ini adalah wawancara di mana pertanyaannya hanya bisa "diambil" dengan mempercepat kecepatan bicara dan meningkatkan desibel.

Pada sore hari tanggal 7 Juli, sebelum Forum Tencent World Artificial Intelligence Conference 2023, di ruang konferensi yang kecil dan berisik, Wu Yunsheng, wakil presiden Tencent Cloud, kepala Tencent Cloud Intelligence, dan kepala Youtu Lab, menerima wawancara kelompok dari media. Hampir 20 hari yang lalu, Tencent secara resmi mengumumkan panorama MaaS, memotong "trek model skala besar" panas dengan model industri skala besar. Jalur yang terlihat lebih "realistis".

"Yang dibutuhkan perusahaan adalah benar-benar menyelesaikan masalah tertentu dalam skenario aktual, daripada menyelesaikan 70%-80% masalah dalam 100 skenario." Wu Yunsheng mengatakan bahwa dari perspektif strategi perusahaan, Tencent lebih fokus pada penyelesaian masalah sebenarnya dari masalah pendaratan, dan model besar umum tidak dapat sepenuhnya menyelesaikan semua masalah pengguna.

Tencent, yang memiliki jumlah pengguna individu terbesar di China, mengambil langkah pertama dalam transformasi Internet industri menjadi AI ketika gelombang baru kecerdasan buatan datang.

Peningkatan Tencent Cloud MaaS

Pada tanggal 19 Juni, Tencent Cloud untuk pertama kalinya mengumumkan kemajuan penelitian dan pengembangan model industri skala besar Tencent Cloud. Menyediakan lebih dari 50 solusi industri skala besar untuk lebih dari 10 industri seperti media, pariwisata budaya, urusan pemerintahan, dan keuangan.

Di World Artificial Intelligence Conference, Tencent Cloud sekali lagi mengumumkan sejumlah peningkatan.

Di antaranya, jaringan komputasi performa tinggi Xingmai yang dikembangkan sendiri oleh Tencent Cloud yang baru ditingkatkan dapat meningkatkan utilisasi GPU sebesar 40%, menghemat 30% hingga 60% dari biaya pelatihan model, dan membawa peningkatan 10 kali lipat dalam performa komunikasi untuk model AI besar . Berdasarkan HCC cluster daya komputasi generasi baru Tencent Cloud, perangkat ini dapat mendukung skala komputasi super besar sebanyak 100.000 kartu. Database vektor AI asli Tencent Cloud mendukung skala pengambilan vektor hingga 1 miliar level, dan penundaan dikontrol pada level milidetik. Dibandingkan dengan database plug-in tradisional yang berdiri sendiri, skala pengambilannya 10 kali lebih tinggi, dan juga memiliki kemampuan puncak jutaan kueri per detik (QPS).

Dalam hal inovasi aplikasi, kapabilitas model industri skala besar Tencent Cloud telah diterapkan pada skenario seperti kontrol risiko keuangan, penerjemahan interaktif, dan layanan pelanggan pintar digital, yang telah sangat meningkatkan efisiensi aplikasi cerdas.

Solusi pengendalian risiko keuangan yang didukung oleh model skala besar industri memiliki efisiensi 10 kali lipat dibandingkan dengan yang sebelumnya.Melalui akumulasi Tencent selama lebih dari 20 tahun pengalaman konfrontasi produksi hitam dan abu-abu dan ribuan skenario bisnis nyata, keseluruhan anti- efek penipuan adalah 20 kali lebih tinggi dari model tradisional.Peningkatan sekitar%. Di bidang manusia digital, Tencent Cloud meluncurkan pabrik manusia digital sampel kecil tahun ini, yang dapat mereproduksi klon digital 2D dalam waktu 24 jam hanya dengan sejumlah kecil data, sangat mengurangi biaya layanan manusia digital aplikasi perusahaan.

“Faktanya, selama lebih dari setengah tahun, kami telah memikirkan dan mengeksplorasi apa logika paling esensial di balik kombinasi model besar dan berbagai industri? Sebenarnya hanya ada dua poin: satu adalah titik awal mendasar dari teknologi adalah untuk memecahkan masalah praktis, dan yang lainnya adalah Jika Anda tidak bisa masuk jauh ke dalam industri, Anda tidak bisa benar-benar menyelesaikan masalah yang dihadapi industri.” “Ujian” yang dibawa oleh adegan nyata ke model besar membuat Wu Yunsheng merasa banyak.

Layanan pelanggan yang cerdas diakui sebagai industri yang paling dapat diterapkan untuk LLM (Large-Scale Language Model). Pada konferensi ini, Tencent menciptakan model industri berskala besar untuk perusahaan OTA perjalanan online. Model khusus pelanggan yang disesuaikan dapat menyelesaikan masalah bisnis secara menyeluruh tanpa mengonfigurasi proses dialog. Tingkatkan tingkat penyelesaian tugas dan kurangi biaya pembuatan dialog. Namun nyatanya, tidak sesederhana yang dibayangkan model besar untuk benar-benar memahami masalah pelanggan.

“Selama proses komunikasi, pemikiran pelanggan melompat dan berubah. Misalnya, dia baru saja mengusulkan untuk memesan hotel pada tanggal 10, tetapi sebelum mesin menjawab, tiba-tiba dia berkata, biarkan saya memeriksa hotel dan penerbangan pada tanggal 11, kapan AI masih memberikan umpan balik pada persyaratan kedua, dia mungkin berkata, tunjukkan saya kamar kembar.” Wu Yunsheng menunjukkan bahwa model besar masih cukup sulit untuk mewujudkan pengenalan multi-maksud, dan model besar pada umumnya tidak bisa Ini adalah solusi sederhana, tetapi perlu dikombinasikan dengan pemandangan, terutama interaksi dengan sistem pelanggan untuk merekonstruksi beberapa model yang sangat kompleks.

Era "model grup menari bersama" telah tiba

Setelah hiruk pikuk awal, bagaimana mengkomersialkan model besar AI, bagaimana pelanggan perusahaan dapat menikmati putaran dividen AI ini, dan mengatasi "kecemasan AI" telah menjadi topik hangat di Konferensi Kecerdasan Buatan Dunia ini.

Zheng Qingsheng, mitra Sequoia Capital China, telah memasuki bidang investasi sejak jangka menengah Internet PC. Menurutnya, pemenang setiap era berasal dari teknologi asli era itu. Misalnya di Internet PC era, orang menghargai e-commerce dan jejaring sosial Perangkat lunak telah menjadi pemenang terbesar; sejak era Internet seluler, orang telah memperhatikan perangkat lunak sosial dan video panjang, tetapi video pendek menempati sebagian besar waktu. "Sekarang kita tidak tahu adegan asli mana yang dihasilkan oleh AI itu sendiri akan mengubah perilaku dasar hidup kita."

Meskipun masih belum diketahui kapan "pembunuh" asli AI akan muncul, "memasuki game" harus menjadi langkah pertama. Di antara lebih dari 30 model skala besar yang diluncurkan di WAIC kali ini, kecuali putaran pertama model skala besar tujuan umum seperti Baidu Wenxin Yiyan, Ali Tongyi, Xunfei Xinghuo, dan Shangtang Ririxin, para pendatang baru pada dasarnya fokus pada model industri besar.

"Untuk pelanggan, model besar khusus perusahaan dengan sedikit parameter, investasi rendah, dan hasil cepat lebih mungkin diterima, dan kesediaan mereka untuk membayar relatif jelas." Seorang peserta pameran dari perusahaan baru mengatakan kepada "IT Times" melaporkan bahwa beberapa sudah menggunakan model besar. Pelanggan bank yang mengubah sistem layanan pelanggan biasanya memilih metode penyebaran domain pribadi yang mengintegrasikan perangkat lunak dan perangkat keras, dan menggunakan grafik pengetahuan dan data yang ada untuk melatih dan mengimplementasikan penalaran, yang tidak hanya memastikan keamanan data , tetapi juga mengurangi biaya daya komputasi, " Jika hanya satu adegan yang perlu disimpulkan dan dihasilkan, papan daya komputasi bahkan dapat dilakukan dalam satu digit."

"Skenario industri telah menjadi tempat pelatihan terbaik," kata Tang Daosheng, Senior Executive Vice President Tencent Group dan CEO Cloud and Smart Industry Business Group, dalam rapat pleno WAIC-Industrial Development Forum, memilih model industri satu atap Kerja sama vendor cloud dengan kemampuan layanan untuk membangun model eksklusif mereka sendiri berdasarkan model industri besar mungkin merupakan jalur yang layak bagi perusahaan untuk mengeksplorasi praktik penerapan model besar.

Ini berarti bahwa masa depan akan menjadi era "koeksistensi semua model", dan setiap perusahaan akan memiliki model besarnya sendiri, dan Tencent telah memutuskan untuk menjadi pendorong era baru tersebut.

Dalam panorama layanan MaaS yang dirilis oleh Tencent Cloud bulan lalu, disebutkan bahwa berdasarkan platform TI Tencent Cloud, toko pilihan model industri skala besar dapat dibangun Tencent Cloud dapat menyediakan 10 industri besar seperti keuangan, pariwisata budaya , urusan pemerintahan, perawatan medis, media, dan solusi pendidikan. Pada saat yang sama, Tencent Cloud meluncurkan solusi fine-tuning model industri besar untuk membantu pengembang model dan insinyur algoritme menyelesaikan tugas-tugas seperti pemanggilan model, pengelolaan data dan label, penyempurnaan model, pengujian evaluasi dan penerapan dalam satu atap, dan mengurangi tekanan menciptakan model besar.

Berdasarkan model dan platform alat ini, perusahaan dapat dengan cepat membuat "model eksklusif" mereka sendiri hanya dengan menambahkan data adegan mereka sendiri.

"Ini masih dalam tahap awal pengembangan model skala besar. Saya pribadi berharap seratus bunga akan mekar dan setiap orang akan mencoba berbagai kemungkinan di bidang yang berbeda. "Wu Yunsheng percaya bahwa pengembangan kecerdasan buatan adalah data yang sangat besar proyek, yang membutuhkan pengetahuan umum dan Ini juga membutuhkan organisasi pengetahuan yang profesional, mendalam dan berwibawa, dan upaya bersama dari semua pihak diperlukan untuk benar-benar memungkinkan teknologi melayani industri.

AI for Science Menangkap Cosmic "Flicker"

Tentunya, selain memberikan efek dalam transformasi digital industri, model industri skala besar Tencent Cloud juga mempercepat penerapan teknologi AI seperti model besar di bidang komputasi ilmiah.

Mulai tahun 2021, Tencent, National Astronomical Observatory, dan School of Computer Science and Technology of Fudan University bersama-sama meluncurkan "Proyek Eksplorasi Bintang", menggunakan cloud + AI untuk membantu China Tianyan FAST memproses sejumlah besar data yang diterima setiap hari, dan temukan semburan radio dan pulsa cepat melalui analisis AI visual Menurut petunjuk bintang, 30 pulsar telah ditemukan sejauh ini.

Pada WAIC tahun ini, Tencent mengumumkan bahwa program penjelajahan bintang telah mencapai kemajuan lebih jauh, dan untuk pertama kalinya menemukan 2 semburan radio cepat melalui teknologi AI.

Semburan radio cepat adalah fenomena astronomi yang misterius Setiap 1 milidetik, energi yang dilepaskan matahari sepanjang tahun akan dipancarkan, "berkedip" alam semesta. Namun, frekuensi "kedipannya" sangat rendah dan waktunya sangat singkat. Sangat mudah untuk diabaikan dalam data yang sangat besar dan sangat sulit untuk ditangkap. Baru pada tahun 2007 manusia menemukan pulsar pertama, 40 tahun setelah penemuannya. dari pulsar.

Dibandingkan dengan eksplorasi pulsar, untuk menemukan semburan radio cepat yang terjadi pada frekuensi yang lebih rendah dalam data masif, model AI harus memiliki akurasi yang lebih tinggi dan kecepatan perhitungan yang lebih cepat. Untuk meningkatkan kecepatan kalkulasi, Tencent secara khusus merancang serangkaian algoritme AI end-to-end terbaru untuk eksplorasi semburan radio cepat. Di bawah kekuatan komputasi yang sama, paradigma pemrosesan data astronomi baru ini meningkatkan efisiensi pemrosesan sinyal menjadi 1800 kali lebih cepat daripada proses pemrosesan konvensional.

Sebelumnya, sebelum AI dapat memahami peta, perlu untuk menyelesaikan pemrosesan awal astrofisika yang rumit pada peta sinyal, seperti transformasi Fourier, dispersi kromatik... Tugas ini profesional dan rumit. Sekarang Tencent Youtu telah menciptakan "algoritme AI end-to-end" untuk pemrosesan data astronomi, yang dapat melewati langkah-langkah pra-pemrosesan dan langsung masuk ke pengenalan AI, meningkatkan efisiensi secara signifikan.

FAST menghasilkan ratusan terabyte data setiap hari dan puluhan juta peta sinyal setiap minggu. Dalam menghadapi data yang masif, Tencent Cloud dapat dengan cepat menemukan dan mengidentifikasi informasi berguna dalam data melalui "mekanisme pembelajaran + mekanisme perhatian multi-instans", dan memberikan dukungan daya komputasi mendasar yang kuat.

Saat ini, Tencent Cloud dan FAST terus mendeteksi sinyal radio M31 Andromeda yang berjarak 2,5 juta tahun cahaya, dan diperkirakan lebih banyak "kilatan kosmik" akan ditangkap dalam waktu dekat.

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)