Berapa volume yang dimiliki "Battle of the Big Models"?

Question

**Sumber:** Konferensi Internet DuniaPada tanggal 31 Agustus, gelombang pertama produk model skala besar Tiongkok didaftarkan melalui "Langkah Sementara untuk Pengelolaan Layanan Kecerdasan Buatan Generatif" dan dapat diluncurkan secara resmi secara online untuk memberikan layanan kepada publik. Batch pertama dari 8 model skala besar yang akan diluncurkan termasuk Baidu Wenxinyiyan, model skala besar Skylark dari Byte, model skala besar Baichuan dari Baichuan Intelligent, Zhipu Qingyan dari perusahaan AI yang berbasis di Tsinghua, Zhipu Huazhang, dll.Sejak awal tahun ini, model besar telah menjadi sangat populer dan menjadi arena persaingan bagi produsen besar di seluruh dunia.Semua perusahaan teknologi besar telah meluncurkan model besar mereka sendiri, menghadirkan acara akbar "Pertempuran 100 Model".## Model besar mendorong perkembangan ekonomi digitalMulai tanggal 31 Agustus, pengguna dapat mengunduh "Wenxin Yiyan APP" di app store atau masuk ke "situs web resmi Wenxin Yiyan" untuk merasakannya. Baidu juga akan membuka sejumlah aplikasi asli AI yang baru direkonstruksi, memungkinkan pengguna merasakan empat kemampuan inti AI generatif: pemahaman, pembangkitan, logika, dan memori.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d0fa6514d6-dd1a6f-6d2ef1) Sumber: Situs resmi WenxinyiyanRobin Li, pendiri, ketua dan CEO Baidu, pernah mengatakan bahwa model besar akan merambah ke lebih banyak bidang. Ekonomi digital, yang didorong oleh model besar sebagai kuncinya, akan sangat terintegrasi dengan ekonomi riil dan akan menjadi lebih kuat, lebih baik. dan perekonomian yang lebih besar, yang menciptakan nilai tambah yang besar dan membawa perubahan besar dalam pembangunan ekonomi dan sosial serta industri.Dapat dipahami bahwa dalam sepuluh tahun terakhir, Baidu telah menginvestasikan lebih dari 140 miliar yuan dalam penelitian dan pengembangan kumulatif, menjadi perusahaan AI dengan tata letak aplikasi, model, kerangka kerja, dan chip empat lapis, mencapai tujuan akhir. optimasi menyeluruh, dan memiliki kunci untuk memimpin industri di semua tingkatan.Teknologi yang dikembangkan sendiri.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2e46ac1e8f-dd1a6f-6d2ef1) *Sumber: "Laporan Penelitian Peta Model Besar Kecerdasan Buatan Tiongkok"*Juga di pagi hari tanggal 31, Baichuan Intelligence juga mengumumkan bahwa model besarnya telah didaftarkan melalui "Langkah Sementara untuk Pengelolaan Layanan Kecerdasan Buatan Generatif" dan terbuka untuk umum.Pengguna dapat masuk ke situs web resmi untuk mengalaminya.Baichuan Intelligence didirikan pada 10 April 2023 oleh mantan CEO Sogou Wang Xiaochuan. Tim inti terdiri dari talenta AI terbaik dari perusahaan teknologi terkenal seperti Sogou, Baidu, Huawei, Microsoft, Byte, dan Tencent. Hanya empat bulan setelah didirikan, Baichuan Intelligent telah merilis tiga model bahasa besar untuk keperluan umum, termasuk Baichuan-7B, model bahasa besar sumber terbuka pertama di negara itu dengan 7 miliar parameter yang dapat dikomersialkan secara gratis, dan Baichuan-53B, sebuah model bahasa besar model bahasa dengan 53 miliar parameter. tunggu.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-3f187723ad-dd1a6f-6d2ef1) *Sumber: Situs Resmi Baichuan Smart*HKUST Xunfei secara resmi merilis "Xunfei Spark Cognitive Model" pada 6 Mei tahun ini. HKUST Xunfei mengatakan bahwa pada tanggal 24 Oktober tahun ini, Xunfei Xinghuo akan merealisasikan benchmarking model umum terhadap ChatGPT. Dalam laporan evaluasi model besar yang dirilis oleh MIT Technology Review China pada tanggal 17 Agustus, iFlytek Spark V2.0 menduduki peringkat pertama dengan skor total 81,5 poin, dan disebut sebagai model besar "paling cerdas" di China.## Model besar global semakin berkembangKecerdasan buatan berpindah dari cloud ke terminal. Dari perspektif global, produsen seperti Google, Microsoft, dan Apple juga melakukan upaya dalam model terminal berskala besar, dan bobot ringan telah menjadi arah pengembangan penting untuk penerapan model skala besar di terminal.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d3d505232f-dd1a6f-6d2ef1) *Sumber: Gambar Naga*Pada bulan Mei tahun ini, Google merilis PaLM2, model besar yang cocok untuk edge. Secara spesifik model besar PaLM2 memiliki empat spesifikasi yaitu Gecko (Gecko), Otter (Berang-berang laut), Bison (Bison) dan Unicorn (Unicorn). Diantaranya, Gecko sangat ringan dan berfungsi di perangkat seluler. Model yang lebih ringan namun berkualitas lebih tinggi dapat secara signifikan meningkatkan efisiensi inferensi dan mengurangi biaya layanan, memungkinkan penerapan model hilir beradaptasi dengan lebih banyak aplikasi dan pengguna, sehingga memungkinkan penerapan AI edge.Pada bulan Juli, Apple secara resmi mengumumkan peluncuran pengembangan AppleGPT dan bergabung dalam pertarungan model besar terminal AI. Dapat dipahami bahwa AppleGPT adalah alat AI yang dikembangkan oleh Apple berdasarkan kerangka Ajax yang dikembangkan sendiri dan saat ini sedang diuji dalam skala kecil di Apple.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9682614d49-dd1a6f-6d2ef1) *Sumber: Pixabay*Pada saat yang sama, Microsoft telah menjadikan model pelatihan DeepSpeedChat sebagai sumber terbuka dan LLaMA sumber terbuka Meta, yang dengan cepat memunculkan tren pelatihan berdasarkan LLaMA di kalangan pengembang AI, sehingga mempercepat penetrasi metode pelatihan seperti Lora. Dapat dipahami bahwa model Deepspeed dan Lora memberi pengembang kecil dan menengah alat lengkap untuk pelatihan berbiaya rendah dan cepat dari "model kecil" mereka sendiri, sehingga mempercepat pembentukan pola distribusi gradien untuk model besar.Dalam hal produsen chip, Qualcomm merilis demonstrasi sisi terminal Difusi Stabil pertama di dunia yang berjalan pada ponsel Android pada konferensi MWC 2023. Menurut laporan, parameter model Difusi Stabil melebihi 1 miliar. Qualcomm menggunakan tumpukan perangkat lunak AI miliknya untuk mengukur, mengkompilasi, dan mengoptimalkan akselerasi perangkat keras model tersebut, sehingga model tersebut dapat berhasil dijalankan pada ponsel yang dilengkapi dengan platform seluler Snapdragon 8 generasi kedua. .![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c4eb152acd-dd1a6f-6d2ef1) *Sumber: Pixabay*## Model besar "aplikasi" dan "pengawasan" berjalan beriringanPada bulan Maret tahun ini, alat chatbot AI baru ChatGPT 3.5 yang diluncurkan oleh startup Silicon Valley, OPEN AI, menunjukkan kemampuan percakapan yang luar biasa. Hanya dalam dua bulan, pengguna aktif bulanan ChatGPT mencapai 100 juta, menjadikannya aplikasi konsumen dengan pertumbuhan tercepat dalam sejarah.Menghadapi peluang dan tantangan yang ditimbulkan oleh AI generatif, setiap negara mempunyai pendapat berbeda mengenai cara mengatur AI. Tiongkok, Amerika Serikat, Uni Eropa, dan negara atau kawasan lain merespons dengan cepat, sementara Singapura dan India mengumumkan bahwa mereka tidak berencana meregulasi AI untuk saat ini.Pada tanggal 15 Agustus, “Langkah Sementara untuk Pengelolaan Layanan Kecerdasan Buatan Generatif” Tiongkok secara resmi diterapkan dan dianggap sebagai undang-undang AI generatif yang pertama di dunia.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b14f04e560-dd1a6f-6d2ef1) *Sumber: Pixabay*Sambil menerapkan peraturan dan regulasi, "Langkah-langkah" ini selanjutnya mendorong penerapan inovatif teknologi kecerdasan buatan generatif di berbagai industri dan bidang, dan mendukung berbagai organisasi dalam inovasi teknologi kecerdasan buatan generatif, konstruksi sumber daya data, transformasi dan penerapan, serta pencegahan risiko. Berkolaborasi untuk mendorong pembangunan infrastruktur kecerdasan buatan generatif dan platform sumber daya data pelatihan publik.Orang dalam industri mengatakan bahwa dengan penerapan "Langkah-langkah tersebut", model AI besar diharapkan secara bertahap memasuki tahap perjuangan untuk aplikasi asli dan implementasi industri dari parameter.