"Bin model savaşı" yükselişi altında AI soğuk düşünme

Orijinal kaynak: International Finance News

2023 Dünya Yapay Zeka Konferansı sona ermiş olsa da, ChatGPT'nin başlattığı büyük ölçekli model patlaması artmaya devam edecek ve yapay zekanın düzeni ve keşfi de son yıllarda önemli bir tema olacak. "Önce masaya git" ve "ilk hareketi sen yap", bu "100-model savaşı" yükselişini başlatan ve sektörü "1000-model savaşı"na götüren sektör konsensüsüdür.

Görsel kaynağı: Unbounded AI‌ tarafından oluşturuldu

Temmuz ayının başında Şanghay'da yapay zekada bir patlama yaşandı. **2023 Dünya Yapay Zeka Konferansı şimdiye kadarki en yüksek katılımcı sayısına ve sergi alanına ulaştı. Konferansta birçok şirket büyük yapay zeka modellerini piyasaya süreceklerini duyurdu. **Yüksek sıcaklık ve güçlü konvektif hava, herkesin coşkusunu dağıtmayı başaramadı. Serginin kapısı, bir zamanlar bilet satmak için kazıcıları cezbetti ve birçok kişi, yaşlı ve gençlerin yapay zekanın en son gelişme trendini keşfetmesine yardımcı oldu.

Yükselişin altında **, büyük modelin hala sağlamlık, uyumluluk ve güvenilirlik gibi temel sorunlarla karşı karşıya olduğunu da sakince görmelidir. **Gelişmiş ülkelerle karşılaştırıldığında, ülkemde hala çipler, bilgi işlem gücü, veriler vb. yerli büyük modeller geliştirmede önemli bir faktör.

Temel sorunların henüz aşılmadığı ve aradaki farkın kapatıldığı mevcut aşamada, Çin'in yapay zeka gelişimi ne tür bir gelişim yolu keşfetmeli? Üç günlük forum ve birçok katılımcı sektör uzmanıyla yapılan röportajlar sırasında, muhabirin aldığı en çok yanıt "dikey entegrasyon" ve "iniş uygulaması" oldu.

"Önce masaya git"

Şu anda, dijital ekonominin gelişimi küresel bir fikir birliği haline geldi. Gelişmekte olan stratejik bir teknoloji olarak yapay zeka, endüstriyel yükseltme ve üretkenlik iyileştirme için giderek daha fazla temel itici güç haline geliyor. Kasım 2022'de OpenAI, büyük ölçekli, sohbete dayalı, genel amaçlı bir yapay zeka modeli olan ChatGPT'yi piyasaya sürdü. Dünya çapında yeni bir yapay zeka inovasyon patlaması turu başlatıldı.

**2023 Dünya Yapay Zeka Konferansında büyük model başroldedir. **Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Cloud Pangu, Xunfei Xunhuo, Shangtang Rixin, Lanzhou Mencius MChat, Xinghuan Wuya Transwarp Infinity, Midu Honey Nest Series, Torsi General ve Tuotian ve Daguan "Cao Zhi" gibi dikey büyük modeller baş döndürücü

Samoyed Cloud Technology Group'un kurucusu ve başkanı Lin Jianming, International Finance News'ten bir muhabirle yaptığı röportajda **AI'nın yeni bir endüstriyel trendler turunun başlangıç noktasında olduğuna dikkat çekti. ** Büyük modelin düzeni açısından Baidu, Ali ve Huawei gibi "üst düzey oyuncular", bilgi işlem güç katmanı, platform katmanı, model katmanından "dördü bir arada" bir düzen gerçekleştirir. ve uygulama katmanı; Giriş noktası, büyük ölçekli model algoritmaları ve alt bölümlere ayrılmış alan uygulamaları geliştirmektir.

Lin Jianming, mevcut yerel büyük ölçekli model parametrelerinin temelde 100 milyar veya daha fazla ölçekte olduğunu söyledi.Uygulama yönü açısından, çoğu işletme erken aşamada dahili uygulamalara odaklanıyor ve kademeli olarak B-end işletmelere uzanıyor. **Yapay zeka teknolojisi çığır açmaya devam ediyor.Büyük üreticiler ile küçük ve orta ölçekli teknoloji şirketleri büyük modeller için yarışıyor.Doğal olarak kimse bu çağın büyük dalgasını kaçırmak istemiyor. Ancak "önce masaya giderek" kuralların "kozunu" kavrayabilirsiniz. Mobil İnternetin azalan temettüleri bağlamında, büyük modelleri benimsemeyi seçmenin yeni büyüme noktaları getirmesi bekleniyor.

IEEE/CAAI Üyesi, Tsinghua Üniversitesi Huiyan Kürsüsü Profesörü, Elektronik Bölümü'nde kadrolu profesör ve Lianyuan Technology'nin kurucusu Zhou Bowen, "International Finance News" muhabirine **Çin'in büyük ölçekli bir sistemi benimsemesi gerektiğini söyledi. "bağımsız yenilik, güvenlik ve kontrol edilebilirlik" üzerine Dil modeli ve üretken yapay zeka teknolojisinin geliştirme rotası, dikey endüstrilerde genel amaçlı yeteneklere sahip büyük modellerin geniş çapta uygulanmasını teşvik etmeye odaklanır. **Ayrıca, iş uygulamalarının, akademik inovasyonun ve teknolojik ekolojinin çeşitlendirilmesi gerekir ve tamamen büyük bir model üzerinde yoğunlaştırılamaz ve her şeyi yapmak için tek bir düşünme biçimi kullanılmamalıdır.

Birden Fazla Zorluk

AI yükselişi altında, büyük modeller hala sağlamlık, uyumluluk ve güvenilirlik gibi birçok zorlukla karşı karşıya. Lin Jianming, açıkça, dünyayla, özellikle Amerika Birleşik Devletleri ile karşılaştırıldığında, yapay zeka çipleri, patentler, algoritma araştırmaları ve olgun bir inovasyon ekosisteminde hala belirli bir açığımız olduğunu söyledi. **Yerli büyük ölçekli modellerin geliştirilmesini kısıtlayan ana faktörler şunlardır: birincisi, büyük modeller büyük bilgi işlem gücü gerektirir ve çiplerde ve bilgi işlem gücünde eksikliklerimiz var; ikincisi, yüksek kaliteli Çin külliyat verilerinin ve endüstri verilerinin olmaması; üçüncüsü , profesyonellerin sayısı Nadir, temel araştırma inovasyonu yeterli değil.

"Finans sektörü, risk yönetimi ve güvenlik için çok yüksek gereksinimleri olan özel bir varlıktır. Finansal büyük modellerin araştırma ve geliştirmesinin karşılaştığı güven riski, model riski, etik, istikrar, doğruluk, veri güvenliği, uyumluluk ve diğer risklerle ilgili zorluklar daha şiddetlidir.” Lin Jianming işaret etti.

Mama Consumer'in genel müdür yardımcısı ve bilgi sorumlusu Jiang Ning, International Finance News'ten bir muhabirle yaptığı röportajda **AI büyük modelinin, önemli kararlarda dinamik uyum, sağlamlık, uyum ve güvenilirlik gibi temel sorunlarla karşı karşıya olduğunu söyledi. , Ani ve öngörülemeyen durumlarda gürültü ve müdahale sorunları nasıl ortadan kaldırılır, sürekli istikrar ve önemli kararların uygunluğu ve güvenilirliğinin sağlanması özellikle önemlidir. **

Jiang Ning, yerel büyük ölçekli modellerin orijinal buluşlardan yoksun olduğuna ve model muhakeme yeteneği ile büyük ölçekli model oluşturma yeteneğinde hala boşluklar olduğuna dikkat çekti. Büyük ölçekli ve yüksek kaliteli Çince derlem verilerini elde etmenin zorluğu, Çin'de büyük ölçekli modellerin geliştirilmesini kısıtlayan önemli bir faktördür. Finans alanına özgü olarak, gizliliğin korunması, sürekli istikrar, uyumluluk ve güvenilirlik gibi birçok zorlukla da karşı karşıyadır.

Zhou Bowen, büyük AI modellerinin mevcut eğitiminde, algoritma tarafının nöral ağ Transformer modeline yakınsadığına, bilgi işlem gücü tarafının, büyük ölçekli paralel hesaplama yeteneklerine sahip AI sunucu kümelerine dayandığına ve veri tarafının büyük- büyük miktarda veri içeren ölçek veri kümeleri Yapay zekanın üç unsuru açısından bakıldığında, veri kıtlığı, büyük ölçekli model uygulamalarının uygulanmasına yol açan büyük bir sorundur. Veri güvenliği ve kullanıcı mahremiyetinin korunması için son derece katı gereksinimleri olan finans sektörü gibi belirli alanlar da güvenilirlik, otonom kontrol edilebilirlik ve güçlü güvenlik gibi büyük modeller için bir dizi zorluk teşkil eder.

Zhou Bowen, büyük ölçekli modellerin sanayileşmesinin de zorluklarla karşı karşıya olduğunu söyledi: birincisi, veri ölçeği büyük ve veri kalitesi dengesiz, ikincisi, model boyut olarak büyük ve eğitilmesi zor; ** Bu nedenle, büyük modellerin geliştirilmesi, algoritma hesaplama gücü ve verilerinin kapsamlı desteğine bağlıdır. Büyük modeller, gelecekteki endüstriyel gelişimin odak noktasıdır, ancak büyük modellerin iş modeli keşfedilmeye değerdir. Büyük modellerin maliyet engelleri çok yüksek olduğu için hem büyük şirketlerin hem de küçük işletmelerin kendi yükleri vardır.

Dikey entegrasyon

Temel sorunların henüz aşılmadığı ve aradaki farkın kapatıldığı mevcut aşamada, Çin'in yapay zeka gelişimi ne tür bir gelişim yolu keşfetmeli? Başka hangi geliştirme fırsatları var? Jiang Ning, birleşik bir yapay zeka sistemi oluşturmanın, çeşitli dikey alanlarda ayrımcı modellerin kullanılabilirliğini ve profesyonelliğini etkin bir şekilde birleştiren ve üretken büyük modellerin transfer öğrenme ve genelleme yeteneklerini etkili bir şekilde birleştiren bir geliştirme trendi olduğuna dikkat çekti, böylece gerçekten popüler olacak. Büyük modellerin genelleme yeteneğinden yararlanın.

Lin Jianming, gelecekte büyük ölçekli modellerin şehirlerin, endüstrilerin ve işletmelerin dijital istihbarat sürecinde büyük potansiyele sahip olacağına dikkat çekti. Büyük modellerin yurt içi düzeninin bağımsız inovasyon yeteneklerini güçlendirmesi, büyük modellerin bilgi işlem gücü, algoritmalar ve yetenekler gibi çeşitli düzeylerdeki temel rekabet gücünü artırması ve ayrıca endüstrinin sorunlu noktalarını keşfetmek için ulusal stratejik ihtiyaçlar ile endüstri geliştirme yönergelerini yakından birleştirmesi gerekir. derinlemesine senaryolar

Ayrıca “dikey alanda büyük bir model oluşturmak için kendi teknolojisini, senaryolarını, kullanıcı ve endüstri verilerini ve endüstri know-how'ını (endüstri sırlarını) kullanmak gerekir; 'genel model + endüstri know-how özel modelini kullanın' ' Reel ekonomiyi güçlendirmek ve kendi bariyer avantajını oluşturmak için." Lin Jianming dedi.

Zhou Bowen, Çin'deki büyük ölçekli model endüstrisinin uçtan uca başlaması ve yinelemeli olarak daha uygun bir yaklaşım olabilecek daha büyük iş modelleri geliştirmesi gerektiğine inanıyor. Genel yeteneklere sahip olma temelinde, büyük modellerin profesyonel yeteneklerini geliştirmek için dikey alanda sürekli eğitim, gelecekte büyük modellerin gelişmesine ve ilerlemesine yardımcı olmak için önemli bir araçtır. **

Zhou Bowen, teorik ve teknik açıdan farklılıkların olması gerektiğine dikkat çekti. Yapay zekanın geliştirilmesinde bir yandan teknik düzeyde yakalayıcı, diğer yandan uygulama düzeyinde yenilikçi ve hatta lider olma ihtimalimiz yüksek. **Çin'in yapay zekasının yeni bir yol keşfetmesi gerekiyor, yani üretken yapay zekanın "ikili inişini" gerçekleştirmek için kendi geliştirdiği genel modelden uygulamaya ve kullanıcının tam senaryo kapalı döngüsüne dikey olarak entegre olmak gerekiyor teknoloji ve ticari değer. **

Zhou Bowen, girişimcilik rekabeti için bunun üç yola ayrılabileceğine inanıyor: birinci yol, teknik algoritmalardan model yinelemeye ve sahne kapalı döngüsüne kadar genel yeteneklere sahip büyük ölçekli bir temel model oluşturmak; ikinci yol ise diğer kişilerin modellerinde (GPT gibi) ve daha sonra eğitim yapmak için kendi sektör bilgilerini birleştirin; üçüncü yol tamamen uygulama içindir, yani modeli doğrudan kullanmaktır ve bu engel daha düşük olacaktır.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)