Global Product Manager Konferansı'na verdiğiniz destek için çok teşekkür ederiz. 2009'dan günümüze kadar süren Product Manager Konferansı'nı sizlerin desteğiyle gerçekleştirdik. Bugünkü konuşmamın konusu "AGI Döneminde Ürün Yerleşimi ve Paradigma". Bugünkü konuşmam esas olarak aşağıdaki üç bölüme ayrılmıştır:
AGI döneminin özelliklerinin derinlemesine anlaşılması 2. Bilimsel ve teknolojik inovasyonun "paradigma dönüşüm küpü" 3. AGI ürünlerinin gelecekteki gelişimi hakkında altı düşünce
1. Bölüm: AGI döneminin özelliklerinin derinlemesine anlaşılması
Her şeyden önce, aşağıdaki resim aracılığıyla büyük ölçekli model teknolojisinin tüm gelişimini tanıyalım.
İlk yapay zekanın makine öğreniminden geliştirildiğini görebilirsiniz. ImageNet'teki derin sinir ağının 2012'de parıldamasından sonra, derin öğrenme önde gelen bir yapay zeka bilimi haline geldi. Daha sonra, doğal dil işleme alanında RNN ve LSTM geliştirildi.Yedi Google araştırmacı bilim insanı 2017'de Transformer makaleleri yayınladıktan sonra, önceden eğitilmiş dil modeli yavaş yavaş ana akım haline geldi ve ardından GPT tarafından temsil edilen büyük dil modeli (LLM) oldu çünkü ChatGPT Yapay zekanın başarısı, endüstri tarafından genel yapay zekaya (AGI) açılan kapı olarak kabul edilir.
Yapay zeka ile ilgili teknolojileri takip ettiğim ve araştırdığım için, yukarıda belirtilen geliştirme hattındaki birkaç önemli figürle derinlemesine fikir alışverişinde bulundum ve tartışmalar yaptım. 2018'de Şangay'da Küresel Makine Öğrenimi Konferansı düzenledik ve makine öğreniminin babası ve UC Berkeley'de ünlü bir profesör olan Michael Jordan'ı açılış konuşmacısı olarak davet ettik ve onunla derinlemesine fikir alışverişinde bulunduk. Nisan 2021'de Pekin'de salgın nedeniyle bir makine öğrenimi konferansı düzenlediğimizde Google Transformer modelinin kurucularından Lukasz Kaiser'i internete davet ettik ve o konuşmadan kısa bir süre sonra bana Google'dan ayrıldığını söyledi. OpenAI'ye gitti ve daha sonra GPT 3.5'e yatırım yaptığını öğrendi. O sırada başka bir derin öğrenme gazisi, LSTM'nin babası Jurgen Schmidhuber davet edildi. Bu yılın nisan ayına kadar Silikon Vadisi'ne gittim ve OpenAI'nin baş bilim adamı Ilya Sutskever ile birçok derinlemesine fikir alışverişinde bulundum. Genel olarak, AI geliştirme yolunda, endüstrinin sınırlarıyla derinlemesine tartışmalar ve fikir alışverişleri sürdürüyoruz ki bu bana çok fayda sağladı.
İlk olarak, genellikle üç katmana ayrılan AGI teknoloji yığınından bahsedelim: uygulama katmanı, model katmanı ve altyapı katmanı (tabii ki sektördeki bazı kişiler LLMOps'u çıkarır ve dört katman adı verilen ayrı bir katman oluşturur. ). Üçüncü kat ya da dördüncü kat fark etmez, bu resme bakınca daha kolay anlaşılıyor, o yüzden fazla açıklamayacağım. Büyük model teknolojisi anlayışımızın temelidir.
Ancak bu anlayışın teknik yüzeyde kalması kolaydır.Büyük ölçekli model teknolojisinin ardındaki daha derin şeylere bakalım.Bence büyük ölçekli modelin öncülük ettiği bu teknolojik devrim dalgasını anlamamıza yardımcı olabilir. Tarihe biraz daha uzun bakarsak, tüm teknoloji endüstrisinde çok önemli iki önerme vardır, biri bağlantı, diğeri bilgi işlem. Bir süreliğine bağlantıdan bilgi işleme ve bir süre bilgi işleme geçiş yapan bir sarkaç gibidirler.
Yukarıdaki resme bir göz atalım. 1840'tan 1940'a kadar geçen 100 yıl boyunca, telgraf, telefon, radyo ve televizyon da dahil olmak üzere tüm teknolojik devrime "bağlantı" hakim oldu. Dünyanın her köşesinden insanları ve kuruluşları birbirine bağlamak o zamanki toplumsal biçimi derinden değiştirmiştir.
Ardından, 1946'da ilk bilgisayar ENIAC'ın doğumundan itibaren, insanlığın teknolojik devrimi bir "bilgisayar" sarkacına girdi. 1950'lerdeki ana bilgisayarlar, 1960'lardaki mini bilgisayarlar, 1970'lerdeki mini bilgisayarlar ve 1980'lerdeki PC'ler dahil. Çekirdek olarak von Neumann mimarisi ile, her şey "bilgi işlem" önermesi etrafında gerçekleştirilir. Bu süreç yaklaşık 50 yıldır devam ediyor.
Daha sonra 1994'ten 1995'e kadar Netscape ve Yahoo tarafından işaretlenen İnternet'in ortaya çıkışı geldi. WWW İnternet, insan teknolojisi devrimini "bağlantı" sarkacına itti, ardından 2004'te Web 2.0 ve 2007'de iPhone'un doğuşu damgasını vurdu. 2013 yılında Mobil İnternet, Bulut Hizmetleri. Hepsi "bağlantı" önermesini büyük ölçüde geliştiriyor ve zenginleştiriyor. Bu süreç yaklaşık 30 yıl sürdü.
Sıra 2017'ye geldi, Transformer modeliyle ilgili makale yayınlandı, 2018'de GPT 1.0 doğdu ve ardından 2.0, 3.0 ve geçen yılın sonunda GPT 3.5'in getirdiği ChatGPT çıktı ve genel yapay zeka AGI'nın şafağını getirdi. tüm insanlığa. Bu büyük modeller turu "hesaplama" sarkacına girdi ve zaman yaklaşık 2020'den başlayacak.
Çok ilginç, ilk "bağlantı" devrimine bakarsanız, ben buna "bağlantı 1.0" adını verdim, yaklaşık 100 yıl geçti ve ikinci "bilgisayar" devrimi, adını "bilgisayar 2.0" koydum, geçti. yaklaşık 50 yıl sonra ikinci "bağlantı" devrimi geldi, sözde "bağlantı 2.0", 30 yıl geçti. Zaman diliminde katlanarak azalan bir trend görüyor musunuz? Bu nedenle, birçok insan önümüzdeki 15 yıl içinde bunu yapamayacağımıza inanıyor ve 2035'te bu büyük model dalgasının getirdiği "bilgisayar" sarkacı zirveye ulaşabilir.
Sektörün zaman çizelgesini anlayarak, “bağlantı” çağının altında yatan mantık ile “bilgi işlem” çağı arasındaki farka bir göz atalım mı? Bu aslında çok önemli. Çünkü pek çok kişi, büyük model çağının paradigmasını anlamak için bu dönemde sıklıkla mobil İnternetin çeşitli paradigmalarını kullanır. Bence bu algı yanlış. Çünkü mobil internet "bağlantı" mantığına aitken, büyük modellerin çağı "hesaplama" mantığına aittir. Aşağıdaki tabloya bir göz atalım:
Üretim dönüşümü açısından bakıldığında, bağlantı mantığı "üretim ilişkilerine", hesaplama mantığı ise "verimliliğe" hakimdir. Üretim-tüketim ilişkisi açısından bakıldığında, internet çağında, bağlantı mantığının altında Taobao'da alıcı ve satıcı, Didi'de yolcu ve şoför olmak üzere "iki taraflı pazar" denilen çok önemli bir etkinin olduğunu biliyoruz. Douyin.dinleyiciler ve sunucular. Biri üretici, diğeri tüketici. Çok güçlü bir ikili etki oluşturur ve aynı zamanda internet çağında birçok ürün için önemli bir hendektir.
Hesaplama mantığına göre aslında böyle bir ikili etki söz konusu değildir ve çekirdeği tek taraflı bir piyasadır. Bir uç algoritma hesaplama gücü, diğer uç ise tüketicilerdir. Örneğin Midjourney'de tasarımcılardan oluşan bir ağ yok ve algoritma doğrudan kullanıcılara resim üretiyor; örneğin otonom sürüş çağında Didi alt üst edilecekse Didi'nin sürücü-yolcu çift taraflı oluşturduğu hendek. piyasa hiç işe yaramaz, çünkü sürücülere ihtiyaç yoktur, arabayı süren algoritmadır.
İş modeline tekrar bakıldığında bağlantı mantığı altında marjinal maliyeti çok düşük olduğu için bedava iş modeli yapmak çok kolay. Bununla birlikte, hesaplama mantığı altında, algoritma hesaplama gücünün maliyetinin eşit olarak paylaşılması gerekir. Peki, internet ve mobil internet çağında çoğu iş modeli hala "özgürlük kraldır" gibi mi olacak? Büyük ihtimalle hayır, bu yüzden herkes Midjourney ve ChatGPT Plus'ın şarj olduğunu görüyor. Birçok Silikon Vadisi yatırımcısı, büyük modeller çağında "kullanıcılardan doğrudan ücret almanın" ana iş modeli olacağını öne sürdü. Bağlantı çağında artık "yün domuzdan gelir"in özgür modeli değildir.
Peki ya kullanıcı deneyimi? İnternet çağında, bağlantı mantığı, ne kadar çok bilgi o kadar iyi, kaçınılmaz bir aşırı bilgi yüklemesi sorunu ortaya çıkıyor. Ancak hesaplama mantığı, aslında, ne kadar az temas o kadar iyi, verimlilik önce gelir. Yani bir sonraki sıralamada sadece sonuçlarımı vereceğim ve ara sürece katılmama izin verme.
Karar verme mekanizması açısından. Bağlantı mantığı "makine bana bilgi verecek, ben karar vereceğim" şeklindedir. Ve hesaplama mantığı, insanların makinelere bilgi, yani veri vermesi ve makinelerin karar vermeme yardımcı olmasıdır.
Yukarıdaki karşılaştırmalar sayesinde, ürün düşüncemizde bu iki mantığın çok farklı olduğunu görebilirsiniz. Sonra, bilgi işlem mantığı hakkında konuşalım.1940'tan 1990'a kadar olan bilgi işlem 1.0 ile şu anda içinde bulunduğumuz bilgi işlem 2.0 arasındaki temel fark nedir? Aşağıdaki resme bakın:
Hesaplama 1.0 çağında, sol taraf biyolojik sinir ağı dediğimiz insan beyni ve sağ taraf dijital mantık devresidir.Tüm geleneksel bilgisayarlarımız esasen dijital mantık devrelerinin "ve, veya, ve değil"idir. . Sadece yapılandırılmış verileri kabul edebilen, temelde 0-1 düşüncesi olan yapılandırılmış bir işlem mantığıdır. Getirdiği sonuç, insanların makinenin mantığına uyum sağlamasıdır.
Böylece, Computing 1.0 altında, ister PC ister mobil yazılım olsun, kullanıcı deneyiminin biraz dikkatsiz olduğu birçok yer olduğunu ve yaşlılar ve çocuklar da dahil olmak üzere endüstri dışı kişilerin kolayca düştüğünü göreceksiniz. zihinsel yükün çıkmazı. Neden bu ikilem?
Sol taraf insan beyninin biyolojik sinir ağı, sağ taraf ise "ve, veya, ve değil"den oluşan bir dijital mantık devresi olduğundan, onu uyarlamanız gerekir. Herhangi bir giriş girişi önce bir dijital mantık devresinin anlayabileceği bir şeye dönüştürülmelidir; bir bilgisayardan gelen herhangi bir çıktı, bir biyolojik sinir ağının anlayabileceği bir şeye dönüşüm katmanından geçmelidir. Bu ileri geri dönüşüm, eğitimsiz ortalama kullanıcının başının belaya girdiği yerdir.
Ancak, aşağıdaki şekilde açıklanan büyük modelin hakim olduğu bilgi işlem 2.0 çağına bakarsak.
Sağdaki resmi beyin olarak çizdim, içinde silikon bazlı bir çip olmasına rağmen sözde karbon bazlı zeka ve silikon bazlı zeka.
Nisan ayında Silikon Vadisi'nde OpenAI'nin baş bilimcisi Ilya Sutskever ile iletişim kurduğumda, matematiksel ilkeler açısından mevcut dijital sinir ağının insan beyninin karbon tabanlı sinir ağından farklı olmadığını vurgulamak için üç kez tekrarladığını hatırlıyorum. . Biyolojik organizmaların farklı hayatta kalma yöntemleri dışında işleyiş mantığı aynıdır.
Şu anda, insanlar ve büyük model arasındaki etkileşim, aslında biyolojik sinir ağı ile dijital sinir ağı arasındaki etkileşimdir.
Artık bilgi işlem 1.0 çağında dijital devrelerin 0-1 düşüncesi değil, olasılıksal bir düşüncedir. ChatGPT'nin sıcaklık (sıcaklık değeri) parametresini ayarlayabileceğinizi herkes bilir. Yaratıcı olmak için sıcaklığı yükseltin. Sıcaklık kelimesini kullanmak da çok ilginçtir.Yüksek sıcaklık, beynin sıcak olduğu ve beyin sıcakken beynin daha yaratıcı olduğu anlamına gelir. Yanıtı çok vasat yapmak için sıcaklığı da düşürebilirsiniz. Olasılıksal düşünmenin özü, aynı zamanda insan beynimizin karar verme yöntemi olan sinir ağının modelidir. Herkes iyi düşünsün, aslında beynimizdeki her düşünce olasılık hesaplıyor. Computing 2.0'ın tüm oryantasyonunun sonucu, makinelerin insan düşüncesine uyum sağlamasına izin vermektir.
Tüm AGI teknolojisi ve arkasındaki mantıkla ilgili yukarıdaki derinlemesine anlayışla, AGI çağında ürünlerin nasıl üretileceğine dair bazı metodolojilerden bahsedelim.
Bölüm II: Teknolojik İnovasyonun "Paradigma Değiştirme Küpü"
Önce paradigma kaymasından bahsedelim. İngilizce'de Paradigm Shift olarak adlandırılır. İlk olarak Thomas Kuhn tarafından "The Structure of Scientific Revolutions" kitabında ortaya atılmıştır. Bilim alanındaki temel kavram ve uygulamalardaki köklü değişiklikleri ifade eder. ve teknoloji Orijinali çiğner İnsanoğlunun kanunları ve sınırları, insanların düşünceleri ve eylemleri için yeni bir dünya yaratır. Teknoloji alanında sıkça bahsettiğimiz devrimler aslında birer paradigma kaymasıdır, örneğin bağımsızdan internete, internetten mobil internete geçişler birer paradigma kaymasıdır.
Çin İnternet alanında birçok arkadaş, Meituan'dan Wang Xing'in 2009 civarında ünlü bir dört dikey ve üç yatay teorisi olduğunu biliyor. O zamanlar internetteki birçok kişi bu teoriyi duyunca çok heyecanlandı. Wang Xing'in analizi nedeniyle, o zamanki mevcut durumla daha uyumlu görünüyordu. 2009, mobil İnternet'in yeni patlak verdiği yıldı. Mevcut AGI salgınına çok benzer.
Wang Xing, o zamanlar teknoloji endüstrisinde insanların temel olarak dört ana ihtiyacı tarafından yönetildiğine dikkat çekti: bilgi, iletişim, eğlence ve iş. Sözde dört dikey. Sanheng'e gelince, Wang Xing kendi analizini yaptı: arama, sosyal, mobil. Sonra dört dikey ve üç yatayın kesiştiği noktada yeni bir fırsat doğdu. "Dört dikey"e çok katılıyorum ama üç yatay için bu analiz yönteminin sorunlu olduğunu düşünüyorum çünkü sosyal ağ kurma ve arama aslında insan ihtiyaçları ve mobil internet ile aynı boyutta değiller.
Sanırım Wang Xing, sosyal ağı o zamanlar mobil ile aynı boyuta koydu çünkü sosyal ağ o zamanlar çok popülerdi ve sosyal ağ büyük bir trafik portalı haline geldi. oynamak. Ancak trafik girişi teknoloji ile eş değer değildir. Aynı şey arama için de geçerli, çünkü trafik girişi etkisi de var, dolayısıyla Wang Xing bunun birçok alanda da değişikliğe neden olduğunu düşünüyor. Ancak Wang Xing, arama için Google/Baidu modeli dışında iletişim, eğlence ve iş alanlarında ikna edici bir ürün modeli vermedi. Bu yüzden, Wang Xing'in "dört dikey ve üç yatay" metodolojisindeki "üç yatay"ın yanlış olduğunu düşünüyorum.
Şimdi, önerdiğim bir analiz çerçevesinden bahsedeyim, bu analiz çerçevesinin AGI çağındaki ürün paradigmasını analiz etmemiz için çok yararlı olduğunu düşünüyorum. Önerdiğim analiz çerçevesine "Paradigm Transformation Cube" adını verdim ve İngilizce adı ParaShift Cube, burada Para, Paradigm'in kısaltmasıdır.
Neden küp olarak adlandırılıyor, çünkü üç eksen tanımlıyoruz: x ekseni, y ekseni, z ekseni.
X ekseni, teknolojik paradigmaların dönüşümünü temsil eden teknoloji eksenini temsil eder.AGI akıllı çağı dediğimiz bağlantı 1.0, bilgi işlem 1.0, bağlantı 2.0 (PC İnternet, mobil İnternet dahil), bilgi işlem 2.0 vardır.
Y ekseni, Wang Xing'in bahsettiği kısım da dahil olmak üzere insan ihtiyaçlarının tüm yönlerini kapsayan talep eksenini temsil ediyor: bilgi, eğlence ve iş Aynı zamanda, Y eksenine sosyal ağ ve arama da koyuyorum. Sosyal ve İletişim, onları birleştirdim ve küçük farklılıkları olsa da ortak yönleri farklılıklarına ağır basıyor.
Z ekseni orta ekseni temsil eder, çünkü bilginin ifadesi belirli bir ortam gerektirir ve insanlar da ortam aracılığıyla çevrelerindeki dünyayla etkileşime girer. Medya eksenleri şunları içerir: metin, resimler, ses, video ve üç boyutlu alan hesaplaması (bu, Apple'ın VisionPro'daki en son teklifidir). Bence Z ekseni birçok kişinin göz ardı ettiği bir nokta. Bilgisayarların gelişmesinde büyük etkisi olan GUI grafiksel kullanıcı arayüzü de bilgisayar görüntüleri gibi bir ortamdaki olayların yönlendirdiği etkileşimin sonucudur.
Bu üç eksen küp bir yapı oluşturur.Üç eksen, her eksende değişim noktası ve diğer eksenlerin kesişimi ürünlerde “paradigma dönüşüm inovasyonunun” gerçekleştiği yerlerdir. Ürün alanlarında yenilik fırsatlarını analiz etmek için Paradigma Shift Cube'u uygulamak mantıksal olarak basittir.
Daha sonra, 1.0 çağında PC İnternet bağlantısını analiz etmek, 2.0 çağında mobil İnternete bağlanmak ve bilgi işlem 2.0 AGI zekası çağında olası fırsatları tahmin etmek için "Paradigma Dönüşüm Küpü"nü kullanıyoruz. Bilgi işlem 1.0 ve bağlantı 1.0 çağına gelince, aslında "paradigma dönüşüm küpü" analizini de kullanabilirsiniz, ancak yaş nispeten eski, bu yüzden burada bundan bahsetmeyeceğim ama ilgileniyorsanız, yapabilirsiniz Analiz için tarihe geri dönün ve bunun da çok mantıklı olduğunu göreceksiniz.
Küpte doldurulan içeriğin PPT'de ifade edilmesi çok kolay olmadığı için teknoloji eksenini ve talep eksenini ifade etmek için bir tablo kullandım ve altında medya değişikliklerini temsil eden mavi bir eksen var.
Tablodaki talep eksenini kırmızı ve yeşil olarak ikiye ayırdım. AGI zekası çağında kırmızı kısım, paradigma kaymasının daha şiddetli olduğu ve inovasyon ve hatta devleri devirme şansının büyük olduğu kısımdır; önce PC'den mobile dönüşümde bilgi talebine bakın. , Sina ve Sohu gibi portal modellerinin yerini Toutiao vb. Şimdi aşırı bilgi yüklemesi çok ciddi, bazen on makale okuduktan sonra aslında yalnızca bir parça bilgi ediniyorsunuz. Öyleyse büyük model, önceki günden onlarca bilgiyi tercihlerime göre entegre etmeme yardımcı olabilir ve ardından bana bazı kısa ve öz özetler verebilir, ki bu büyük modelin çok iyi olduğu şeydir. Bu, bilgi ürünlerinde kolayca bir paradigma değişikliğine yol açabilir. Yine eğlenceden bahsedelim.Eğlencenin içeriğe çok ihtiyacı var ve AIGC içerik üretmede çok iyi.Eğlencenin biçimi, taşıyıcısı, tedariki ve diğer zincirleri AIGC tarafından yeniden şekillendirilecek, bu nedenle paradigma kayması için birçok fırsat da var.
Son olarak, arama hakkında konuşalım. Arama, internet alanında büyük bir sektör ve insanoğlu için de büyük bir talep. Ancak ChatGPT ve diğer büyük ölçekli model ürünleri kullanırsanız, arama davranışı oranının önemli ölçüde düştüğünü göreceksiniz.Neden? Çünkü çoğu zaman sadece bir cevap veya karar bulmak için bir düzine makaleyi araştırır ve birkaç sayfayı çeviririz. Bu ürün iyi mi? Bu cazibe ziyaret etmeye değer mi? Bu ilaç sorunu çözüyor mu? Bu karar verme ve yanıtlama gereksinimleri, ChatGPT gibi büyük ölçekli model ürünlerin çok iyi olduğu konulardır. Bu nedenle, arama, AGI döneminde büyük bir altüst olma olasılığıyla karşı karşıya kalacak. Ne yazık ki, Nisan ve Mayıs aylarında Silikon Vadisi'nden döndüğümde, Google'ın arama kredi defterinde hala para saydığını ve ChatGPT'nin getirdiği büyük paradigma değişikliği tehdidine karşı hissiz olduğunu hissettim.
Bazıları diyor ki, Google büyük modellerle ilgili bir sürü teknoloji ve ürün piyasaya sürmedi mi? Cevabım, yüzeye çıkan birkaç ürüne bakmayın. Paradigma değişikliği geldiğinde bu savunma eylemlerinin hepsi çiseliyor. Yahoo'nun o yıl nasıl çöktüğünü bir düşünün. Elbette Google'ın bir şansı var mı?Bence var, ancak öncül, Google'ın, Ma Huateng ve Zhang Xiaolong'un Michat ile savaşmak için Tencent'in tüm şirketinin gücünü All in WeChat'e kullandığı savaşa benzer bir kararlılıkla gelmesi gerektiğidir; veya 1995'te Bill Gates Microsoft'un tüm şirketinin gücünü her yıl All in IE için kullanarak Netscape ile tarayıcı savaşına karşı mücadele etme kararlılığı, paradigma kaymasının yıkıcı gücünü önleyebilir. Ve Google ne yaptı? Kurucu, Kaliforniya'da sahilde uzanıp güneşin tadını çıkardı ve OpenAI'nin işe alınan CEO'su Sam Altman ve Ilya Sutskever ile şiirleri ve savaşacak uzak yerleri olan diğer kurucu ortakların ve ardından teknoloji ustası Jeff Dean'in görevden alınmasına izin verdi. Goolge Brain'in patronu konumundan ve derin öğrenmenin babası Jeffrey Hinton, nazikçe görevden alındı. Google I/O konferansında birkaç büyük PPT modeline güvenerek AGI çağını kazanmak ister misiniz? Bu arada, Google'ın son yıllardaki Daxing PPT ürünlerinin (çoğu resmi olarak bundan sonra piyasaya sürülmedi) aceleci tarzını eleştirmek istiyorum ve bakalım OpenAI gibi girişimlerin ne zaman bir geliştirme konferansına ihtiyacı var? Bir ürün sürümü, en fazla bir blogun bunu açıklayan bir basın toplantısıdır. Ürünler hakkında konuşmak (PPT yerine) inovasyonun kralıdır!
Son olarak şunu belirteyim ki Yahoo'yu alt üst eden başka bir portal değil, Google'ı alt üst eden başka bir arama değil, paradigma kaymasının getirdiği yapısal altüst oluş ve arama alanının çağda karşı karşıya olduğu satranç oyunu da bu. büyük modellerden.
Kırmızı kısımdan bahsettikten sonra yeşil kısımdan bahsedelim.Kırmızı kısımla karşılaştırıldığında, yeşil kısım hala bağlantı döneminin "iki taraflı pazar" etkisine sahiptir, bu nedenle hendek nispeten derindir.Teknoloji geçtiğinde bile Bir paradigma kayması, bence öyle değil. Büyük fırsatlar var. Örneğin, PC İnternetten mobile dönüşümde, Michat, Momo ve diğer şirketler o dönemde sosyal ağlara saldırsa da, Tencent hayatta kaldı (adını QQ'dan WeChat'e değiştirse de), çünkü Tencent tarafından kurulan sosyal ağ QQ dönemi Hendek çok derin. Çin'deki tüm sosyal ilişki, basit bir ikili yapı değil, Tencent'in elinde olan bir ağ yapısıdır.
Bir süre önce birçok kişi AGI döneminde WeChat'in alt üst edileceğini de sordu. Yukarıdaki paradigma dönüşümü küp analizini kullanıyoruz, sonuç değil. Öncelikle AGI çağında insanların sosyal ihtiyaçları değişecek mi? Alışkanlık. İkincisi, insanlar ve insanlar arasındaki sosyal model, insanlar ve sanal insanlar arasındaki sosyal model olacak mı? Ben de öyle düşünmüyorum. Silikon Vadisi'nde gelecekte robotların insanların kölesi olacağına dair bir söz vardır ve insanlar robotları "çalıştırmak" gibi net bir amaç için kullanırlar. Sosyal etkileşime duyulan ihtiyaç, insanın sosyal ilişkilerinin yapısından gelir: arkadaşlar, akrabalar, sınıf arkadaşları, meslektaşlar... tabi gelecekte insan sosyal yapısında böyle bir sosyal ilişki yoksa. Kimse bir robotla sosyalleşmek istemez. Bu nedenle, WeChat'in Çin'deki avantajı ve daha doğrusu tüm dünyadaki Çinlilerin sosyal ağı olması gerektiği, AGI'nin büyük paradigma değişimi çağında bile altüst olmayacak. WeChat'e gelince, metin ve görüntü oluşturma ve daha akıllı bilgi optimizasyonu gibi bazı özel etkileşimli güncellemeler var. Bunlar küçük etkileşimli iyileştirmeler. Bunlar, WeChat'in yeteneğiyle dakikalar içinde yapılabilir ve bu, herhangi bir yeni kurulan şirkete bağlı değildir. Bunu yapmak için alt üst edin.
Ocak 2019'da aynı gün Byte'ın Duoshan'ı, Luo Yonghao'nun Chat Bao'yu ve Kuaibo'nun kurucusu Wang Xin'in Toilet MT'yi başlattığını hatırlıyorum. WeChat'in sosyal kral statüsünü devirmek için işbirliği yapmak istediler, ancak iki ay içinde öldüler. . Kurucular o dönemde benim "Paradigma Shift Cube"u okusalardı, bu işin yapılamayacağını anlarlardı. Dahası, 2019 teknolojik paradigma kayması çağı değil.PC İnternetten mobil paradigmaya geçiş çağında bile, Lei Jun'un Michat'ı, uluslararası WhatsApp, Talkbox ve diğer uygulamalar Tencent'i devirmedi, çünkü sosyal hendek en derinidir. AGI çağında herkes WeChat kullanmayı düşünmemeli, kapı yok.
Aslında e-ticareti ifade eden iş hakkında konuşalım. Büyük aksamalar için çok fazla fırsat yok ve bunun nedeni, "bağlantı çağındaki" iki taraflı pazarın hendeğinin e-ticaret alanında hala var olmasıdır. Herhangi bir iş formu, alıcılar ve satıcılardan ayrılamaz. AGI büyük modeli, kapalı iş döngüsündeki (Taobao resimleri, sanal soyunma odaları vb.) yalnızca bazı küçük bağlantıları optimize edebilir, ancak bunlar asla alıcılardan, satıcılardan, lojistik vb. Temel e-ticaret nitelikleri ve bu alanlardaki geleneksel devlerin avantajları hala çok büyük. Yani, PC İnternetinden mobil İnternete dönüşümde, Taobao ve JD.com'un avantajları temel olarak çevrilmiştir.
Ancak bir hususu belirtmek gerekiyor mobil internet alanında Pinduoduo ve Douyin e-ticareti yarı yarıya ortaya çıktı ama bu WeChat ve Douyin'in trafik giriş etkisinden kaynaklanıyor iyi bir ek ama Ayrıca, Pinduoduo, yeni İnternet demografik değişikliklerinin getirdiği batan kalabalığa vurur (bu, yeniden analiz etme fırsatına sahiptir). Benim yargım, büyük ölçekli modeller yeni trafik girişleri getirebileceğinden, e-ticaret alanında Pinduoduo ve Douyin e-ticaretine benzer yeni fırsatlar ortaya çıkabilir, ancak Taobao ve JD.com'un mevcut avantajları devam edecektir. Sonuçta, e-ticaretin plakası çok büyük. Pasifik Okyanusu, Çin ve Amerika Birleşik Devletleri'ni barındırabilir ve e-ticaret alanı birçok küçük devi barındırabilir.
Alttaki mavi eksen, daha önce bahsettiğimiz ortamdır: metin, resimler, ses, video ve üç boyutlu (uzaysal hesaplama). Birçok kişinin bu kısmı gözden kaçırması kolaydır.Farklı medyaların arkasındaki ürünlerin gücü çok farklıdır. Herhangi bir ürün ürettiğimizde, ne tür bir medya taşıyıcıya odaklanmak istediğimizi düşünmeliyiz.
Medya mantığı açısından resimler metinden daha iyidir, video resimlerden daha iyidir ve sesin kendi özel sahnesi vardır. Erken mobil alanındaki not alma ve metin tabanlı ürünlerin birçoğunun ortadan kalktığı tahmin ediliyor. Bir cep telefonu kamerası birçok resim ürününü besler. Yurt dışında Instagram, Pinterest vb. Yerli fotoğraf ürünleri ne olacak? Aslında birkaç arkadaşım fotoğraf ürünleri yapardı ama pek bir şey yapmazlardı, neden? Çin'deki en büyük fotoğraf ürünü aslında WeChat Moments.
Pek çok insan aslında WeChat Anlarında nasıl düz metin gönderileceğini bilmiyor, sadece fotoğraf göndermek için nasıl kullanılacağını biliyorlar (Bana inanmıyorsanız, çevrenizdeki on kişiye sorun, kaçının bildiğini görün? Aslında , WeChat Moments bu işleve sahiptir, ancak gizlidir, kamera düğmesini basılı tutmanız gerekir). Anlar'daki varsayılan düğme bir kamera düğmesidir. WeChat bunu neden yaptı? Zhang Xiaolong neden birçok kişinin itirazı altında metin gönderme düğmesi ile fotoğraf gönderme düğmesini yan yana koymadı? Çok basit, eğer Şanghay'da bir metro istasyonunda 100 kişiyi rastgele daire içine alırsanız, bu 100 kişiden kaç tanesi resim ve yazı gönderebilir? Aradaki farkın şaşırtıcı olacağını düşünüyorum. WeChat kullanıcılarının %99'u resim göndermek için Anları kullanacak. Ancak kullanıcıların %10'undan fazlasının metin gönderebileceğini sanmıyorum. Kelime yazmak beceri gerektirir, ancak resim göndermek tüm kadınlar ve çocuklar tarafından bilinir ve herhangi bir eşik yoktur. Bu, farklı ortamların ürün gücüdür.
Tekrar videodan bahsedelim Silikon Vadisi'ndeyken birkaç Google arkadaşım TickTok'un Google için ChatGPT'den daha büyük bir tehdit olduğundan bahsetmişti. Neden? TickTok kullanıcıları çevrimiçi olarak çok fazla zaman geçirdikleri için Google'ın kullanıcı zamanını sıkıştırıyor. Douyin'in yerli versiyonu artık trafiğin kralı. WeChat'in son yıllarda bir video hesabı yoksa, ilk zamanlarda bir arkadaş çevresi olmayacaktır. Çin İnternetinin topraklarının kesinlikle bugün olduğu gibi olmadığını düşünüyorum. Karşılaştırma olarak, bugün WhatsApp'a bakarsanız, değeri WeChat'in yirmide biri bile olmayabilir. Doğru zamanda, WeChat resimlerin (Anlar) ve videoların (Video Kimliği) temettülerini ele geçirdi ve her adımda afişe bastı, bu nedenle Zhang Xiaolong, Çin'in 1 Numaralı ürün müdürü unvanını hak ediyor.
Dolayısıyla ortam da çok önemli bir değişim eksenidir. Peki ya videodan sonra? Bu, Apple tarafından iki hafta önce piyasaya sürülen, sözde üç boyutlu (uzaysal hesaplama) VisionPro'dur. Metin tek boyutlu bir ortamdır, resimler ve videolar iki boyutlu ortamdır ve uzamsal hesaplama üç boyutludur. İki boyutlu, bir boyutluyu geçmeli ve üç boyutlu, iki boyutluyu geçmelidir, bu yüzden VisionPro konusunda iyimserim.
Bu nedenle, gelecekteki paradigma kaymasının en büyük iki gücü, birincisi, AGI büyük modelinin teknoloji ekseninde getirdiği paradigma kayması; ikincisi, medya ekseni. İlki çoktan geldi, ikincisi ise VisionPro ürünlerinin olgunlaşma hızına göre 2 ila 3 yıl sonra tahmin ediliyor. İki eksenin kesişimi, bence önümüzdeki 5-10 yıl çok heyecan verici olacak.
Ancak büyük modelin tüm alanlarda çok büyük bir ürün paradigması kayması yok, aşağıdaki resme bakalım.
Büyük ölçekli model ürünlerin giriş noktalarını iki kategoriye ayırıyorum. Bir kategori, ciddi paradigma değişimlerinden geçecek olan sözde AI-Native yerel uygulamalarına aittir. Bu kategorinin özelliği, büyük bir modele gerek olmaması ve ürünün hiç yapılamamasıdır. Bu kategorideki temsili ürün kategorileri şunları içerir: akıllı asistanlar (ChatGPT gibi), AIGC üretim ürünleri (Midjourney gibi) ve somutlaştırılmış zeka (Tesla'nın Optimus Prime'ı gibi). Bu ürünler çok büyük yıkıcı fırsatlara sahiptir ve AGI çağında yeni türlerdir.
Diğer tür, AI-Copilot yardımcı pilot modu olarak adlandırılan aşamalı geliştirme türüne aittir. Üretkenlik araçları (Office Copilot), kod oluşturma (Github Copilot), tasarım geliştirmeleri (Adobe Firefly) vb. Bu kategori, belirli bir bağlantıda büyük bir model kullanan orijinal ürünün geliştirilmiş halidir.
AI-Native ve AI-Copilot'un getirdiği paradigma değişimi ve ilerici geliştirme, birçok farklı özelliğe sahiptir. Bunları yukarıdaki resimde listeledim. Herkes işinin özelliğine göre tercih yapmalıdır. Benim burada vurgulamam gereken örgütlenme meselesidir. AI-Native paradigma değiştiren inovasyonu seçerseniz, organizasyonu yeniden düzenlemelisiniz.Yeni bir startup şirketi yönetmek daha kolaydır.Eğer bu büyük bir şirketin dahili bir inovasyonuysa, ayrıca yeni bir ekip kurmalısınız, aksi halde muhtemelen güvenilmez olmak Birçok şeyden dolayı, organizasyonun sebebidir. Tarih, yeni şeyler yapmanın yeni bir ekip yapısı gerektirdiğini defalarca kanıtladı. Çünkü organizasyon süreci farklı, iş modeli de farklı, bu yüzden daha önce bahsettiğim bağlantı çağının mantığı ile bilişim çağının mantığı farklı. AI-Copilot'u seçerseniz nispeten olgunlaşmış mevcut ürünleriniz olmalıdır, bu nedenle şu anda eski organizasyonun yalnızca bazı geliştirmeler ve ince ayarlar yapması gerekiyor. AI-Native'in ekip için gereksinimlerinden tamamen farklıdır. Bu, Silikon Vadisi'ndeki birçok şirkette de görülüyor.
Bu arada Microsoft'tan bahsetmeme izin verin, AGI'nin gelişinden sonra Microsoft bayrağı sallıyor ve bağırıyor.Birçok kişi Microsoft'un paradigma kayması yolunu tuttuğunu düşünüyor. Ancak, büyük resim açısından Microsoft'un aslında AI-Copilot'un aşamalı geliştirme modunu seçtiğini söylemek istiyorum. Çünkü Microsoft zaten 2.5 trilyon dolarlık bir şirket. Bir devrime ihtiyacı yok, sadece AGI'nin doğu rüzgarını kullanması ve yavaş büyümesi gerekiyor. Office, Windows ve Azure temel ürünlerinin yaklaşık %30 büyümesine izin verin ve birkaç yıl içinde 4 trilyon dolarlık, hatta 5 trilyon dolarlık bir şirket haline gelebilir. Hayatı ve zenginliğiyle All-In paradigma değiştiren AI-Native ürünlerine kumar oynamasına gerek yok, çünkü paradigma kayması yüksek getiri olasılığına sahip olsa da aynı zamanda yüksek risklidir. Microsoft'un AGI çağındaki ürün stratejisi seçimi, bu yolda birçok olgun şirket için de referans almaya değer.
Bölüm III: AGI ürünlerinin gelecekteki gelişimi hakkında altı düşünce
**İlk düşünce 2C veya 2B'dir. **2C uçtan uca bir ürün olduğundan, kullanıcı yolu genellikle nispeten kısadır ve bu da AI-Native paradigma değişimi için çok uygundur. Bununla birlikte, 2B'nin uzun müşteri yolu nedeniyle, yapay zekanın yeteneği tüm iş kapalı döngüsünün yalnızca bir parçasıdır, bu nedenle AI-Copilot'un kademeli olarak geliştirilmesi için uygundur.
Değere göre sıralamaya odaklanın. 2C ürünleri için içerik hizmetten, hizmet araçtan büyüktür. Bu mantık sadece PC İnternet ve mobil İnternet çağında değil, aynı zamanda AGI çağında da geçerlidir. Bir düşünün mobil internet çağı ilk başladığında resim düzenleme araçları, anti-virüs araçları, not alma araçları vb. birçok sıcak araç çok popüler değildi ama bugün neredeler? Canlı olsalar bile toplam değer, Xiaohongshu, Zhihu ve Douyin gibi tüm içerik şirketlerinden çok daha düşük. Hizmetler esas olarak 58 ve Ctrip gibi hizmetlere bağlı ürünlere atıfta bulunur. Değerleri araçlardan daha yüksek, ancak içerikten daha düşüktür. Neden? Basitçe söylemek gerekirse, kullanıcıların içerik üzerinde geçirdikleri süre hizmetlere göre çok daha uzundur ve hizmetler için harcadıkları süre de aynı büyüklük sıralamasında olmayan araçlardan çok daha uzundur. Kullanıcı süresi temel olarak ürünün değer aralığını belirlemektedir. Bu nedenle, AGI çağında, bu harika görünen araçlara takıntılı olmayın, değeri içerik veya hizmetlerden çok daha azdır.
2B alanında ise değer mantığı tamamen değişti: Müşterilerin karar verme süreci verimlilikten, verimlilik içerikten daha fazladır. Kurumsal ürünler çok fazla içerik peşinde koşmaz, bunun yerine maksimum verimlilik gerektirir.Hızlı karar vermemde bana yardımcı olmak en iyisidir.
İkinci husus, bir platform mu yoksa bir uygulama mı olacağıdır. Büyük model popüler olur olmaz birçok kişinin platform hayali ateşlendi. Yukarı çıkar çıkmaz büyük ölçekli maket platformu olsun diye bağıran, ağlayan arkadaşıma soğuk su verdim. Midjourney'in kurucusu David Holz'dan yeni bir alıntı yapacağım. Önceki şirketi Leap Motion'dan öğrendiği en büyük dersin, herkesin bir ekosistem platform hayaliyle başlayıp sonra başarısız olması olduğunu söyledi. Ancak Midjourney üzerinde çalışırken bu dersi aldı, kullanıcıların gerçekten sevdiği bir ürün yapmalı ve önce onu süper bir uygulama yapmalıdır.
Aslında OpenAI aynıdır, önce ChatGPT gibi süper bir uygulamaya sahip olur, ardından Plugin ve API'nin ekolojik yapısını kurar. Aynısı WeChat için de geçerli, mini programlar gibi bir ekoloji oluşturmadan önce sohbet, Anlar ve resmi hesaplar gibi süper uygulama portallarına sahip. Jobs, iPhone üzerinde çalışırken bile, önceleri iTunes'da pek çok güzel şarkı vardı ve iPhone'da uygulamalar yapmaları için büyükbabasına yalvarmak ve birçok web sitesini yapmaya ikna etmek için Time Warner, Disney ve New York Times'a gitti. H5, Safari'nin web sitelerinde gezinmesini kolay hale getirmek için uyarlanmıştır ve iPhone, ekolojik bir platform statüsüne sahiptir.
Bu yol, ürün çalışanlarımız için çok önemlidir. Son zamanlarda, amacımızın XXX büyük ölçekli bir model platform oluşturmak olduğunu söyleyen bazı insanlarla sık sık karşılaşıyorum. Elimde olmadan kusmak istiyorum. Kullanılmayan ürününüz nedir? Hiç kimse kullanmadı. Ben nasıl platform yapmaya cesaret edebilirim, sen mi verdin? Bir platform olduğunuzu iddia ettiğiniz için kimse sizi desteklemeyecektir. Ancak süper bir uygulamanız ve devasa bir kullanıcı havuzunuz olduğunda platformun cazibesine sahip olursunuz ve herkes sizi platform olarak destekler.
Üçüncü düşünce, AIGC'ye karşı UGC'dir. UGC, Web 2.0'da çok önemli bir stratejiydi. Ancak büyük model, AIGC'nin yeteneklerini getiriyor.
UGC tipik bir iki taraflı kullanıcı ağı iken, AIGC'nin içerik sağlayıcısı bir kullanıcı değil, bir model + bilgi işlem gücü + veridir.Bu bir veri çarkıdır. UGC'nin soğuk başlangıcı zordur çünkü birçok yaratıcıyı bir araya getirmeniz gerekir. Ancak AIGC, bilgi işlem gücüne ve modele öncelik verir. UGC'nin maliyeti düşüktür çünkü içerik sağlayıcılardan çok fazla yün alır. Ancak AIGC bilgi işlem gücünün maliyeti, özellikle başlatma sırasında nispeten yüksektir. Öte yandan, UGC'nin nispeten yüksek bir sosyal hendeği vardır, çünkü bazen kullanıcılar yalnızca içeriği sevdikleri için değil, aynı zamanda içerik oluşturucunun hayranı oldukları için. Ancak AIGC için kullanıcılar yalnızca içeriği tüketir ve geçiş maliyeti çok düşüktür. Büyük bir şirket sizinkine benzer bir şeyi daha düşük bir maliyetle yaparsa, kullanıcılar daha ucuz olduğu için hemen geçiş yapabilir.
Dördüncü düşünce, yenilikçinin ikilemi: Yeniliğe karşı Muhafazakar
Tarihte paradigma her değiştiğinde, yerleşik devler yenilikçinin ikilemiyle karşı karşıya kalacak. Örneğin, Google'ın mevcut durumunu örnek alarak OpenAI, Google'ın karşı karşıya olduğu "yenilikçinin ikilemini" akıllıca kullanmıştır.
Aslında, Google'daki pek çok kişi GPT gibi büyük modellere hala pek dikkat etmiyor, çünkü ChatGPT'nin sinir ağı eğitiminin dizin tabanlı arama sorgularına kıyasla çok pahalı olduğunu dahili olarak hesapladılar. Arama, Google'ın gelirinin %90'ını oluşturur. Büyük bir model ne kadar gelir getirebilir? Hala bilinmiyor. Bu nedenle, OpenAI'ye stratejik fırsatlar için çok iyi bir dönem veren Google'ın artık büyük modellerde tümüne ulaşması zor. Buna ek olarak OpenAI, GPT aracılığıyla arama savaşında Google'ın ateş gücünü çekmek için Microsoft'un Bing'ini güçlendirmek için stratejik iş birliğini akıllıca kullandı ve büyük ölçekli ekolojik platformlar alanında gözü kapalı koşma fırsatına sahip oldu. Paradigma değişikliği fırsatı ortaya çıktığında, girişimciler, devlerin kendileriyle yüzleşmesini önlemek için "yenilikçinin ikilemini" iyi kullanmalıdır.
Bir karşı örnek vermek gerekirse, Lei Jun Michat'ı yaparken, Tencent her türlü dünyayı sarsan tanıtım karşısında şok oldu, ancak dev rekabetle başa çıkmak için önceden stratejik bir tasarım hazırlamadı, böylece Tencent birleşti ve birleşti. WeChat. Bir yıldan biraz daha uzun bir süre içinde, Michat'ı temelde ortadan kaldırdı. Tabii tersine, Tencent'in bakış açısından, paradigma kayması gerçekleştiğinde, yerleşik devler yeterince dikkat edebilir ve yeterince All in'e sahip olabilirlerse, "yenilikçinin ikilemi" kaderinden de kurtulabilirler.
Beşinci düşünce, AGI'nin uçurumu nasıl aşabileceğidir
"Crossing the Chasm" da çok ünlü bir kitap. Açıkladığı çok aşamalı boşluklar, birçok yenilikçi ürün için özel dikkat gerektirir.
Şu anda, ChatGPT açıkça ilk boşluğu (yani, Yenilikçiler ve Erken Benimseyenler arasındaki küçük boşluk) aştı ve kullanıcı sayısı 100 milyonu aştı. Ancak bir sonraki boşluk, Erken Benimseyenler ile Erken Çoğunluk arasındaki en büyük boşluktur ve ChatGPT hala bu boşluğu kapatmaya çalışmaktadır. Şahsen ben daha iyimserim, ancak son verileri Plugin'in henüz PMF'yi (Product Market Match) geçmediğini gösteriyor. Ancak Silikon Vadisi'ndeki OpenAI insanlarıyla olan iletişimime göre, içlerinde hala çok sayıda büyük katil var, özellikle çok modlu yeteneği son derece güçlü, beyinsiz Midjourney'i çok geride bırakıyor. Hâlâ çok sayıda hizalama uyumluluğu çalışması yapması gerekiyor. Tabii ki, her ürünün köprülenmesi gereken kendi boşlukları vardır.
Altıncı düşünce, büyük modelin yalnızca AGI'ye açılan bir kapı olduğudur
Geriye dönüp tüm teknoloji endüstrisinin tarihine bakarsak, birçok teknoloji ilk çıktığında teknolojinin çok güçlü olduğunu hissettik. Bu teknolojiye akın edin ve bu teknolojinin çeşitli alanlarda getirdiği paradigma değişimini unutun. Örneğin, tarayıcılar ve web sunucuları ilk çıktığında, birçok kişi tarayıcı ve web sunucusu olmak için acele etti, çünkü birçok teknik kişi tarayıcıların ve web sunucularının İnternet'i temsil ettiğine inanıyordu. En trajik savaş, Microsoft'un tarayıcı pazarını ele geçirmek için tüm şirketi IE ve Netscape'i geliştirmek için kullanmasıdır. Tarihin bu dönemi hakkında oldukça netim çünkü Küresel Ürün Yöneticileri Konferansımızın eski bir arkadaşı ve "Apocalypse" yazarı Marty Çağan, Netscape'te ürünlerden sorumlu kıdemli başkan yardımcısıydı.Onu daha önce birçok kez Çin'e davet ettim. , ve sık sık bu dönem tarihinden bahsederim.
Microsoft ve Netscape bu konuda kaybedenlerdir, çünkü savaşırken, insanlar internete girdikten sonra daha büyük stratejik fırsatları tamamen görmezden geldiler.
Artık birçok şirket büyük modellere akın ettiğine göre, o zamanki tarayıcıların ve web sunucularının hatalarını tekrarlamaları muhtemel. Ve büyük modelin endüstri düzeyinde paradigma değişimi için büyük bir fırsat getirdiğini tamamen unutun. Bu anlamda büyük model sadece bir kapı, kapı açıldıktan sonra daha heyecanlı bir AGI dünyası bizi bekliyor.
Bugünkü konuşmam bu kadar, umarım içeriğin tamamı, özellikle "Paradigm Transformation Cube" yani ParaShift Cub ve "Connection and Computing Era" analizi herkesin inovasyonuna yardımcı olur. AGI çağında girişimcilik ve girişimcilik.Herkese teşekkürler!
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Derinlemesine iyi makale: AGI çağında ürün düzeni ve paradigması
Kaynak: Li Jianzhong tarafından yapılan araştırma
1. Bölüm: AGI döneminin özelliklerinin derinlemesine anlaşılması
Her şeyden önce, aşağıdaki resim aracılığıyla büyük ölçekli model teknolojisinin tüm gelişimini tanıyalım.
Yapay zeka ile ilgili teknolojileri takip ettiğim ve araştırdığım için, yukarıda belirtilen geliştirme hattındaki birkaç önemli figürle derinlemesine fikir alışverişinde bulundum ve tartışmalar yaptım. 2018'de Şangay'da Küresel Makine Öğrenimi Konferansı düzenledik ve makine öğreniminin babası ve UC Berkeley'de ünlü bir profesör olan Michael Jordan'ı açılış konuşmacısı olarak davet ettik ve onunla derinlemesine fikir alışverişinde bulunduk. Nisan 2021'de Pekin'de salgın nedeniyle bir makine öğrenimi konferansı düzenlediğimizde Google Transformer modelinin kurucularından Lukasz Kaiser'i internete davet ettik ve o konuşmadan kısa bir süre sonra bana Google'dan ayrıldığını söyledi. OpenAI'ye gitti ve daha sonra GPT 3.5'e yatırım yaptığını öğrendi. O sırada başka bir derin öğrenme gazisi, LSTM'nin babası Jurgen Schmidhuber davet edildi. Bu yılın nisan ayına kadar Silikon Vadisi'ne gittim ve OpenAI'nin baş bilim adamı Ilya Sutskever ile birçok derinlemesine fikir alışverişinde bulundum. Genel olarak, AI geliştirme yolunda, endüstrinin sınırlarıyla derinlemesine tartışmalar ve fikir alışverişleri sürdürüyoruz ki bu bana çok fayda sağladı.
Ardından, 1946'da ilk bilgisayar ENIAC'ın doğumundan itibaren, insanlığın teknolojik devrimi bir "bilgisayar" sarkacına girdi. 1950'lerdeki ana bilgisayarlar, 1960'lardaki mini bilgisayarlar, 1970'lerdeki mini bilgisayarlar ve 1980'lerdeki PC'ler dahil. Çekirdek olarak von Neumann mimarisi ile, her şey "bilgi işlem" önermesi etrafında gerçekleştirilir. Bu süreç yaklaşık 50 yıldır devam ediyor.
Daha sonra 1994'ten 1995'e kadar Netscape ve Yahoo tarafından işaretlenen İnternet'in ortaya çıkışı geldi. WWW İnternet, insan teknolojisi devrimini "bağlantı" sarkacına itti, ardından 2004'te Web 2.0 ve 2007'de iPhone'un doğuşu damgasını vurdu. 2013 yılında Mobil İnternet, Bulut Hizmetleri. Hepsi "bağlantı" önermesini büyük ölçüde geliştiriyor ve zenginleştiriyor. Bu süreç yaklaşık 30 yıl sürdü.
Sıra 2017'ye geldi, Transformer modeliyle ilgili makale yayınlandı, 2018'de GPT 1.0 doğdu ve ardından 2.0, 3.0 ve geçen yılın sonunda GPT 3.5'in getirdiği ChatGPT çıktı ve genel yapay zeka AGI'nın şafağını getirdi. tüm insanlığa. Bu büyük modeller turu "hesaplama" sarkacına girdi ve zaman yaklaşık 2020'den başlayacak.
Çok ilginç, ilk "bağlantı" devrimine bakarsanız, ben buna "bağlantı 1.0" adını verdim, yaklaşık 100 yıl geçti ve ikinci "bilgisayar" devrimi, adını "bilgisayar 2.0" koydum, geçti. yaklaşık 50 yıl sonra ikinci "bağlantı" devrimi geldi, sözde "bağlantı 2.0", 30 yıl geçti. Zaman diliminde katlanarak azalan bir trend görüyor musunuz? Bu nedenle, birçok insan önümüzdeki 15 yıl içinde bunu yapamayacağımıza inanıyor ve 2035'te bu büyük model dalgasının getirdiği "bilgisayar" sarkacı zirveye ulaşabilir.
Sektörün zaman çizelgesini anlayarak, “bağlantı” çağının altında yatan mantık ile “bilgi işlem” çağı arasındaki farka bir göz atalım mı? Bu aslında çok önemli. Çünkü pek çok kişi, büyük model çağının paradigmasını anlamak için bu dönemde sıklıkla mobil İnternetin çeşitli paradigmalarını kullanır. Bence bu algı yanlış. Çünkü mobil internet "bağlantı" mantığına aitken, büyük modellerin çağı "hesaplama" mantığına aittir. Aşağıdaki tabloya bir göz atalım:
Hesaplama mantığına göre aslında böyle bir ikili etki söz konusu değildir ve çekirdeği tek taraflı bir piyasadır. Bir uç algoritma hesaplama gücü, diğer uç ise tüketicilerdir. Örneğin Midjourney'de tasarımcılardan oluşan bir ağ yok ve algoritma doğrudan kullanıcılara resim üretiyor; örneğin otonom sürüş çağında Didi alt üst edilecekse Didi'nin sürücü-yolcu çift taraflı oluşturduğu hendek. piyasa hiç işe yaramaz, çünkü sürücülere ihtiyaç yoktur, arabayı süren algoritmadır.
İş modeline tekrar bakıldığında bağlantı mantığı altında marjinal maliyeti çok düşük olduğu için bedava iş modeli yapmak çok kolay. Bununla birlikte, hesaplama mantığı altında, algoritma hesaplama gücünün maliyetinin eşit olarak paylaşılması gerekir. Peki, internet ve mobil internet çağında çoğu iş modeli hala "özgürlük kraldır" gibi mi olacak? Büyük ihtimalle hayır, bu yüzden herkes Midjourney ve ChatGPT Plus'ın şarj olduğunu görüyor. Birçok Silikon Vadisi yatırımcısı, büyük modeller çağında "kullanıcılardan doğrudan ücret almanın" ana iş modeli olacağını öne sürdü. Bağlantı çağında artık "yün domuzdan gelir"in özgür modeli değildir.
Peki ya kullanıcı deneyimi? İnternet çağında, bağlantı mantığı, ne kadar çok bilgi o kadar iyi, kaçınılmaz bir aşırı bilgi yüklemesi sorunu ortaya çıkıyor. Ancak hesaplama mantığı, aslında, ne kadar az temas o kadar iyi, verimlilik önce gelir. Yani bir sonraki sıralamada sadece sonuçlarımı vereceğim ve ara sürece katılmama izin verme.
Karar verme mekanizması açısından. Bağlantı mantığı "makine bana bilgi verecek, ben karar vereceğim" şeklindedir. Ve hesaplama mantığı, insanların makinelere bilgi, yani veri vermesi ve makinelerin karar vermeme yardımcı olmasıdır.
Yukarıdaki karşılaştırmalar sayesinde, ürün düşüncemizde bu iki mantığın çok farklı olduğunu görebilirsiniz. Sonra, bilgi işlem mantığı hakkında konuşalım.1940'tan 1990'a kadar olan bilgi işlem 1.0 ile şu anda içinde bulunduğumuz bilgi işlem 2.0 arasındaki temel fark nedir? Aşağıdaki resme bakın:
Böylece, Computing 1.0 altında, ister PC ister mobil yazılım olsun, kullanıcı deneyiminin biraz dikkatsiz olduğu birçok yer olduğunu ve yaşlılar ve çocuklar da dahil olmak üzere endüstri dışı kişilerin kolayca düştüğünü göreceksiniz. zihinsel yükün çıkmazı. Neden bu ikilem?
Sol taraf insan beyninin biyolojik sinir ağı, sağ taraf ise "ve, veya, ve değil"den oluşan bir dijital mantık devresi olduğundan, onu uyarlamanız gerekir. Herhangi bir giriş girişi önce bir dijital mantık devresinin anlayabileceği bir şeye dönüştürülmelidir; bir bilgisayardan gelen herhangi bir çıktı, bir biyolojik sinir ağının anlayabileceği bir şeye dönüşüm katmanından geçmelidir. Bu ileri geri dönüşüm, eğitimsiz ortalama kullanıcının başının belaya girdiği yerdir.
Ancak, aşağıdaki şekilde açıklanan büyük modelin hakim olduğu bilgi işlem 2.0 çağına bakarsak.
Nisan ayında Silikon Vadisi'nde OpenAI'nin baş bilimcisi Ilya Sutskever ile iletişim kurduğumda, matematiksel ilkeler açısından mevcut dijital sinir ağının insan beyninin karbon tabanlı sinir ağından farklı olmadığını vurgulamak için üç kez tekrarladığını hatırlıyorum. . Biyolojik organizmaların farklı hayatta kalma yöntemleri dışında işleyiş mantığı aynıdır.
Şu anda, insanlar ve büyük model arasındaki etkileşim, aslında biyolojik sinir ağı ile dijital sinir ağı arasındaki etkileşimdir.
Artık bilgi işlem 1.0 çağında dijital devrelerin 0-1 düşüncesi değil, olasılıksal bir düşüncedir. ChatGPT'nin sıcaklık (sıcaklık değeri) parametresini ayarlayabileceğinizi herkes bilir. Yaratıcı olmak için sıcaklığı yükseltin. Sıcaklık kelimesini kullanmak da çok ilginçtir.Yüksek sıcaklık, beynin sıcak olduğu ve beyin sıcakken beynin daha yaratıcı olduğu anlamına gelir. Yanıtı çok vasat yapmak için sıcaklığı da düşürebilirsiniz. Olasılıksal düşünmenin özü, aynı zamanda insan beynimizin karar verme yöntemi olan sinir ağının modelidir. Herkes iyi düşünsün, aslında beynimizdeki her düşünce olasılık hesaplıyor. Computing 2.0'ın tüm oryantasyonunun sonucu, makinelerin insan düşüncesine uyum sağlamasına izin vermektir.
Tüm AGI teknolojisi ve arkasındaki mantıkla ilgili yukarıdaki derinlemesine anlayışla, AGI çağında ürünlerin nasıl üretileceğine dair bazı metodolojilerden bahsedelim.
Bölüm II: Teknolojik İnovasyonun "Paradigma Değiştirme Küpü"
Önce paradigma kaymasından bahsedelim. İngilizce'de Paradigm Shift olarak adlandırılır. İlk olarak Thomas Kuhn tarafından "The Structure of Scientific Revolutions" kitabında ortaya atılmıştır. Bilim alanındaki temel kavram ve uygulamalardaki köklü değişiklikleri ifade eder. ve teknoloji Orijinali çiğner İnsanoğlunun kanunları ve sınırları, insanların düşünceleri ve eylemleri için yeni bir dünya yaratır. Teknoloji alanında sıkça bahsettiğimiz devrimler aslında birer paradigma kaymasıdır, örneğin bağımsızdan internete, internetten mobil internete geçişler birer paradigma kaymasıdır.
Çin İnternet alanında birçok arkadaş, Meituan'dan Wang Xing'in 2009 civarında ünlü bir dört dikey ve üç yatay teorisi olduğunu biliyor. O zamanlar internetteki birçok kişi bu teoriyi duyunca çok heyecanlandı. Wang Xing'in analizi nedeniyle, o zamanki mevcut durumla daha uyumlu görünüyordu. 2009, mobil İnternet'in yeni patlak verdiği yıldı. Mevcut AGI salgınına çok benzer.
Wang Xing, o zamanlar teknoloji endüstrisinde insanların temel olarak dört ana ihtiyacı tarafından yönetildiğine dikkat çekti: bilgi, iletişim, eğlence ve iş. Sözde dört dikey. Sanheng'e gelince, Wang Xing kendi analizini yaptı: arama, sosyal, mobil. Sonra dört dikey ve üç yatayın kesiştiği noktada yeni bir fırsat doğdu. "Dört dikey"e çok katılıyorum ama üç yatay için bu analiz yönteminin sorunlu olduğunu düşünüyorum çünkü sosyal ağ kurma ve arama aslında insan ihtiyaçları ve mobil internet ile aynı boyutta değiller.
Sanırım Wang Xing, sosyal ağı o zamanlar mobil ile aynı boyuta koydu çünkü sosyal ağ o zamanlar çok popülerdi ve sosyal ağ büyük bir trafik portalı haline geldi. oynamak. Ancak trafik girişi teknoloji ile eş değer değildir. Aynı şey arama için de geçerli, çünkü trafik girişi etkisi de var, dolayısıyla Wang Xing bunun birçok alanda da değişikliğe neden olduğunu düşünüyor. Ancak Wang Xing, arama için Google/Baidu modeli dışında iletişim, eğlence ve iş alanlarında ikna edici bir ürün modeli vermedi. Bu yüzden, Wang Xing'in "dört dikey ve üç yatay" metodolojisindeki "üç yatay"ın yanlış olduğunu düşünüyorum.
Şimdi, önerdiğim bir analiz çerçevesinden bahsedeyim, bu analiz çerçevesinin AGI çağındaki ürün paradigmasını analiz etmemiz için çok yararlı olduğunu düşünüyorum. Önerdiğim analiz çerçevesine "Paradigm Transformation Cube" adını verdim ve İngilizce adı ParaShift Cube, burada Para, Paradigm'in kısaltmasıdır.
X ekseni, teknolojik paradigmaların dönüşümünü temsil eden teknoloji eksenini temsil eder.AGI akıllı çağı dediğimiz bağlantı 1.0, bilgi işlem 1.0, bağlantı 2.0 (PC İnternet, mobil İnternet dahil), bilgi işlem 2.0 vardır.
Y ekseni, Wang Xing'in bahsettiği kısım da dahil olmak üzere insan ihtiyaçlarının tüm yönlerini kapsayan talep eksenini temsil ediyor: bilgi, eğlence ve iş Aynı zamanda, Y eksenine sosyal ağ ve arama da koyuyorum. Sosyal ve İletişim, onları birleştirdim ve küçük farklılıkları olsa da ortak yönleri farklılıklarına ağır basıyor.
Z ekseni orta ekseni temsil eder, çünkü bilginin ifadesi belirli bir ortam gerektirir ve insanlar da ortam aracılığıyla çevrelerindeki dünyayla etkileşime girer. Medya eksenleri şunları içerir: metin, resimler, ses, video ve üç boyutlu alan hesaplaması (bu, Apple'ın VisionPro'daki en son teklifidir). Bence Z ekseni birçok kişinin göz ardı ettiği bir nokta. Bilgisayarların gelişmesinde büyük etkisi olan GUI grafiksel kullanıcı arayüzü de bilgisayar görüntüleri gibi bir ortamdaki olayların yönlendirdiği etkileşimin sonucudur.
Bu üç eksen küp bir yapı oluşturur.Üç eksen, her eksende değişim noktası ve diğer eksenlerin kesişimi ürünlerde “paradigma dönüşüm inovasyonunun” gerçekleştiği yerlerdir. Ürün alanlarında yenilik fırsatlarını analiz etmek için Paradigma Shift Cube'u uygulamak mantıksal olarak basittir.
Daha sonra, 1.0 çağında PC İnternet bağlantısını analiz etmek, 2.0 çağında mobil İnternete bağlanmak ve bilgi işlem 2.0 AGI zekası çağında olası fırsatları tahmin etmek için "Paradigma Dönüşüm Küpü"nü kullanıyoruz. Bilgi işlem 1.0 ve bağlantı 1.0 çağına gelince, aslında "paradigma dönüşüm küpü" analizini de kullanabilirsiniz, ancak yaş nispeten eski, bu yüzden burada bundan bahsetmeyeceğim ama ilgileniyorsanız, yapabilirsiniz Analiz için tarihe geri dönün ve bunun da çok mantıklı olduğunu göreceksiniz.
Tablodaki talep eksenini kırmızı ve yeşil olarak ikiye ayırdım. AGI zekası çağında kırmızı kısım, paradigma kaymasının daha şiddetli olduğu ve inovasyon ve hatta devleri devirme şansının büyük olduğu kısımdır; önce PC'den mobile dönüşümde bilgi talebine bakın. , Sina ve Sohu gibi portal modellerinin yerini Toutiao vb. Şimdi aşırı bilgi yüklemesi çok ciddi, bazen on makale okuduktan sonra aslında yalnızca bir parça bilgi ediniyorsunuz. Öyleyse büyük model, önceki günden onlarca bilgiyi tercihlerime göre entegre etmeme yardımcı olabilir ve ardından bana bazı kısa ve öz özetler verebilir, ki bu büyük modelin çok iyi olduğu şeydir. Bu, bilgi ürünlerinde kolayca bir paradigma değişikliğine yol açabilir. Yine eğlenceden bahsedelim.Eğlencenin içeriğe çok ihtiyacı var ve AIGC içerik üretmede çok iyi.Eğlencenin biçimi, taşıyıcısı, tedariki ve diğer zincirleri AIGC tarafından yeniden şekillendirilecek, bu nedenle paradigma kayması için birçok fırsat da var.
Son olarak, arama hakkında konuşalım. Arama, internet alanında büyük bir sektör ve insanoğlu için de büyük bir talep. Ancak ChatGPT ve diğer büyük ölçekli model ürünleri kullanırsanız, arama davranışı oranının önemli ölçüde düştüğünü göreceksiniz.Neden? Çünkü çoğu zaman sadece bir cevap veya karar bulmak için bir düzine makaleyi araştırır ve birkaç sayfayı çeviririz. Bu ürün iyi mi? Bu cazibe ziyaret etmeye değer mi? Bu ilaç sorunu çözüyor mu? Bu karar verme ve yanıtlama gereksinimleri, ChatGPT gibi büyük ölçekli model ürünlerin çok iyi olduğu konulardır. Bu nedenle, arama, AGI döneminde büyük bir altüst olma olasılığıyla karşı karşıya kalacak. Ne yazık ki, Nisan ve Mayıs aylarında Silikon Vadisi'nden döndüğümde, Google'ın arama kredi defterinde hala para saydığını ve ChatGPT'nin getirdiği büyük paradigma değişikliği tehdidine karşı hissiz olduğunu hissettim.
Bazıları diyor ki, Google büyük modellerle ilgili bir sürü teknoloji ve ürün piyasaya sürmedi mi? Cevabım, yüzeye çıkan birkaç ürüne bakmayın. Paradigma değişikliği geldiğinde bu savunma eylemlerinin hepsi çiseliyor. Yahoo'nun o yıl nasıl çöktüğünü bir düşünün. Elbette Google'ın bir şansı var mı?Bence var, ancak öncül, Google'ın, Ma Huateng ve Zhang Xiaolong'un Michat ile savaşmak için Tencent'in tüm şirketinin gücünü All in WeChat'e kullandığı savaşa benzer bir kararlılıkla gelmesi gerektiğidir; veya 1995'te Bill Gates Microsoft'un tüm şirketinin gücünü her yıl All in IE için kullanarak Netscape ile tarayıcı savaşına karşı mücadele etme kararlılığı, paradigma kaymasının yıkıcı gücünü önleyebilir. Ve Google ne yaptı? Kurucu, Kaliforniya'da sahilde uzanıp güneşin tadını çıkardı ve OpenAI'nin işe alınan CEO'su Sam Altman ve Ilya Sutskever ile şiirleri ve savaşacak uzak yerleri olan diğer kurucu ortakların ve ardından teknoloji ustası Jeff Dean'in görevden alınmasına izin verdi. Goolge Brain'in patronu konumundan ve derin öğrenmenin babası Jeffrey Hinton, nazikçe görevden alındı. Google I/O konferansında birkaç büyük PPT modeline güvenerek AGI çağını kazanmak ister misiniz? Bu arada, Google'ın son yıllardaki Daxing PPT ürünlerinin (çoğu resmi olarak bundan sonra piyasaya sürülmedi) aceleci tarzını eleştirmek istiyorum ve bakalım OpenAI gibi girişimlerin ne zaman bir geliştirme konferansına ihtiyacı var? Bir ürün sürümü, en fazla bir blogun bunu açıklayan bir basın toplantısıdır. Ürünler hakkında konuşmak (PPT yerine) inovasyonun kralıdır!
Son olarak şunu belirteyim ki Yahoo'yu alt üst eden başka bir portal değil, Google'ı alt üst eden başka bir arama değil, paradigma kaymasının getirdiği yapısal altüst oluş ve arama alanının çağda karşı karşıya olduğu satranç oyunu da bu. büyük modellerden.
Kırmızı kısımdan bahsettikten sonra yeşil kısımdan bahsedelim.Kırmızı kısımla karşılaştırıldığında, yeşil kısım hala bağlantı döneminin "iki taraflı pazar" etkisine sahiptir, bu nedenle hendek nispeten derindir.Teknoloji geçtiğinde bile Bir paradigma kayması, bence öyle değil. Büyük fırsatlar var. Örneğin, PC İnternetten mobile dönüşümde, Michat, Momo ve diğer şirketler o dönemde sosyal ağlara saldırsa da, Tencent hayatta kaldı (adını QQ'dan WeChat'e değiştirse de), çünkü Tencent tarafından kurulan sosyal ağ QQ dönemi Hendek çok derin. Çin'deki tüm sosyal ilişki, basit bir ikili yapı değil, Tencent'in elinde olan bir ağ yapısıdır.
Bir süre önce birçok kişi AGI döneminde WeChat'in alt üst edileceğini de sordu. Yukarıdaki paradigma dönüşümü küp analizini kullanıyoruz, sonuç değil. Öncelikle AGI çağında insanların sosyal ihtiyaçları değişecek mi? Alışkanlık. İkincisi, insanlar ve insanlar arasındaki sosyal model, insanlar ve sanal insanlar arasındaki sosyal model olacak mı? Ben de öyle düşünmüyorum. Silikon Vadisi'nde gelecekte robotların insanların kölesi olacağına dair bir söz vardır ve insanlar robotları "çalıştırmak" gibi net bir amaç için kullanırlar. Sosyal etkileşime duyulan ihtiyaç, insanın sosyal ilişkilerinin yapısından gelir: arkadaşlar, akrabalar, sınıf arkadaşları, meslektaşlar... tabi gelecekte insan sosyal yapısında böyle bir sosyal ilişki yoksa. Kimse bir robotla sosyalleşmek istemez. Bu nedenle, WeChat'in Çin'deki avantajı ve daha doğrusu tüm dünyadaki Çinlilerin sosyal ağı olması gerektiği, AGI'nin büyük paradigma değişimi çağında bile altüst olmayacak. WeChat'e gelince, metin ve görüntü oluşturma ve daha akıllı bilgi optimizasyonu gibi bazı özel etkileşimli güncellemeler var. Bunlar küçük etkileşimli iyileştirmeler. Bunlar, WeChat'in yeteneğiyle dakikalar içinde yapılabilir ve bu, herhangi bir yeni kurulan şirkete bağlı değildir. Bunu yapmak için alt üst edin.
Ocak 2019'da aynı gün Byte'ın Duoshan'ı, Luo Yonghao'nun Chat Bao'yu ve Kuaibo'nun kurucusu Wang Xin'in Toilet MT'yi başlattığını hatırlıyorum. WeChat'in sosyal kral statüsünü devirmek için işbirliği yapmak istediler, ancak iki ay içinde öldüler. . Kurucular o dönemde benim "Paradigma Shift Cube"u okusalardı, bu işin yapılamayacağını anlarlardı. Dahası, 2019 teknolojik paradigma kayması çağı değil.PC İnternetten mobil paradigmaya geçiş çağında bile, Lei Jun'un Michat'ı, uluslararası WhatsApp, Talkbox ve diğer uygulamalar Tencent'i devirmedi, çünkü sosyal hendek en derinidir. AGI çağında herkes WeChat kullanmayı düşünmemeli, kapı yok.
Aslında e-ticareti ifade eden iş hakkında konuşalım. Büyük aksamalar için çok fazla fırsat yok ve bunun nedeni, "bağlantı çağındaki" iki taraflı pazarın hendeğinin e-ticaret alanında hala var olmasıdır. Herhangi bir iş formu, alıcılar ve satıcılardan ayrılamaz. AGI büyük modeli, kapalı iş döngüsündeki (Taobao resimleri, sanal soyunma odaları vb.) yalnızca bazı küçük bağlantıları optimize edebilir, ancak bunlar asla alıcılardan, satıcılardan, lojistik vb. Temel e-ticaret nitelikleri ve bu alanlardaki geleneksel devlerin avantajları hala çok büyük. Yani, PC İnternetinden mobil İnternete dönüşümde, Taobao ve JD.com'un avantajları temel olarak çevrilmiştir.
Ancak bir hususu belirtmek gerekiyor mobil internet alanında Pinduoduo ve Douyin e-ticareti yarı yarıya ortaya çıktı ama bu WeChat ve Douyin'in trafik giriş etkisinden kaynaklanıyor iyi bir ek ama Ayrıca, Pinduoduo, yeni İnternet demografik değişikliklerinin getirdiği batan kalabalığa vurur (bu, yeniden analiz etme fırsatına sahiptir). Benim yargım, büyük ölçekli modeller yeni trafik girişleri getirebileceğinden, e-ticaret alanında Pinduoduo ve Douyin e-ticaretine benzer yeni fırsatlar ortaya çıkabilir, ancak Taobao ve JD.com'un mevcut avantajları devam edecektir. Sonuçta, e-ticaretin plakası çok büyük. Pasifik Okyanusu, Çin ve Amerika Birleşik Devletleri'ni barındırabilir ve e-ticaret alanı birçok küçük devi barındırabilir.
Alttaki mavi eksen, daha önce bahsettiğimiz ortamdır: metin, resimler, ses, video ve üç boyutlu (uzaysal hesaplama). Birçok kişinin bu kısmı gözden kaçırması kolaydır.Farklı medyaların arkasındaki ürünlerin gücü çok farklıdır. Herhangi bir ürün ürettiğimizde, ne tür bir medya taşıyıcıya odaklanmak istediğimizi düşünmeliyiz.
Medya mantığı açısından resimler metinden daha iyidir, video resimlerden daha iyidir ve sesin kendi özel sahnesi vardır. Erken mobil alanındaki not alma ve metin tabanlı ürünlerin birçoğunun ortadan kalktığı tahmin ediliyor. Bir cep telefonu kamerası birçok resim ürününü besler. Yurt dışında Instagram, Pinterest vb. Yerli fotoğraf ürünleri ne olacak? Aslında birkaç arkadaşım fotoğraf ürünleri yapardı ama pek bir şey yapmazlardı, neden? Çin'deki en büyük fotoğraf ürünü aslında WeChat Moments.
Pek çok insan aslında WeChat Anlarında nasıl düz metin gönderileceğini bilmiyor, sadece fotoğraf göndermek için nasıl kullanılacağını biliyorlar (Bana inanmıyorsanız, çevrenizdeki on kişiye sorun, kaçının bildiğini görün? Aslında , WeChat Moments bu işleve sahiptir, ancak gizlidir, kamera düğmesini basılı tutmanız gerekir). Anlar'daki varsayılan düğme bir kamera düğmesidir. WeChat bunu neden yaptı? Zhang Xiaolong neden birçok kişinin itirazı altında metin gönderme düğmesi ile fotoğraf gönderme düğmesini yan yana koymadı? Çok basit, eğer Şanghay'da bir metro istasyonunda 100 kişiyi rastgele daire içine alırsanız, bu 100 kişiden kaç tanesi resim ve yazı gönderebilir? Aradaki farkın şaşırtıcı olacağını düşünüyorum. WeChat kullanıcılarının %99'u resim göndermek için Anları kullanacak. Ancak kullanıcıların %10'undan fazlasının metin gönderebileceğini sanmıyorum. Kelime yazmak beceri gerektirir, ancak resim göndermek tüm kadınlar ve çocuklar tarafından bilinir ve herhangi bir eşik yoktur. Bu, farklı ortamların ürün gücüdür.
Tekrar videodan bahsedelim Silikon Vadisi'ndeyken birkaç Google arkadaşım TickTok'un Google için ChatGPT'den daha büyük bir tehdit olduğundan bahsetmişti. Neden? TickTok kullanıcıları çevrimiçi olarak çok fazla zaman geçirdikleri için Google'ın kullanıcı zamanını sıkıştırıyor. Douyin'in yerli versiyonu artık trafiğin kralı. WeChat'in son yıllarda bir video hesabı yoksa, ilk zamanlarda bir arkadaş çevresi olmayacaktır. Çin İnternetinin topraklarının kesinlikle bugün olduğu gibi olmadığını düşünüyorum. Karşılaştırma olarak, bugün WhatsApp'a bakarsanız, değeri WeChat'in yirmide biri bile olmayabilir. Doğru zamanda, WeChat resimlerin (Anlar) ve videoların (Video Kimliği) temettülerini ele geçirdi ve her adımda afişe bastı, bu nedenle Zhang Xiaolong, Çin'in 1 Numaralı ürün müdürü unvanını hak ediyor.
Dolayısıyla ortam da çok önemli bir değişim eksenidir. Peki ya videodan sonra? Bu, Apple tarafından iki hafta önce piyasaya sürülen, sözde üç boyutlu (uzaysal hesaplama) VisionPro'dur. Metin tek boyutlu bir ortamdır, resimler ve videolar iki boyutlu ortamdır ve uzamsal hesaplama üç boyutludur. İki boyutlu, bir boyutluyu geçmeli ve üç boyutlu, iki boyutluyu geçmelidir, bu yüzden VisionPro konusunda iyimserim.
Bu nedenle, gelecekteki paradigma kaymasının en büyük iki gücü, birincisi, AGI büyük modelinin teknoloji ekseninde getirdiği paradigma kayması; ikincisi, medya ekseni. İlki çoktan geldi, ikincisi ise VisionPro ürünlerinin olgunlaşma hızına göre 2 ila 3 yıl sonra tahmin ediliyor. İki eksenin kesişimi, bence önümüzdeki 5-10 yıl çok heyecan verici olacak.
Ancak büyük modelin tüm alanlarda çok büyük bir ürün paradigması kayması yok, aşağıdaki resme bakalım.
Diğer tür, AI-Copilot yardımcı pilot modu olarak adlandırılan aşamalı geliştirme türüne aittir. Üretkenlik araçları (Office Copilot), kod oluşturma (Github Copilot), tasarım geliştirmeleri (Adobe Firefly) vb. Bu kategori, belirli bir bağlantıda büyük bir model kullanan orijinal ürünün geliştirilmiş halidir.
Bu arada Microsoft'tan bahsetmeme izin verin, AGI'nin gelişinden sonra Microsoft bayrağı sallıyor ve bağırıyor.Birçok kişi Microsoft'un paradigma kayması yolunu tuttuğunu düşünüyor. Ancak, büyük resim açısından Microsoft'un aslında AI-Copilot'un aşamalı geliştirme modunu seçtiğini söylemek istiyorum. Çünkü Microsoft zaten 2.5 trilyon dolarlık bir şirket. Bir devrime ihtiyacı yok, sadece AGI'nin doğu rüzgarını kullanması ve yavaş büyümesi gerekiyor. Office, Windows ve Azure temel ürünlerinin yaklaşık %30 büyümesine izin verin ve birkaç yıl içinde 4 trilyon dolarlık, hatta 5 trilyon dolarlık bir şirket haline gelebilir. Hayatı ve zenginliğiyle All-In paradigma değiştiren AI-Native ürünlerine kumar oynamasına gerek yok, çünkü paradigma kayması yüksek getiri olasılığına sahip olsa da aynı zamanda yüksek risklidir. Microsoft'un AGI çağındaki ürün stratejisi seçimi, bu yolda birçok olgun şirket için de referans almaya değer.
Bölüm III: AGI ürünlerinin gelecekteki gelişimi hakkında altı düşünce
**İlk düşünce 2C veya 2B'dir. **2C uçtan uca bir ürün olduğundan, kullanıcı yolu genellikle nispeten kısadır ve bu da AI-Native paradigma değişimi için çok uygundur. Bununla birlikte, 2B'nin uzun müşteri yolu nedeniyle, yapay zekanın yeteneği tüm iş kapalı döngüsünün yalnızca bir parçasıdır, bu nedenle AI-Copilot'un kademeli olarak geliştirilmesi için uygundur.
2B alanında ise değer mantığı tamamen değişti: Müşterilerin karar verme süreci verimlilikten, verimlilik içerikten daha fazladır. Kurumsal ürünler çok fazla içerik peşinde koşmaz, bunun yerine maksimum verimlilik gerektirir.Hızlı karar vermemde bana yardımcı olmak en iyisidir.
İkinci husus, bir platform mu yoksa bir uygulama mı olacağıdır. Büyük model popüler olur olmaz birçok kişinin platform hayali ateşlendi. Yukarı çıkar çıkmaz büyük ölçekli maket platformu olsun diye bağıran, ağlayan arkadaşıma soğuk su verdim. Midjourney'in kurucusu David Holz'dan yeni bir alıntı yapacağım. Önceki şirketi Leap Motion'dan öğrendiği en büyük dersin, herkesin bir ekosistem platform hayaliyle başlayıp sonra başarısız olması olduğunu söyledi. Ancak Midjourney üzerinde çalışırken bu dersi aldı, kullanıcıların gerçekten sevdiği bir ürün yapmalı ve önce onu süper bir uygulama yapmalıdır.
Bu yol, ürün çalışanlarımız için çok önemlidir. Son zamanlarda, amacımızın XXX büyük ölçekli bir model platform oluşturmak olduğunu söyleyen bazı insanlarla sık sık karşılaşıyorum. Elimde olmadan kusmak istiyorum. Kullanılmayan ürününüz nedir? Hiç kimse kullanmadı. Ben nasıl platform yapmaya cesaret edebilirim, sen mi verdin? Bir platform olduğunuzu iddia ettiğiniz için kimse sizi desteklemeyecektir. Ancak süper bir uygulamanız ve devasa bir kullanıcı havuzunuz olduğunda platformun cazibesine sahip olursunuz ve herkes sizi platform olarak destekler.
Üçüncü düşünce, AIGC'ye karşı UGC'dir. UGC, Web 2.0'da çok önemli bir stratejiydi. Ancak büyük model, AIGC'nin yeteneklerini getiriyor.
Dördüncü düşünce, yenilikçinin ikilemi: Yeniliğe karşı Muhafazakar
Tarihte paradigma her değiştiğinde, yerleşik devler yenilikçinin ikilemiyle karşı karşıya kalacak. Örneğin, Google'ın mevcut durumunu örnek alarak OpenAI, Google'ın karşı karşıya olduğu "yenilikçinin ikilemini" akıllıca kullanmıştır.
Bir karşı örnek vermek gerekirse, Lei Jun Michat'ı yaparken, Tencent her türlü dünyayı sarsan tanıtım karşısında şok oldu, ancak dev rekabetle başa çıkmak için önceden stratejik bir tasarım hazırlamadı, böylece Tencent birleşti ve birleşti. WeChat. Bir yıldan biraz daha uzun bir süre içinde, Michat'ı temelde ortadan kaldırdı. Tabii tersine, Tencent'in bakış açısından, paradigma kayması gerçekleştiğinde, yerleşik devler yeterince dikkat edebilir ve yeterince All in'e sahip olabilirlerse, "yenilikçinin ikilemi" kaderinden de kurtulabilirler.
Beşinci düşünce, AGI'nin uçurumu nasıl aşabileceğidir
"Crossing the Chasm" da çok ünlü bir kitap. Açıkladığı çok aşamalı boşluklar, birçok yenilikçi ürün için özel dikkat gerektirir.
Altıncı düşünce, büyük modelin yalnızca AGI'ye açılan bir kapı olduğudur
Geriye dönüp tüm teknoloji endüstrisinin tarihine bakarsak, birçok teknoloji ilk çıktığında teknolojinin çok güçlü olduğunu hissettik. Bu teknolojiye akın edin ve bu teknolojinin çeşitli alanlarda getirdiği paradigma değişimini unutun. Örneğin, tarayıcılar ve web sunucuları ilk çıktığında, birçok kişi tarayıcı ve web sunucusu olmak için acele etti, çünkü birçok teknik kişi tarayıcıların ve web sunucularının İnternet'i temsil ettiğine inanıyordu. En trajik savaş, Microsoft'un tarayıcı pazarını ele geçirmek için tüm şirketi IE ve Netscape'i geliştirmek için kullanmasıdır. Tarihin bu dönemi hakkında oldukça netim çünkü Küresel Ürün Yöneticileri Konferansımızın eski bir arkadaşı ve "Apocalypse" yazarı Marty Çağan, Netscape'te ürünlerden sorumlu kıdemli başkan yardımcısıydı.Onu daha önce birçok kez Çin'e davet ettim. , ve sık sık bu dönem tarihinden bahsederim.
Microsoft ve Netscape bu konuda kaybedenlerdir, çünkü savaşırken, insanlar internete girdikten sonra daha büyük stratejik fırsatları tamamen görmezden geldiler.
Bugünkü konuşmam bu kadar, umarım içeriğin tamamı, özellikle "Paradigm Transformation Cube" yani ParaShift Cub ve "Connection and Computing Era" analizi herkesin inovasyonuna yardımcı olur. AGI çağında girişimcilik ve girişimcilik.Herkese teşekkürler!