مقالة متعمقة جيدة: تخطيط المنتج والنموذج في عصر الذكاء الاصطناعي العام

المصدر: بحث أجراه لي جيان تشونغ

شكرًا جزيلاً لك على دعمك لمؤتمر مديري المنتجات العالمي. إن دعمك هو الذي جعل مؤتمر مدير المنتج يستمر من عام 2009 إلى اليوم. موضوع خطابي اليوم هو "تخطيط المنتج والنموذج في عصر الذكاء الاصطناعي العام". ينقسم حديثي اليوم بشكل أساسي إلى الأجزاء الثلاثة التالية:

  1. فهم متعمق لخصائص عصر الذكاء الاصطناعي العام. 2. "مكعب التحول النموذجي" للابتكار العلمي والتكنولوجي 3. ستة أفكار حول التطوير المستقبلي لمنتجات الذكاء الاصطناعي العام

** الجزء الأول: فهم متعمق لخصائص عصر الذكاء الاصطناعي العام **

بادئ ذي بدء ، دعنا نتعرف على التطور الكامل لتكنولوجيا النماذج واسعة النطاق من خلال الصورة التالية.

يمكنك أن ترى أن أقدم ذكاء اصطناعي تم تطويره من التعلم الآلي. بعد تألق الشبكة العصبية العميقة على ImageNet في عام 2012 ، أصبح التعلم العميق علمًا بارزًا للذكاء الاصطناعي. في وقت لاحق ، تم تطوير RNN و LSTM في مجال معالجة اللغة الطبيعية. بعد أن نشر سبعة من علماء أبحاث Google أوراق Transformer في عام 2017 ، أصبح نموذج اللغة المدربين مسبقًا هو السائد تدريجيًا ، ثم نموذج اللغة الكبير (LLM) الذي يمثله GPT بسبب ChatGPT تعتبر الصناعة أن نجاح الذكاء الاصطناعي هو الباب أمام الذكاء الاصطناعي العام (AGI).

نظرًا لتتبعي وأبحاثي حول التقنيات المتعلقة بالذكاء الاصطناعي ، فقد حدث لي تبادل ومناقشات متعمقة مع العديد من الشخصيات الرئيسية حول خط التطوير المذكور أعلاه. في عام 2018 ، عقدنا المؤتمر العالمي للتعلم الآلي في شنغهاي ، ودعينا مايكل جوردان ، والد التعلم الآلي والأستاذ الشهير في جامعة كاليفورنيا في بيركلي ، كمتحدث رئيسي ، وأجرينا معه محادثات متعمقة. في أبريل 2021 ، عندما عقدنا مؤتمرًا للتعلم الآلي في بكين ، بسبب الوباء ، قمنا بدعوة Lukasz Kaiser ، أحد مؤسسي نموذج Google Transformer ، عبر الإنترنت. أخبرني بعد فترة وجيزة من هذا الخطاب أنه ترك Google لـ انتقل إلى OpenAI ، واكتشف لاحقًا أنه كان يستثمر في GPT 3.5. في ذلك الوقت ، تمت دعوة أحد المخضرمين في التعلم العميق ، Jurgen Schmidhuber ، والد LSTM. بحلول أبريل من هذا العام ، ذهبت إلى وادي السيليكون وأجريت الكثير من التبادلات المتعمقة مع إيليا سوتسكيفر ، كبير العلماء في أوبن إيه آي. بشكل عام ، على طريق تطوير الذكاء الاصطناعي ، واصلنا المناقشات المتعمقة والتبادلات مع حدود الصناعة ، والتي أفادتني كثيرًا.

أولاً ، دعنا نتحدث عن مكدس تقنية AGI ، والذي ينقسم عمومًا إلى ثلاث طبقات: طبقة التطبيق ، وطبقة النموذج ، وطبقة البنية التحتية (بالطبع ، يستخرج بعض الأشخاص في الصناعة LLMOps ويصنعون طبقة منفصلة ، تسمى أربع طبقات ). بغض النظر عن الطابق الثالث أو الطابق الرابع ، عند النظر إلى هذه الصورة ، من السهل فهمها ، لذلك لن أشرح كثيرًا. إنه أساس فهمنا لتكنولوجيا النماذج الكبيرة.

لكن هذا الفهم من السهل أن يبقى على السطح التقني ، دعونا نلقي نظرة على الأشياء الأعمق وراء تقنية النماذج واسعة النطاق أعتقد أنه يمكن أن يساعدنا في فهم هذه الموجة من الثورة التكنولوجية التي يقودها النموذج واسع النطاق. إذا نظرنا إلى التاريخ لفترة أطول قليلاً ، فهناك اقتراحان مهمان للغاية في صناعة التكنولوجيا بأكملها ، ** أحدهما هو الاتصال والآخر هو الحوسبة **. إنها مثل البندول الذي يتأرجح من الاتصال إلى الحوسبة لفترة من الوقت ، والحوسبة لفترة من الوقت.

دعونا نلقي نظرة على الصورة أعلاه. خلال 100 عام من 1840 إلى 1940 ، سيطر "الاتصال" على الثورة التكنولوجية بأكملها ، بما في ذلك التلغراف والهاتف والراديو والتلفزيون. ربط الأشخاص والمنظمات من جميع أنحاء العالم لقد غير بشكل عميق الشكل الاجتماعي في ذلك الوقت.

بعد ذلك ، منذ ولادة أول كمبيوتر ENIAC في عام 1946 ، دخلت الثورة التكنولوجية للبشرية بندول "الحوسبة". بما في ذلك الحواسيب المركزية في الخمسينيات من القرن الماضي ، وأجهزة الكمبيوتر الصغيرة في الستينيات ، وأجهزة الكمبيوتر الصغيرة في السبعينيات ، وأجهزة الكمبيوتر في الثمانينيات. مع بنية von Neumann باعتبارها جوهرًا ، يتم تنفيذ كل ذلك حول اقتراح "الحوسبة". هذه العملية مستمرة منذ حوالي 50 عامًا.

جاء بعد ذلك ظهور الإنترنت في الفترة من 1994 إلى 1995 ، وتميزت بشركة Netscape و Yahoo. ودفعت شبكة الإنترنت WWW ثورة التكنولوجيا البشرية إلى بندول "الاتصال" ، تليها Web 2.0 في عام 2004 ، وتميزت بولادة iPhone في عام 2007 الإنترنت عبر الهاتف النقال ، الخدمات السحابية 2013. إنهم جميعًا يقومون بتطوير وإثراء اقتراح "الاتصال" بشكل كبير. استمرت هذه العملية حوالي 30 عامًا.

جاء الوقت إلى عام 2017 ، وتم نشر الورقة الخاصة بنموذج Transformer ، وولد GPT 1.0 في عام 2018 ، ثم ظهرت 2.0 و 3.0 و ChatGPT التي جلبتها GPT 3.5 في نهاية العام الماضي ، مما أدى إلى بزوغ فجر الذكاء الاصطناعي العام AGI لكل إنسان. دخلت هذه الجولة من النماذج الكبيرة في بندول "الحساب" ، وسيبدأ الوقت حوالي عام 2020.

إنه أمر مثير للاهتمام للغاية ، إذا نظرت إلى ثورة "الاتصال" الأولى ، وسميتها "اتصال 1.0" ، فقد مرت حوالي 100 عام ؛ وثورة "الحوسبة" الثانية ، أطلق عليها اسم "الحوسبة 2.0" "، مرت حوالي 50 عامًا ؛ ثم جاءت ثورة "الاتصال" الثانية ، المسماة "اتصال 2.0" ، والتي استمرت 30 عامًا. هل ترى اتجاهًا متناقصًا بشكل كبير في الفترة الزمنية؟ لذلك ، يعتقد الكثير من الناس أننا قد لا نكون قادرين على القيام بذلك في السنوات الخمس عشرة القادمة ، وبحلول عام 2035 ، قد يصل بندول "الحوسبة" الذي أحدثته هذه الموجة من النماذج الكبيرة إلى ذروته.

مع فهم الجدول الزمني للصناعة ، دعنا نلقي نظرة على الفرق بين المنطق الأساسي لعصر "الاتصال" وعصر "الحوسبة"؟ هذا في الواقع مهم جدا لأن العديد من الأشخاص يستخدمون غالبًا نماذج مختلفة للإنترنت عبر الهاتف المحمول خلال هذه الفترة لاستنتاج نموذج عصر النموذج الكبير. أعتقد أن هذا التصور خاطئ. لأن الإنترنت المتنقل ينتمي إلى منطق "الاتصال" ، بينما ينتمي عصر النماذج الكبيرة إلى منطق "الحساب". دعنا نلقي نظرة على الجدول أدناه:

من منظور تحويل الإنتاج ، يسيطر منطق الاتصال على "علاقات الإنتاج" ، بينما يهيمن المنطق الحسابي على "الإنتاجية". من منظور العلاقة بين الإنتاج والاستهلاك ، نعلم أنه في عصر الإنترنت ، تحت منطق الاتصال ، هناك تأثير مهم جدًا يسمى "السوق ذو الوجهين" ، بما في ذلك المشترين والبائعين على Taobao والركاب والسائقين على Didi ، و Douyin. المستمعين والمقدمين. أحدهما منتج والآخر مستهلك. إنه يشكل تأثيرًا ثنائيًا قويًا جدًا وهو أيضًا خندق مائي مهم للعديد من المنتجات في عصر الإنترنت.

بموجب منطق الحساب ، لا يوجد في الواقع مثل هذا التأثير الثنائي ، وجوهره هو سوق أحادي الجانب. أحد طرفيه هو قوة حوسبة الخوارزمية ، والطرف الآخر هو المستهلكون. على سبيل المثال ، في Midjourney ، لا توجد شبكة من المصممين ، وتنتج الخوارزمية صورًا للمستخدمين بشكل مباشر ؛ على سبيل المثال ، في عصر القيادة الذاتية ، إذا تم تخريب ديدي ، فإن الخندق الذي شكله ديدي السائق والراكب على الوجهين سيكون السوق عديم الفائدة على الإطلاق ، لأنه لا توجد حاجة للسائقين ، إنها الخوارزمية التي تقود السيارة.

بالنظر إلى نموذج العمل مرة أخرى ، وفقًا لمنطق الاتصال ، فإن تكلفته الحدية منخفضة جدًا ، لذلك من السهل القيام بنموذج أعمال مجاني. ومع ذلك ، في ظل المنطق الحسابي ، يجب تقاسم تكلفة قوة حوسبة الخوارزمية بالتساوي. فهل ستظل معظم نماذج الأعمال مثل "free is king" في عصر الإنترنت والإنترنت عبر الهاتف المحمول؟ على الأرجح لا ، ولهذا السبب يرى الجميع أن Midjourney و ChatGPT Plus يشحنان. اقترح العديد من مستثمري Silicon Valley أن "فرض رسوم مباشرة على المستخدمين" سيكون نموذج الأعمال الرئيسي في عصر النماذج الكبيرة. لم يعد نموذجًا مجانيًا لـ "الصوف يأتي من الخنزير" في عصر الاتصال.

وماذا عن تجربة المستخدم؟ في عصر الإنترنت ، يتمثل منطق الاتصال في أنه كلما زادت المعلومات كلما كان ذلك أفضل ، تنشأ مشكلة حتمية تتمثل في تحميل المعلومات بشكل زائد. لكن منطق الحساب ، في الواقع ، هو أنه كلما قل عدد الاتصالات كلما كان ذلك أفضل ، تأتي الكفاءة أولاً. أي ، سأعطي نتائجي بالترتيب التالي ، ولا تسمح لي بالمشاركة في العملية الوسيطة.

من حيث آلية اتخاذ القرار. منطق الاتصال هو "ستعطيني الآلة معلومات ، وسأتخذ القرارات". والمنطق الحسابي هو أن الناس يقدمون المعلومات للآلات ، أي أن البيانات والآلات تساعدني في اتخاذ القرارات.

من خلال المقارنات أعلاه ، يمكنك أن ترى أن هذين المنطقين مختلفان تمامًا في تفكير منتجنا. بعد ذلك ، لنتحدث عن منطق الحوسبة. ما هو الفرق الأساسي بين الحوسبة 1.0 من 1940 إلى 1990 وحوسبة 2.0 التي نحن فيها حاليًا؟ ننظر إلى الصورة أدناه:

في عصر الحوسبة 1.0 ، الجانب الأيسر هو الدماغ البشري ، والذي نسميه الشبكة العصبية البيولوجية ، والجانب الأيمن هو دائرة المنطق الرقمي. جميع أجهزة الكمبيوتر التقليدية لدينا هي في الأساس "و ، أو ، وليس" دوائر المنطق الرقمي . إنه منطق عملية منظم لا يقبل إلا البيانات المنظمة ، والتي هي في الأساس عملية تفكير 0-1. والنتيجة التي تؤدي إليها هي جعل الناس يتأقلمون مع منطق الآلة.

لذلك ستجد أنه ضمن Computing 1.0 ، سواء كان جهاز كمبيوتر أو برنامج محمول ، هناك العديد من الأماكن التي تكون فيها تجربة المستخدم قليلة الإهمال ، ومن السهل على الأشخاص غير الصناعيين ، بما في ذلك كبار السن والأطفال ، الوقوع في مأزق العبء العقلي. لماذا هذه المعضلة؟

لأن الجانب الأيسر هو الشبكة العصبية البيولوجية للدماغ البشري ، والجانب الأيمن عبارة عن دائرة منطقية رقمية تتكون من "و ، أو ، وليس" ، عليك تكييفها. يجب أولاً تحويل أي إدخال إدخال إلى شيء يمكن أن تفهمه دائرة المنطق الرقمي ؛ يجب أن يخضع أي إخراج من الكمبيوتر لطبقة تحويل إلى شيء يمكن للشبكة العصبية البيولوجية فهمه. هذا التحويل ذهابًا وإيابًا هو المكان الذي يواجه فيه المستخدم العادي غير المدرب مشكلة.

ولكن إذا نظرنا إلى عصر الحوسبة 2.0 الذي يهيمن عليه النموذج الكبير الموصوف في الشكل أدناه.

لقد رسمت الصورة على اليمين كدماغ ، على الرغم من أن بداخلها عبارة عن شريحة تعتمد على السيليكون ، ما يسمى بالذكاء القائم على الكربون والذكاء القائم على السيليكون.

عندما تواصلت مع كبير علماء OpenAI إيليا سوتسكفر في وادي السيليكون في أبريل ، أتذكر أنه كرر ثلاث مرات للتأكيد على أنه من منظور المبادئ الرياضية ، فإن الشبكة العصبية الرقمية الحالية لا تختلف عن الشبكة العصبية القائمة على الكربون للدماغ البشري . باستثناء طرق البقاء المختلفة للكائنات البيولوجية ، فإن منطق العملية هو نفسه.

في هذا الوقت ، التفاعل بين البشر والنموذج الكبير هو في الواقع التفاعل بين الشبكة العصبية البيولوجية والشبكة العصبية الرقمية.

لم يعد التفكير 0-1 للدوائر الرقمية في عصر الحوسبة 1.0 ، بل التفكير الاحتمالي. يعلم الجميع أنه يمكنك ضبط معامل درجة الحرارة (قيمة درجة الحرارة) في ChatGPT. ارفع درجة الحرارة لتصبح مبدعًا. من المثير للاهتمام أيضًا استخدام كلمة درجة الحرارة ، فارتفاع درجة الحرارة يعني أن الدماغ ساخن ، والدماغ يكون أكثر إبداعًا عندما يكون الدماغ ساخنًا. يمكنك أيضًا خفض درجة الحرارة لجعل الإجابة متواضعة جدًا. جوهر التفكير الاحتمالي هو نموذج الشبكة العصبية ، وهي أيضًا طريقة اتخاذ القرار في دماغنا البشري. فكر في الأمر بعناية ، الجميع ، في الواقع ، كل فكرة في دماغنا تحسب الاحتمال. نتيجة التوجه الكامل للحوسبة 2.0 هي السماح للآلات بالتكيف مع التفكير البشري.

من خلال الفهم المتعمق أعلاه لتقنية الذكاء الاصطناعي العام بالكامل والمنطق الكامن وراءها ، فلنتحدث عن بعض المنهجيات حول كيفية صنع المنتجات في عصر الذكاء الاصطناعي العام.

** الجزء الثاني: "نموذج مكعب التحول" للابتكار التكنولوجي **

دعنا نتحدث عن النقلة النوعية أولاً. تسمى التحول النموذجي في اللغة الإنجليزية. اقترحها توماس كون لأول مرة في كتاب "هيكل الثورات العلمية". وهي تشير إلى التغييرات الأساسية في المفاهيم والممارسات الأساسية في مجال العلوم و التكنولوجيا يكسر الأصلي قوانين و حدود البشر تخلق عالما جديدا لأفكار الناس و أفعالهم. الثورات التي نتحدث عنها غالبًا في مجال التكنولوجيا هي في الواقع تحولات نموذجية ، على سبيل المثال ، من المستقلة إلى الإنترنت ، من الإنترنت إلى الإنترنت عبر الهاتف المحمول ، كلها تحولات نموذجية.

في مجال الإنترنت الصيني ، يعرف العديد من الأصدقاء أن وانغ شينغ من ميتوان كان له ذات مرة نظرية مشهورة ذات أربعة أعمدة وثلاثة أفقية في عام 2009 تقريبًا. في ذلك الوقت ، كان الكثير من الناس على الإنترنت متحمسين للغاية عندما سمعوا هذه النظرية. بسبب تحليل Wang Xing ، بدا أنه أكثر انسجاما مع الوضع الحالي في ذلك الوقت.كان عام 2009 عندما اندلعت الإنترنت عبر الهاتف المحمول. إنه مشابه جدًا لتفشي الذكاء الاصطناعي العام الحالي.

أشار وانغ شينغ في ذلك الوقت إلى أن البشر تهيمن عليهم بشكل أساسي أربعة احتياجات رئيسية في صناعة التكنولوجيا: المعلومات والاتصالات والترفيه والأعمال. الأعمدة الأربعة ما يسمى. أما بالنسبة إلى Sanheng ، فقد قدم Wang Xing تحليله الخاص: بحث ، اجتماعي ، متنقل. ثم عند نقطة التقاطع أربعة أفقية وثلاثة أفقية ، ولدت فرصة جديدة. أتفق مع "القطاعات الأربعة" كثيرًا ، لكن بالنسبة للأفقيات الثلاثة ، أعتقد أن طريقة التحليل هذه إشكالية ، لأن الشبكات الاجتماعية والبحث هما في الواقع احتياجات بشرية ، وليسا على نفس بُعد الإنترنت عبر الهاتف المحمول.

أعتقد أن وانج شينغ وضع الشبكات الاجتماعية على نفس البعد مثل الهاتف المحمول في ذلك الوقت لأن الشبكة الاجتماعية كانت شائعة جدًا في ذلك الوقت الذي أصبحت فيه الشبكات الاجتماعية بوابة مرور ضخمة. بمجرد اكتشاف الشبكات الاجتماعية في العديد من المجالات ، ستكون هناك طرق جديدة يلعب. لكن دخول حركة المرور لا يساوي التكنولوجيا. وينطبق الشيء نفسه على البحث ، لأنه يحتوي أيضًا على تأثير دخول حركة المرور ، لذلك يشعر Wang Xing أنه تسبب أيضًا في تغييرات في العديد من المجالات. ومع ذلك ، لم يقدم Wang Xing نموذجًا مقنعًا للمنتج في مجالات الاتصال والترفيه والأعمال بخلاف نموذج Google / Baidu للبحث. لذلك أعتقد أن "الأفقيات الثلاثة" لمنهجية وانغ شينغ "الأربعة والأفقية الثلاثة" في غير محلها.

بعد ذلك ، دعني أتحدث عن إطار عمل التحليل الذي اقترحته ، وأعتقد أن إطار التحليل هذا مفيد جدًا بالنسبة لنا لتحليل نموذج المنتج في عصر الذكاء الاصطناعي العام. لقد قمت بتسمية إطار التحليل الذي اقترحته ** "مكعب تحويل النموذج" ، والاسم الإنجليزي هو ParaShift Cube ** ، حيث Para هي اختصار لـ Paradigm.

لماذا يسمى المكعب ، لأننا نحدد ثلاثة محاور: المحور السيني ، المحور الصادي ، المحور العيني.

يمثل المحور السيني المحور التكنولوجي الذي يمثل تحول النماذج التكنولوجية ، فهناك اتصال 1.0 ، وحوسبة 1.0 ، ووصلة 2.0 (بما في ذلك إنترنت كمبيوتر شخصي ، وإنترنت محمول) ، وحوسبة 2.0 ، وهو ما نسميه عصر الذكاء الاصطناعي العام.

يمثل المحور Y محور الطلب ، ويغطي جميع جوانب الاحتياجات البشرية ، بما في ذلك الجزء الذي تحدث عنه وانغ شينغ: المعلومات والترفيه والأعمال. وفي الوقت نفسه ، أضع الشبكات الاجتماعية والبحث على المحور ص. التواصل الاجتماعي والتواصل ، جمعت بينهما ، وعلى الرغم من وجود اختلافات طفيفة ، فإن القواسم المشتركة بينهما تفوق الاختلافات.

يمثل المحور Z المحور المتوسط ، لأن التعبير عن المعلومات يتطلب وسيطًا معينًا ، ويتفاعل البشر أيضًا مع العالم من حولهم من خلال الوسيط. تتضمن محاور الوسائط: النصوص والصور والصوت والفيديو وحساب المساحة ثلاثي الأبعاد (هذا هو أحدث اقتراح لشركة Apple في VisionPro). أعتقد أن المحور Z هو نقطة يتجاهلها كثير من الناس. إن تضمين واجهة المستخدم الرسومية لواجهة المستخدم الرسومية ، والتي لها تأثير كبير على تطوير أجهزة الكمبيوتر ، هو أيضًا نتيجة تفاعل مدفوع بأحداث في وسيط مثل صور الكمبيوتر.

تشكل هذه المحاور الثلاثة هيكل مكعب ، والمحاور الثلاثة ، ونقطة التغيير على كل محور ، وتقاطع المحاور الأخرى هي الأماكن التي يحدث فيها "ابتكار التحول النموذجي" في المنتجات. يعد تطبيق نموذج تحول المكعب لتحليل فرص الابتكار في مجالات المنتجات أمرًا بسيطًا منطقيًا.

بعد ذلك ، نستخدم "Paradigm Transformation Cube" لتحليل الاتصال بإنترنت الكمبيوتر الشخصي في عصر 1.0 ، والاتصال بالإنترنت عبر الهاتف المحمول في عصر 2.0 ، والتنبؤ بالفرص المحتملة في عصر الحوسبة 2.0 AGI Intelligence. بالنسبة لعصر الحوسبة 1.0 والاتصال 1.0 ، في الواقع ، يمكنك أيضًا استخدام تحليل "مكعب التحول النموذجي" ، لكن العمر قديم نسبيًا ، لذلك لن أتحدث عنه هنا ، ولكن إذا كنت مهتمًا ، فيمكنك ارجع إلى التاريخ لتحليله ، وستجد أنه أيضًا منطقي جدًا.

نظرًا لأنه ليس من السهل جدًا التعبير عن المحتوى المملوء في المكعب في PPT ، لذلك استخدمت جدولًا للتعبير عن محور التكنولوجيا ومحور الطلب ، وهناك محور أزرق أسفله ، والذي يمثل تغييرات الوسائط.

لقد قسمت محور الطلب في الجدول إلى جزأين: الأحمر والأخضر. الجزء الأحمر ، في عصر ذكاء الذكاء الاصطناعي العام ، هو الجزء الذي يكون فيه التحول النموذجي أكثر جذرية ، وهناك فرصة كبيرة للابتكار وحتى الإطاحة بالعمالقة ؛ انظر أولاً إلى الطلب على المعلومات ، في التحول من الكمبيوتر الشخصي إلى الهاتف المحمول ، يتم استبدال نماذج البوابة مثل سينا وسوهو بـ Toutiao ، إلخ. الهزيمة ، وستواجه طريقة إنتاج المعلومات في عصر الذكاء العام للذكاء الاصطناعي تغييرات هائلة. الآن ، يعتبر الحمل الزائد للمعلومات أمرًا خطيرًا للغاية ، ففي بعض الأحيان ، بعد قراءة عشر مقالات ، تحصل في الواقع على معلومة واحدة فقط. لذا هل يمكن أن يساعدني النموذج الكبير في دمج عشرات المعلومات من اليوم السابق وفقًا لتفضيلاتي ، ومن ثم إعطائي بعض الملخصات القصيرة والموجزة ، وهو ما يجيده النموذج الكبير جدًا. يمكن أن يؤدي هذا بسهولة إلى نقلة نوعية في منتجات المعلومات. دعنا نتحدث عن الترفيه مرة أخرى. يحتاج الترفيه إلى المحتوى كثيرًا ، و AIGC جيدة جدًا في إنشاء المحتوى. سيتم إعادة تشكيل الشكل والناقل والإمداد وسلاسل الترفيه الأخرى بواسطة AIGC ، لذلك هناك أيضًا العديد من الفرص لتغيير النموذج.

أخيرًا ، لنتحدث عن البحث. يعد البحث صناعة كبيرة في مجال الإنترنت ، كما أنه يمثل طلبًا كبيرًا على البشر. ولكن إذا كنت تستخدم ChatGPT ومنتجات أخرى من النماذج واسعة النطاق ، فستجد أن نسبة سلوك البحث ستنخفض بشكل كبير ، لماذا؟ لأنه في كثير من الأحيان ، نبحث في عشرات المقالات ونقلب عدة صفحات فقط للعثور على إجابة أو قرار. هل هذا المنتج جيد؟ هل هذا الجذب يستحق الزيارة؟ هل هذا الدواء يحل المشكلة؟ إن احتياجات اتخاذ القرار والإجابة على هذه الاحتياجات هي ما تُجيده منتجات النماذج واسعة النطاق مثل ChatGPT. لذلك ، سيواجه البحث احتمالًا كبيرًا للتخريب في عصر الذكاء الاصطناعي العام. لسوء الحظ ، عندما عدت من وادي السيليكون في أبريل ومايو ، شعرت أن Google كانت لا تزال تعول الأموال على دفتر الائتمان الخاص بالبحث ، وكنت مخدرًا لخطر التحول الهائل في النموذج الذي أحدثته ChatGPT.

يقول البعض ، ألم تطلق Google الكثير من التقنيات والمنتجات المتعلقة بالنماذج الكبيرة؟ جوابي هو ، لا تنظر إلى المنتجات القليلة التي تم إطلاقها على السطح. تتساقط كل هذه الإجراءات الدفاعية عندما يأتي التحول النموذجي. فكر في كيفية انهيار موقع ياهو في ذلك العام؟ بالطبع ، هل لدى Google فرصة؟ أعتقد أن هناك فرصة ، لكن الفرضية هي أن Google يجب أن تأتي بتصميم مشابه للحرب التي استخدمها Ma Huateng و Zhang Xiaolong قوة شركة Tencent بالكامل لـ All in WeChat لمحاربة Michat ؛ أو بيل جيتس في عام 1995 ، فإن التصميم على خوض حرب المستعرضات مع Netscape باستخدام قوة شركة Microsoft بأكملها في All in IE كل عام يمكن أن يمنع القوة التخريبية للتحول النموذجي. وماذا فعل جوجل؟ استلقى المؤسس على الشاطئ في ولاية كاليفورنيا واستغرق في الشمس ، وترك الرئيس التنفيذي المعين ، سام التمان وإيليا سوتسكفر من شركة OpenAI وغيرهما من المؤسسين الذين لديهم قصائد وأماكن بعيدة للقتال ، ثم تمت إزالة سيد التكنولوجيا جيف دين من منصب رئيس Goolge Brain ، وتم فصل جيفري هينتون ، والد التعلم العميق ، بلباقة. هل تريد الفوز بعصر الذكاء الاصطناعي العام بالاعتماد على بعض نماذج PPT الكبيرة في مؤتمر Google I / O؟ بالمناسبة ، أود أن أنتقد الأسلوب المتهور لمنتجات Daxing PPT من Google في السنوات الأخيرة (العديد منها لم يتم إصداره رسميًا بعد ذلك) ، ودعونا نرى متى تحتاج الشركات الناشئة مثل OpenAI إلى مؤتمر تطوير؟ بيان المنتج هو مؤتمر صحفي ، مع شرح مدونة على الأكثر. الحديث عن المنتجات (بدلاً من PPT) هو ملك الابتكار!

أخيرًا ، اسمحوا لي أن أقول إنها ليست بوابة أخرى تقلب موقع Yahoo ؛ ليس بحثًا آخر يقلب Google ، بل التخريب الهيكلي الذي أحدثته النقلة النوعية ، وهذه هي لعبة الشطرنج التي يواجهها مجال البحث في العصر من النماذج الكبيرة.

بعد الحديث عن الجزء الأحمر ، دعنا نتحدث عن الجزء الأخضر. بالمقارنة مع الجزء الأحمر ، لا يزال الجزء الأخضر له تأثير "السوق ذي الوجهين" لعصر الاتصال ، لذا فإن الخندق المائي عميق نسبيًا. حتى عندما تخضع التكنولوجيا نقلة نوعية ، أعتقد أنه ليس هناك فرص كبيرة. على سبيل المثال ، في التحول من كمبيوتر الإنترنت إلى الهاتف المحمول ، على الرغم من أن Michat و Momo وشركات أخرى هاجمت الشبكات الاجتماعية في ذلك الوقت ، نجت Tencent (على الرغم من أنها غيرت اسمها من QQ إلى WeChat) ، لأن الشبكات الاجتماعية التي أنشأتها Tencent في عصر QQ الخندق المائي عميق جدًا. العلاقة الاجتماعية بأكملها في الصين ليست بنية ثنائية بسيطة ، ولكنها هيكل شبكة ، وهي في أيدي Tencent.

سأل العديد من الأشخاص أيضًا منذ بعض الوقت أنه في عصر الذكاء الاصطناعي العام ، هل سيتم تخريب WeChat؟ نحن نستخدم تحليل مكعب التحويل النموذجي أعلاه ، والاستنتاج ليس كذلك. بادئ ذي بدء ، في عصر الذكاء الاصطناعي العام ، هل ستتغير احتياجات الناس الاجتماعية؟ متعود. ثانيًا ، هل سيصبح النموذج الاجتماعي بين الناس والناس نموذجًا اجتماعيًا بين الناس والأشخاص الافتراضيين؟ لا أعتقد ذلك أيضًا. هناك قول مأثور في وادي السيليكون مفاده أن الروبوتات في المستقبل ستكون عبيدًا للبشر ، ويستخدم الناس الروبوتات لغرض واضح هو "إنجاحها". تأتي الحاجة إلى التفاعل الاجتماعي من بنية العلاقات الاجتماعية البشرية: الأصدقاء والأقارب وزملاء الدراسة والزملاء ... ما لم تكن هناك علاقات اجتماعية من هذا القبيل في الهيكل الاجتماعي البشري في المستقبل. لا أحد يريد الاختلاط بالروبوت. لذلك ، فإن ميزة WeChat في الصين ، وبشكل أكثر دقة ، يجب أن تكون الشبكة الاجتماعية للشعب الصيني في جميع أنحاء العالم ، لن يتم تخريبها حتى في عصر التحول النموذجي الرئيسي للذكاء الاصطناعي العام. بالنسبة إلى WeChat ، هناك بعض التحديثات التفاعلية المحددة ، مثل إنشاء النصوص والصور ، وتحسين المعلومات الأكثر ذكاءً. هذه تحسينات تفاعلية صغيرة. يمكن تنفيذ هذه الأشياء في دقائق باستخدام قدرة WeChat ، ولا يعود الأمر إلى أي شركة ناشئة للقيام بذلك.

أتذكر أنه في نفس اليوم من يناير 2019 ، أطلقت Byte Duoshan ، وأطلق Luo Yonghao Chat Bao ، وأطلق مؤسس Kuaibo Wang Xin مرحاض MT. لقد أرادوا التعاون لإسقاط وضع WeChat كملك اجتماعي ، لكنهم ماتوا في غضون شهرين. . إذا كان المؤسسون قد قرأوا "مكعب التحول النموذجي" الخاص بي في ذلك الوقت ، لكانوا قد فهموا أن هذا الأمر لا يمكن القيام به. والأكثر من ذلك ، أن 2019 ليس حقبة تحول نموذجي تكنولوجي.حتى في عصر تحول الإنترنت من الكمبيوتر الشخصي إلى نموذج الهاتف المحمول ، لم يقم Lei Jun's Michat و WhatsApp الدولي و Talkbox والتطبيقات الأخرى بتخريب Tencent ، لأن الخندق الاجتماعي هو الأعمق. في عصر الذكاء الاصطناعي العام ، لا ينبغي على الجميع التفكير في استخدام WeChat ، فلا يوجد باب.

لنتحدث عن الأعمال التجارية ، والتي تشير في الواقع إلى التجارة الإلكترونية. لا توجد فرص كثيرة لاضطراب كبير ، والسبب هو أن الخندق المائي للسوق ذي الوجهين في "عصر الاتصال" لا يزال موجودًا في مجال التجارة الإلكترونية. لا يمكن فصل أي نموذج عمل عن المشترين والبائعين.يمكن للنموذج الكبير AGI تحسين بعض الروابط الصغيرة فقط في حلقة العمل المغلقة (مثل صور Taobao ، وغرف التجهيز الافتراضية ، وما إلى ذلك) ، ولكن لا يمكن فصلها عن المشترين والبائعين ، الخدمات اللوجستية ، إلخ. سمات التجارة الإلكترونية الأساسية ، ومزايا الشركات العملاقة التقليدية في هذه المجالات لا تزال كبيرة. أي أنه في التحول من إنترنت الكمبيوتر الشخصي إلى الإنترنت عبر الهاتف المحمول ، يتم ترجمة مزايا Taobao و JD.com بشكل أساسي.

ومع ذلك ، هناك شيء واحد يجب الإشارة إليه. في مجال الإنترنت عبر الهاتف المحمول ، ظهرت التجارة الإلكترونية بين Pinduoduo و Douyin في منتصف الطريق ، ولكن هذا ناتج عن تأثير دخول حركة المرور لـ WeChat و Douyin. إنه مكمل جيد ، لكنه علاوة على ذلك ، يضرب Pinduoduo الحشد الغارق الذي أحدثته التغييرات الديموغرافية الجديدة للإنترنت (وهذا لديه فرصة لإعادة التحليل). رأيي هو أنه نظرًا لأن النماذج واسعة النطاق قد تجلب مداخل جديدة لحركة المرور ، فقد تظهر فرص جديدة مماثلة للتجارة الإلكترونية Pinduoduo و Douyin في مجال التجارة الإلكترونية ، لكن المزايا الحالية لـ Taobao و JD.com ستظل موجودة. بعد كل شيء ، لوحة التجارة الإلكترونية كبيرة جدًا. يمكن أن يستوعب المحيط الهادئ الصين والولايات المتحدة ، ويمكن أن يستوعب مجال التجارة الإلكترونية العديد من الشركات العملاقة الصغيرة.

المحور الأزرق في الأسفل هو بشكل أساسي الوسائط التي ذكرناها سابقًا: نصوص وصور وصوت وفيديو وثلاثي الأبعاد (الحوسبة المكانية). من السهل على كثير من الناس التغاضي عن هذا الجزء ، فسلطة المنتجات وراء الوسائط المختلفة مختلفة تمامًا. عندما نصنع أي منتج ، يجب أن نفكر في نوع ناقل الوسائط الذي نريد التركيز عليه.

من حيث منطق الوسائط ، الصور أفضل من النص ، والفيديو أفضل من الصور ، والصوت له مشهد خاص به. تشير التقديرات إلى أن العديد من منتجات تدوين الملاحظات والنصوص في مجال الأجهزة المحمولة المبكرة قد اختفت. تغذي كاميرا الهاتف المحمول الكثير من منتجات الصور. في الخارج ، يوجد Instagram و Pinterest وما إلى ذلك. ماذا عن منتجات الصور المحلية؟ في الواقع ، اعتاد العديد من أصدقائي على صناعة منتجات الصور ، لكنهم لم يفعلوا الكثير ، لماذا؟ أكبر منتج للصور في الصين هو WeChat Moments.

لا يعرف الكثير من الأشخاص كيفية نشر نص عادي في WeChat Moments ، فهم يعرفون فقط كيفية استخدامه لنشر الصور (إذا كنت لا تصدقني ، فاطلب من عشرة أشخاص من حولك معرفة كم منهم يعرف؟ ، WeChat Moments بها هذه الوظيفة ، لكنها مخفية ، تحتاج إلى الضغط مع الاستمرار على زر الكاميرا). الزر الافتراضي في اللحظات هو زر الكاميرا. لماذا فعل WeChat هذا؟ لماذا لم يضع Zhang Xiaolong زر نشر النص وزر نشر الصور جنبًا إلى جنب تحت جاذبية العديد من الأشخاص؟ الأمر بسيط للغاية ، إذا قمت بدائرة 100 شخص بشكل عشوائي في محطة مترو أنفاق في شنغهاي ، فكم عدد الأشخاص المائة الذين يمكنهم نشر الصور والنصوص؟ أعتقد أن الفجوة ستكون مذهلة للغاية. 99٪ من مستخدمي WeChat سيستخدمون اللحظات لنشر الصور. لكن لا أعتقد أن أكثر من 10٪ من المستخدمين يمكنهم إرسال رسائل نصية. تتطلب كتابة الكلمات مهارات ، لكن نشر الصور معروف لجميع النساء والأطفال ، وليس هناك عتبة. هذه هي قوة منتج الوسائط المختلفة.

لنتحدث عن الفيديو مرة أخرى. عندما كنت في وادي السيليكون ، ذكر العديد من أصدقاء Google أن TickTok يمثل تهديدًا أكبر لـ Google من ChatGPT. لماذا؟ نظرًا لأن مستخدمي TickTok يقضون الكثير من الوقت على الإنترنت ، فإنه يضغط على وقت مستخدم Google. النسخة المحلية من دوين هي الآن ملك حركة المرور. إذا لم يكن لدى WeChat حساب فيديو في السنوات القليلة الماضية ، فلن تكون دائرة من الأصدقاء في الأيام الأولى. أعتقد أن منطقة الإنترنت في الصين ليست بالتأكيد ما هي عليه اليوم. على سبيل المقارنة ، إذا نظرت إلى WhatsApp اليوم ، فقد لا تكون قيمته حتى واحدًا على عشرين من قيمة WeChat. في الوقت المناسب ، استحوذت WeChat على أرباح الصور (اللحظات) ومقاطع الفيديو (معرف الفيديو) ، وخطت على اللافتة في كل خطوة على الطريق ، لذلك يستحق Zhang Xiaolong لقب مدير المنتج الأول في الصين.

لذا فإن الوسيط هو أيضًا محور تغيير مهم جدًا. إذن ماذا بعد الفيديو؟ إنه VisionPro الذي أصدرته شركة Apple منذ أسبوعين ، ما يسمى بالحوسبة المكانية ثلاثية الأبعاد. النص هو وسيط أحادي البعد ، والصور ومقاطع الفيديو هي وسيط ثنائي الأبعاد ، والحوسبة المكانية ثلاثية الأبعاد. يجب أن يتجاوز البعد الثنائي البعد الأحادي ، ويجب أن يتجاوز الأبعاد الثنائية الأبعاد ، ولهذا السبب أنا متفائل بشأن VisionPro.

لذلك ، فإن أكبر قوتين للتحول النموذجي في المستقبل ، ** الأول هو النقلة النوعية التي أحدثها نموذج AGI الكبير على محور التكنولوجيا ** ؛ ** والثاني هو النقلة النوعية التي أحدثتها الحوسبة المكانية على محور الوسائط **. وصل الأول بالفعل ، والثاني يقدر بعد 2 إلى 3 سنوات وفقًا لسرعة نضج منتجات VisionPro. تقاطع المحورين ، أعتقد أن السنوات الخمس إلى العشر القادمة ستكون مثيرة للغاية.

لكن النموذج الكبير لا يحتوي على تحول كبير في نموذج المنتج في جميع المجالات ، دعنا نلقي نظرة على الصورة أدناه

أقسم نقاط الدخول لمنتجات النماذج واسعة النطاق إلى فئتين. تنتمي فئة واحدة إلى ما يسمى بالتطبيقات الأصلية للذكاء الاصطناعي والتي ستخضع لتحولات جذرية في النموذج. ما يميز هذه الفئة هو عدم الحاجة إلى نموذج كبير ، ولا يمكن تصنيع المنتج على الإطلاق. تشمل فئات المنتجات التمثيلية في هذه الفئة: المساعدين الأذكياء (مثل ChatGPT) ، ومنتجات AIGC التوليدية (مثل Midjourney) ، والذكاء المتجسد (مثل Tesla's Optimus Prime). تتمتع هذه المنتجات بفرص تخريبية هائلة وهي أنواع جديدة في عصر الذكاء الاصطناعي العام.

النوع الآخر ينتمي إلى نوع التحسين التدريجي ، ما يسمى بوضع الطيار المساعد AI-Copilot. مثل أدوات الإنتاجية (Office Copilot) وإنشاء الكود (Github Copilot) وتحسينات التصميم (Adobe Firefly) وما إلى ذلك. هذه الفئة هي تحسين للمنتج الأصلي باستخدام نموذج كبير في رابط معين.

التحول النموذجي والتعزيز التدريجي الذي أحدثته AI-Native و AI-Copilot لهما العديد من الميزات المختلفة. أدرجتهم في الصورة أعلاه. يجب على الجميع الاختيار وفقًا لخصائص أعمالهم. ما أحتاج إلى التأكيد عليه هنا هو مسألة التنظيم. إذا اخترت ابتكار تغيير نموذج AI-Native ، فيجب عليك إعادة تنظيم المنظمة. فمن الأسهل إدارة شركة ناشئة جديدة. إذا كان ابتكارًا داخليًا لشركة كبيرة ، فيجب عليك أيضًا بناء فريق جديد ، وإلا فمن المحتمل أن تكون غير جدير بالثقة. بسبب أشياء كثيرة ، هذا هو سبب المنظمة. لقد أثبت التاريخ مرات لا تحصى أن القيام بأشياء جديدة يتطلب هيكل فريق جديد. لأن عمليتها التنظيمية مختلفة ، ونموذج عملها مختلف أيضًا ، ولهذا السبب يختلف منطق عصر الاتصال ومنطق عصر الحوسبة الذي ذكرته سابقًا. إذا اخترت AI-Copilot ، فيجب أن يكون لديك منتجات حالية ناضجة نسبيًا ، لذلك في هذا الوقت ، تحتاج المؤسسة القديمة فقط إلى إجراء بعض التحسينات والضبط الدقيق. إنه مختلف تمامًا عن متطلبات AI-Native للفريق. هذا واضح أيضًا في العديد من الشركات في وادي السيليكون.

بالمناسبة ، اسمحوا لي أن أذكر Microsoft. بعد وصول الذكاء الاصطناعي العام ، كانت مايكروسوفت تلوح بالعلم وتصرخ. يعتقد الكثير من الناس أن مايكروسوفت تسلك طريق التحول النموذجي. لكني أريد أن أقول أنه من منظور الصورة الكبيرة ، اختارت Microsoft بالفعل وضع التحسين التدريجي لـ AI-Copilot. لأن Microsoft هي بالفعل شركة 2.5 تريليون دولار. لا تحتاج إلى ثورة ، إنها تحتاج فقط إلى ركوب الرياح الشرقية للذكاء الاصطناعي العام وتنمو ببطء. دع منتجات Office و Windows و Azure الأساسية تنمو بنحو 30٪ ، وفي غضون سنوات قليلة يمكن أن تصبح شركة 4 تريليون دولار أو حتى 5 تريليون دولار. لا تحتاج إلى المقامرة بحياتها وثروتها في منتجات All-In التي تحول نموذج AI-Native ، لأنه على الرغم من أن التحول النموذجي لديه إمكانية تحقيق عوائد عالية ، إلا أنه ينطوي أيضًا على مخاطر عالية. كما أن اختيار استراتيجية منتج Microsoft في عصر الذكاء الاصطناعي العام جدير أيضًا بالرجوع إليه للعديد من الشركات الناضجة في المسار.

** الجزء الثالث: ستة أفكار حول التطوير المستقبلي لمنتجات الذكاء الاصطناعي العام **

** الفكرة الأولى هي 2C أو 2B. ** نظرًا لأن 2C منتج شامل ، يكون مسار المستخدم عادةً قصيرًا نسبيًا ، وهو مناسب جدًا لتحول نموذج الذكاء الاصطناعي الأصلي. ومع ذلك ، نظرًا لطول مسار العميل 2B ، فإن قدرة الذكاء الاصطناعي ليست سوى جزء من الحلقة المغلقة للأعمال بأكملها ، لذا فهي مناسبة للتحسين التدريجي لـ AI-Copilot.

ركز على الفرز حسب القيمة. بالنسبة لمنتجات 2C ، يكون المحتوى أكبر من الخدمة ، والخدمة أكبر من الأداة. هذا المنطق لا ينطبق فقط في عصر الإنترنت لأجهزة الكمبيوتر الشخصية والإنترنت عبر الهاتف المحمول ، ولكن أيضًا في عصر الذكاء الاصطناعي العام. فكر في الأمر ، عندما بدأ عصر الإنترنت عبر الهاتف المحمول لأول مرة ، لم تكن العديد من الأدوات الساخنة ، مثل أدوات تحرير الصور ، وأدوات مكافحة الفيروسات ، وأدوات تدوين الملاحظات ، وما إلى ذلك ، شائعة جدًا ، ولكن أين هي جميعًا اليوم؟ حتى لو كانوا على قيد الحياة ، فإن القيمة الإجمالية أقل بكثير من جميع شركات المحتوى ، مثل Xiaohongshu و Zhihu و Douyin. تشير الخدمات بشكل أساسي إلى المنتجات المرتبطة بخدمات مثل 58 و Ctrip. قيمتها أكبر من الأدوات ، ولكنها أقل من المحتوى. لماذا؟ بكل بساطة ، الوقت الذي يقضيه المستخدمون على المحتوى أطول بكثير من الوقت الذي يقضيه المستخدمون في الخدمات ، والوقت الذي يقضيه المستخدمون على الخدمات أطول بكثير من الوقت الذي يقضيه المستخدمون على المحتوى من حيث الحجم على الإطلاق. تحدد مدة المستخدم أساسًا نطاق قيمة المنتج. لذلك ، في عصر الذكاء الاصطناعي العام ، لا تكن مهووسًا بتلك الأدوات ذات المظهر الرائع ، فقيمتها أقل بكثير من المحتوى أو الخدمات.

ومع ذلك ، فقد تغير منطق القيمة تمامًا في الحقل 2 ب ، فعملية اتخاذ القرار لدى العملاء أكبر من الكفاءة ، والكفاءة أكبر من المحتوى. لا تتابع منتجات Enterprise قدرًا كبيرًا من المحتوى ، ولكنها تتطلب بدلاً من ذلك أقصى قدر من الكفاءة ، فمن الأفضل مساعدتي في اتخاذ قرارات سريعة.

** الاعتبار الثاني هو ما إذا كان يجب أن تكون منصة أو تطبيقًا **. بمجرد أن أصبح النموذج الكبير شائعًا ، اشتعلت أحلام العديد من الأشخاص في المنصة. أعطيت الماء البارد لصديقي الذي بكى وصرخ ليكون منصة نموذجية واسعة النطاق بمجرد وصولي. سأقتبس اقتباسًا حديثًا من مؤسس Midjourney ديفيد هولز. قال إن أكبر درس تعلمه من شركته السابقة ، Leap Motion ، هو أن الجميع بدأ بحلم النظام الأساسي للنظام الإيكولوجي ، ثم فشل. لكنه تعلم هذا الدرس عندما كان يعمل على Midjourney. يجب أن يصنع منتجًا يحبه المستخدمون حقًا ، وأن يجعله تطبيقًا رائعًا أولاً.

في الواقع ، OpenAI هو نفسه ، فهو يمتلك أولاً تطبيقًا فائقًا مثل ChatGPT ، ثم يبني البناء البيئي لـ Plugin و API. وينطبق الشيء نفسه على WeChat ، حيث يحتوي أولاً على بوابات تطبيقات فائقة مثل الدردشة واللحظات والحسابات الرسمية قبل إنشاء بيئة مثل البرامج المصغرة. حتى عندما كان جوبز يعمل على iPhone ، كان لديه في البداية الكثير من الأغاني الجيدة على iTunes ، وذهب إلى Time Warner و Disney و New York Times للتوسل إلى أجداده لإنشاء تطبيقات على iPhone وإقناع العديد من مواقع الويب بالقيام بذلك. حسنًا ، تم تكييف H5 لجعل تصفح مواقع الويب Safari سهل الاستخدام ، ويتمتع iPhone بوضع النظام الأساسي البيئي.

هذا المسار مهم جدًا لأفراد منتجنا. في الآونة الأخيرة ، غالبًا ما أقابل بعض الأشخاص الذين يقولون إن هدفنا هو إنشاء منصة نموذجية كبيرة الحجم XXX. لا يسعني إلا أن أتقيأ. ما هو منتجك الذي لم يتم استخدامه؟ لم يستخدمه أحد من قبل. كيف يمكنني أن أتحلى بالشجاعة لإنشاء منصة؟ هل أعطيتها؟ لن يدعمك أحد لمجرد أنك تدعي أنك منصة. فقط عندما يكون لديك تطبيق فائق ومجموعة مستخدمين ضخمة ، سيكون لديك جاذبية النظام الأساسي ، وسيدعمك الجميع كمنصة.

** الفكرة الثالثة هي UGC VS. AIGC **. اعتاد إنشاء UGC أن يكون إستراتيجية مهمة جدًا في Web 2.0. لكن النموذج الكبير يجلب قدرات AIGC.

UGC عبارة عن شبكة مستخدم نموذجية ذات وجهين ، في حين أن موفر محتوى AIGC ليس مستخدمًا ، ولكنه نموذج + قوة حوسبة + بيانات. هذه عبارة عن دولاب موازنة للبيانات. البداية الباردة لـ UGC صعبة ، لأنه يتعين عليك جمع العديد من المبدعين. لكن AIGC تضع قوة الحوسبة في المقام الأول والنموذج أولاً. تعد UGC منخفضة التكلفة لأنها تتطلب الكثير من الصوف من موفري المحتوى. ومع ذلك ، فإن تكلفة قوة حوسبة AIGC مرتفعة نسبيًا ، خاصة في وقت بدء التشغيل. من ناحية أخرى ، يمتلك UGC خندقًا اجتماعيًا مرتفعًا نسبيًا ، لأنه في بعض الأحيان لا يكون المستخدمون فقط لأنهم يحبون المحتوى ، ولكن لأنهم معجبون بمنشئ المحتوى. ولكن بالنسبة لـ AIGC ، فإن المستخدمين يستهلكون المحتوى ببساطة ، وتكلفة التحويل منخفضة للغاية. إذا فعلت شركة كبيرة شيئًا مشابهًا لشركتك ، ولكن بتكلفة أقل ، فقد ينتقل المستخدمون على الفور لأنه أرخص.

** الفكر الرابع معضلة المبتكر: الابتكار مقابل المحافظ **

في كل مرة يتغير فيها النموذج في التاريخ ، سيواجه العمالقة الراسخون معضلة المبتكر. على سبيل المثال ، بأخذ الوضع الحالي لـ Google كمثال ، استخدمت OpenAI بذكاء "معضلة المبتكر" التي تواجهها Google.

في الواقع ، لا يزال العديد من الأشخاص في Google لا يهتمون كثيرًا بالنماذج الكبيرة مثل GPT ، لأنهم حسبوا داخليًا أنه بالمقارنة مع استعلامات البحث القائمة على الفهرس ، فإن تدريب الشبكة العصبية في ChatGPT مكلف للغاية. يمثل البحث 90٪ من أرباح Google. ما مقدار الإيرادات التي يمكن أن يجلبها نموذج كبير؟ لا يزال مجهولا. لذلك ، يصعب على Google to All في النماذج الكبيرة الآن ، مما يمنح OpenAI فترة جيدة جدًا من الفرص الإستراتيجية. بالإضافة إلى ذلك ، استخدمت OpenAI بذكاء التعاون الاستراتيجي لتمكين Bing من Microsoft لجذب قوة Google النارية في ساحة معركة البحث من خلال GPT ، ولديها الفرصة للعمل معصوب العينين في مجال المنصات البيئية واسعة النطاق. عندما تظهر فرصة النقلة النوعية ، يجب على رواد الأعمال الاستفادة بشكل جيد من "معضلة المبتكر" لمنع العمالقة من مواجهة أنفسهم وجهاً لوجه.

لإعطاء مثال مضاد ، عندما كان Lei Jun يقوم بعمل Michat ، صُدم Tencent بجميع أنواع الدعاية المدمرة للأرض ، لكنه لم يعد تصميمًا استراتيجيًا للتعامل مع المنافسة العملاقة مقدمًا ، لذلك كانت Tencent موحدة ومتحدة في WeChat. في ما يزيد قليلاً عن عام ، قضى على Michat بشكل أساسي. بالطبع ، على العكس من ذلك ، من منظور Tencent ، عندما يحدث التحول النموذجي ، إذا كان بإمكان العمالقة الراسخين إيلاء الاهتمام الكافي والحصول على ما يكفي من الكل ، يمكنهم أيضًا التخلص من مصير "معضلة المبتكر".

** الفكرة الخامسة هي كيف يمكن للذكاء الاصطناعي عبور الهوة **

"عبور الهوة" هو أيضًا كتاب مشهور جدًا. تتطلب الفجوات متعددة المراحل التي يصفها اهتمامًا خاصًا للعديد من المنتجات المبتكرة.

في الوقت الحالي ، من الواضح أن ChatGPT قد عبرت الفجوة الأولى (أي الفجوة الصغيرة بين المبتكرين والمتبنين الأوائل) ، وتجاوز مستخدموها 100 مليون. لكن الفجوة التالية هي أكبر فجوة بين المتبنين الأوائل والأغلبية المبكرة ، ولا يزال ChatGPT يحاول سدها. أنا شخصياً أكثر تفاؤلاً ، على الرغم من أن بياناته الأخيرة تُظهر أن البرنامج المساعد لم يجتاز بعد PMF (مطابقة سوق المنتج). لكن وفقًا لتواصلي مع أفراد OpenAI في وادي السيليكون ، لا يزال لديهم الكثير من القتلة الكبار في الداخل ، خاصة أن قدرتها متعددة الوسائط قوية للغاية ، وتتفوق كثيرًا على Midjourney بلا عقل. إنها فقط ما زالت بحاجة إلى القيام بالكثير من أعمال التوافق مع المواءمة. بالطبع ، لكل منتج فجواته الخاصة التي يجب سدها.

** الفكر السادس أن النموذج الكبير هو مجرد باب للذكاء الاصطناعي **

إذا نظرنا إلى تاريخ صناعة التكنولوجيا بأكملها ، عندما ظهرت العديد من التقنيات لأول مرة ، شعرنا أن التكنولوجيا كانت قوية للغاية. اندفعوا إلى هذه التكنولوجيا ، وانسوا النقلة النوعية في مختلف المجالات التي أحدثتها هذه التكنولوجيا. على سبيل المثال ، عندما ظهرت المتصفحات وخوادم الويب لأول مرة ، اندفع الكثير من الناس ليكونوا متصفحات وخوادم ويب ، لأن العديد من التقنيين اعتقدوا أن المتصفحات وخوادم الويب تمثل الإنترنت. الحرب الأكثر مأساوية هي أن Microsoft استخدمت الشركة بأكملها لتطوير IE و Netscape للاستيلاء على سوق المتصفحات. أنا واضح تمامًا بشأن هذه الفترة من التاريخ ، لأن مارتي كاجان ، وهو صديق قديم لمؤتمر مديري المنتجات العالمية ومؤلف كتاب "نهاية العالم" ، كان نائب الرئيس الأول للمنتجات في Netscape. لقد دعوته إلى الصين عدة مرات من قبل ، وأنا أتحدث كثيرًا عن تاريخ هذه الفترة.

مايكروسوفت ونيتسكيب كلاهما خاسر في هذا الأمر ، لأنهما عندما كانا يتقاتلان ، تجاهلا تمامًا الفرص الإستراتيجية الأكبر بعد دخول البشر إلى الإنترنت سوق خوادم الويب.

الآن بعد أن أصبحت العديد من الشركات تتدفق إلى النماذج الكبيرة ، فمن المحتمل أن تكرر أخطاء المتصفحات وخوادم الويب في ذلك الوقت. وننسى تمامًا أن النموذج الكبير يجلب فرصة هائلة للتحول النموذجي على مستوى الصناعة. بهذا المعنى ، فإن النموذج الكبير هو مجرد باب ، وبعد فتح الباب ، ينتظرنا عالم أكثر إثارة من الذكاء الاصطناعي العام.

حسنًا ، هذه نهاية حديثي اليوم. أتمنى أن يكون المحتوى بأكمله ، وخاصة تحليل ** "Paradigm Transformation Cube" ، أي ParaShift Cub و "Connection and Computing Era" ** مفيدًا لابتكار الجميع وريادة الأعمال في عصر الذكاء الاصطناعي العام. شكرا للجميع!

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت