سيبدأ النصف الثاني من "حرب نموذج 100" ، وستصبح المنصة هي المفتاح

المصدر الأصلي: تيتانيوم ميديا

مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود

لقد مر ما يقرب من عام منذ أن دخل النموذج الكبير مجال رؤية الناس ، وتحت موجة الذكاء الاصطناعي النماذج الكبيرة ، سارعت شركات التكنولوجيا الكبرى إلى إطلاق منتجات النماذج الكبيرة الخاصة بها. في الوقت نفسه ، تولي الشركات في مختلف الصناعات اهتماما وثيقا للنماذج الكبيرة.

إذا قيل إن وضع الشركات المصنعة الكبرى التي تطلق منتجات نموذجية واسعة النطاق لتشكيل "حرب 100 نموذج" هي النصف الأول من "معركة" النماذج الكبيرة ، فإن النصف الثاني من هذه "المعركة" سيركز أكثر على قدرة تكامل المنتجات النموذجية واسعة النطاق ، وكذلك اتجاه تطوير المنصة والتصنيع.

**النصف الثاني من اللعبة ، ستصبح المنصة والتصنيع المسار الرئيسي **

بأخذ ChatGPT ، "منشئ" النموذج الكبير ، فإن ChatGPT هو تطبيق ويمكن اعتباره تطبيقا ، في حين أن GPT4 هو نموذج كبير ، يبني بيئة مشابهة لنموذج كبير ، بحيث يمكن للمؤسسات بناء نماذجها الكبيرة بناء على ذلك.

من الحالات المذكورة أعلاه ، يمكن ملاحظة أنه في العام الماضي تقريبا ، ركزت جميع الشركات على تلميع المنتجات المشابهة ل "ChatGPT" ، والهبوط على جانب التطبيق ، بينما بالنسبة لجانب المؤسسة ، لا تزال الصناعة تفتقر إلى منصة تسمح للمؤسسات بالاتصال بمرونة بكل منتج نموذجي كبير ، أو فتح نموذج كبير لاحتياجاتهم الخاصة بناء على منتج معين. وفقا ل Li Gang ، نائب الرئيس وكبير مسؤولي التكنولوجيا في Digital China ، إذا أراد نموذج كبير تحقيق انفجار التطبيقات على جانب المؤسسة ، فإنه يحتاج إلى منصة واحدة أو حتى عدة منصات نموذجية كبيرة مفتوحة المصدر ومفتوحة.

عندما يتعلق الأمر بتطبيق النماذج الكبيرة على مستوى المؤسسة ، يجب أن نذكر نموذج الصناعة الكبير ، وجدت مراقبة وسائط التيتانيوم أن النموذج الكبير الحالي على مستوى الصناعة لا يزال في المرحلة الأولى من التطوير ، على الرغم من وجود العديد من الشركات التي أطلقت نموذج الصناعة الكبير ، لكن التطبيق ليس جيدا جدا.

إذا أخذنا الصناعة المالية سريعة النمو كمثال ، في مارس من هذا العام ، أطلقت بلومبرج BloombergGPT ، وهو نموذج لغوي كبير للصناعة المالية ، والذي جذب انتباه السوق إلى النماذج الكبيرة في القطاعات المالية ، وفي يونيو ، أطلقت جامعة كولومبيا وجامعة نيويورك شنغهاي FinGPT.

في الصين ، في يوليو ، أصدرت Huawei طراز Pangu ، أحدها واحد من عدة نماذج على مستوى الصناعة. في سبتمبر ، أصدرت Ant Group رسميا "نموذج Ant الأساسي" الذي طورته ذاتيا و "نموذج Ant المالي" المخصص على هذا الأساس.

أخبر لي قانغ Titanium Media أن أنواع النماذج الكبيرة في السوق تنقسم بشكل أساسي إلى عدة فئات ، إحداها هي النموذج الأساسي العام ، بشكل عام ، تقوم هذه النماذج الكبيرة ببناء قاعدة بيانات من خلال مجموعة اللغة الطبيعية ، وبعد التنظيف والتدريب والعمليات الأخرى ، يتم إنشاء النموذج الأساسي الكبير ، "هذا النوع من النماذج ، كلما زاد حجم الجسم ، زاد عدد المعلمات ، زادت القدرة". قال لي قانغ.

النوع الآخر هو نموذج الصناعة ، وهو محترف للغاية ويتطلب عددا كبيرا من قواعد المعرفة الصناعية ، "في الوقت الحاضر ، يجب التحكم في مجموعة قاعدة معارف الصناعة هذه بنسبة 20٪ ، لا أكثر ولا أقل". وأكد لي قانغ أنه "إذا تجاوزت 20٪ ، فقد لا يكون النموذج الكبير المدرب" قادرا على الكلام "، مما يتسبب في حواجز الاتصال ، وقد لا يتمتع أقل من 20٪ باحترافية الصناعة." "

**طبقة "PaaS" لبناء نماذج كبيرة **

تماما كما تنقسم الحوسبة السحابية إلى IaaS و PaaS و SaaS ، من وجهة نظر Huang Fu Ziqiao ، المدير العام لقسم التسويق الاستراتيجي في Digital China ، في عصر النماذج الكبيرة ، تحتاج الشركات أيضا إلى منصة PaaS مماثلة لعصر السحابة.

من أجل بناء منصة للمؤسسات لاستخدام النماذج الكبيرة بشكل أفضل ، أصدرت Digital China مؤخرا رسميا منصة Shenzhou Wenxue ، متحدثا عن أهمية إصدار النظام الأساسي ، قال Li Gang ل Titanium Media: "مع منصة Shenzhou Wenxue كجوهر ، نحن لا نفعل النموذج الكبير الأساسي ، ولكن منصة التكامل وتطوير التطبيقات وتسليمها للنموذج الكبير ، وذلك لتسريع الابتكار الذكاء الاصطناعي للمؤسسات ؛ نحن شريك خدمة البيانات الضخمة ، وذلك لتسريع ترقية حوكمة بيانات المؤسسة ؛ نحن نفعل العلاقات البيئية ، والأسواق النموذجية ، وأسواق البيانات ، متجر التطبيقات ، وذلك لتسريع الابتكار الصناعي والاختراق البيئي. "

في بداية هذا العام ، أصدرت HUAWEI CLOUD نموذج Pangu الكبير وصنفته وفقا ل L0 و L1 و L2. وفقا ل HUAWEI CLOUD ، يشير L0 إلى النموذج الأساسي ، ويشير L1 إلى نموذج الصناعة ، ويشير L2 إلى نموذج الاستدلال لمزيد من السيناريوهات المقسمة.

من حيث النماذج الكبيرة الأساسية ، مع أخذ نموذج شبكة الرسم البياني الكبير كمثال ، يمكن تكييف النموذج الكبير مع سيناريوهات متعددة مثل تحسين العملية والتنبؤ بالسلاسل الزمنية والتحليل الذكي ، ويمكن تطبيقه على صناعات متعددة مثل التمويل وتعدين الفحم والتصنيع.

وفيما يتعلق بنماذج الصناعة، أطلقت HUAWEI CLOUD نماذج صناعية مثل نموذج بانغو المالي، ونموذج بانغو ماين، ونموذج بانغو للطاقة الكهربائية، ونموذج بانغو لفحص جودة التصنيع، ونموذج بانغو للجزيء الصيدلاني.

فيما يتعلق بنماذج الاستدلال ، على سبيل المثال ، استنادا إلى نموذج الطاقة Pangu ، أطلقت HUAWEI CLOUD نموذج Pangu لفحص الطاقة لسيناريوهات تقسيم الطاقة بدون طيار من خلال التدريب المسبق + الضبط الدقيق للمهام النهائية ، مما يحل مشاكل تعلم العينات الصغيرة والتعلم النشط والتعلم التدريجي في نظام الفحص الذكي للطائرات بدون طيار (اكتشاف العيوب) ، ويحل مشاكل عبء العمل الكبير للتعليقات التوضيحية الضخمة للبيانات ومجموعة متنوعة من العيوب.

ما سبق هو فهم HUAWEI CLOUD للنماذج الكبيرة وبعض تخطيطات صناعة HUAWEI CLOUD. وبناء على ذلك ، أخبر Huangfu Ziqiao Titanium Media أن منصة التعلم Digital China ستلعب دور "المحول" في مساعدة الشركات على الهبوط من سيناريوهات تطبيقات الصناعة L0 إلى L2 ، "مما يوفر للشركات القدرة على توفير منصة PaaS مماثلة لعصر الحوسبة السحابية." وقال هوانغفو زيتشياو.

من قبيل الصدفة ، صرح رئيس قسم التكنولوجيا في Baidu Wang Haifeng علنا أنه في مواجهة التحدي المتمثل في تصنيع النماذج على نطاق واسع ، تحتاج الصناعة إلى نموذج مسبك رقائق مماثل لاعتماد نموذج "الإنتاج المكثف والتطبيق القائم على المنصة" ، أي أن الشركات ذات المزايا الشاملة في الخوارزميات وقوة الحوسبة والبيانات ستغلف العملية المعقدة لإنتاج النماذج ، وتوفر خدمات نموذجية واسعة النطاق لآلاف الصناعات من خلال منصة إنتاج منخفضة العتبة وعالية الكفاءة.

وفقا ل Titanium Media ، في الوقت الحاضر ، تم التحقق من مسار التصنيع هذا في ممارسة صناعة النماذج الكبيرة Wenxin و Baidu والعديد من الشركات الرائدة في الصناعة والمؤسسات لبناء نموذج كبير بما في ذلك الطاقة والتمويل والفضاء والتصنيع والإعلام والمدينة والعلوم الاجتماعية والسينما والتلفزيون وغيرها من الصناعات.

** التكلفة المنخفضة والعتبة المنخفضة هي الهدف **

على الرغم من أن النماذج الكبيرة قد تغلغلت تدريجيا في جميع مناحي الحياة ، من حيث تطوير نماذج كبيرة في هذه المرحلة ، فإن تكلفة استخدام النماذج الكبيرة لا تزال باهظة بالنسبة للعديد من الشركات للمستخدمين على مستوى المؤسسة.

بأخذ GPT-3 كمثال ، كشفت Nvidia أن الأمر يستغرق 34 يوما لتدريب GPT-3 مع 175 مليار معلمة ، باستخدام 1،024 شريحة A100 GPU ، وتكلفة تدريب واحد تصل إلى 12 مليون دولار. لتدريب نماذج الذكاء الاصطناعي واسعة النطاق ، قامت Microsoft ببناء أحد أفضل خمسة أجهزة كمبيوتر عملاقة في العالم ل OpenAI.

في الوقت نفسه ، وفقا لتقرير Guosheng Securities "مقدار قوة الحوسبة التي تحتاجها ChatGPT" ، فإن تكلفة ما قبل التدريب للنماذج الكبيرة مرتفعة للغاية ، حيث تتجاوز تكلفة التدريب الواحد مليون دولار أمريكي. لا تغطي هذه الرسوم بنية النموذج واختيار الخوارزمية واختيار بيانات التدريب فحسب ، بل تشمل أيضا الكمية الكبيرة من موارد الحوسبة والوقت اللازم لتدريب النموذج. ومع ترقية إصدار النموذج الكبير ، تزداد تكلفة التدريب أيضا بشكل كبير.

كما أشار روبن لي ، المؤسس ورئيس مجلس الإدارة والرئيس التنفيذي لشركة بايدو: "لا يمكن لأي شركة أن تصنع مثل هذا النموذج اللغوي الكبير في غضون بضعة أشهر". يتطلب التعلم العميق ومعالجة اللغة الطبيعية سنوات من المثابرة والتراكم ، ولا يمكن تحقيقه بسرعة. "

في مواجهة هذه التكلفة العالية لاستخدام نموذج كبير واستخدام العتبة ، فإنه لا يمكن تحمله بالنسبة للمؤسسات العادية ، ولهذا السبب بالتحديد ، لا يوجد حتى الآن هبوط مثالي حقيقي لمنتجات النماذج الكبيرة في الصناعة. في هذا الصدد ، قال Huangfu Ziqiao أن تكلفة استخدام النماذج الكبيرة هي أكبر عقبة أمام العديد من الشركات لتطبيق نماذج كبيرة لتمكين أعمالها ، وأن وضع منصة Shenzhou Wenxue هو السماح للشركات باستخدام منتجات النماذج الكبيرة بتكلفة اختيار أقل من خلال المصدر المفتوح. "هناك جزءان رئيسيان ، أحدهما هو النظام الأساسي ، والآخر هو تطبيق السيناريو الجاهز. وقال هوانغفو زيتشياو لتيتانيوم ميديا: "من ناحية ، يأمل هذان الجزءان في جمع المزيد من الشركاء البيئيين لتمكين المستخدمين بشكل مشترك ، ومن ناحية أخرى ، يأملون أن تتمكن الشركات من استخدام المنتجات النموذجية واسعة النطاق بشكل أسرع وأكثر ملاءمة." "

إنه الإجماع في الصناعة على تقليل تكلفة وعتبة النماذج الكبيرة ، سواء كان من الصعب العثور على وحدة معالجة الرسومات ، أو فواتير الكهرباء المرتفعة ، والتي هي عتبات الشركات لتطبيق نماذج كبيرة في هذه المرحلة ، ومثل Shenzhou Wenxue و Baidu Qianfan و Kunlun Wanwei وما إلى ذلك ، "أنماط مختلفة" ، ولكن نفس الهدف - ظهور منتجات على مستوى النظام الأساسي "تساعد النماذج الكبيرة على الأرض" ، بالإضافة إلى العدد المتزايد من الشركاء في النظام البيئي للنموذج الكبير ، سيتم تخفيض عتبة وتكلفة النماذج الكبيرة لتطبيق المؤسسة. سنقترب أيضا أكثر فأكثر من شمولية نموذج الصناعة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت