حل مشكلة النماذج المحلية واسعة النطاق: تجنب "المياه السلبية" ، يحتاج الميل الأخير إلى ربط الخوارزميات والرقائق

المصدر: الورقة

المؤلف: Hu Xiner ، متدرب ، Shao Wen ، مراسل من The Paper

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI

قال داي تشيونغهاي ، الأكاديمي في الأكاديمية الصينية للهندسة: "ينبغي لبلدنا أن تعمق تنمية العاملين بالذكاء الاصطناعي والأبحاث الأساسية من حيث السياسات والآليات والاستثمار ، وتعزيز الابتكار الأصلي ، وتجنب الوقوع في معضلة" الماء ". بدون مصدر ".

أشار وانغ يو ، الأستاذ المعتمد في قسم الهندسة الإلكترونية بجامعة تسينغهوا ، إلى: "هناك بالفعل العديد من شركات الرقائق في شنغهاي ، وهناك أيضًا العديد من الخوارزميات في شنغهاي. كيفية تحقيق نشر فعال وموحد وتشغيل مثل هذه الخوارزميات على الرقائق هي قضية مهمة للغاية. سؤال ".

في 7 يوليو ، في المؤتمر العالمي للذكاء الاصطناعي لعام 2023 ، "فرص تطوير صناعة الذكاء الاصطناعي العامة والمخاطر في عصر النماذج واسعة النطاق" ، ركز عدد من الخبراء في مجال الذكاء الاصطناعي العام على النماذج واسعة النطاق ، على التوالي من الابتكارات الأساسية وتكنولوجيا التطبيق وآفاق المستقبل. مناقشة متعمقة للذكاء الاصطناعي على مستويات أخرى.

"يجب على بلدنا تعميق تدريب المواهب في مجال الذكاء الاصطناعي والبحوث الأساسية من حيث السياسات والآليات والاستثمار ، وتعزيز الابتكار الأصلي ، وتجنب الوقوع في معضلة 'الماء بدون مصدر'." داي تشيونغهاي ، مستشار مجلس الدولة والأكاديمي من الأكاديمية الصينية للهندسة ، وأكد في خطابه الافتتاحي.

قال وانج يو ، الأستاذ الدائم ورئيس قسم الهندسة الإلكترونية بجامعة تسينغهوا ، من منظور تطبيقات الهبوط ، إنه من الصعب حاليًا نشر نماذج واسعة النطاق في المجال الرأسي ، وتواجه النماذج المحلية واسعة النطاق ثلاثة تحديات : ارتفاع تكاليف النشر الميداني ، والفجوة الكبيرة في قوة الحوسبة النموذجية ، واستبدال الرقاقة المحلية أمر صعب. قال وانغ يو: "في الميل الأخير من هبوط النموذج الكبير ، نحتاج إلى ربط الخوارزمية بالشريحة".

** "ذكاء الدماغ هو الاتجاه الجديد للمستقبل" **

يعتقد Dai Qionghai أنه في ابتكار النموذج الكبير "0 إلى 1" ، تكون الإنجازات التخريبية المحلية في مجال البحث الأساسي ضعيفة. "من منظور صناعة التطوير الذكي ، نحن متفائلون وغير متفائلين." في رأيه ، تتركز معظم مواهب الذكاء الاصطناعي في الصين في طبقة التطبيق ، لذلك هناك مجال كبير لسيناريوهات التطبيق وطبقات التكنولوجيا. ومع ذلك ، من الواضح أن الصين في وضع غير مؤات من حيث المواهب على المستوى الأساسي ، وتفتقر إلى الابتكار الأصلي.

قال Dai Qionghai أن ابتكار وتطوير الذكاء الاصطناعي يتطلب ثلاث ركائز ، وهي الخوارزميات والبيانات وقوة الحوسبة. تحدد الخوارزميات مستوى الذكاء ، وتحدد البيانات نطاق الذكاء ، وتحدد قوة الحوسبة كفاءة الذكاء. على مستوى الخوارزمية ، من المتوقع أن تصبح النماذج الكبيرة منصة أساسية أساسية في تطبيقات الذكاء الاصطناعي في غضون خمس سنوات تقريبًا.

كما أشار Dai Qionghai إلى أن ذكاء الدماغ هو اتجاه جديد في المستقبل. تعد خوارزمية الذكاء الاصطناعي الجديدة التي تدمج الدماغ والإدراك في طليعة تخطيط الصناعة وستقود جيلًا جديدًا من الذكاء. واقترح في المنتدى أن الحكومة يجب أن تشجع الشركات على قيادة بناء نماذج واسعة النطاق ، واستكشاف مزيج من الآليات البيولوجية وخصائص الماكينة ، وإنشاء نماذج جديدة للذكاء الاصطناعي ، وتعزيز البحث الأساسي وتوسيع التطبيقات في وقت واحد. ويتوقع أن يتم تطبيق الذكاء الاصطناعي مع الذكاء المعرفي باعتباره جوهره بعد عشر سنوات.

بالإضافة إلى ذلك ، يعتقد Dai Qionghai أنه من الضروري توخي اليقظة بشأن القضايا الأمنية لتطبيقات النماذج واسعة النطاق. النماذج الكبيرة ليست قادرة بعد على مصادقة المخرجات مثل إنشاء محتوى مخادع. "هذا يعني أنه بمجرد حدوث مشكلة في تطبيق النموذج الكبير ، فإن الأمر ليس بهذه البساطة مثل فيروس شبكة الكمبيوتر الحالي ، ما عليك سوى قتل الفيروس وقتله ، والذي سيكون له تأثير تخريبي. لذلك ، عندما يكون النموذج الكبير المطبقة ، يجب الجمع بين الأمان والموثوقية. نوقشت المصداقية بوضوح ".

** يجب أن تركز النماذج المحلية واسعة النطاق على حل نقاط الضعف الأربع **

قال وانغ يو في المنتدى ، "شنغهاي قلقة للغاية بشأن الذكاء الاصطناعي والرقائق ، ولكن من منظور آخر ، تخضع نماذجنا الأكثر تقدمًا وقوة الحوسبة المهمة نسبيًا لقيود معينة. يجب أن تكون قوتنا الحاسوبية أكثر في الاتجاه الذي يجب أن نسير فيه ، كيفية التعويض بشكل أفضل عن قوة الحوسبة المحلية ، وكيفية دعم تطوير البلد في تدريب نموذج كبير والتفكير باستخدام مثل هذه المساحة ، أصبحت هذه القضايا في غاية الأهمية ".

ذكر وانغ يو أيضًا أنه حاليًا في البلدان الأجنبية ، يمكن لـ Nvidia و AMD فقط اختيار الرقائق ذات قوة الحوسبة الكبيرة. تهيمن Nvidia على السوق ، كما أن نظام برمجياتها الإيكولوجي جيد نسبيًا. "لذا فإن العديد من النماذج الأجنبية ، مثل OpenAI و Microsoft و Google ، تشتري رقائق Nvidia بكميات كبيرة ، ثم تطورها فوق إطار عمل برمجيات Nvidia. البيئة الأجنبية بسيطة للغاية. تقوم الشركات بعمل جيد في الخوارزميات. في في هذا المجال ، يتم دعم النشر بواسطة نظام برمجيات Nvidia. "

"ومع ذلك ، لا يزال تطوير رقائق طاقة الحوسبة الكبيرة في الصين في مهده." يعتقد وانغ يو ، "هناك بالفعل العديد من شركات الرقائق في شنغهاي ، مثل Tianshu Zhixin ، Suiyuan Technology ، Cambrian ، Biren Technology ، إلخ. أيضًا في شنغهاي. الخوارزميات ، وكيفية تحقيق نشر فعال وموحد ، وكيفية تشغيل مثل هذه الخوارزميات على الرقائق هي مسألة مهمة للغاية. "

في الوقت نفسه ، أكد وانغ يو أنه من الصعب جدًا نشر نماذج واسعة النطاق في المجال الرأسي في الوقت الحالي ، وتواجه النماذج المحلية واسعة النطاق ثلاثة تحديات رئيسية: ارتفاع تكاليف النشر الميداني ، وفجوة كبيرة في قوة الحوسبة النموذجية ، وصعوبة استبدال الرقائق المحلية.

"يختلف عن نموذج في عصر AI 1.0 السابق لمهمة محددة ، فإن عصر AI 2.0 الحالي هو نموذج يحل العديد من المهام ، ويجب تحسين طبقة التطبيق وطبقة الخوارزمية وطبقة النظام بشكل تعاوني." في نهاية هبوط النموذج الكبير على بعد كيلومتر واحد ، يجب أن تركز النماذج المحلية واسعة النطاق على حل أربع نقاط ضعف.

"نحتاج أولاً إلى التعامل مع مشكلة النص الطويل ، أي استخدامه جيدًا." قال وانغ يو إن الاتجاه الحالي للخوارزميات هو زيادة طول النص المدعوم بالنماذج الكبيرة ، ولكن النص الطويل سيؤدي أيضًا إلى زيادة في الحمل المحول (نموذج التعلم العميق الذي طورته Google ، والذي طور OpenAI من خلاله GPT) يزداد الحمل على البنية بشكل كبير مع زيادة المدخلات. لذلك ، يعد تعديل النص الطويل مطلبًا بالغ الأهمية.

مطلب آخر للنماذج الكبيرة هو تحسين أداء التكلفة. "إذا استخدمت Google نموذجًا كبيرًا في محرك البحث الخاص بها ، فستزيد التكاليف بمقدار 36 مليار دولار أمريكي ، وقد تخسر أرباحها بنسبة 65٪." قال وانغ يو إنه إذا تمكنت الشركة من تقليل تكلفة النقرة ، فإن الخسارة الإجمالية من الأرباح. التحرك في هذا الاتجاه ، من المتوقع أن يتمكن الجميع من تحمل تكلفة النماذج الكبيرة.

بالإضافة إلى ذلك ، تحتاج النماذج الكبيرة إلى تمكين مجموعة متنوعة من المجالات الرأسية. بالنسبة لجميع مناحي الحياة ، لا يوجد العديد من النماذج الكبيرة التي لديها الكثير من المعرفة. لا سيما في مجالات مثل الرعاية الطبية والتمويل ، فإن الحصول على بيانات المجموعة أمر مكلف ونادر للغاية. "إذا كان بإمكانك إضافة نموذج أساسي للأغراض العامة وضبطه ، فمن المتوقع أن يتحسن الأداء الأساسي لمختلف الصناعات." لكن وانغ يو أشار أيضًا إلى أنه إذا تطور في المجال الرأسي ، فإن الغرض العام يجب ضبط النموذج الكبير بدقة ، وكلما كان النموذج أكبر ، تزداد تكلفة الضبط بشكل كبير أيضًا. لذلك ، فإن كيفية تصميم خوارزمية ضبط فعالة هي موضوع يجب مناقشته.

في الوقت نفسه ، تجلب النماذج الكبيرة أيضًا متطلبات جديدة للنشر الشامل. في تحسين البرامج والأجهزة ، إذا تم نشر تحسين المشغل ، وتحسين التجميع ، ونشر الأجهزة في طبقات ، فسيلزم ما مجموعه 100 قوة عاملة يوميًا ، بينما للنشر الآلي الشامل ، يتطلب الأمر 10 قوى عاملة فقط يوميًا. أشار وانغ يو إلى أن النشر الشامل يمكن أن يحسن تكاليف العمالة ، ويزيد من حجم مساحة تحسين التجميع ، ومن المتوقع أن يعزز تطوير السلسلة الصناعية بأكملها.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت