* مصدر الصورة: تم إنشاؤه بواسطة أداة Unbounded AI *
عندما أطلق ChatGPT جنونًا عالميًا ، ارتفع نموذج الذكاء الاصطناعي الذي يقف وراءه فجأة. الكل يريد أن يعرف ما هي أبعاد ومعايير تقييم مستوى نموذج كبير؟
إطلاق ChatGPT يسمح لنا برؤية الفجوة بين الصين والولايات المتحدة في AIGC ، إذن ، ما هو وضع التنمية الحالي لنموذج الصين الكبير؟ ما هي الفرص والتحديات التي سيواجهها تطوير نموذج الصين واسع النطاق في المستقبل؟
نحن الآن في فترة حرجة لتطوير الذكاء الاصطناعي العام.في مواجهة اتجاه التنمية للبحث المستقل على النماذج الكبيرة من قبل مختلف المؤسسات ، كيف نحسن كفاءة قوة الحوسبة وتجنب الازدواجية منخفضة المستوى بشكل فعال؟
يشعر بعض العاملين في الصناعة بالقلق من أن الذكاء الاصطناعي سيدمر البشر ، فهل هذا مقلق لا أساس له من الصحة؟ كيف يمكننا منع المشاكل قبل حدوثها ، وإدراك النتائج المتوقعة والسلوك الذي يمكن التحكم فيه للذكاء الاصطناعي؟
مع أسئلة مختلفة حول AIGC ، أجرى معهد أبحاث تينسنت مقابلة حصرية مع وو هيكان ، وهو أكاديمي في الأكاديمية الصينية للهندسة وخبير موثوق في مجال الاتصالات في بلدي. **
** 【المحاور】 **
** نيو فوليان ** باحث أول ، معهد تينسنت للأبحاث
** وو تشونلينج ** باحث أول في معهد تينسنت للأبحاث
** وانغ تشيانغ ** كبير الخبراء في معهد أبحاث تينسنت
(المشار إليها فيما يلي باسم T)
** الحجم الإجمالي لقوة الحوسبة الحالية في الصين مقارنة بالولايات المتحدة: هناك فجوة ولكنها ليست كبيرة **
** ت: يقول بعض الناس إن تطوير نموذج الصين واسع النطاق يتأخر من سنة إلى سنتين عن الدول الأجنبية ، ما رأيك في التطور الحالي للنماذج الصينية واسعة النطاق؟ **
** وو هيكان: ** بدأت الصين بعد الولايات المتحدة في تطوير نماذج واسعة النطاق. بعد ظهور ChatGPT ، عبرت العديد من الوحدات المحلية عن تطوير نماذج إنتاجية واسعة النطاق. في الوقت الحالي ، لا يوجد سوى عدد قليل شركات مثل Microsoft و Google في الولايات المتحدة. مقارنة بأبحاث النماذج واسعة النطاق ، فإن بلدي لديه عدد أكبر من الوحدات التي تطور نماذج واسعة النطاق مقارنة بالولايات المتحدة ، ولكن العدد الكبير من الموضوعات البحثية لا يعني أن الصين لديها نسبة عالية مستوى البحث والتطوير في النماذج واسعة النطاق. يُقال أن عدد المعلمات لنموذج محلي كبير يصل إلى 1.75 تريليون ، متجاوزًا GPT-4 ، لكن لا توجد تقارير عن تطبيقه. ** على الرغم من ادعاء بعض الشركات الصينية إطلاق روبوتات محادثة مشابهة لـ ChatGPT ، إلا أنها حاليًا ليست بجودة ChatGPT من حيث الدعم متعدد اللغات ، ولا تزال هناك فجوة من حيث سرعة الاستجابة فيما يتعلق بقدرات الحوار الصيني. **
** نلاحظ فقط ChatGPT الآن ، والذي يستهدف المهام التوليدية ويكمل بشكل أساسي توليد اللغة مثل الدردشة والكتابة. يولي نموذج BERT من Google مزيدًا من الاهتمام للحكم واتخاذ القرار ، مع التركيز على فهم اللغة مثل الإجابة على الأسئلة واستخراج العلاقة الدلالية. مهمة ، تستحق تقنية نموذج BERT اهتمامنا أيضًا. ** يجب أن يكون تقييم مستوى النماذج الكبيرة متعدد الأبعاد ، والشمولية ، والعقلانية ، وسهولة الاستخدام ، وسرعة الاستجابة ، والتكلفة ، وكفاءة الطاقة ، وما إلى ذلك. ** بشكل عام ، الفجوة بين تطوير النماذج واسعة النطاق في بلدي والبلدان الأجنبية هو 1-2 سنوات الأساس لا يزال غير واضح ، وليس من المجدي استخلاص هذا الاستنتاج الآن. **
تتمتع الشركات الصينية بمزايا طبيعية على الشركات الأجنبية في الحصول على المعلومات الصينية وفهم الثقافة الصينية. ** تمتلك الصين أكثر فئات التصنيع اكتمالًا ولديها ظروف مواتية لتدريب AIGC للصناعات الحقيقية. فيما يتعلق بقوة الحوسبة ، تمتلك الصين بالفعل أساسًا جيدًا. ** وفقًا لتقرير OpenAI ، فإن قوة الحوسبة المطلوبة لتدريب نموذج GPT3 تصل إلى 3.64 فليب / يوم ، وهو ما يعادل 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II هي 1Eflops ، أي عشرات من بلايين من حسابات الفاصلة العائمة في الثانية). ** وفقًا لبيانات نهاية عام 2022 ، تمثل الولايات المتحدة 36٪ من قوة الحوسبة العالمية ، وتمثل الصين 31٪. ومن بينها ، تعد الصين أعلى بكثير من الولايات المتحدة (وفقًا للبيانات الموجودة في نهاية عام 2021 ، يمثل حجم الحوسبة الذكية في الولايات المتحدة 15٪ من الحجم الإجمالي للحوسبة الذكية العالمية ، وتمثل الصين 26٪). إن بلدي ليس فقط شركة إنترنت كبيرة تتمتع بقوة حوسبة كبيرة ، ولكن أيضًا تتمتع المعامل والمختبرات الوطنية التي تدعمها بعض حكومات المدن أيضًا بموارد طاقة حاسوبية واسعة النطاق ، ويمكن القول إن الصين يمكنها أيضًا تحقيق دعم قوة الحوسبة المطلوبة لتدريب النماذج الكبيرة. ** من المفهوم أن Pengcheng Lab يصمم Pengcheng Cloud Brain III ، التي تتمتع بقوة حوسبة تبلغ 16EFlops ، وهي أعلى بثلاث مرات من تلك الموجودة في GPT-3. ومن المتوقع أن تكلف 6 مليارات يوان وستستمر في توفير حوسبة قوية قوة لتدريب الذكاء الاصطناعي.دعم قوي.
** البحث والتطوير في الصين AIGC: الحاجة إلى التعرف على الفجوة والتركيز على التحديات والابتكار **
** T: بالإضافة إلى مؤسستنا الجيدة في قوة الحوسبة ، ما هي التحديات التي تعتقد أنها تواجه بناء نموذج واسع النطاق في الصين؟ **
** وو هيكان: قوة الحوسبة وحدها لا تكفي ، وما زلنا نواجه العديد من التحديات في الجوانب التالية: **
** أولاً وقبل كل شيء ، أساس النموذج الكبير هو إطار التعلم العميق. تعمل Tensorflow و PyTorch في الولايات المتحدة على تنمية بيئة إطار التعلم العميق لسنوات عديدة. وعلى الرغم من أن الشركات المحلية طورت أيضًا إطار عمل التعلم العميق بشكل مستقل ، فإن لا يكفي اختبار السوق ، ولا تزال البيئة بحاجة إلى البناء.
** ثانيًا ، قد يتطلب توسيع نطاق AIGC ليشمل التطبيقات الصناعية أكثر من نموذج واحد كبير.إن كيفية دمج العديد من النماذج الكبيرة بكفاءة تواجه تحديات في توحيد المعايير ودمج البيانات.
** ثالثًا ** ، النماذج الكبيرة تتطلب تدريبًا هائلًا على البيانات. تمتلك الصين آلاف السنين من الحضارة ، لكن معظم الرواسب الثقافية الثرية لم يتم تحويلها رقميًا.الصين أقل من 0.1٪ من المجموعة المستخدمة في تدريب ChatGPT. على الرغم من أن شركات الإنترنت في بلدي لديها قدر كبير من بيانات الشبكة مثل التجارة الإلكترونية والشبكات الاجتماعية والبحث ، فإن أنواع البيانات المعنية ليست شاملة بما يكفي ، ومصداقية المعرفة عبر الإنترنت تفتقر إلى الضمانات الصارمة. المجموعة التي يمكن استخدامها التدريب باللغة الصينية لا يزال بحاجة إلى الكثير من أعمال التعدين.
** رابعًا ** ، يتم تمثيل شريحة وحدة معالجة الرسومات (GPU) التي يعتمد عليها نموذج التدريب الكبير بشريحة Nvidia's A100 ، ولكن تم تقييد الشريحة من تصديرها إلى الصين من قبل الولايات المتحدة ، ويحتاج أداء وحدات معالجة الرسومات المحلية إلى مزيد من الاختبارات. هناك لا يزال هناك فجوة في الكفاءة.
** خامسًا ** ، لا يوجد عدد قليل من الفنيين المشاركين في أبحاث الذكاء الاصطناعي في الصين ، ولكن لا يزال هناك نقص في المواهب ذات قدرات التصميم المعماري ومحفزات التدريب على بيانات AIGC. قبل ظهور ChatGPT ، اعتقد بعض الناس أن عدد الأوراق وبراءات الاختراع في الصين في مجال الذكاء الاصطناعي يمكن مقارنته بعدد الولايات المتحدة. ** جعلنا إطلاق ChatGPT نرى الفجوة بين الصين والولايات المتحدة في AIGC. الآن نحن بحاجة إلى أن نفهم بوضوح التحديات التي نواجهها وأن ننتبه إليها ، ونصنع ابتكارات حقيقية ، ونحول التحديات إلى فرص ، ونساهم الصين في الجولة الجديدة من مسار الذكاء الاصطناعي. **
** يوصى بفتح النظام الأساسي الوطني للقدرة الحاسوبية لدعم مختلف نماذج التدريب على نطاق واسع **
** T: إن ChatGPT هو بلا شك ابتكار ضخم ، فكيف ينبغي للصين أن تشجع مثل هذه الابتكارات في المستقبل ، وما هي جوانب العمل التي يجب أن تفعلها؟ **
** وو هيكان: ** يعد تطوير الذكاء الاصطناعي من التمييز إلى التوليدي ابتكارًا بارزًا ، وقد بدأ يدخل في مسار الذكاء الاصطناعي العام. من GPT-3 إلى GPT-4 ، تم تطويره من إدخال النص إلى الإدخال الجزئي للرسومات ، أي أنه زاد من القدرة على فهم الرسومات. على هذا الأساس ، ليس بعيدًا تنفيذ بنية التعلم العميق ونموذج عام لدعم إدخال البيانات متعدد الوسائط. نعم ، ولكن تعميم المهام للنماذج الكبيرة وصقل الاستدعاء عند الطلب للنماذج الكبيرة لا يزالان يتطلبان قدرًا أكبر من الاستثمار والابتكار. تعد البيانات غير المسماة وغير الخاضعة للإشراف للرسومات ومقاطع الفيديو أكثر صعوبة من اللغة وإدخال النص.
نحن الآن في فترة حرجة من التطور نحو الذكاء الاصطناعي العام ، وبالنسبة لبلدنا ، فهذه فرصة نادرة لتحقيق قفزات في التنمية وأيضًا تحدٍ خطير. تعد قوة الحوسبة والنماذج والبيانات الشروط اللازمة لنجاح ChatGPT وستكون أيضًا عوامل أساسية لنجاح الذكاء الاصطناعي العام.بالإضافة إلى ذلك ، فإن البيئة والآليات والمواهب الأكثر ابتكارًا هي المفتاح. يمكن مقارنة الصين بالولايات المتحدة من حيث الحجم الإجمالي لقوة الحوسبة ، لكن تنسيق قوة الحوسبة عبر مراكز البيانات لا يزال يواجه تحديات مؤسسية ، ومعدل استخدام وكفاءة قوة الحوسبة في العديد من مراكز الحوسبة الذكية ليست عالية. ** العديد من الوحدات تبحث عن نماذج كبيرة بشكل مستقل ولا مفر من تكرارها بمستوى منخفض ** يوصى بتشكيل قوة مشتركة بتقسيم معقول للعمل بتنسيق علمي وتقني وطني وخطط صناعية. يوصى بفتح منصة طاقة الحوسبة للمختبر الوطني لدعم مختلف نماذج التدريب على نطاق واسع. ** على سبيل المثال ، وصلت قوة الحوسبة لـ Pengcheng Cloud Brain إلى 3/4 من السعة الإجمالية ، والتي يمكن أن تدعم مقياس 200 مليار معلمة قابلة للمقارنة بـ GPT-3. نموذج كبير للغة الصينية مفتوحة المصدر مُدرَّبة مسبقًا. ** في الوقت نفسه ، يوصى بتشكيل تحالف قوة الحوسبة لتركيز موارد طاقة الحوسبة لوحدات معالجة الرسومات المتطورة الحالية وتوفير قوة الحوسبة المطلوبة للتدريب على بيانات النماذج واسعة النطاق. ** حاليًا ، تم توصيل "شبكة طاقة الحوسبة الصينية (C2NET)" التي تم بناؤها بشكل أساسي بواسطة مختبر Pengcheng بأكثر من 20 مركزًا للحوسبة الذكية والحوسبة الفائقة ومراكز البيانات ، وقد وصلت قوة الحوسبة غير المتجانسة المجمعة إلى 3EFlops. تتجاوز قوة حوسبة الذكاء الاصطناعي المطورة ذاتيًا 1.8 ضعفًا. بالإضافة إلى ذلك ، فإن تطبيق روبوتات المحادثة ليس سوى طريقة بديهية لتدريب واختبار AIGC ، ولكن الدردشة ليست ضرورية فقط.من الضروري تطوير نماذج مختلفة لتطبيقات الصناعة على أساس النماذج الكبيرة ، وذلك لجعل النماذج الكبيرة فعالة في الصناعة بأسرع وقت ممكن ، قم بتنمية المواهب في تطبيق كل مناحي الحياة. **
** تتطلب تطبيقات الصناعة ذات النماذج الكبيرة مواهب شاملة تفهم تكنولوجيا الصناعة والتدريب على الذكاء الاصطناعي على حدٍ سواء **
** T: لقد رأينا حتى الآن تطبيق ChatGPT في بعض المجالات ، مثل روبوتات الدردشة وإنشاء النصوص والتعرف على الكلام. هل ستكون هناك بعض فرص التطبيق في الصناعة المادية والميدان في المستقبل؟ ما هي العقبات التي لا تزال تواجه تطبيق النماذج الكبيرة في الصناعة المادية؟ **
** Wu Hequan: ** استنادًا إلى روبوتات الدردشة ChatGPT الحالية ، بعد استكمال التدريب المعرفي للصناعة والمؤسسات ذات الصلة ، يمكنهم القيام بأعمال خدمة العملاء الذكية في المؤسسات ، واستبدال العمال لتزويد العملاء بخدمات ما قبل البيع وما بعد البيع. في عملية التصميم والتصنيع التي تتطلب برمجة البرامج ، يمكن لـ ChatGPT استبدال المبرمجين لإكمال مهام البرمجة والتحقق من أخطاء البرامج. يمكن أن تتولى جمع وترجمة وترتيب الوثائق والمواد المطلوبة في عملية التصميم والإنتاج. بعد التدريب الاحترافي ، يمكن استخدام النماذج الكبيرة الشبيهة بـ AIGC لتصميم برامج EDA ، مثل برنامج الأدوات لتصميم الدوائر المتكاملة. في شركات الرسوم المتحركة والألعاب ، يمكن للروبوتات المدربة على نماذج كبيرة تشبه AIGC كتابة نصوص ، وإنشاء نصوص ألعاب وبرمجتها وفقًا للمطالبات ، وإكمال عرض الرسوم المتحركة ثلاثية الأبعاد.
ومع ذلك ، فإن ChatGPT ليس نموذجًا عامًا ، ومن الصعب تطبيقه بشكل مباشر على عملية التصنيع الخاصة بالصناعة الحقيقية. ومع ذلك ، يمكن أن يعتمد على مبدأ تدريب ChatGPT واستخدام الرسم البياني المعرفي للصناعات والمؤسسات من أجل- تدريب عميق.من الممكن تطوير نموذج كبير مخصص للمؤسسات لإكمال ذلك. يتمثل التحدي في المهمة الأولى في الحاجة إلى مواهب ليست فقط على دراية بعملية تحميل المؤسسة وتقنية الارتباط الرئيسية ، ولكن أيضًا إتقان تدريب البيانات الضخمة على الذكاء الاصطناعي تكنولوجيا.
** من التركيز على النتائج إلى التركيز على العملية ، يهيمن تكامل التكنولوجيا والنظام القانوني على عملية التفكير في AIGC **
** T: سترتكب ChatGPT أيضًا العديد من الأخطاء ، وستجلب أيضًا بعض المشكلات الأخلاقية والأمنية والخصوصية. عند تطبيق النماذج الكبيرة في المستقبل ، كيف يمكننا إنشاء بيئة شاملة وآمنة وتنموية؟ **
** وو هيكان: ** دفع ظهور الذكاء الاصطناعي التوليدي انتباه المجتمع إلى الذكاء الاصطناعي إلى مستوى غير مسبوق. وبينما أدى إلى طفرة في أبحاث الذكاء الاصطناعي في الأوساط العلمية والصناعية ، يشعر العديد من الخبراء بالقلق من أن الذكاء الاصطناعي سيدمر البشر والأشخاص. دعوة لإيقاف البحث عن GPT-5. مخاوف بعض الخبراء لا أساس لها من الصحة ، لأن عملية التفكير في روبوتات ChatGPT غير شفافة حاليًا. لقد أنشأ البشر ChatGPT ، لكن البشر في الوقت الحالي لا يفهمون تمامًا عملية التفكير الخاصة به. سيكون المجهول لا يمكن السيطرة عليه ، وهناك مخاطر من شذوذ الروبوت والشذوذ الأخلاقي والسلوك خارج نطاق السيطرة.
** لا يكمن الحل في التوقف عن البحث عن الذكاء الاصطناعي ، ولكن التركيز على أبحاث AIGC بدلاً من التركيز على النتائج والتصميم وقيادة عملية التفكير ، بحيث يمكن توقع النتائج والتحكم في السلوكيات. ** يتطلب الترويج للنموذج الكبير وتطبيقه في المستقبل تقييمًا آمنًا وموثوقًا من قبل مؤسسة مؤهلة ، ويمكن تتبع عملية التفكير الخاصة بالنموذج الكبير بعد الفحص. في الوقت نفسه ، من الضروري وضع قوانين ولوائح حوكمة للذكاء الاصطناعي مقابلة لمنع التدريب المضلل لـ AIGC ، ومحاسبة موضوعات تدريب AIGC ، ومعاقبة جرائم التحريض والتحريض بشدة. من خلال تكامل التكنولوجيا والنظام القانوني ، أصبح الذكاء الاصطناعي مساعدًا مخلصًا حقًا للبشر.
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
مقابلة Tengyan | الأكاديمي Wu Hequan: مزايا وتحديات ومسارات الابتكار لتطوير نموذج الصين واسع النطاق
عندما أطلق ChatGPT جنونًا عالميًا ، ارتفع نموذج الذكاء الاصطناعي الذي يقف وراءه فجأة. الكل يريد أن يعرف ما هي أبعاد ومعايير تقييم مستوى نموذج كبير؟
إطلاق ChatGPT يسمح لنا برؤية الفجوة بين الصين والولايات المتحدة في AIGC ، إذن ، ما هو وضع التنمية الحالي لنموذج الصين الكبير؟ ما هي الفرص والتحديات التي سيواجهها تطوير نموذج الصين واسع النطاق في المستقبل؟
نحن الآن في فترة حرجة لتطوير الذكاء الاصطناعي العام.في مواجهة اتجاه التنمية للبحث المستقل على النماذج الكبيرة من قبل مختلف المؤسسات ، كيف نحسن كفاءة قوة الحوسبة وتجنب الازدواجية منخفضة المستوى بشكل فعال؟
يشعر بعض العاملين في الصناعة بالقلق من أن الذكاء الاصطناعي سيدمر البشر ، فهل هذا مقلق لا أساس له من الصحة؟ كيف يمكننا منع المشاكل قبل حدوثها ، وإدراك النتائج المتوقعة والسلوك الذي يمكن التحكم فيه للذكاء الاصطناعي؟
مع أسئلة مختلفة حول AIGC ، أجرى معهد أبحاث تينسنت مقابلة حصرية مع وو هيكان ، وهو أكاديمي في الأكاديمية الصينية للهندسة وخبير موثوق في مجال الاتصالات في بلدي. **
** 【المحاور】 **
** نيو فوليان ** باحث أول ، معهد تينسنت للأبحاث
** وو تشونلينج ** باحث أول في معهد تينسنت للأبحاث
** وانغ تشيانغ ** كبير الخبراء في معهد أبحاث تينسنت
(المشار إليها فيما يلي باسم T)
** الحجم الإجمالي لقوة الحوسبة الحالية في الصين مقارنة بالولايات المتحدة: هناك فجوة ولكنها ليست كبيرة **
** ت: يقول بعض الناس إن تطوير نموذج الصين واسع النطاق يتأخر من سنة إلى سنتين عن الدول الأجنبية ، ما رأيك في التطور الحالي للنماذج الصينية واسعة النطاق؟ **
** وو هيكان: ** بدأت الصين بعد الولايات المتحدة في تطوير نماذج واسعة النطاق. بعد ظهور ChatGPT ، عبرت العديد من الوحدات المحلية عن تطوير نماذج إنتاجية واسعة النطاق. في الوقت الحالي ، لا يوجد سوى عدد قليل شركات مثل Microsoft و Google في الولايات المتحدة. مقارنة بأبحاث النماذج واسعة النطاق ، فإن بلدي لديه عدد أكبر من الوحدات التي تطور نماذج واسعة النطاق مقارنة بالولايات المتحدة ، ولكن العدد الكبير من الموضوعات البحثية لا يعني أن الصين لديها نسبة عالية مستوى البحث والتطوير في النماذج واسعة النطاق. يُقال أن عدد المعلمات لنموذج محلي كبير يصل إلى 1.75 تريليون ، متجاوزًا GPT-4 ، لكن لا توجد تقارير عن تطبيقه. ** على الرغم من ادعاء بعض الشركات الصينية إطلاق روبوتات محادثة مشابهة لـ ChatGPT ، إلا أنها حاليًا ليست بجودة ChatGPT من حيث الدعم متعدد اللغات ، ولا تزال هناك فجوة من حيث سرعة الاستجابة فيما يتعلق بقدرات الحوار الصيني. **
** نلاحظ فقط ChatGPT الآن ، والذي يستهدف المهام التوليدية ويكمل بشكل أساسي توليد اللغة مثل الدردشة والكتابة. يولي نموذج BERT من Google مزيدًا من الاهتمام للحكم واتخاذ القرار ، مع التركيز على فهم اللغة مثل الإجابة على الأسئلة واستخراج العلاقة الدلالية. مهمة ، تستحق تقنية نموذج BERT اهتمامنا أيضًا. ** يجب أن يكون تقييم مستوى النماذج الكبيرة متعدد الأبعاد ، والشمولية ، والعقلانية ، وسهولة الاستخدام ، وسرعة الاستجابة ، والتكلفة ، وكفاءة الطاقة ، وما إلى ذلك. ** بشكل عام ، الفجوة بين تطوير النماذج واسعة النطاق في بلدي والبلدان الأجنبية هو 1-2 سنوات الأساس لا يزال غير واضح ، وليس من المجدي استخلاص هذا الاستنتاج الآن. **
تتمتع الشركات الصينية بمزايا طبيعية على الشركات الأجنبية في الحصول على المعلومات الصينية وفهم الثقافة الصينية. ** تمتلك الصين أكثر فئات التصنيع اكتمالًا ولديها ظروف مواتية لتدريب AIGC للصناعات الحقيقية. فيما يتعلق بقوة الحوسبة ، تمتلك الصين بالفعل أساسًا جيدًا. ** وفقًا لتقرير OpenAI ، فإن قوة الحوسبة المطلوبة لتدريب نموذج GPT3 تصل إلى 3.64 فليب / يوم ، وهو ما يعادل 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II هي 1Eflops ، أي عشرات من بلايين من حسابات الفاصلة العائمة في الثانية). ** وفقًا لبيانات نهاية عام 2022 ، تمثل الولايات المتحدة 36٪ من قوة الحوسبة العالمية ، وتمثل الصين 31٪. ومن بينها ، تعد الصين أعلى بكثير من الولايات المتحدة (وفقًا للبيانات الموجودة في نهاية عام 2021 ، يمثل حجم الحوسبة الذكية في الولايات المتحدة 15٪ من الحجم الإجمالي للحوسبة الذكية العالمية ، وتمثل الصين 26٪). إن بلدي ليس فقط شركة إنترنت كبيرة تتمتع بقوة حوسبة كبيرة ، ولكن أيضًا تتمتع المعامل والمختبرات الوطنية التي تدعمها بعض حكومات المدن أيضًا بموارد طاقة حاسوبية واسعة النطاق ، ويمكن القول إن الصين يمكنها أيضًا تحقيق دعم قوة الحوسبة المطلوبة لتدريب النماذج الكبيرة. ** من المفهوم أن Pengcheng Lab يصمم Pengcheng Cloud Brain III ، التي تتمتع بقوة حوسبة تبلغ 16EFlops ، وهي أعلى بثلاث مرات من تلك الموجودة في GPT-3. ومن المتوقع أن تكلف 6 مليارات يوان وستستمر في توفير حوسبة قوية قوة لتدريب الذكاء الاصطناعي.دعم قوي.
** البحث والتطوير في الصين AIGC: الحاجة إلى التعرف على الفجوة والتركيز على التحديات والابتكار **
** T: بالإضافة إلى مؤسستنا الجيدة في قوة الحوسبة ، ما هي التحديات التي تعتقد أنها تواجه بناء نموذج واسع النطاق في الصين؟ **
** وو هيكان: قوة الحوسبة وحدها لا تكفي ، وما زلنا نواجه العديد من التحديات في الجوانب التالية: **
** أولاً وقبل كل شيء ، أساس النموذج الكبير هو إطار التعلم العميق. تعمل Tensorflow و PyTorch في الولايات المتحدة على تنمية بيئة إطار التعلم العميق لسنوات عديدة. وعلى الرغم من أن الشركات المحلية طورت أيضًا إطار عمل التعلم العميق بشكل مستقل ، فإن لا يكفي اختبار السوق ، ولا تزال البيئة بحاجة إلى البناء.
** ثانيًا ، قد يتطلب توسيع نطاق AIGC ليشمل التطبيقات الصناعية أكثر من نموذج واحد كبير.إن كيفية دمج العديد من النماذج الكبيرة بكفاءة تواجه تحديات في توحيد المعايير ودمج البيانات.
** ثالثًا ** ، النماذج الكبيرة تتطلب تدريبًا هائلًا على البيانات. تمتلك الصين آلاف السنين من الحضارة ، لكن معظم الرواسب الثقافية الثرية لم يتم تحويلها رقميًا.الصين أقل من 0.1٪ من المجموعة المستخدمة في تدريب ChatGPT. على الرغم من أن شركات الإنترنت في بلدي لديها قدر كبير من بيانات الشبكة مثل التجارة الإلكترونية والشبكات الاجتماعية والبحث ، فإن أنواع البيانات المعنية ليست شاملة بما يكفي ، ومصداقية المعرفة عبر الإنترنت تفتقر إلى الضمانات الصارمة. المجموعة التي يمكن استخدامها التدريب باللغة الصينية لا يزال بحاجة إلى الكثير من أعمال التعدين.
** رابعًا ** ، يتم تمثيل شريحة وحدة معالجة الرسومات (GPU) التي يعتمد عليها نموذج التدريب الكبير بشريحة Nvidia's A100 ، ولكن تم تقييد الشريحة من تصديرها إلى الصين من قبل الولايات المتحدة ، ويحتاج أداء وحدات معالجة الرسومات المحلية إلى مزيد من الاختبارات. هناك لا يزال هناك فجوة في الكفاءة.
** خامسًا ** ، لا يوجد عدد قليل من الفنيين المشاركين في أبحاث الذكاء الاصطناعي في الصين ، ولكن لا يزال هناك نقص في المواهب ذات قدرات التصميم المعماري ومحفزات التدريب على بيانات AIGC. قبل ظهور ChatGPT ، اعتقد بعض الناس أن عدد الأوراق وبراءات الاختراع في الصين في مجال الذكاء الاصطناعي يمكن مقارنته بعدد الولايات المتحدة. ** جعلنا إطلاق ChatGPT نرى الفجوة بين الصين والولايات المتحدة في AIGC. الآن نحن بحاجة إلى أن نفهم بوضوح التحديات التي نواجهها وأن ننتبه إليها ، ونصنع ابتكارات حقيقية ، ونحول التحديات إلى فرص ، ونساهم الصين في الجولة الجديدة من مسار الذكاء الاصطناعي. **
** يوصى بفتح النظام الأساسي الوطني للقدرة الحاسوبية لدعم مختلف نماذج التدريب على نطاق واسع **
** T: إن ChatGPT هو بلا شك ابتكار ضخم ، فكيف ينبغي للصين أن تشجع مثل هذه الابتكارات في المستقبل ، وما هي جوانب العمل التي يجب أن تفعلها؟ **
** وو هيكان: ** يعد تطوير الذكاء الاصطناعي من التمييز إلى التوليدي ابتكارًا بارزًا ، وقد بدأ يدخل في مسار الذكاء الاصطناعي العام. من GPT-3 إلى GPT-4 ، تم تطويره من إدخال النص إلى الإدخال الجزئي للرسومات ، أي أنه زاد من القدرة على فهم الرسومات. على هذا الأساس ، ليس بعيدًا تنفيذ بنية التعلم العميق ونموذج عام لدعم إدخال البيانات متعدد الوسائط. نعم ، ولكن تعميم المهام للنماذج الكبيرة وصقل الاستدعاء عند الطلب للنماذج الكبيرة لا يزالان يتطلبان قدرًا أكبر من الاستثمار والابتكار. تعد البيانات غير المسماة وغير الخاضعة للإشراف للرسومات ومقاطع الفيديو أكثر صعوبة من اللغة وإدخال النص.
نحن الآن في فترة حرجة من التطور نحو الذكاء الاصطناعي العام ، وبالنسبة لبلدنا ، فهذه فرصة نادرة لتحقيق قفزات في التنمية وأيضًا تحدٍ خطير. تعد قوة الحوسبة والنماذج والبيانات الشروط اللازمة لنجاح ChatGPT وستكون أيضًا عوامل أساسية لنجاح الذكاء الاصطناعي العام.بالإضافة إلى ذلك ، فإن البيئة والآليات والمواهب الأكثر ابتكارًا هي المفتاح. يمكن مقارنة الصين بالولايات المتحدة من حيث الحجم الإجمالي لقوة الحوسبة ، لكن تنسيق قوة الحوسبة عبر مراكز البيانات لا يزال يواجه تحديات مؤسسية ، ومعدل استخدام وكفاءة قوة الحوسبة في العديد من مراكز الحوسبة الذكية ليست عالية. ** العديد من الوحدات تبحث عن نماذج كبيرة بشكل مستقل ولا مفر من تكرارها بمستوى منخفض ** يوصى بتشكيل قوة مشتركة بتقسيم معقول للعمل بتنسيق علمي وتقني وطني وخطط صناعية. يوصى بفتح منصة طاقة الحوسبة للمختبر الوطني لدعم مختلف نماذج التدريب على نطاق واسع. ** على سبيل المثال ، وصلت قوة الحوسبة لـ Pengcheng Cloud Brain إلى 3/4 من السعة الإجمالية ، والتي يمكن أن تدعم مقياس 200 مليار معلمة قابلة للمقارنة بـ GPT-3. نموذج كبير للغة الصينية مفتوحة المصدر مُدرَّبة مسبقًا. ** في الوقت نفسه ، يوصى بتشكيل تحالف قوة الحوسبة لتركيز موارد طاقة الحوسبة لوحدات معالجة الرسومات المتطورة الحالية وتوفير قوة الحوسبة المطلوبة للتدريب على بيانات النماذج واسعة النطاق. ** حاليًا ، تم توصيل "شبكة طاقة الحوسبة الصينية (C2NET)" التي تم بناؤها بشكل أساسي بواسطة مختبر Pengcheng بأكثر من 20 مركزًا للحوسبة الذكية والحوسبة الفائقة ومراكز البيانات ، وقد وصلت قوة الحوسبة غير المتجانسة المجمعة إلى 3EFlops. تتجاوز قوة حوسبة الذكاء الاصطناعي المطورة ذاتيًا 1.8 ضعفًا. بالإضافة إلى ذلك ، فإن تطبيق روبوتات المحادثة ليس سوى طريقة بديهية لتدريب واختبار AIGC ، ولكن الدردشة ليست ضرورية فقط.من الضروري تطوير نماذج مختلفة لتطبيقات الصناعة على أساس النماذج الكبيرة ، وذلك لجعل النماذج الكبيرة فعالة في الصناعة بأسرع وقت ممكن ، قم بتنمية المواهب في تطبيق كل مناحي الحياة. **
** تتطلب تطبيقات الصناعة ذات النماذج الكبيرة مواهب شاملة تفهم تكنولوجيا الصناعة والتدريب على الذكاء الاصطناعي على حدٍ سواء **
** T: لقد رأينا حتى الآن تطبيق ChatGPT في بعض المجالات ، مثل روبوتات الدردشة وإنشاء النصوص والتعرف على الكلام. هل ستكون هناك بعض فرص التطبيق في الصناعة المادية والميدان في المستقبل؟ ما هي العقبات التي لا تزال تواجه تطبيق النماذج الكبيرة في الصناعة المادية؟ **
** Wu Hequan: ** استنادًا إلى روبوتات الدردشة ChatGPT الحالية ، بعد استكمال التدريب المعرفي للصناعة والمؤسسات ذات الصلة ، يمكنهم القيام بأعمال خدمة العملاء الذكية في المؤسسات ، واستبدال العمال لتزويد العملاء بخدمات ما قبل البيع وما بعد البيع. في عملية التصميم والتصنيع التي تتطلب برمجة البرامج ، يمكن لـ ChatGPT استبدال المبرمجين لإكمال مهام البرمجة والتحقق من أخطاء البرامج. يمكن أن تتولى جمع وترجمة وترتيب الوثائق والمواد المطلوبة في عملية التصميم والإنتاج. بعد التدريب الاحترافي ، يمكن استخدام النماذج الكبيرة الشبيهة بـ AIGC لتصميم برامج EDA ، مثل برنامج الأدوات لتصميم الدوائر المتكاملة. في شركات الرسوم المتحركة والألعاب ، يمكن للروبوتات المدربة على نماذج كبيرة تشبه AIGC كتابة نصوص ، وإنشاء نصوص ألعاب وبرمجتها وفقًا للمطالبات ، وإكمال عرض الرسوم المتحركة ثلاثية الأبعاد.
ومع ذلك ، فإن ChatGPT ليس نموذجًا عامًا ، ومن الصعب تطبيقه بشكل مباشر على عملية التصنيع الخاصة بالصناعة الحقيقية. ومع ذلك ، يمكن أن يعتمد على مبدأ تدريب ChatGPT واستخدام الرسم البياني المعرفي للصناعات والمؤسسات من أجل- تدريب عميق.من الممكن تطوير نموذج كبير مخصص للمؤسسات لإكمال ذلك. يتمثل التحدي في المهمة الأولى في الحاجة إلى مواهب ليست فقط على دراية بعملية تحميل المؤسسة وتقنية الارتباط الرئيسية ، ولكن أيضًا إتقان تدريب البيانات الضخمة على الذكاء الاصطناعي تكنولوجيا.
** من التركيز على النتائج إلى التركيز على العملية ، يهيمن تكامل التكنولوجيا والنظام القانوني على عملية التفكير في AIGC **
** T: سترتكب ChatGPT أيضًا العديد من الأخطاء ، وستجلب أيضًا بعض المشكلات الأخلاقية والأمنية والخصوصية. عند تطبيق النماذج الكبيرة في المستقبل ، كيف يمكننا إنشاء بيئة شاملة وآمنة وتنموية؟ **
** وو هيكان: ** دفع ظهور الذكاء الاصطناعي التوليدي انتباه المجتمع إلى الذكاء الاصطناعي إلى مستوى غير مسبوق. وبينما أدى إلى طفرة في أبحاث الذكاء الاصطناعي في الأوساط العلمية والصناعية ، يشعر العديد من الخبراء بالقلق من أن الذكاء الاصطناعي سيدمر البشر والأشخاص. دعوة لإيقاف البحث عن GPT-5. مخاوف بعض الخبراء لا أساس لها من الصحة ، لأن عملية التفكير في روبوتات ChatGPT غير شفافة حاليًا. لقد أنشأ البشر ChatGPT ، لكن البشر في الوقت الحالي لا يفهمون تمامًا عملية التفكير الخاصة به. سيكون المجهول لا يمكن السيطرة عليه ، وهناك مخاطر من شذوذ الروبوت والشذوذ الأخلاقي والسلوك خارج نطاق السيطرة.
** لا يكمن الحل في التوقف عن البحث عن الذكاء الاصطناعي ، ولكن التركيز على أبحاث AIGC بدلاً من التركيز على النتائج والتصميم وقيادة عملية التفكير ، بحيث يمكن توقع النتائج والتحكم في السلوكيات. ** يتطلب الترويج للنموذج الكبير وتطبيقه في المستقبل تقييمًا آمنًا وموثوقًا من قبل مؤسسة مؤهلة ، ويمكن تتبع عملية التفكير الخاصة بالنموذج الكبير بعد الفحص. في الوقت نفسه ، من الضروري وضع قوانين ولوائح حوكمة للذكاء الاصطناعي مقابلة لمنع التدريب المضلل لـ AIGC ، ومحاسبة موضوعات تدريب AIGC ، ومعاقبة جرائم التحريض والتحريض بشدة. من خلال تكامل التكنولوجيا والنظام القانوني ، أصبح الذكاء الاصطناعي مساعدًا مخلصًا حقًا للبشر.