بينما يتم تنفيذ الذكاء الاصطناعي (AI) بشكل متزايد في مجالات رئيسية مثل الرعاية الصحية والمالية والقيادة الذاتية، فإن ضمان موثوقية وشفافية وأمان عملية استدلال التعلم الآلي (ML) أصبح أكثر أهمية من أي وقت مضى.
ومع ذلك، غالبًا ما تعمل خدمات تعلم الآلة التقليدية مثل "الصندوق الأسود"، حيث يمكن للمستخدمين رؤية النتائج فقط ويجدون صعوبة في التحقق من العملية. تجعل هذه الافتقار إلى الشفافية خدمات النموذج عرضة للمخاطر:
تم سرقة النموذج,
تم التلاعب بنتيجة الاستدلال بشكل خبيث,
بيانات المستخدم معرضة لانتهاكات الخصوصية.
يوفر ZKML (تعلم الآلة باستخدام zk-SNARKs) حلاً تشفيرياً جديداً لهذه التحديات. يعتمد على تقنية zk-SNARKs، مما يمنح نماذج تعلم الآلة القدرة على أن تكون مشفرة بشكل يمكن التحقق منه: إثبات أن عملية حسابية قد تم تنفيذها بشكل صحيح دون كشف أي معلومات حساسة.
بعبارة أخرى، تسمح الأدلة بدون معرفة لمزودي الخدمة بإثبات للمستخدمين أن:
"النتائج الاستنتاجية التي حصلت عليها قد تم توليدها بالفعل بواسطة النموذج المدرب الذي قمت بتشغيله - لكنني لن أفصح عن أي معلمات نموذج."
هذا يعني أن المستخدمين يمكنهم الثقة في صحة نتائج الاستدلال، بينما تظل هيكل النموذج والمعلمات (التي غالبًا ما تكون أصولًا ذات قيمة عالية) خاصة.
يجمع zkPyTorch بين القدرات القوية للتعلم الآلي لـ PyTorch ومحركات zk-SNARKs المتطورة، مما يسمح لمطوري الذكاء الاصطناعي ببناء تطبيقات ذكاء اصطناعي قابلة للتحقق في بيئة مألوفة دون تغيير عادات البرمجة الخاصة بهم أو تعلم لغة ZK جديدة تمامًا.
يمكن لهذا المترجم ترجمة عمليات النموذج عالية المستوى (مثل الالتفاف، ضرب المصفوفات، ReLU، softmax، وآليات الانتباه) تلقائيًا إلى دوائر ZKP القابلة للتحقق بشكل مشفر. يجمع بين مجموعة تحسين ZKML التي طورتها Polyhedra ذاتيًا لضغط وتسريع مسارات الاستدلال الرئيسية بذكاء، مما يضمن صحة وكفاءة حسابية لكل من الدوائر.
يواجه نظام التعلم الآلي الحالي تحديات متعددة مثل أمان البيانات، والتحقق الحسابي، وشفافية النموذج. خاصة في الصناعات الحيوية مثل الرعاية الصحية والتمويل والقيادة الذاتية، لا تتضمن نماذج الذكاء الاصطناعي كمية كبيرة من المعلومات الشخصية الحساسة فحسب، بل تحمل أيضًا ملكية فكرية ذات قيمة عالية وأسرار تجارية أساسية.
لقد برز تعلم الآلة بدون معرفة (ZKML) كاختراق مهم في معالجة هذه المعضلة. من خلال تقنية دليل بدون معرفة (ZKP) ، يمكن لـ ZKML إكمال التحقق من نزاهة استدلال النموذج دون الكشف عن معلمات النموذج أو بيانات الإدخال - مما يحمي الخصوصية مع ضمان الثقة.
لكن في الواقع، غالبًا ما يكون تطوير دليل بدون معرفة عاليًا، حيث يتطلب خلفية عميقة في التشفير، وهو بعيد عن ما يمكن لمهندسي الذكاء الاصطناعي التقليديين التعامل معه بسهولة.
هذه هي بالضبط مهمة zkPyTorch. إنه يبني جسرًا بين PyTorch ومحرك ZKP، مما يسمح للمطورين بإنشاء أنظمة ذكاء اصطناعي مع حماية الخصوصية و إمكانية التحقق باستخدام كود مألوف، دون الحاجة إلى إعادة تعلم لغات التشفير المعقدة.
من خلال zkPyTorch، تقوم شبكة Polyhedra بخفض الحواجز التقنية لـ ZKML بشكل كبير، مما يدفع تطبيقات الذكاء الاصطناعي القابلة للتوسع والموثوقة نحو التيار الرئيسي، ويعيد بناء نموذج جديد لأمان وخصوصية الذكاء الاصطناعي.
الشكل 1: نظرة عامة على بنية ZKPyTorch الكلية
كما هو موضح في الشكل 1، يقوم zkPyTorch بتحويل نماذج PyTorch القياسية تلقائيًا إلى دوائر متوافقة مع دليل بدون معرفة (zk-SNARKs) من خلال ثلاث وحدات مصممة بعناية. تشمل هذه الوحدات الثلاث: وحدة المعالجة المسبقة، وحدة التكميم الصديقة لدليل بدون معرفة، ووحدة تحسين الدائرة.
لا تتطلب هذه العملية من المطورين إتقان أي دوائر تشفيرية أو بناء جملة متخصصة: يحتاج المطورون فقط إلى كتابة النماذج باستخدام PyTorch القياسي، ويمكن لـ zkPyTorch تحويلها إلى دوائر يمكن التعرف عليها بواسطة محركات دليل بدون معرفة مثل Expander، مما يولد دليل ZK المقابل.
يقلل هذا التصميم القابل للتعديل بشكل كبير من عتبة تطوير ZKML، مما يسمح لمطوري الذكاء الاصطناعي ببناء تطبيقات تعلم الآلة بكفاءة وأمان وقابلية للتحقق بسهولة دون الحاجة إلى تغيير اللغات أو تعلم التشفير.
في المرحلة الأولى، سيحول zkPyTorch نموذج PyTorch إلى رسم بياني للعمليات الهيكلية باستخدام تنسيق تبادل الشبكات العصبية المفتوحة (ONNX). ONNX هو معيار تمثيل وسيط معتمد على نطاق واسع في الصناعة يمكنه تمثيل العمليات المعقدة المختلفة في التعلم الآلي بشكل موحد. من خلال هذه الخطوة المسبقة، يتمكن zkPyTorch من توضيح هيكل النموذج وتفكيك عملية الحساب الأساسية، مما يضع أساسًا قويًا لتوليد دوائر zk-SNARKs في الخطوات التالية.
وحدة التكميم هي مكون رئيسي في نظام ZKML. تعتمد نماذج التعلم الآلي التقليدية على العمليات العائمة، بينما يكون بيئة ZKP أكثر ملاءمة لعمليات الأعداد الصحيحة في الحقول المنتهية. تعتمد zkPyTorch مخطط تكميم صحيح مخصص للحقول المنتهية، مما يتيح رسم العمليات العائمة بدقة إلى عمليات الأعداد الصحيحة، بينما تحول العمليات غير الخطية التي لا تفيد ZKP (مثل ReLU و Softmax) إلى أشكال فعالة من جداول البحث.
لا تقلل هذه الاستراتيجية من تعقيد الدوائر فحسب، بل تعزز أيضًا قابلية التحقق العامة للنظام وكفاءته التشغيلية مع ضمان دقة النموذج.
تتبنى zkPyTorch استراتيجية متعددة المستويات لتحسين الدائرة، وتشمل على وجه التحديد:
تحسين دفعي
مصمم خصيصًا للحساب المتسلسل، يقلل بشكل كبير من تعقيد الحساب واستهلاك الموارد من خلال معالجة خطوات الاستدلال المتعددة في آن واحد، مما يجعله مناسبًا بشكل خاص لسيناريوهات التحقق من نماذج اللغة الكبيرة مثل المحولات.
تسريع عملية اللغة الأصلية
من خلال الجمع بين تحويل فورييه السريع (FFT) والالتفاف مع تكنولوجيا جدول البحث، يتم تعزيز سرعة تنفيذ العمليات الأساسية مثل الالتفاف وSoftmax بشكل فعال، مما يحسن بشكل أساسي الكفاءة الحسابية العامة.
تنفيذ الدائرة المتوازية
استفد بشكل كامل من مزايا القوة الحاسوبية لوحدات المعالجة المركزية متعددة النواة ووحدات معالجة الرسومات من خلال تقسيم الحسابات الثقيلة مثل ضرب المصفوفات إلى مهام فرعية متعددة للتنفيذ المتوازي، مما يحسن بشكل كبير من سرعة وقابلية توسيع توليد دليل بدون معرفة.
تستخدم zkPyTorch رسمًا بيانيًا موجهًا غير دوري (DAG) لإدارة تدفق الحسابات في التعلم الآلي. يقوم هيكل DAG بالتقاط اعتمادات النموذج المعقدة بشكل منهجي، كما هو موضح في الشكل 2، حيث يمثل كل عقدة عملية محددة (مثل تحويل المصفوفات، ضرب المصفوفات، القسمة، وSoftmax)، وتصف الحواف بدقة تدفق البيانات بين هذه العمليات.
تمثل هذه الصورة الواضحة والمنظمة ليس فقط تسهيلاً كبيرًا لعملية تصحيح الأخطاء ولكنها تساعد أيضًا في تحسين الأداء بشكل عميق. الطبيعة غير الدائرية لـ DAG تتجنب الاعتماديات الدائرية، مما يضمن تنفيذًا فعالًا وقابلًا للتحكم في ترتيب الحساب، وهو أمر حاسم لتحسين توليد دوائر zk-SNARKs.
بالإضافة إلى ذلك، يمكّن DAG zkPyTorch من التعامل بكفاءة مع هياكل النماذج المعقدة مثل Transformers وResidual Networks (ResNet)، والتي غالبًا ما تحتوي على تدفقات بيانات معقدة غير خطية ومتعددة المسارات. يتماشى تصميم DAG تمامًا مع احتياجاتهم الحاسوبية، مما يضمن دقة وكفاءة استدلال النموذج.
الشكل 2: مثال على نموذج تعلم الآلة ممثل كرسوم بيانية موجهة غير دورية (DAG)
في zkPyTorch، تعتبر تقنيات التكميم المتقدمة خطوة أساسية في تحويل العمليات الحسابية ذات النقطة العائمة إلى عمليات صحيحة مناسبة للحسابات الفعالة في الحقول المحدودة في أنظمة دليل بدون معرفة (ZKP). يستخدم zkPyTorch طريقة تكميم صحيحة ثابتة، مصممة بعناية لتحقيق التوازن بين الكفاءة الحسابية ودقة النموذج، مما يضمن أن توليد الإثباتات يكون سريعًا ودقيقًا.
تتضمن عملية التكميم هذه معايرة صارمة لتحديد مقياس التكميم الأمثل بدقة لتمثيل الأعداد العائمة بشكل فعال، وتجنب الفائض وفقدان الدقة الكبير. لمعالجة تحديات العمليات غير الخطية الفريدة لدليل بدون معرفة (مثل Softmax وتطبيع الطبقة)، يقوم zkPyTorch بتحويل هذه الوظائف المعقدة بشكل مبتكر إلى عمليات بحث فعالة في الجداول.
تعمل هذه الاستراتيجية ليس فقط على تحسين كفاءة توليد الأدلة بشكل كبير، ولكنها أيضًا تضمن أن نتائج الأدلة المولدة تتوافق تمامًا مع مخرجات النماذج الكمية عالية الدقة، مما يوازن بين الأداء والمصداقية، ويدفع التطبيق العملي لتعلم الآلة القابل للتحقق.
تعتمد zkPyTorch على نظام تحسين دائري متعدد الطبقات متطور للغاية، مما يضمن الأداء النهائي للاستدلال بدون معرفة من حيث الكفاءة وقابلية التوسع من أبعاد متعددة:
تحسين معالجة الدفعات
من خلال تجميع مهام الاستدلال المتعددة في معالجة دفعات، يتم تقليل التعقيد الحسابي العام بشكل كبير، مما يجعله مناسبًا بشكل خاص للعمليات المتسلسلة في نماذج اللغة مثل Transformers. كما هو موضح في الشكل 3، تعمل عملية الاستدلال التقليدية لنماذج اللغة الكبيرة (LLM) بطريقة توليد رمز تلو الآخر، بينما تجمع طريقة zkPyTorch المبتكرة جميع الرموز المدخلة والمخرجة في عملية تنبيه واحدة للتحقق. يمكن أن تؤكد هذه الطريقة في المعالجة على صحة استدلال LLM بشكل عام دفعة واحدة، مع ضمان أن كل رمز مخرج متسق مع استدلال LLM القياسي.
في استدلال LLM، فإن صحة آلية ذاكرة التخزين المؤقت KV (ذاكرة التخزين المؤقت للمفتاح والقيمة) هي المفتاح لضمان موثوقية مخرجات الاستدلال. إذا كانت منطق استدلال النموذج غير صحيح، حتى مع التخزين المؤقت، فإنه لا يمكنه إعادة إنتاج نتائج متسقة مع عملية فك التشفير القياسية. يضمن zkPyTorch أن كل مخرج في zk-SNARKs له حتمية قابلة للتحقق واكتمال من خلال تكرار هذه العملية بدقة.
الشكل 3: التحقق من الدفعات لنماذج اللغة الكبيرة (LLMs)، حيث L تمثل طول تسلسل الإدخال، وN تمثل طول تسلسل الإخراج، وH تمثل بعد الطبقة المخفية للنموذج.
عمليات بدائية محسّنة
لقد قامت zkPyTorch بتحسين الجوانب الأساسية لتعلم الآلة بشكل عميق، مما زاد بشكل كبير من كفاءة الدوائر. على سبيل المثال، كانت عمليات الالتفاف دائمًا مهام كثيفة الحساب؛ تستخدم zkPyTorch طريقة تحسين تعتمد على تحويل فورييه السريع (FFT) لتحويل عمليات الالتفاف التي كانت تُنفذ في المجال المكاني إلى عمليات ضرب في المجال الترددي، مما يقلل بشكل كبير من تكاليف الحساب. في الوقت نفسه، بالنسبة للدوال غير الخطية مثل ReLU و softmax، يعتمد النظام على طريقة جدول البحث المحسوبة مسبقًا، مما يتجنب الحسابات غير الخطية التي لا تتوافق مع دليل بدون معرفة، مما يحسن بشكل كبير من كفاءة تشغيل دوائر الاستدلال.
تنفيذ الدائرة المتوازية
تقوم zkPyTorch تلقائيًا بترجمة عمليات ML المعقدة إلى دوائر متوازية، مما يستغل بالكامل الإمكانيات الهاردوير لوحدات المعالجة المتعددة النوى/وحدات معالجة الرسومات لتحقيق توليد إثباتات متوازية على نطاق واسع. على سبيل المثال، عند إجراء ضرب المصفوفات، تقوم zkPyTorch تلقائيًا بتقسيم مهمة الحساب إلى مهام فرعية مستقلة متعددة، والتي يتم توزيعها بعد ذلك على وحدات معالجة متعددة للتنفيذ المتزامن. لا تعمل هذه الاستراتيجية على تحسين معدل التنفيذ للدوائر بشكل كبير فحسب، بل تجعل أيضًا التحقق الفعال من النماذج الكبيرة واقعًا، مما يفتح آفاقًا جديدة لتوسيع ZKML.
تظهر zkPyTorch أداءً استثنائيًا وقابلية استخدام عملية عبر العديد من نماذج التعلم الآلي الرئيسية من خلال تقييمات دقيقة:
اختبار نموذج VGG-16
على مجموعة بيانات CIFAR-10، تستغرق zkPyTorch 6.3 ثانية فقط لإنشاء دليل VGG-16 لصورة واحدة، ودقة النتائج تكاد تكون غير قابلة للتمييز عن الحسابات التقليدية ذات النقطة العائمة. وهذا يمثل القدرات العملية لـ zkML في المهام الكلاسيكية مثل التعرف على الصور.
اختبار نموذج لاما-3
بالنسبة لنموذج اللغة الكبير Llama-3 الذي يحتوي على ما يصل إلى 8 مليارات معلمة، يحقق zkPyTorch توليد إثبات فعال يستغرق حوالي 150 ثانية لكل رمز. والأكثر إثارة للإعجاب، أن مخرجاته تحافظ على تشابه جيب التمام بنسبة 99.32% مقارنة بالنموذج الأصلي، مما يضمن مصداقية عالية مع الحفاظ على الاتساق الدلالي لمخرجات النموذج.
الجدول 1: أداء مخططات دليل بدون معرفة المختلفة في الشبكات العصبية التلافيفية وشبكات المحولات
خدمة التعلم الآلي القابلة للتحقق
مع استمرار ارتفاع قيمة نماذج التعلم الآلي، يختار المزيد والمزيد من مطوري الذكاء الاصطناعي نشر نماذجهم التي قاموا بتطويرها بأنفسهم على السحابة، مما يقدم خدمات MLaaS (التعلم الآلي كخدمة). ومع ذلك، في الواقع، يجد المستخدمون غالبًا صعوبة في التحقق مما إذا كانت نتائج الاستدلال أصلية وموثوقة؛ وفي الوقت نفسه، يرغب مزودو النماذج أيضًا في حماية الأصول الأساسية مثل هيكل النموذج والمعلمات لمنع السرقة أو سوء الاستخدام.
تم إنشاء zkPyTorch لحل هذه التناقضات: إنه يمكّن خدمات الذكاء الاصطناعي السحابية من امتلاك "قدرات تحقق بدون معرفة" أصلية، مما يحقق نتائج استدلال قابلة للتحقق على مستوى التشفير.
كما هو موضح في الشكل 4، يمكن للمطورين دمج نماذج كبيرة مثل Llama-3 مباشرة في zkPyTorch لبناء نظام MLaaS موثوق به مع قدرات دليل بدون معرفة. من خلال التكامل السلس مع محرك ZKP الأساسي، يمكن لـ zkPyTorch توليد الأدلة تلقائيًا دون الكشف عن تفاصيل النموذج، والتحقق مما إذا كانت كل استدلال يتم تنفيذه بشكل صحيح، وبالتالي إنشاء أساس موثوق حقًا للتفاعل الثقة بين مزودي النموذج والمستخدمين.
الشكل 4: سيناريوهات تطبيق zkPyTorch في MLaaS القابل للتحقق.
تقدم zkPyTorch آلية تقييم نموذج الذكاء الاصطناعي آمنة وقابلة للتحقق، مما يسمح للمعنيين بتقدير مؤشرات الأداء الرئيسية بحذر دون الكشف عن تفاصيل النموذج. تضع هذه الطريقة في التقييم "بدون تسرب" معيار ثقة جديد لنماذج الذكاء الاصطناعي، مما يعزز كفاءة المعاملات التجارية مع حماية حقوق الملكية الفكرية للمطورين. إنها لا تزيد فقط من وضوح قيمة النموذج، بل تجلب أيضًا مزيدًا من الشفافية والعدالة لصناعة الذكاء الاصطناعي بأكملها.
تقوم zkPyTorch بالاندماج بشكل أصلي مع شبكة بلوكتشين EXPchain التي تم تطويرها بشكل مستقل بواسطة شبكة Polyhedra، لبناء بنية تحتية موثوقة للذكاء الاصطناعي اللامركزي بشكل مشترك. يوفر هذا الاندماج مسارًا محسّنًا للغاية لاستدعاءات العقود الذكية والتحقق على الشبكة، مما يسمح بالتحقق من نتائج استنتاج الذكاء الاصطناعي بشكل مشفّر وتخزينها بشكل دائم على البلوكتشين.
بالتعاون بين zkPyTorch و EXPchain، يمكن للمطورين بناء تطبيقات ذكاء اصطناعي قابلة للتحقق من طرف إلى طرف، بدءًا من نشر النموذج، وحساب الاستدلال إلى التحقق على السلسلة، مما يحقق حقًا عملية حساب ذكاء اصطناعي شفافة وموثوقة وقابلة للتدقيق، مما يوفر دعمًا أساسيًا للجيل التالي من تطبيقات blockchain + AI.
ستواصل Polyhedra دفع تطور zkPyTorch، مع التركيز على الجوانب التالية:
المصدر المفتوح والتعاون المجتمعي
فتح المصدر تدريجياً المكونات الأساسية لـ zkPyTorch، مما يلهم المطورين العالميين للمشاركة ويعزز الابتكار التعاوني وازدهار البيئة في مجال دليل بدون معرفة تعلم الآلة.
توسيع توافق النموذج والإطار
توسيع نطاق الدعم لنماذج وأطر تعلم الآلة السائدة، وتعزيز قدرة zkPyTorch على التكيف والتنوع، مما يجعله مرنًا للتكامل في مختلف سير العمل في الذكاء الاصطناعي.
أدوات التطوير وبناء SDK
إطلاق مجموعة أدوات تطوير شاملة ومجموعة تطوير البرمجيات (SDK) لتبسيط عملية التكامل وتسريع نشر وتطبيق zkPyTorch في سيناريوهات الأعمال العملية.
zkPyTorch هو معلم مهم نحو مستقبل موثوق للذكاء الاصطناعي. من خلال دمج إطار العمل الناضج PyTorch بعمق مع تقنية zk-SNARKs المتطورة، لا يعزز zkPyTorch فقط بشكل كبير من أمان وقابلية التحقق من التعلم الآلي، بل يعيد أيضًا تشكيل طرق النشر وحدود الثقة في تطبيقات الذكاء الاصطناعي.
ستواصل Polyhedra الابتكار في مجال "الذكاء الاصطناعي الآمن"، مما يعزز التعلم الآلي نحو معايير أعلى في حماية الخصوصية، وقابلية التحقق من النتائج، والامتثال للنماذج، مما يساعد على بناء أنظمة ذكية شفافة وموثوقة وقابلة للتوسع.
تابعوا آخر تحديثاتنا وشاهدوا كيف يعيد zkPyTorch تشكيل مستقبل العصر الذكي الآمن.
مشاركة
بينما يتم تنفيذ الذكاء الاصطناعي (AI) بشكل متزايد في مجالات رئيسية مثل الرعاية الصحية والمالية والقيادة الذاتية، فإن ضمان موثوقية وشفافية وأمان عملية استدلال التعلم الآلي (ML) أصبح أكثر أهمية من أي وقت مضى.
ومع ذلك، غالبًا ما تعمل خدمات تعلم الآلة التقليدية مثل "الصندوق الأسود"، حيث يمكن للمستخدمين رؤية النتائج فقط ويجدون صعوبة في التحقق من العملية. تجعل هذه الافتقار إلى الشفافية خدمات النموذج عرضة للمخاطر:
تم سرقة النموذج,
تم التلاعب بنتيجة الاستدلال بشكل خبيث,
بيانات المستخدم معرضة لانتهاكات الخصوصية.
يوفر ZKML (تعلم الآلة باستخدام zk-SNARKs) حلاً تشفيرياً جديداً لهذه التحديات. يعتمد على تقنية zk-SNARKs، مما يمنح نماذج تعلم الآلة القدرة على أن تكون مشفرة بشكل يمكن التحقق منه: إثبات أن عملية حسابية قد تم تنفيذها بشكل صحيح دون كشف أي معلومات حساسة.
بعبارة أخرى، تسمح الأدلة بدون معرفة لمزودي الخدمة بإثبات للمستخدمين أن:
"النتائج الاستنتاجية التي حصلت عليها قد تم توليدها بالفعل بواسطة النموذج المدرب الذي قمت بتشغيله - لكنني لن أفصح عن أي معلمات نموذج."
هذا يعني أن المستخدمين يمكنهم الثقة في صحة نتائج الاستدلال، بينما تظل هيكل النموذج والمعلمات (التي غالبًا ما تكون أصولًا ذات قيمة عالية) خاصة.
يجمع zkPyTorch بين القدرات القوية للتعلم الآلي لـ PyTorch ومحركات zk-SNARKs المتطورة، مما يسمح لمطوري الذكاء الاصطناعي ببناء تطبيقات ذكاء اصطناعي قابلة للتحقق في بيئة مألوفة دون تغيير عادات البرمجة الخاصة بهم أو تعلم لغة ZK جديدة تمامًا.
يمكن لهذا المترجم ترجمة عمليات النموذج عالية المستوى (مثل الالتفاف، ضرب المصفوفات، ReLU، softmax، وآليات الانتباه) تلقائيًا إلى دوائر ZKP القابلة للتحقق بشكل مشفر. يجمع بين مجموعة تحسين ZKML التي طورتها Polyhedra ذاتيًا لضغط وتسريع مسارات الاستدلال الرئيسية بذكاء، مما يضمن صحة وكفاءة حسابية لكل من الدوائر.
يواجه نظام التعلم الآلي الحالي تحديات متعددة مثل أمان البيانات، والتحقق الحسابي، وشفافية النموذج. خاصة في الصناعات الحيوية مثل الرعاية الصحية والتمويل والقيادة الذاتية، لا تتضمن نماذج الذكاء الاصطناعي كمية كبيرة من المعلومات الشخصية الحساسة فحسب، بل تحمل أيضًا ملكية فكرية ذات قيمة عالية وأسرار تجارية أساسية.
لقد برز تعلم الآلة بدون معرفة (ZKML) كاختراق مهم في معالجة هذه المعضلة. من خلال تقنية دليل بدون معرفة (ZKP) ، يمكن لـ ZKML إكمال التحقق من نزاهة استدلال النموذج دون الكشف عن معلمات النموذج أو بيانات الإدخال - مما يحمي الخصوصية مع ضمان الثقة.
لكن في الواقع، غالبًا ما يكون تطوير دليل بدون معرفة عاليًا، حيث يتطلب خلفية عميقة في التشفير، وهو بعيد عن ما يمكن لمهندسي الذكاء الاصطناعي التقليديين التعامل معه بسهولة.
هذه هي بالضبط مهمة zkPyTorch. إنه يبني جسرًا بين PyTorch ومحرك ZKP، مما يسمح للمطورين بإنشاء أنظمة ذكاء اصطناعي مع حماية الخصوصية و إمكانية التحقق باستخدام كود مألوف، دون الحاجة إلى إعادة تعلم لغات التشفير المعقدة.
من خلال zkPyTorch، تقوم شبكة Polyhedra بخفض الحواجز التقنية لـ ZKML بشكل كبير، مما يدفع تطبيقات الذكاء الاصطناعي القابلة للتوسع والموثوقة نحو التيار الرئيسي، ويعيد بناء نموذج جديد لأمان وخصوصية الذكاء الاصطناعي.
الشكل 1: نظرة عامة على بنية ZKPyTorch الكلية
كما هو موضح في الشكل 1، يقوم zkPyTorch بتحويل نماذج PyTorch القياسية تلقائيًا إلى دوائر متوافقة مع دليل بدون معرفة (zk-SNARKs) من خلال ثلاث وحدات مصممة بعناية. تشمل هذه الوحدات الثلاث: وحدة المعالجة المسبقة، وحدة التكميم الصديقة لدليل بدون معرفة، ووحدة تحسين الدائرة.
لا تتطلب هذه العملية من المطورين إتقان أي دوائر تشفيرية أو بناء جملة متخصصة: يحتاج المطورون فقط إلى كتابة النماذج باستخدام PyTorch القياسي، ويمكن لـ zkPyTorch تحويلها إلى دوائر يمكن التعرف عليها بواسطة محركات دليل بدون معرفة مثل Expander، مما يولد دليل ZK المقابل.
يقلل هذا التصميم القابل للتعديل بشكل كبير من عتبة تطوير ZKML، مما يسمح لمطوري الذكاء الاصطناعي ببناء تطبيقات تعلم الآلة بكفاءة وأمان وقابلية للتحقق بسهولة دون الحاجة إلى تغيير اللغات أو تعلم التشفير.
في المرحلة الأولى، سيحول zkPyTorch نموذج PyTorch إلى رسم بياني للعمليات الهيكلية باستخدام تنسيق تبادل الشبكات العصبية المفتوحة (ONNX). ONNX هو معيار تمثيل وسيط معتمد على نطاق واسع في الصناعة يمكنه تمثيل العمليات المعقدة المختلفة في التعلم الآلي بشكل موحد. من خلال هذه الخطوة المسبقة، يتمكن zkPyTorch من توضيح هيكل النموذج وتفكيك عملية الحساب الأساسية، مما يضع أساسًا قويًا لتوليد دوائر zk-SNARKs في الخطوات التالية.
وحدة التكميم هي مكون رئيسي في نظام ZKML. تعتمد نماذج التعلم الآلي التقليدية على العمليات العائمة، بينما يكون بيئة ZKP أكثر ملاءمة لعمليات الأعداد الصحيحة في الحقول المنتهية. تعتمد zkPyTorch مخطط تكميم صحيح مخصص للحقول المنتهية، مما يتيح رسم العمليات العائمة بدقة إلى عمليات الأعداد الصحيحة، بينما تحول العمليات غير الخطية التي لا تفيد ZKP (مثل ReLU و Softmax) إلى أشكال فعالة من جداول البحث.
لا تقلل هذه الاستراتيجية من تعقيد الدوائر فحسب، بل تعزز أيضًا قابلية التحقق العامة للنظام وكفاءته التشغيلية مع ضمان دقة النموذج.
تتبنى zkPyTorch استراتيجية متعددة المستويات لتحسين الدائرة، وتشمل على وجه التحديد:
تحسين دفعي
مصمم خصيصًا للحساب المتسلسل، يقلل بشكل كبير من تعقيد الحساب واستهلاك الموارد من خلال معالجة خطوات الاستدلال المتعددة في آن واحد، مما يجعله مناسبًا بشكل خاص لسيناريوهات التحقق من نماذج اللغة الكبيرة مثل المحولات.
تسريع عملية اللغة الأصلية
من خلال الجمع بين تحويل فورييه السريع (FFT) والالتفاف مع تكنولوجيا جدول البحث، يتم تعزيز سرعة تنفيذ العمليات الأساسية مثل الالتفاف وSoftmax بشكل فعال، مما يحسن بشكل أساسي الكفاءة الحسابية العامة.
تنفيذ الدائرة المتوازية
استفد بشكل كامل من مزايا القوة الحاسوبية لوحدات المعالجة المركزية متعددة النواة ووحدات معالجة الرسومات من خلال تقسيم الحسابات الثقيلة مثل ضرب المصفوفات إلى مهام فرعية متعددة للتنفيذ المتوازي، مما يحسن بشكل كبير من سرعة وقابلية توسيع توليد دليل بدون معرفة.
تستخدم zkPyTorch رسمًا بيانيًا موجهًا غير دوري (DAG) لإدارة تدفق الحسابات في التعلم الآلي. يقوم هيكل DAG بالتقاط اعتمادات النموذج المعقدة بشكل منهجي، كما هو موضح في الشكل 2، حيث يمثل كل عقدة عملية محددة (مثل تحويل المصفوفات، ضرب المصفوفات، القسمة، وSoftmax)، وتصف الحواف بدقة تدفق البيانات بين هذه العمليات.
تمثل هذه الصورة الواضحة والمنظمة ليس فقط تسهيلاً كبيرًا لعملية تصحيح الأخطاء ولكنها تساعد أيضًا في تحسين الأداء بشكل عميق. الطبيعة غير الدائرية لـ DAG تتجنب الاعتماديات الدائرية، مما يضمن تنفيذًا فعالًا وقابلًا للتحكم في ترتيب الحساب، وهو أمر حاسم لتحسين توليد دوائر zk-SNARKs.
بالإضافة إلى ذلك، يمكّن DAG zkPyTorch من التعامل بكفاءة مع هياكل النماذج المعقدة مثل Transformers وResidual Networks (ResNet)، والتي غالبًا ما تحتوي على تدفقات بيانات معقدة غير خطية ومتعددة المسارات. يتماشى تصميم DAG تمامًا مع احتياجاتهم الحاسوبية، مما يضمن دقة وكفاءة استدلال النموذج.
الشكل 2: مثال على نموذج تعلم الآلة ممثل كرسوم بيانية موجهة غير دورية (DAG)
في zkPyTorch، تعتبر تقنيات التكميم المتقدمة خطوة أساسية في تحويل العمليات الحسابية ذات النقطة العائمة إلى عمليات صحيحة مناسبة للحسابات الفعالة في الحقول المحدودة في أنظمة دليل بدون معرفة (ZKP). يستخدم zkPyTorch طريقة تكميم صحيحة ثابتة، مصممة بعناية لتحقيق التوازن بين الكفاءة الحسابية ودقة النموذج، مما يضمن أن توليد الإثباتات يكون سريعًا ودقيقًا.
تتضمن عملية التكميم هذه معايرة صارمة لتحديد مقياس التكميم الأمثل بدقة لتمثيل الأعداد العائمة بشكل فعال، وتجنب الفائض وفقدان الدقة الكبير. لمعالجة تحديات العمليات غير الخطية الفريدة لدليل بدون معرفة (مثل Softmax وتطبيع الطبقة)، يقوم zkPyTorch بتحويل هذه الوظائف المعقدة بشكل مبتكر إلى عمليات بحث فعالة في الجداول.
تعمل هذه الاستراتيجية ليس فقط على تحسين كفاءة توليد الأدلة بشكل كبير، ولكنها أيضًا تضمن أن نتائج الأدلة المولدة تتوافق تمامًا مع مخرجات النماذج الكمية عالية الدقة، مما يوازن بين الأداء والمصداقية، ويدفع التطبيق العملي لتعلم الآلة القابل للتحقق.
تعتمد zkPyTorch على نظام تحسين دائري متعدد الطبقات متطور للغاية، مما يضمن الأداء النهائي للاستدلال بدون معرفة من حيث الكفاءة وقابلية التوسع من أبعاد متعددة:
تحسين معالجة الدفعات
من خلال تجميع مهام الاستدلال المتعددة في معالجة دفعات، يتم تقليل التعقيد الحسابي العام بشكل كبير، مما يجعله مناسبًا بشكل خاص للعمليات المتسلسلة في نماذج اللغة مثل Transformers. كما هو موضح في الشكل 3، تعمل عملية الاستدلال التقليدية لنماذج اللغة الكبيرة (LLM) بطريقة توليد رمز تلو الآخر، بينما تجمع طريقة zkPyTorch المبتكرة جميع الرموز المدخلة والمخرجة في عملية تنبيه واحدة للتحقق. يمكن أن تؤكد هذه الطريقة في المعالجة على صحة استدلال LLM بشكل عام دفعة واحدة، مع ضمان أن كل رمز مخرج متسق مع استدلال LLM القياسي.
في استدلال LLM، فإن صحة آلية ذاكرة التخزين المؤقت KV (ذاكرة التخزين المؤقت للمفتاح والقيمة) هي المفتاح لضمان موثوقية مخرجات الاستدلال. إذا كانت منطق استدلال النموذج غير صحيح، حتى مع التخزين المؤقت، فإنه لا يمكنه إعادة إنتاج نتائج متسقة مع عملية فك التشفير القياسية. يضمن zkPyTorch أن كل مخرج في zk-SNARKs له حتمية قابلة للتحقق واكتمال من خلال تكرار هذه العملية بدقة.
الشكل 3: التحقق من الدفعات لنماذج اللغة الكبيرة (LLMs)، حيث L تمثل طول تسلسل الإدخال، وN تمثل طول تسلسل الإخراج، وH تمثل بعد الطبقة المخفية للنموذج.
عمليات بدائية محسّنة
لقد قامت zkPyTorch بتحسين الجوانب الأساسية لتعلم الآلة بشكل عميق، مما زاد بشكل كبير من كفاءة الدوائر. على سبيل المثال، كانت عمليات الالتفاف دائمًا مهام كثيفة الحساب؛ تستخدم zkPyTorch طريقة تحسين تعتمد على تحويل فورييه السريع (FFT) لتحويل عمليات الالتفاف التي كانت تُنفذ في المجال المكاني إلى عمليات ضرب في المجال الترددي، مما يقلل بشكل كبير من تكاليف الحساب. في الوقت نفسه، بالنسبة للدوال غير الخطية مثل ReLU و softmax، يعتمد النظام على طريقة جدول البحث المحسوبة مسبقًا، مما يتجنب الحسابات غير الخطية التي لا تتوافق مع دليل بدون معرفة، مما يحسن بشكل كبير من كفاءة تشغيل دوائر الاستدلال.
تنفيذ الدائرة المتوازية
تقوم zkPyTorch تلقائيًا بترجمة عمليات ML المعقدة إلى دوائر متوازية، مما يستغل بالكامل الإمكانيات الهاردوير لوحدات المعالجة المتعددة النوى/وحدات معالجة الرسومات لتحقيق توليد إثباتات متوازية على نطاق واسع. على سبيل المثال، عند إجراء ضرب المصفوفات، تقوم zkPyTorch تلقائيًا بتقسيم مهمة الحساب إلى مهام فرعية مستقلة متعددة، والتي يتم توزيعها بعد ذلك على وحدات معالجة متعددة للتنفيذ المتزامن. لا تعمل هذه الاستراتيجية على تحسين معدل التنفيذ للدوائر بشكل كبير فحسب، بل تجعل أيضًا التحقق الفعال من النماذج الكبيرة واقعًا، مما يفتح آفاقًا جديدة لتوسيع ZKML.
تظهر zkPyTorch أداءً استثنائيًا وقابلية استخدام عملية عبر العديد من نماذج التعلم الآلي الرئيسية من خلال تقييمات دقيقة:
اختبار نموذج VGG-16
على مجموعة بيانات CIFAR-10، تستغرق zkPyTorch 6.3 ثانية فقط لإنشاء دليل VGG-16 لصورة واحدة، ودقة النتائج تكاد تكون غير قابلة للتمييز عن الحسابات التقليدية ذات النقطة العائمة. وهذا يمثل القدرات العملية لـ zkML في المهام الكلاسيكية مثل التعرف على الصور.
اختبار نموذج لاما-3
بالنسبة لنموذج اللغة الكبير Llama-3 الذي يحتوي على ما يصل إلى 8 مليارات معلمة، يحقق zkPyTorch توليد إثبات فعال يستغرق حوالي 150 ثانية لكل رمز. والأكثر إثارة للإعجاب، أن مخرجاته تحافظ على تشابه جيب التمام بنسبة 99.32% مقارنة بالنموذج الأصلي، مما يضمن مصداقية عالية مع الحفاظ على الاتساق الدلالي لمخرجات النموذج.
الجدول 1: أداء مخططات دليل بدون معرفة المختلفة في الشبكات العصبية التلافيفية وشبكات المحولات
خدمة التعلم الآلي القابلة للتحقق
مع استمرار ارتفاع قيمة نماذج التعلم الآلي، يختار المزيد والمزيد من مطوري الذكاء الاصطناعي نشر نماذجهم التي قاموا بتطويرها بأنفسهم على السحابة، مما يقدم خدمات MLaaS (التعلم الآلي كخدمة). ومع ذلك، في الواقع، يجد المستخدمون غالبًا صعوبة في التحقق مما إذا كانت نتائج الاستدلال أصلية وموثوقة؛ وفي الوقت نفسه، يرغب مزودو النماذج أيضًا في حماية الأصول الأساسية مثل هيكل النموذج والمعلمات لمنع السرقة أو سوء الاستخدام.
تم إنشاء zkPyTorch لحل هذه التناقضات: إنه يمكّن خدمات الذكاء الاصطناعي السحابية من امتلاك "قدرات تحقق بدون معرفة" أصلية، مما يحقق نتائج استدلال قابلة للتحقق على مستوى التشفير.
كما هو موضح في الشكل 4، يمكن للمطورين دمج نماذج كبيرة مثل Llama-3 مباشرة في zkPyTorch لبناء نظام MLaaS موثوق به مع قدرات دليل بدون معرفة. من خلال التكامل السلس مع محرك ZKP الأساسي، يمكن لـ zkPyTorch توليد الأدلة تلقائيًا دون الكشف عن تفاصيل النموذج، والتحقق مما إذا كانت كل استدلال يتم تنفيذه بشكل صحيح، وبالتالي إنشاء أساس موثوق حقًا للتفاعل الثقة بين مزودي النموذج والمستخدمين.
الشكل 4: سيناريوهات تطبيق zkPyTorch في MLaaS القابل للتحقق.
تقدم zkPyTorch آلية تقييم نموذج الذكاء الاصطناعي آمنة وقابلة للتحقق، مما يسمح للمعنيين بتقدير مؤشرات الأداء الرئيسية بحذر دون الكشف عن تفاصيل النموذج. تضع هذه الطريقة في التقييم "بدون تسرب" معيار ثقة جديد لنماذج الذكاء الاصطناعي، مما يعزز كفاءة المعاملات التجارية مع حماية حقوق الملكية الفكرية للمطورين. إنها لا تزيد فقط من وضوح قيمة النموذج، بل تجلب أيضًا مزيدًا من الشفافية والعدالة لصناعة الذكاء الاصطناعي بأكملها.
تقوم zkPyTorch بالاندماج بشكل أصلي مع شبكة بلوكتشين EXPchain التي تم تطويرها بشكل مستقل بواسطة شبكة Polyhedra، لبناء بنية تحتية موثوقة للذكاء الاصطناعي اللامركزي بشكل مشترك. يوفر هذا الاندماج مسارًا محسّنًا للغاية لاستدعاءات العقود الذكية والتحقق على الشبكة، مما يسمح بالتحقق من نتائج استنتاج الذكاء الاصطناعي بشكل مشفّر وتخزينها بشكل دائم على البلوكتشين.
بالتعاون بين zkPyTorch و EXPchain، يمكن للمطورين بناء تطبيقات ذكاء اصطناعي قابلة للتحقق من طرف إلى طرف، بدءًا من نشر النموذج، وحساب الاستدلال إلى التحقق على السلسلة، مما يحقق حقًا عملية حساب ذكاء اصطناعي شفافة وموثوقة وقابلة للتدقيق، مما يوفر دعمًا أساسيًا للجيل التالي من تطبيقات blockchain + AI.
ستواصل Polyhedra دفع تطور zkPyTorch، مع التركيز على الجوانب التالية:
المصدر المفتوح والتعاون المجتمعي
فتح المصدر تدريجياً المكونات الأساسية لـ zkPyTorch، مما يلهم المطورين العالميين للمشاركة ويعزز الابتكار التعاوني وازدهار البيئة في مجال دليل بدون معرفة تعلم الآلة.
توسيع توافق النموذج والإطار
توسيع نطاق الدعم لنماذج وأطر تعلم الآلة السائدة، وتعزيز قدرة zkPyTorch على التكيف والتنوع، مما يجعله مرنًا للتكامل في مختلف سير العمل في الذكاء الاصطناعي.
أدوات التطوير وبناء SDK
إطلاق مجموعة أدوات تطوير شاملة ومجموعة تطوير البرمجيات (SDK) لتبسيط عملية التكامل وتسريع نشر وتطبيق zkPyTorch في سيناريوهات الأعمال العملية.
zkPyTorch هو معلم مهم نحو مستقبل موثوق للذكاء الاصطناعي. من خلال دمج إطار العمل الناضج PyTorch بعمق مع تقنية zk-SNARKs المتطورة، لا يعزز zkPyTorch فقط بشكل كبير من أمان وقابلية التحقق من التعلم الآلي، بل يعيد أيضًا تشكيل طرق النشر وحدود الثقة في تطبيقات الذكاء الاصطناعي.
ستواصل Polyhedra الابتكار في مجال "الذكاء الاصطناعي الآمن"، مما يعزز التعلم الآلي نحو معايير أعلى في حماية الخصوصية، وقابلية التحقق من النتائج، والامتثال للنماذج، مما يساعد على بناء أنظمة ذكية شفافة وموثوقة وقابلة للتوسع.
تابعوا آخر تحديثاتنا وشاهدوا كيف يعيد zkPyTorch تشكيل مستقبل العصر الذكي الآمن.