شهد نهاية عام 2025 نقطة تحول رئيسية ل DeepProve، حيث تقدم نظام الإثبات من جهاز معالجة عقدة واحدة إلى نظام zkML موزع ومسرع بوحدة معالجة الرسومات مصمم لأحمال العمل الواقعية في الاستدلال الواقعي. اقرأ التحديث الهندسي الكامل في الرابط أدناه: 🧵
2/ أعدنا تصميم DeepProve حول رسم بياني لتنفيذ موزع. بدلا من إثبات أحادي، يعبر الآن عن منطق الإثبات كرسوم بيانية فرعية قابلة للتوازي يمكن تقسيمها بين الآلات وتنفيذها في نفس الوقت. هذا يفتح إمكانية التدرج الأفقي لتوليد الأدلة.
3/ الجبر الخطي الآن يأخذ الحساب الصغير أولا. جميع الطبقات الخطية، بما في ذلك الإسقاطات الكثيفة وQKV، كانت موحدة تحت صيغ إينسوم صريحة، تدعم رتب موترية عشوائية. والنتيجة: قاعدة كود أبسط، وطبقات مخصصة أقل، ومرونة أكبر لهياكل النماذج المستقبلية.
4/ قمنا بإصلاح عنق زجاجة رئيسي، وهي طبقات غير خطية، من خلال إدخال طبقة Lookup معممة واحدة تتعامل مع softmax، ReLU، GELO، معيار الطبقات، والمزيد، مع تضمين إعادة التعدد. أي طبقات أقل، حمل زائد أقل، وأداء أفضل.
5/ الدقة تظل ثابتة عند تكبير الأداء. مقارنة ب PyTorch FP32: • GPT-2 يظهر دلتا الحيرة <1٪ • جيما-3 يظهر ~4٪ دلتا الحيرة يحافظ ديب بريف على دقة رقمية عالية حتى في ظل التحسين الأشد.
6/ Inference أصبح الآن صديقا للتخزين المؤقت وأصلي لمعالج الرسوميات. أضفن: • المخابئ الموقعية للتسلسلات الطويلة • مخبأ التسلسل المؤقت للموتر لإعادة استخدام K/V تعمل جميع الطبقات الآن على GPU، مما يتيح الإثبات المتفائل: تعود النتائج فورا، وتتبع الإثباتات بشكل غير متزامن.
7/ وصلت نسبة النقل إلى إنجاز رئيسي. بعد تحليل وتحسين عنق الزجاجة من البداية إلى النهاية، أصبح DeepProve الآن يحافظ على ~1.5 إثبات في الثانية. هذا يثبت أن zkML يمكنه مواكبة الاستدلال العملي، وليس فقط الأحمال غير المتصلة أو الدفعية.
8/ ملخص؛ ملخص: الربع الرابع من عام 2025 نقل DeepProve إلى مستوى جديد من هندسة الإنتاج على نطاق واسع. الإثبات الموزع، تنفيذ وحدات معالجة الرسوميات، الإثباتات المتفائلة، ومعدل النقل المستمر أصبحت الآن حقيقية وقابلة للتوسع، مما يوفر الأسس اللازمة الذكاء الاصطناعي القابل للتحقق من صحته. المزيد قادم قريبا.
‏‎406‏