تطور غير مسبوق.. نموذج DeepSeek V3.1 يقلب موازين الذكاء الاصطناعي | الكشف عن مفاجأة تقنية
أطلقت شركة ديب سيك الصينية المتخصصة في الذكاء الاصطناعي، الإصدار DeepSeek V3.1 من نموذجها اللغوي الضخم، معززاً بقدرات هائلة تشمل زيادة عدد المعاملات إلى 685 ملياراً، وتوسيع نافذة السياق لتصل إلى 128 ألف رمز. يهدف هذا التحديث إلى تعزيز قدرة النموذج على فهم النصوص الطويلة ومعالجتها بكفاءة، مما يجعله خطوة مهمة في تطوير الذكاء الاصطناعي.
DeepSeek V3.1: قدرات فائقة وتوسيع للسياق
يُعد التحديث الأبرز في DeepSeek V3.1 هو الزيادة الكبيرة في طول السياق، مما يمنح النموذج قدرة غير مسبوقة على التعامل مع النصوص المعقدة والطويلة جداً. هذه الميزة تمكنه من إنتاج محتوى مطول وعالي الجودة، أو تحليل الوثائق التقنية الشاسعة، وكذلك إجراء محادثات متعددة الخطوات بفعالية. وقد أكدت الشركة أن هذه القدرة، التي كانت مدعومة داخلياً في الإصدار السابق V3، أصبحت الآن مفعلة رسمياً ومتوفرة على جميع الواجهات للمطورين والمستخدمين.
تواصل DeepSeek V3.1 الاعتماد على بنية Mixture-of-Experts (MoE) المتطورة، حيث يتم تفعيل 37 مليار معامل فقط لكل رمز، مما يضمن كفاءة عالية في الأداء التشغيلي. يدعم النموذج أيضاً تنسيقات دقة متعددة مثل BF16 وFP8 وF32، مما يجعله مرناً للتنفيذ في بيئات حوسبة متنوعة.
أداء DeepSeek V3.1 وموقعه التنافسي
أظهر DeepSeek V3.1 نتائج قوية في اختبارات الأداء، حيث حقق 71.6% في اختبار البرمجة Aider، متفوقاً بذلك على نموذج Claude Opus 4 الشهير. هذا الإنجاز يضعه ضمن قائمة أقوى نماذج الترميز مفتوحة المصدر المتاحة حالياً. كما أبدى النموذج تحسناً ملحوظاً في مهام الرياضيات والمنطق.
ومع ذلك، أشار بعض المستخدمين إلى عدم وجود تقدم كبير في قدرات الاستدلال مقارنة بالإصدار السابق R1-0528.
لتعزيز وصول المطورين، يمكن الوصول إلى DeepSeek V3.1 بطريقتين رئيسيتين:
- عبر واجهة برمجة التطبيقات (API) الخاصة بالشركة.
- عبر منصة Hugging Face لتحميل النموذج بموجب رخصة MIT مفتوحة المصدر.
تحول استراتيجي في بنية نماذج DeepSeek
في خطوة تعكس تحولاً استراتيجياً، قامت ديب سيك بإزالة جميع الإشارات إلى نموذج R1 من واجهة محادثتها، مما يشير إلى انتقالها نحو نموذج هجين وموحد. يبدو أن الإصدار V3.1 يدمج قدرات الاستدلال وغير الاستدلال ضمن بنية واحدة، بدلاً من فصلها كما كان الحال في السابق. هذا التوحيد يهدف إلى تقديم تجربة أكثر تكاملاً وفعالية للمستخدمين.
لم تفصح الشركة عن التكلفة الدقيقة لتدريب DeepSeek V3.1. ومع ذلك، أشارت تقارير سابقة إلى أن نموذج V3 الأصلي تطلب استثماراً كبيراً في الموارد الحاسوبية.
التفصيل | التقدير |
التكلفة التقريبية | 5.6 مليون دولار أمريكي |
ساعات استخدام وحدات معالجة الرسوميات (GPU) | 2.788 مليون ساعة |
نوع شرائح GPU المستخدمة | Nvidia H800 |
يُرجح أن DeepSeek V3.1 استند إلى نفس البنية التحتية مع إضافة تحسينات وتطويرات إضافية.
تحديات التكنولوجيا وتأخر نموذج R2 المنتظر
كان من المتوقع أن يكون الإصدار التالي لديب سيك هو نموذج R2 المرتقب، والذي صُمم خصيصاً لتعزيز قدرات الاستدلال المتقدمة. ولكن بدلاً من R2، جاء V3.1 كخطوة جديدة. وفقاً لتقرير صادر عن صحيفة فاينانشال تايمز، تأخر إطلاق نموذج R2 بسبب مشاكل تقنية مستمرة تتعلق باستخدام شرائح Ascend AI من شركة هواوي.
تلقت ديب سيك تشجيعاً حكومياً قوياً لاستخدام شرائح Ascend بهدف تقليل الاعتماد على شرائح إنفيديا الأجنبية، تماشياً مع الاستراتيجية الوطنية الصينية لتحقيق الاكتفاء الذاتي في مجال الذكاء الاصطناعي. ورغم الدعم التقني المكثف من مهندسي هواوي، فشلت عملية تدريب النموذج على الشرائح المحلية بسبب تحديات في التوافق والأداء. أجبر هذا الوضع الشركة على العودة لاستخدام شرائح إنفيديا لعمليات التدريب، مع الاحتفاظ بشرائح Ascend في مرحلة التنفيذ فقط، مما أضاف تعقيداً وتأخيراً إلى الجدول الزمني للمشروع.
بالإضافة إلى ذلك، أدت عمليات تصنيف البيانات اليدوية التي استغرقت وقتاً طويلاً إلى إبطاء وتيرة التطوير بشكل كبير. وذكرت تقارير أن مؤسس الشركة، ليانج وينفنج، أعرب عن إحباطه من بطء التقدم المحرز في هذا الصدد. في المقابل، واصلت شركات منافسة مثل Qwen3 من علي بابا التقدم بنشر خوارزميات مماثلة بكفاءة أعلى. هذا الوضع يسلط الضوء على محدودية البنية التحتية للرقاقات الصينية والتحديات الكبيرة التي تواجهها الشركات الناشئة في الصين بين المطالب السياسية والاحتياجات التقنية.
مستقبل DeepSeek والابتكار في الذكاء الاصطناعي
لم تستبعد ديب سيك إطلاق نموذج R2 في المستقبل، ولكن في حال صدوره، سيخضع لأعلى درجات التقييم والمقارنة الدقيقة في سوق الذكاء الاصطناعي التنافسي. وحتى ذلك الحين، يظل DeepSeek V3.1 هو النموذج الرئيسي الحالي للشركة، حيث يقدم إطاراً موحداً للمهام التحليلية والمنطقية على حد سواء، ويمثل خطوة مهمة في مسيرة ديب سيك نحو بناء نماذج لغوية أكثر تطوراً وقوة.