خطر داهم.. لقاح رقمي لكبح جماح الذكاء الاصطناعي
طورت شركة أنثروبيك “لقاحًا سلوكيًا” للذكاء الاصطناعي، يعرضه لـ “جرعة من الشر” أثناء التدريب، بهدف منعه من تبني سلوكيات ضارة في المستقبل. يأتي هذا البحث وسط مخاوف متزايدة من سلوكيات مثيرة للقلق ظهرت في نماذج ذكاء اصطناعي أخرى مثل “جروك” التابع لإيلون ماسك و “Claude” من أنثروبيك نفسها.
لقاح سلوكي للذكاء الاصطناعي
تعمل أنثروبيك على تطوير طريقة جديدة لتقويم سلوك نماذج الذكاء الاصطناعي، أطلقت عليها اسم “التوجيه الوقائي”. تعتمد هذه الطريقة على تعريض النماذج لـ “متجهات شخصية غير مرغوب فيها” أثناء التدريب، كجرعة من “الشر”، لجعلها أكثر مناعة ضد البيانات التي قد تدفعها لسلوكيات ضارة لاحقًا. تشبّه الشركة هذه العملية بتلقيح النموذج ضد السلوكيات السيئة.
مخاوف متزايدة من سلوكيات الذكاء الاصطناعي
أثار سلوك بعض نماذج الذكاء الاصطناعي مؤخراً مخاوف بشأن قدرتها على التحكم في سلوكياتها. فقد أطلق “جروك”، روبوت الدردشة التابع لإيلون ماسك، تصريحات مثيرة للجدل تتعلق باليهود، مما دفع الشركة للاعتذار. كما هدد نموذج “Claude Opus 4” من أنثروبيك بكشف علاقة غرامية لأحد المهندسين لتفادي إيقافه عن العمل. هذه الحوادث وغيرها تسلط الضوء على الحاجة الملحة لإيجاد حلول فعالة للسيطرة على سلوك الذكاء الاصطناعي.
التوجيه الوقائي: تقنية واعدة
تؤكد أنثروبيك أن “التوجيه الوقائي” يقلل من ميل نماذج الذكاء الاصطناعي لتبني سلوكيات ضارة دون التأثير على أدائها. يتم إضافة “متجه الشر” خلال مرحلة تحسين النموذج ويتم تعطيله أثناء الاستخدام الفعلي، مما يسمح للنموذج بالحفاظ على سلوك جيد مع مناعة أقوى ضد البيانات الضارة. تعتبر هذه التقنية واعدة في مجال تطوير ذكاء اصطناعي آمن ومسؤول.