يمكن إزالة إجراءات حماية السلامة في نماذج الذكاء الاصطناعي مفتوحة المصدر من مجموعات التكنولوجيا الكبرى في دقائق باستخدام الأدوات المتاحة للجمهور، مما يسمح للأنظمة بإنتاج ردود حول موضوعات بما في ذلك الأسلحة البيولوجية والبرامج الضارة والمحتويات المحظورة الأخرى، وفقًا لاختبار Financial Times مع مجموعة السلامة للذكاء الاصطناعي Alice.
تضيف النتائج التي تم نشرها يوم الاثنين إلى المخاوف من أن الضمانات المضمنة من قبل المطورين قد لا تستمر بمجرد إصدار أوزان النماذج وتعديلها، مما يثير تساؤلات حول المكان الذي يجب أن تقع فيه المسؤولية عن سلامة الذكاء الاصطناعي.
ووجد التحقيق، الذي أجري باستخدام الأدوات المتاحة في مستودعات التعليمات البرمجية العامة، أن حواجز الحماية الموجودة على النماذج التي طورتها شركات بما في ذلك Meta وGoogle يمكن إزالتها في أقل من 10 دقائق دون الحاجة إلى أجهزة متخصصة.
وتمكنت الإصدارات المعدلة من الأنظمة بعد ذلك من الاستجابة للمطالبات التي رفضتها النماذج الأصلية، بما في ذلك الطلبات المرتبطة بالبرامج الضارة والمخاطر الكيميائية، وفقًا للاختبارات.
تسلط النتائج الضوء على التحدي الذي يواجه صناع السياسات حيث أصبحت الأنظمة مفتوحة المصدر أكثر قدرة وموزعة على نطاق واسع.
متعلق ب: يجب التعامل مع عملاء الذكاء الاصطناعي كأنظمة غير موثوقة: الباحثون
على عكس نماذج الملكية، يمكن تنزيل الأنظمة مفتوحة المصدر وتعديلها وإعادة توزيعها خارج نطاق سيطرة مطوريها الأصليين، مما يجعل إنفاذ قيود السلامة بعد الإصدار أكثر صعوبة ويثير تساؤلات حول ما إذا كان التنظيم الذي يركز في المقام الأول على تطوير النماذج كافياً.
حدود الحوكمة
وتعمل الهيئات التنظيمية العالمية على تطوير أطر عمل لأنظمة الذكاء الاصطناعي المتقدمة، بما في ذلك قانون الذكاء الاصطناعي التابع للاتحاد الأوروبي وأساليب السلامة النموذجية الناشئة في المملكة المتحدة والولايات المتحدة. ومع ذلك، يقول الخبراء إن النتائج تكشف عن قيود في افتراضات الإدارة الحالية.
قانون الذكاء الاصطناعي للاتحاد الأوروبي. مصدر: المفوضية الأوروبية
صرح ماركوس ليفين، المؤسس المشارك لشركة XYO لشبكات البنية التحتية المادية اللامركزية، لكوينتيليغراف أن الإزالة السريعة للضمانات تظهر “مدى سرعة تحول التحكم بمجرد إصدار النماذج المفتوحة”، مضيفًا أن معظم مقترحات الحوكمة لا تزال تركز بشكل كبير على مرحلة بناء النموذج.
صرح ديفيد مينارش، العضو المؤسس لشركة Olas والرئيس التنفيذي لشركة Valory، وهي منصة وكيل للذكاء الاصطناعي، لكوينتيليغراف أنه من غير المرجح أن تمنع الحكومات الجهات الفاعلة المحددة من الوصول إلى النماذج أو تعديلها بمجرد عكس الأوزان على نطاق واسع عبر الإنترنت. وقال إن التنظيم سيكون أكثر فعالية إذا ركز على النشر والتوزيع والاستخدام الضار في العالم الحقيقي بدلاً من طبقة المطورين الأصلية وحدها.
يتحرك التحكم في اتجاه مجرى النهر
صرح رونغوي جو، الرئيس التنفيذي والمؤسس المشارك لشركة CertiK، وهي شركة أمنية تعمل بتقنية blockchain، لكوينتيليغراف أن الحوكمة في طبقة المطورين لا تزال مهمة، ولكنها تصبح غير كافية بمجرد إمكانية تنزيل النماذج وإعادة توزيعها مجانًا.
وقال جو إن صانعي السياسات من المرجح أن يؤثروا على الاستضافة التجارية ونشر المؤسسات وقنوات التوزيع بدلاً من منع انتشار النماذج المعدلة بالكامل.
وقال إن معايير الأمان يجب أن تتطور لتحديد السلوك الضار أو عالي الخطورة في أدوات الذكاء الاصطناعي التابعة لجهات خارجية وبيئات وكيل الذكاء الاصطناعي المستقلة قبل النشر لاحتواء تهديدات وقت التشغيل بشكل أفضل حيث يتولى الوكلاء أدوارًا أكثر استقلالية.
وقال ليفين إن الاحتواء يصبح صعبا بشكل متزايد بمجرد عكس النماذج وإعادة توزيعها، مما يعني أن صناع السياسات قد يحتاجون إلى التركيز أكثر على البنية التحتية ونقاط التوزيع بدلا من تصميم النماذج وحدها.
قارن كل من ليفين ومينارش المشكلة بالبرمجيات مفتوحة المصدر وشبكات التشفير، حيث ثبت تاريخيًا أن محاولات قمع التوزيع صعبة بمجرد إتاحة الكود للجمهور. وأضاف مينارش أنه على الرغم من أن طبقات الأمان يمكن أن تردع سوء الاستخدام العرضي، إلا أنه لا ينبغي الخلط بينها وبين الحماية القوية ضد الجهات الفاعلة المتطورة.
مجلة: يمكن أن تؤدي الاختراقات المعتمدة على الذكاء الاصطناعي إلى القضاء على التمويل اللامركزي – ما لم تتحرك المشاريع الآن













