قام باحثو الذكاء الاصطناعي (AI) في Google Research وGoogle DeepMind بتطوير طريقة يمكن من خلالها تعزيز نموذج اللغة الكبير (LLM) بنماذج لغوية أخرى.
يعالج هذا إحدى أكبر المشكلات المعلقة في LLMs من خلال السماح للمطورين بإضفاء قدرات جديدة على النماذج الحالية دون الحاجة إلى البدء من الصفر أو المشاركة في جلسات إعادة تدريب/ضبط مكلفة.
وفقًا لفريق أبحاث Google، فإن تعزيز LLM بلغة أخرى يؤدي إلى تحسين الأداء في المهام الحالية وتمكين المهام الجديدة التي لا يمكن تحقيقها بواسطة النماذج بمفردها.
تعليم روبوتات الدردشة القديمة حيلًا جديدة
تم إجراء البحث باستخدام Google PaLM2-S LLM، وهو نموذج تقول الشركة إنه مشابه لـ GPT-4، وهو الذكاء الاصطناعي الذي يدعم ChatGPT الخاص بـ OpenAI.
تم قياس PaLM2-S بمفردها في تجارب الفريق ثم مرة أخرى بعد تعزيزها بنماذج لغوية أصغر حجمًا ومتخصصة. وشملت المهام التي تم تنفيذها الترجمة، حيث أظهرت النسخة المعززة تحسنًا يصل إلى 13% مقارنة بالخط الأساسي، والترميز.
عند اختباره في مهام الترميز، أظهر النموذج الهجين تحسينات كبيرة، وفقًا للورقة البحثية:
“وبالمثل، عندما يتم تعزيز PaLM2-S بنموذج خاص بالرمز، فإننا نرى تحسنًا نسبيًا بنسبة 40% مقارنة بالنموذج الأساسي لإنشاء التعليمات البرمجية ومهام الشرح – على قدم المساواة مع نظيراتها المضبوطة تمامًا.”
آثار هائلة محتملة
على السطح، يمكن أن يكون لمكاسب الأداء الواضحة آثار فورية على قطاع الذكاء الاصطناعي. على سبيل المثال، كان الأداء المتزايد في مهام الترجمة أكبر عند ترجمة لغة ذات دعم منخفض إلى اللغة الإنجليزية. وتظل هذه مشكلة بارزة في التعلم الآلي، وعمل جوجل هنا لديه القدرة على إحداث تغيير جذري.
ومع ذلك، في المخطط الأكبر، من الممكن أن يعالج هذا المسار البحثي سيف ديموقليس الذي يلوح في الأفق والمعلق فوق رؤوس العديد من المديرين التنفيذيين للتكنولوجيا في قطاع الذكاء الاصطناعي: المشاكل القانونية التي يمكن أن تفكك أساس روبوتات الدردشة مثل ChatGPT.
حقوق الطبع والنشر مقابل الذكاء الاصطناعي
تمت تسمية صانعي بعض نماذج اللغات الكبيرة الأكثر شيوعًا كمتهمين في العديد من الدعاوى القضائية التي تعتمد على مزاعم بأن أنظمة الذكاء الاصطناعي هذه تم تدريبها على بيانات محمية بحقوق الطبع والنشر.
السؤال الذي سيتعين على المشرعين والمحاكم الإجابة عليه هو ما إذا كان بإمكان شركة هادفة للربح استخدام هذه البيانات بشكل قانوني لتدريب نماذجها اللغوية. وفي الحالة القصوى، إذا حكمت المحاكم بعدم قدرة المطورين على استخدام مثل هذه البيانات وأنه يجب تطهير أي نماذج تم تدريبها على المواد المحمية بحقوق الطبع والنشر، فقد يكون من المستحيل من الناحية الفنية أو غير ممكن من الناحية المالية الاستمرار في تقديم الخدمات المتأثرة.
في الأساس، بسبب التكاليف المرتفعة التي ينطوي عليها تدريب نماذج اللغة الكبيرة، واعتمادها على مجموعات هائلة من البيانات، فإن منتجات مثل ChatGPT، كما تم بناؤها اليوم، قد لا تكون قابلة للتطبيق في مشهد الذكاء الاصطناعي الأمريكي الأكثر تنظيمًا.
ومع ذلك، إذا نجح مخطط زيادة LLM الجديد من Google في مزيد من التطوير، فمن الممكن أن يتم تخفيف العديد من متطلبات التوسع وتكاليف إنشاء LLM من الصفر أو إعادة تدريب واحدة موجودة.
متعلق ب: إيطاليا تتعامل مع تنظيم الذكاء الاصطناعي كأحد الأولويات الرئيسية خلال رئاسة مجموعة السبع













