ما أسوأ ما يمكن أن يحدث؟

عندما يقوم نظام الذكاء الاصطناعي التوليدي بإخراج شيء مشابه بشكل لافت للنظر للبيانات التي تم تدريبه عليها، فهل يعد ذلك انتهاكًا لحقوق الطبع والنشر أم خطأ في النظام؟ هذا هو السؤال الذي يكمن في قلب الدعوى القضائية الأخيرة التي رفعتها صحيفة نيويورك تايمز ضد OpenAI، صانع ChatGPT.

تزعم صحيفة التايمز أن شركة OpenAI استخدمت محتوى من موقع صحيفة نيويورك تايمز لتدريب نماذج الذكاء الاصطناعي الخاصة بها أكثر من أي مصدر خاص آخر تقريبًا – مع ويكيبيديا ومجموعات البيانات التي تحتوي على وثائق براءات الاختراع الأمريكية فقط التي تتفوق عليها.

تقول شركة OpenAI إن التدريب على البيانات المحمية بحقوق الطبع والنشر هو “استخدام عادل” وأن الدعوى القضائية التي رفعتها صحيفة نيويورك تايمز “لا أساس لها من الصحة”.

نحن نبني الذكاء الاصطناعي لتمكين الناس، بما في ذلك الصحفيين.

موقفنا من @نيتايمز دعوى قضائية:
• يعتبر التدريب استخدامًا عادلاً، ولكننا نقدم إمكانية إلغاء الاشتراك
• “القلس” هو خطأ نادر ونحن نقوده إلى الصفر
• صحيفة نيويورك تايمز لا تروي القصة كاملةhttps://t.co/S6fSaDsfKb

– أوبن إيه آي (@OpenAI) 8 يناير 2024

الرهانات

يمكن تسوية الدعوى خارج المحكمة، وقد تنتهي بالتعويضات أو الفصل من العمل، أو نتائج أخرى لا تعد ولا تحصى. ولكن بعيدًا عن الإغاثة المالية أو الأوامر القضائية (التي يمكن اعتبارها مؤقتة، أو في انتظار الاستئناف، أو التي يتم تفعيلها عند استئناف غير ناجح)، فإن العواقب يمكن أن تؤثر على المجتمع الأمريكي ككل مع تأثير عالمي محتمل أبعد من ذلك.

أولاً، إذا قضت المحاكم لصالح OpenAI بأن تدريب أنظمة الذكاء الاصطناعي على المواد المحمية بحقوق الطبع والنشر يعد استخدامًا عادلاً، فقد يكون لذلك تأثير كبير على النظام القانوني الأمريكي.

وكما كتب مايك كوك، كبير المحاضرين في كينجز كوليدج، مؤخرًا في The Conversation:

“إذا كنت قد استخدمت الذكاء الاصطناعي للرد على رسائل البريد الإلكتروني أو تلخيص العمل لك، فقد ترى ChatGPT كغاية تبرر الوسيلة. ومع ذلك، ربما ينبغي لنا أن نشعر بالقلق إذا كانت الطريقة الوحيدة لتحقيق ذلك هي إعفاء كيانات مؤسسية محددة من القوانين التي تنطبق على الجميع.

وتقول صحيفة نيويورك تايمز إن مثل هذا الإعفاء من شأنه أن يمثل تهديدا واضحا لنموذج أعمالها.

اعترفت OpenAI بأن ChatGPT به “خلل” حيث يقوم أحيانًا بإخراج مقاطع نصية تحمل أوجه تشابه مذهلة مع الأعمال الحالية المحمية بحقوق الطبع والنشر. وفقًا لصحيفة التايمز، قد يؤدي هذا إلى تجاوز نظام حظر الاشتراك غير المدفوع، وحرمان الشركة من عائدات الإعلانات، والتأثير على قدرتها على أداء وظائفها الأساسية.

إذا سُمح لـ OpenAI بمواصلة التدريب على المواد المحمية بحقوق الطبع والنشر دون قيود، فإن التأثيرات طويلة المدى لصحيفة نيويورك تايمز وأي منافذ صحفية أخرى يمكن استخدام عملها لتدريب أنظمة الذكاء الاصطناعي قد تكون كارثية، وفقًا للدعوى القضائية.

ويمكن القول الشيء نفسه بالنسبة للمجالات الأخرى التي تحقق فيها المواد المحمية بحقوق الطبع والنشر الأرباح، بما في ذلك الأفلام والتلفزيون والموسيقى والأدب وغيرها من أشكال الوسائط المطبوعة.

من ناحية أخرى، في الوثائق المقدمة إلى لجنة الاتصالات والرقمية بمجلس اللوردات في المملكة المتحدة، قالت OpenAI “سيكون من المستحيل تدريب نماذج الذكاء الاصطناعي الرائدة اليوم دون استخدام مواد محمية بحقوق الطبع والنشر”.

وأضافت شركة الذكاء الاصطناعي:

“إن قصر بيانات التدريب على الكتب والرسومات العامة التي تم إنشاؤها منذ أكثر من قرن من الزمان قد يؤدي إلى تجربة مثيرة للاهتمام ولكنه لن يوفر أنظمة الذكاء الاصطناعي التي تلبي احتياجات مواطني اليوم.”

الصندوق الأسود

وما يزيد الأمور تعقيدًا هو حقيقة أن التوصل إلى تسوية قد يكون صعبًا. اتخذت شركة OpenAI خطوات لمنع ChatGPT والمنتجات الأخرى من إنتاج مواد محمية بحقوق الطبع والنشر، ولكن لا توجد ضمانات تكنولوجية بأنها لن تستمر في القيام بذلك.

يُشار إلى نماذج الذكاء الاصطناعي مثل ChatGPT باسم أنظمة “الصندوق الأسود”. وذلك لأن المطورين الذين يقومون بإنشائها ليس لديهم طريقة لمعرفة بالضبط سبب إنشاء النظام لمخرجاته.

بسبب هذا الصندوق الأسود، والطريقة التي يتم بها تدريب نماذج اللغات الكبيرة مثل ChatGPT، لا توجد طريقة لاستبعاد بيانات صحيفة نيويورك تايمز أو أي بيانات أخرى خاصة بمالك حقوق الطبع والنشر بمجرد تدريب النموذج.

متعلق ب: تواجه OpenAI دعوى قضائية جديدة بشأن حقوق الطبع والنشر بعد أسبوع من رفع دعوى قضائية في نيويورك تايمز

استنادًا إلى التكنولوجيا والأساليب الحالية، هناك احتمال كبير أن يضطر OpenAI إلى حذف ChatGPT والبدء من جديد من الصفر إذا تم حظره تمامًا من استخدام المواد المحمية بحقوق الطبع والنشر. في نهاية المطاف، قد يكون هذا مكلفًا للغاية وغير فعال بحيث لا يستحق العناء.

وتأمل OpenAI في التعامل مع هذا من خلال تقديم شراكات للمؤسسات الإخبارية والإعلامية إلى جانب الوعد بمواصلة العمل للقضاء على “خطأ” القلس.

السيناريو الأسوأ

إن السيناريو الأسوأ بالنسبة لمجال الذكاء الاصطناعي هو فقدان القدرة على تحقيق الدخل من النماذج المدربة على المواد المحمية بحقوق الطبع والنشر. في حين أن هذا لن يؤثر بالضرورة، على سبيل المثال، على المساعي المتعلقة بالسيارات ذاتية القيادة أو أنظمة الذكاء الاصطناعي المستخدمة لإجراء عمليات محاكاة الكمبيوتر العملاق، إلا أنه قد يجعل المنتجات التوليدية مثل ChatGPT غير قانونية لطرحها في السوق.

وعندما يتعلق الأمر بأصحاب حقوق الطبع والنشر، فإن أسوأ الحالات ستكون إعلان المحكمة بأن المواد المحمية بحقوق الطبع والنشر يمكن استخدامها بحرية لتدريب أنظمة الذكاء الاصطناعي.

وهذا، من الناحية النظرية، يمكن أن يمنح شركات الذكاء الاصطناعي حرية إعادة توزيع المواد المحمية بحقوق الطبع والنشر المعدلة قليلاً مع تحميل المستخدمين النهائيين المسؤولية القانونية عن أي حالات لا تفي فيها التعديلات بالمتطلبات القانونية لتجنب انتهاك حقوق الطبع والنشر.