أطلقت Anthropic ، وهي شركة تعمل بالذكاء الاصطناعي (AI) و “المنفعة العامة” ، Claude 2 في 11 يوليو ، مما يمثل علامة فارقة أخرى في عام حافل بالتقدم الذي لا يتوقف على ما يبدو من قطاع الذكاء الاصطناعي التوليدي المزدهر.
نقدم لكم كلود 2! أدى أحدث نموذج لدينا إلى تحسين الأداء في الترميز والرياضيات والاستدلال. يمكن أن ينتج استجابات أطول ، ومتاح في موقع تجريبي جديد يواجه الجمهور على https://t.co/uLbS2JNczH في الولايات المتحدة والمملكة المتحدة. pic.twitter.com/jSkvbXnqLd
– أنثروبيك (AnthropicAI) 11 يوليو 2023
وفقًا لمدونة الشركة ، يُظهر Claude 2 تحسينات عبر كل فئة قابلة للقياس تقريبًا. ولعل أبرز الاختلافات بينه وبين سلفه هو كيفية مناقشة الباحثين لعملهم.
لا يوجد ذكر لمعايير التعلم الآلي التقليدية أو الدرجات الحسابية مقابل نماذج مماثلة في منشور المدونة الذي يعلن كلود 2. وبدلاً من ذلك ، اختبرت Anthropic كلاً من Claude و Claude 2 وجهاً لوجه في العديد من الاختبارات التي تهدف إلى تمثيل المعرفة والمهارات والمشاكل في العالم الحقيقي -حل الاختبارات.
تفوقت كلود 2 على سابقتها في جميع المجالات في اختبارات المعرفة والترميز وغيرها من الاختبارات ، ووفقًا لـ Anthropic ، فقد أحرزت نتائج جيدة مقارنة بالمتوسطات البشرية:
“عند مقارنتها بطلاب الجامعات المتقدمين إلى كلية الدراسات العليا ، حصل كلود 2 على درجات أعلى من النسبة المئوية التسعين في اختبارات القراءة والكتابة GRE ، وبالمثل للمتقدم المتوسط في التفكير الكمي.”
تجدر الإشارة إلى أن العديد من الخبراء يعتقدون أن المقارنات بين المتقدمين للاختبار البشري والذكاء الاصطناعي غير فعالة بسبب طبيعة التفكير الإدراكي البشري واحتمال احتواء مجموعة بيانات التدريب لنموذج اللغة الكبير على معلومات الاختبار. بشكل أساسي ، الاختبارات المصممة للبشر قد لا “تختبر” في الواقع قدرة الذكاء الاصطناعي على التفكير أو تقديم إثبات مناسب للمعرفة أو المهارة الفعلية.
إلى جانب إطلاق Claude 2 ، أطلقت Anthropic إصدارًا تجريبيًا من واجهة “Talk to Claude” المستندة إلى الويب والتي توفر وصولاً عامًا إلى chatbot للمستخدمين في الولايات المتحدة والمملكة المتحدة.
متعلق ب: كيف تحصل على وظيفة عالية الأجر كمهندس سريع للذكاء الاصطناعي
أجرى كوينتيليغراف اختبارًا موجزًا للإصدار الجديد ، وبحسب القصص المتناقلة ، كانت التحسينات ملحوظة على الفور. استجاب كلود 2 لمطالبات كوينتيليغراف على الفور بإجابات واضحة وموجزة.
وفقًا لـ Anthropic ، يبلغ الحد الفوري للنموذج الجديد 100000 رمز ، أو ما يعادل 75000 كلمة تقريبًا. تشير واجهة مستخدم الموقع إلى أنه يمكن للمستخدمين تحميل ملفات PDF و TXT و CSV ومستندات مماثلة للتحليل ؛ ومع ذلك ، لم تعمل هذه الوظيفة في اختبار Cointelegraph المحدود قبل نشر هذه المقالة.
اجمع هذه المقالة باعتبارها NFT للحفاظ على هذه اللحظة في التاريخ وإظهار دعمك للصحافة المستقلة في مجال التشفير.