اكتشف باحثو IBM Security مؤخرًا تقنية “سهلة بشكل مدهش ومخيف” لاختطاف المحادثات المباشرة والتلاعب بها باستخدام الذكاء الاصطناعي (AI).
ويعتمد الهجوم، المسمى “التقاط الصوت”، على الذكاء الاصطناعي التوليدي – وهو فئة من الذكاء الاصطناعي تتضمن ChatGPT من OpenAI وLlama-2 من Meta – وتكنولوجيا الصوت العميقة.
اصطياد الصوت
في التجربة، أمر الباحثون الذكاء الاصطناعي بمعالجة الصوت من مصدرين في اتصال مباشر، مثل محادثة هاتفية. عند سماع كلمة رئيسية أو عبارة محددة، يتم توجيه الذكاء الاصطناعي أيضًا لاعتراض الصوت ذي الصلة والتلاعب به قبل إرساله إلى المستلم المقصود.
وفقًا لمنشور مدونة من IBM Security، انتهت التجربة بنجاح الذكاء الاصطناعي في اعتراض صوت أحد المتحدثين عندما طلب منه المتحدث البشري الآخر تقديم معلومات حسابه المصرفي. ثم استبدل الذكاء الاصطناعي الصوت الأصلي بصوت مزيف عميق مما أعطى رقم حساب مختلف. ولم يتم اكتشاف الهجوم من قبل “الضحايا” في التجربة.
الذكاء الاصطناعي التوليدي
وتشير المدونة إلى أنه على الرغم من أن تنفيذ الهجوم سيتطلب مستوى معينًا من الهندسة الاجتماعية أو التصيد الاحتيالي، فإن تطوير نظام الذكاء الاصطناعي نفسه لا يشكل تحديًا كبيرًا:
“لقد كان بناء إثبات المفهوم (PoC) سهلاً بشكل مدهش ومخيف. لقد أمضينا معظم الوقت في اكتشاف كيفية التقاط الصوت من الميكروفون وتغذية الصوت بالذكاء الاصطناعي المولد.
تقليديًا، كان بناء نظام لاعتراض سلاسل صوتية محددة بشكل مستقل واستبدالها بملفات صوتية يتم إنشاؤها بسرعة يتطلب جهدًا متعدد التخصصات في علوم الكمبيوتر.
لكن الذكاء الاصطناعي التوليدي الحديث يقوم بالمهمة الثقيلة بنفسه. تقول المدونة: “نحتاج فقط إلى ثلاث ثوانٍ من صوت الفرد لاستنساخه”، مضيفة أنه في الوقت الحاضر، يتم تنفيذ هذه الأنواع من التزييف العميق عبر واجهة برمجة التطبيقات.
متعلق ب: تخدع تقنيات الذكاء الاصطناعي العميقة الناخبين والسياسيين قبل الانتخابات الأمريكية لعام 2024 – “اعتقدت أنها كانت حقيقية”
إن تهديد سرقة الصوت يتجاوز مجرد خداع الضحايا غير المتعمدين لإيداع الأموال في حساب خاطئ. ويشير الباحثون أيضًا إلى أنه يمكن أن يعمل كشكل غير مرئي من أشكال الرقابة مع إمكانية تغيير محتوى البث الإخباري المباشر أو الخطب السياسية في الوقت الفعلي.













