تخيل استحضار أي صورة يرغب فيها العقل، بدءًا من صورة واقعية للغاية لرائد فضاء يسكن القمر إلى لوحة مائية غريبة الأطوار لقطط تلعب الشطرنج في مكتبة تنعدم فيها الجاذبية. هذا هو سحر الذكاء الاصطناعي التوليدي للصور، وهي تقنية غيرت مشهد الإبداع البصري في بضع سنوات فقط.
تطور إنشاء الصور باستخدام الذكاء الاصطناعي التوليدي
لقد زُرعت بذور إنشاء الصور عبر الذكاء الاصطناعي التوليدي في السبعينيات من القرن الماضي مع نماذج رائدة مثل آرون هارولد كوهين، الذي استخدم قواعد بسيطة لإنشاء فن تجريدي. لقد حصل الذكاء الاصطناعي (AI) على نصيبه العادل من التاريخ وتقدم على مر العقود، حيث تتعلم الشبكات العصبية تدريجياً كيفية التقاط تعقيدات صور العالم الحقيقي. ومع ذلك، لم ينفجر هذا المجال حقًا إلا في منتصف عام 2010.
في عام 2014، ظهرت شبكات الخصومة التوليدية (GANs)، مما أدى إلى تأليب شبكتين عصبيتين ضد بعضهما البعض: مولد ينشئ الصور وأداة تمييز تحاول تمييزها عن الصور الحقيقية. دفع هذا التدريب التنافسي حدود الواقعية، مما مهد الطريق لنماذج مثل StyleGAN2، التي يمكنها توليد صور واقعية والتلاعب بالصور الموجودة عن طريق تغيير أسلوبها.
اللاعبون الرئيسيون في مجال الذكاء الاصطناعي التوليدي
يهيمن اللاعبون التاليون على مشهد الذكاء الاصطناعي التوليدي للصور:
OpenAI’s Dall-E 2 وDall-E 3
تشتهر هذه النماذج بقدرتها على إنشاء صور واقعية وسريالية بشكل مذهل بناءً على المطالبات النصية. غالبًا ما تثير مخرجاتهم إحساسًا بالعجب الشبيه بالحلم، مما يحفز على الاستكشاف والتعبير الفني.
صورة Google AI
يتفوق هذا النموذج في إنشاء صور تلتزم بأنماط مرئية محددة، مما يجعله مثاليًا لمهام مثل إنشاء الفن المفاهيمي والتصميم الجرافيكي. ويمكنه أيضًا دمج عناصر من الصور الموجودة في مخرجاته، مما يوفر مزيجًا فريدًا من الواقعية والحرية الفنية.
منتصف الرحلة
توفر هذه المنصة واجهة سهلة الاستخدام وتركز على التفسير الفني للمطالبات النصية. تميل مخرجاتها إلى أن تكون أكثر تجريدية ورسمية، وغالبًا ما تميل نحو الجمالية السريالية أو الخيالية.
DreamStudio (الانتشار المستقر)
يمنح هذا النظام الأساسي مفتوح المصدر المستخدمين درجة عالية من التحكم في عملية إنشاء الصور. يمكنهم ضبط المعلمات والإعدادات المختلفة لضبط مخرجات النموذج، مما يجعله مثاليًا لأولئك الذين يريدون تجربة إبداعية أكثر عملية.
النمو الهائل للذكاء الاصطناعي التوليدي في إنشاء الصور
يشهد سوق الذكاء الاصطناعي التوليدي للصور نموًا هائلاً. وفقًا لتقرير عام 2023 الصادر عن شركة Grand View Research، من المتوقع أن يصل حجم السوق العالمية إلى 3.44 مليار دولار بحلول عام 2030، بمعدل نمو سنوي مركب (CAGR) يبلغ 32.4%. ويرجع هذا الارتفاع إلى الطلب المتزايد على المحتوى المرئي، والتقدم في تكنولوجيا الذكاء الاصطناعي، وتزايد إمكانية الوصول إلى المنصات سهلة الاستخدام.

وفي النصف الأول من عام 2023، شهد الذكاء الاصطناعي التوليدي للمجال الفني طفرة كبيرة في الاستثمارات، حيث اجتذب أكثر من 5 مليارات دولار، وفقًا لتقرير صادر عن CB Insights. ويمثل هذا جزءًا كبيرًا من المشهد العام للاستثمار في الذكاء الاصطناعي، مما يسلط الضوء على الاهتمام والإمكانات المتزايدة في هذا المجال. لا يُظهر هذا الاتجاه أي علامات على التباطؤ، مدفوعًا بأمثال صفقة OpenAI من Microsoft بقيمة 10 مليارات دولار واستثمار أمازون الأنثروبي بقيمة 4 مليارات دولار.
إن تطور الذكاء الاصطناعي التوليدي في إنشاء الصور يؤدي بسرعة إلى محو الحدود بين الإبداع البشري والآلة. ومع تقدم التكنولوجيا، نتوقع نماذج أكثر تطورًا بارعة في استيعاب المطالبات المعقدة، وإنتاج أساليب فنية متنوعة وتعزيز التعاون.
دليل خطوة بخطوة لإنشاء الصور باستخدام Dall-E 3
يظل Dall-E 3 واحدًا من أكثر نماذج الذكاء الاصطناعي التوليدية رواجًا نظرًا لجودة صورته الاستثنائية وإمكاناته الإبداعية. فيما يلي دليل خطوة بخطوة لاستخدامه:
الخطوة 1: انضم إلى قائمة انتظار Dall-E 3 على OpenAI
حاليًا، Dall-E 3 في مرحلة تجريبية مغلقة، ولا يمكن الوصول إليها إلا من خلال نظام قائمة الانتظار. يمكن للمستخدمين التسجيل في قائمة الانتظار على موقع OpenAI الإلكتروني.
الخطوة 2: صياغة مطالبات الصور التفصيلية
بمجرد منح الوصول، يمكن للمستخدمين صياغة مطالبة نصية واضحة وموجزة تصف الصورة التي يريدون إنشاءها. سيحتاج المستخدمون إلى أن يكونوا محددين بشأن التفاصيل مثل التركيب والأسلوب والإضاءة. كلما كانت المطالبة أكثر وصفية، كلما كان النموذج قادرًا على فهم رؤية المستخدم بشكل أفضل.
مثال سريع: قم بإنشاء صورة تصور مشهدًا أسطوريًا حيث تمثل الرموز المميزة التي تعمل بتقنية blockchain قوة الحياة، مع تصميمات معقدة ترمز إلى النظم البيئية المالية الآمنة والشفافة.

الخطوة 3: استكشاف أشكال الصور المتعددة
يسمح Dall-E 3 للمستخدمين بإنشاء أشكال متعددة للصورة بناءً على المطالبة الأولية. يمكن للمستخدمين تحسين مطالبتهم أو استخدام ميزة “Outpainting” لإضافة تفاصيل إضافية إلى الصورة التي تم إنشاؤها.
الخطوة 4: تنزيل الصور ضمن إرشادات الاستخدام
بمجرد رضا المستخدمين عن الصورة، يمكنهم تنزيلها بتنسيقات مختلفة لاستخدامها مرة أخرى. تجدر الإشارة إلى أنه يجب على المستخدمين الالتزام بإرشادات استخدام OpenAI فيما يتعلق بالتطبيقات التجارية وغير التجارية.
هل صور Dall-E مجانية للاستخدام التجاري؟
تضع OpenAI سياسة المحتوى والشروط التي يجب على المستخدمين الالتزام بها فيما يتعلق بالاستخدام التجاري للصور التي تنتجها Dall-E. بشكل عام، يمتلك الفرد الصور التي يقوم بإنشائها باستخدام Dall-E.
تتضمن هذه الملكية حقوق إعادة طباعة هذه الصور وبيعها واستخدامها للترويج، بغض النظر عما إذا كانت الصور قد تم إنشاؤها من خلال أرصدة مجانية أو مدفوعة الأجر.
كيف تعمل اعتمادات Dall-E
رصيد Dall-E هو وحدة تستخدمها OpenAI لقياس وإدارة استخدام نظام توليد الصور Dall-E. يُعرض على المستخدمين هذه الاعتمادات لاستخدام Dall-E لإنشاء الصور.
هناك نوعان من الاعتمادات:
اعتمادات مجانية
غالبًا ما توفر OpenAI للمستخدمين أرصدة مجانية، بشكل أساسي عند التسجيل أو كجزء من العروض الترويجية. تتيح هذه الاعتمادات للمستخدمين إنشاء صور دون أي تكلفة. كان المتبنون الأوائل الذين اشتركوا في Dall-E قبل 6 أبريل 2023، مؤهلين للحصول على أرصدة مجانية.
تنتهي صلاحية هذه الاعتمادات بعد شهر واحد من إصدارها ويتم تجديدها شهريًا. على سبيل المثال، إذا تم استلام الأرصدة في 19 ديسمبر، فستتم إعادة تعبئتها في 19 يناير. بالنسبة لأولئك الذين ينضمون في 29 أو 30 أو 31 من أي شهر، تتم إعادة تعبئة أرصدتهم المجانية في 28 من كل شهر لاحق.
الاعتمادات المدفوعة
بمجرد استنفاد الأرصدة المجانية، يمكن للمستخدمين شراء أرصدة إضافية لمواصلة استخدام Dall-E. عادةً ما يتم شراء هذه الاعتمادات المدفوعة في حزم أو حزم. يمكن للمرء شراء أرصدة Dall-E من خلال النقر على زر “شراء الأرصدة”، الموجود في صفحة حسابه أو في القائمة المنسدلة أسفل صورة ملفه الشخصي.
يتم تحديد الأسعار وعدد الصور التي يمكن إنشاؤها لكل رصيد بواسطة OpenAI وقد يختلف بمرور الوقت أو عبر مستويات مختلفة للمستخدمين.
ما هي تكلفة استخدام Dall-E؟
تختلف تكلفة استخدام Dall-E وفقًا لخطة الاستخدام التي اختارها المستخدم. قدمت OpenAI عددًا محددًا من الاعتمادات المجانية عند التسجيل، والتي يمكن استخدامها لإنشاء عدد محدود من الصور. بمجرد استنفاد هذه الأرصدة المجانية، يكون لدى المستخدمين خيار شراء أرصدة إضافية على دفعات مكونة من 115 جيلًا بسعر 15 دولارًا.
بالنسبة لـ Dall-E 3، تبلغ تكلفة الصور ذات الجودة القياسية بدقة 1024×1024 0.04 دولارًا لكل صورة، وبدقة 1024×1792 أو 1792×1024، تكلف 0.08 دولارًا لكل صورة. يبلغ سعر الصور عالية الجودة بدقة 1024 × 1024 0.08 دولارًا أمريكيًا لكل صورة، وبدقة أكبر تبلغ 1024 × 1792 أو 1792 × 1024، تبلغ التكلفة 0.12 دولارًا أمريكيًا لكل صورة. يقدم Dall-E 2 صورًا بدقة 1024×1024 مقابل 0.02 دولارًا لكل صورة، وبدقة 512×512 مقابل 0.018 دولارًا لكل صورة، وبدقة 256×256 مقابل 0.016 دولارًا لكل صورة.
كيفية استخدام المولدات الفنية للذكاء الاصطناعي بشكل أخلاقي
يتضمن الحصول على الصور بشكل أخلاقي من مولدات فنون الذكاء الاصطناعي مثل Dall-E الالتزام بشروط استخدام خدمة الذكاء الاصطناعي، واحترام الملكية الفكرية عن طريق تجنب إنشاء محتوى محمي بحقوق الطبع والنشر أو محتوى يحمل علامة تجارية، وضمان الخصوصية من خلال عدم إنشاء صور لأفراد عاديين دون موافقة.
من المهم جدًا مراعاة العواقب الأخلاقية لطلبات الصور وتجنب أي شيء يمكن أن يسيء إلى الصور النمطية أو يلحق بها الضرر أو يعززها. يجب استخدام الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي فقط عندما يكون ذلك مناسبًا، خاصة عندما تكون الأصالة مطلوبة.
يعد البقاء على اطلاع بتحديثات السياسة والاعتراف بتأثيرها على الفنانين والمبدعين أمرًا ضروريًا أيضًا. عند الضرورة، يجب توفير الإسناد المناسب للصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي.













