رئيس التحرير
حسام حسين لبش

رئيس التحرير: حسام حسين لبش

مدير التحرير: علي عجمي

ذات صلة

متفرقات

هل شكلك الذي تراه في المرآة هو نفسه شكلك الحقيقي؟!

فهم النظر إلى الذات من خلال المرآة المرآة، ذلك الكائن...

ورم في المخ: اكتشف أبرز الأعراض وكيفية الفحص المبكر

الصداع هو أحد أكثر الشكاوى الصحية شيوعًا، ولكن هل...

إينيجو مارتينيز: لا أفكر بمستقبلي حالياً .. والعمر سبب عدم استدعائي لمنتخب إسبانيا

أكد إينيجو مارتينيز، مدافع برشلونة، أنه لا يركز حالياً...

إشارات على ساقيك تنذرك بهذا النوع من السرطان

الأعراض المحتملة التي قد تشير لنوع معين من السرطان في...

رسالة وتهديدات.. خالد يوسف يكشف تفاصيل. الاعتداء على مكتبه

فاجأ المخرج المصري خالد يوسف متابعيه في الساعات الأخيرة...

ميتا تنافس جوجل بتوليد الصور بالذكاء الاصطناعي

متابعة-جودت نصري

 

أعلنت شركة ميتا- بلاتفورمز الأمريكية إطلاق نموذج CM3Leon الجديد لتوليد الصور بالذكاء الاصطناعي وفقاً للإرشادات النصية المدخلة.
وتدعي “ميتا” أن هذا النموذج يعد أفضل نموذج في فئته لتوليد الصور استناداً إلى الأوامر النصية.

مميزات النموذج الجديد
ويتميز هذا النموذج – وفقاً لـ”ميتا” – بأدائه ذي الحالة الفنية المتطورة لتوليد صور أكثر اتساقاً مع الأوامر النصية، إذ إنه أكثر كفاءة، ويتطلب حوسبة أقل بخمس مرات، ومجموعة بيانات أصغر للتدرب مقارنةً بالنماذج الأخرى، حسبما أوردت “البوابة التقنية للأخبار التقنية”.
وتعتمد معظم مولدات الصور التي تعمل بالذكاء الاصطناعي على تقنية تُعرف باسم “الانتشار Diffusion” وهي تقنية تتطلب حوسبة أكبر فضلاً عن كونها بطيئة ومكلفة لتشغيلها، وهي موجودة في أدوات مثل DALL-E التي تطورها شركة “أوبن إيه آي/ OpenAI، و”إيمجن/ Imagen” التي تطورها “جوجل”، بالإضافة إلى Stable Diffusion وغيرها، بينما يعتمد نموذج ميتا CM3Leon على تقنية مختلفة تُعرف باسم “الاهتمام Attention” تجعل النموذج أسرع في التدرب وخلق النتائج وأقل كلفة في التشغيل.
ويتفرد نموذج “CM3Leon” بقدرته على توليد وصف للصور، ما يمهد الطريق لنماذج فهم الصور ذات القدرات الأكبر في المستقبل، وفقاً للشركة.

خطوة نحو التحسين
وقالت ميتا عبر مدونتها الرسمية: “من خلال قدرات CM3Leon يمكن لأدوات توليد الصور إنتاج صور أكثر اتساقاً وفقاً للإرشادات النصية المدخلة، ونحن نعتقد أن الأداء القوي للنموذج – عبر مجموعة متنوعة من المهام – يمثل خطوة نحو تحسين جودة توليد الصور وفهمها”.
واستخدمت “ميتا” ملايين الصور المرخصة من شركة Shutterstock من أجل تدريب “CM3Leon”، وتحتوي أقوى نسخة من النموذج على 7 مليارات معامل، أي أكثر من ضعف ما يحتويه نموذج DALL-E 2 التابع لشركة OpenAI، ويعد المعامل Parameter وحدة قياس لمهارة النموذج وقدراته.
تابعي المزيد: انطلاقة قوية لتطبيق ثريدز.. 10 ملايين مشترك خلال ساعات

الإجابة عن الأسئلة
كما استخدمت “ميتا” تقنية “الضبط الدقيق تحت الإشراف” لتدريب “CM3Leon، إذ حسنت أداء النموذج في توليد الصور وكتابة الوصف والتعليقات على الصور، ما يوفر إمكانية الإجابة عن الأسئلة حول الصور، وكذلك تعديلها باستخدام الأوامر النصية.

استخدامات واسعة
ويمكن استخدام “CM3Leon” في مجموعة واسعة من التطبيقات مثل الواقع الافتراضي والواقع المعزز والروبوتات والإعلان والتسويق.
ولم تحدد “ميتا” موعد إصدار نموذج “CM3Leon” أو إذا كانت تنوي إطلاقه كاملًا للجمهور، ومن المتوقع أن تكشف ميتا مزيد من التفاصيل حول النموذج في وقتٍ لاحق.

تابعونا علي مواقع التواصل الاجتماعي