متابعة بتول ضوا
أطلقت جوجل أداة تجريبية جديدة تُدعى Whisk تُحدث ثورة في عالم توليد الصور بالذكاء الاصطناعي، حيث تعتمد على الصور كمدخلات بدلًا من الأوامر النصية المعقدة. هذه الأداة المبتكرة تُتيح للمستخدمين تعديل وإعادة تخيل الصور بطريقة سهلة وسريعة، مما يفتح آفاقًا جديدة للإبداع الرقمي.
كيف تعمل Whisk؟
تعتمد Whisk على قوة نموذجين من نماذج الذكاء الاصطناعي المتطورة من جوجل:
Gemini: يقوم هذا النموذج بتحليل الصور المُدخلة وإنشاء نصوص وصفية مفصلة “خلف الكواليس” تلتقط جوهر الصورة، بما في ذلك الموضوع والمشهد والنمط.
Imagen 3: يُستخدم هذا النموذج عالي الجودة لتوليد الصور بناءً على النصوص الوصفية التي أنشأها Gemini. يُعرف Imagen 3 بقدرته على إنتاج صور دقيقة التفاصيل وإضاءة غنية، مع تقليل التشوهات.
بدلًا من كتابة أوامر نصية مطولة، يُمكن للمستخدمين ببساطة إدخال صورة أو مجموعة صور، وستقوم Whisk بتحليلها وإنشاء صور جديدة مُعدلة أو مُعاد تخيلها. يُمكن أيضًا إدخال صور متعددة لتحديد عناصر مختلفة مثل الموضوع والنمط والمشهد من صور مختلفة ودمجها معًا.
ميزات Whisk الرئيسية:
سهولة الاستخدام: لا حاجة لكتابة أوامر نصية معقدة، فقط أدخل الصور.
التركيز على الجوهر: لا تُعيد Whisk إنشاء نسخ طبق الأصل من الصور، بل تلتقط جوهر الموضوع وتُعيد تخيله.
إمكانية التعديل: يُمكن للمستخدمين تعديل النصوص الوصفية التي أنشأها Gemini لتحسين النتائج أو إضافة عناصر مفقودة.
سرعة الإبداع: تُتيح Whisk إنشاء صور جديدة بسرعة وسهولة، مما يُشجع على التجربة والاستكشاف.
التنزيل: يُمكن تنزيل الصور الناتجة بسهولة.
لماذا Whisk مُختلفة؟
تختلف Whisk عن برامج تعديل الصور التقليدية في أنها لا تُركز على التعديلات الدقيقة، بل تُقدم وسيلة إبداعية لاستكشاف أفكار جديدة وإنشاء صور مُبتكرة. تُشجع Whisk على التجربة والتفكير خارج الصندوق، حيث قد تُنتج صورًا غير متوقعة تُثير الإلهام.
التوفر:
تتوفر Whisk حاليًا بنسخة تجريبية للمقيمين في الولايات المتحدة المُسجلين في منصة Google Labs.