كشفت شركة جوجل عن أداة جديدة لتوليد الصور تُعرف باسم Whisk. وتأتي هذه الأداة ضمن مجموعة أدواتها التجريبية، وهي تتيح للمستخدمين إمكانية إدخال الصور بدلًا من النصوص التفصيلية للحصول على صور معدلة أو “مُعاد تخيلها”.
وتوفر أداة Whisk إمكانية إدخال صور متعددة لتحديد عناصر مختلفة مثل الموضوع والنمط والمشهد. وتعتمد الأداة على نماذج الذكاء الاصطناعي Gemini لإنشاء نصوص وصفية خلفية لاستخدامها كمدخلات لنموذج جوجل لتوليد الصور Imagen 3.
يُذكر أن نموذج Imagen 3، الذي أطلقته الشركة في وقتٍ سابق من العام الجاري، يُعد من أعلى النماذج جودةً، إذ يتميز بقدرته على إنتاج صور ذات تفاصيل دقيقة، وإضاءة غنية، مع تقليل التشوهات مقارنةً بالإصدارات السابقة.
وفي منشورٍ لها عبر مدونتها الرسمية، أوضحت جوجل أن أداة Whisk لا تهدف إلى إعادة إنشاء النسخة الأصلية من الصور، بل تركز على التقاط “جوهر” الموضوع فقط. وبيّنت أن الأداة قد تُنتج صورًا تختلف عن التوقعات، إذ يمكن أن تظهر العناصر وخاصةً الأشخاص بلون بشرة مختلف أو تصفيفة شعر مغايرة.
وتتيح أداة Whisk للمستخدمين تعديل النصوص الخلفية لتعويض العناصر المفقودة أو تحسين النتائج. وقالت جوجل: “ندرك أن بعض المزايا قد تكون أساسية لمشروعك، وقد لا تنجح Whisk في تحقيقها بدقة، لذلك نتيح لك عرض النصوص الخلفية وتعديلها في أي وقت”.
ومع ذلك، أكدت جوجل أن الأداة لا تشبه برامج تعديل الصور الأخرى، بل تُعد وسيلة إبداعية لاستكشاف أفكار جديدة، والاستمتاع بعملية إنشاء الصور بنحو سريع ومبتكر، كما توفر الأداة خيار تنزيل الصور الناتجة.
وتُتيح جوجل أداة Whisk حاليًا بنحو تجريبي للمقيمين في الولايات المتحدة والمسجلين في المنصة التجريبية Google Labs، التي تمنح المستخدمين إمكانية الوصول إلى مزايا جوجل التجريبية في مجال الذكاء الاصطناعي.
نسخ الرابط تم نسخ الرابط
تابعنا
0 تعليق