
جوجل تطلق “Imagen 4” لتوليد الصور بالنصوص وتعد بتحسينات في عرض النص داخل الصور
أعلنت شركة جوجل عن إطلاق الجيل الجديد من نموذجها لتوليد الصور بالذكاء الاصطناعي، تحت اسم “Imagen 4″، مع وعد بتحسينات ملموسة في عرض النصوص داخل الصور مقارنة بالإصدار السابق Imagen 3.
كما كشفت الشركة عن نسخة أكثر تطورًا تُدعى Imagen 4 Ultra، موجهة للمستخدمين الذين يحتاجون إلى التزام صارم بالتعليمات النصية ودقة عالية في التنفيذ، وتأتي هذه النسخة بتكلفة إضافية.
ويتوفر كلا النموذجين للتجربة المبدئية عبر واجهة برمجة التطبيقات (Gemini API)، إلى جانب اختبار مجاني محدود من خلال منصة Google AI Studio. وتبلغ تكلفة إنتاج صورة واحدة باستخدام الإصدار العادي 0.04 دولار، بينما تبلغ تكلفة صورة Imagen 4 Ultra حوالي 0.06 دولار، أي بزيادة تقارب 50%.
وقد استعرضت جوجل بعض قدرات النموذج الجديد من خلال مجموعة من الصور التجريبية، من بينها سلسلة قصصية مصورة بثلاث مشاهد، تظهر مركبة فضائية صغيرة تتعرض لهجوم من مخلوق فضائي أزرق. ولفتت جوجل إلى أن النموذج نفذ التعليمات النصية بدقة عالية، وإن كان الطابع البصري يقترب من أسلوب الرسوم ثلاثية الأبعاد.
وتصف جوجل Imagen 4 بأنه “الخيار المناسب لمعظم المهام”، موضحة أنه يستهدف الاستخدامات العامة، في حين يُقدم إصدار Ultra أداءً متقدمًا للمحترفين وصنّاع المحتوى.
ورغم التحسينات المعلنة، لا تزال النماذج البصرية من جوجل، بحسب آراء بعض المختصين، متأخرة نسبيًا عن نماذج منافسة مثل DALL·E 3 من OpenAI وMidjourney 7، واللتين تحظيان بانتشار واسع ورضا عالٍ في تجربة المستخدم. بالمقابل، سجّل نموذج جوجل Veo 3 مؤخرًا تقدمًا لافتًا في مجال توليد الفيديو، مما يعزز حضور الشركة في مضمار الذكاء الاصطناعي الإبداعي.
المصدر : سمارت سيرفس