جوجل تطلق نموذج Gemini 3 Pro Image
أعلنت جوجل رسميًا عن إطلاق نموذج Gemini 3 Pro Image — المعروف أيضًا باسم Nano Banana Pro — وهو أحدث إضافة إلى منظومة نماذج الذكاء الاصطناعي الخاصة بها، ليقدم مستوى جديدًا من الدمج بين التصميم البصري والذكاء الاستدلالي والمعرفة الدقيقة المبنية على البيانات الواقعية.
ويعتمد النموذج على البنية المتطورة لـ Gemini 3 Pro، ما يمنحه قدرات عالية على التخصيص ودقة غير مسبوقة في إنتاج الصور وتعديلها. ويُتاح النموذج عالميًا عبر خيار Create image داخل تطبيق Gemini باستخدام نموذج Thinking، مع حصص مجانية محدودة لتجربته من قبل جميع المستخدمين.
ترقية جذرية لجيل Nano Banana
يمثل Nano Banana Pro الجيل الثاني من النموذج الشهير Nano Banana الذي حقق رواجًا واسعًا، إذ يوفر الآن أدوات متقدمة للتحرير والتصميم لصنّاع المحتوى، والطلاب، والمبدعين، والشركات.
تحويل الأفكار إلى تصميمات جاهزة
يتيح النموذج تحويل أي فكرة إلى مخطط بصري متكامل؛ سواء كان نموذجًا أوليًا، أو إنفوغرافيك، أو خطوات تعليمية مصوّرة، أو بيانات حية مثل الطقس والرياضة، أو حتى ملاحظات مكتوبة بخط اليد تتحول تلقائيًا إلى تصميم منسّق.
ويعمل Nano Banana Pro بالاعتماد على تقنية Search Grounding أو “الارتكاز على البحث”، وهي آلية تربط النموذج مباشرة بنتائج بحث جوجل الآنية. وبدل أن يعتمد النموذج على بيانات التدريب فقط، فإنه يجلب معلومات واقعية وحديثة من الويب لدمجها داخل الصور أو النصوص.
على سبيل المثال: عند طلب “خريطة الطقس الحالية في القاهرة”، يستدعي النموذج بيانات الطقس الحقيقية من بحث جوجل قبل إنشاء الصورة. وفي حالة طلب “إنفوغرافيك عن مباراة ريال مدريد الليلة”، يعتمد على نتائج البحث الفعلية لإنتاج الأرقام والمعلومات داخل التصميم.
قدرات فائقة على معالجة النصوص داخل الصور
يمتاز Nano Banana Pro بإمكانية توليد نصوص طويلة داخل الصور — بما في ذلك فقرات كاملة — إلى جانب القدرة على تصميم الشعارات والخطوط الفنية (Calligraphy) بأنماط مختلفة، ودعم لغات متعددة مع المحافظة على جودة التصميم. كما يمكنه دمج النصوص داخل المشاهد بطريقة طبيعية دون تشويه العناصر البصرية.
وتشير جوجل إلى أن هذا هو أفضل نموذج لديها حتى الآن في التعامل مع النصوص داخل الصور من حيث الدقة والوضوح.
دمج الصور وتوحيد الشخصيات
يوفر النموذج إمكانية دمج ما يصل إلى 14 صورة في صورة واحدة مع الحفاظ على اتساق ما يصل إلى 5 أشخاص داخل المشهد. وتُعد هذه الميزة مثالية لصنّاع المحتوى، والتسويق، وتصميم الواجهات، وصناعة الأفلام والرسوم المتحركة، ومجالات الأزياء والإعلانات.
كما يمكن للنموذج تحويل الرسوم الأولية إلى نماذج واقعية، وتحويل المخططات الهندسية إلى تصاميم ثلاثية الأبعاد شديدة القرب من المنتجات الحقيقية.
المصدر : مدونة سمارت سيرفس – سمارت سيرفس












