جوجل تطلق أداة «Whisk» المدعومة بالذكاء الاصطناعى لدمج الصور بطريقة مبتكرة

لتعزيز مكانتها أمام الشركات الكبرى مثل OpenAI وMicrosoft وApple

جوجل تطلق أداة «Whisk» المدعومة بالذكاء الاصطناعى لدمج الصور بطريقة مبتكرة
نيفين نبيل

نيفين نبيل

4:33 م, الثلاثاء, 17 ديسمبر 24

أعلنت جوجل عن إطلاق أداة “Whisk” الجديدة، التي تدمج بين نماذج الذكاء الاصطناعي “Gemini AI” و”Imagen” لتقديم طريقة مبتكرة وسهلة لتوليد الصور باستخدام الذكاء الاصطناعي، الأداة الجديدة تتيح للمستخدمين “إعادة مزج الموضوعات والمشاهد والأنماط بطرق جديدة وممتعة”، وفقًا لما ذكرته “جوجل”.
وستكون الأداة متاحة في الولايات المتحدة فقط خلال الفترة الحالية، وهي جزء من جهود جوجل المستمرة لتعزيز مكانتها في منافسة الذكاء الاصطناعي مع الشركات الكبرى مثل “OpenAI” و”Microsoft” و”Apple”. كما أعلنت جوجل عن تحديثات لأدواتها الحالية مثل Veo 2 لإنشاء الفيديو وImagen 3 للصور، لتعزيز قدراتها في مجال الذكاء الاصطناعي.
وتم الإعلان عن أداة “Whisk” في مدونة جوجل الرسمية من خلال “Google Labs”، التي تعتبر بمثابة “موطن تجارب الذكاء الاصطناعي” لدى الشركة. وتتميز Whisk عن مولدات الصور الأخرى بقدرتها على تقسيم سطر المطالبة إلى ثلاثة خيارات أساسية: الموضوع، المشهد، والأسلوب، مما يمنح المستخدمين مزيدًا من التحكم في النتيجة النهائية.

  1. الموضوع: يمكن للمستخدمين وصف موضوع الصورة باستخدام نص، أو ببساطة سحب صورة موجودة بالفعل.
  2. المشهد: يمكن اختيار السيناريو الذي يرغب المستخدم في وضع الموضوع فيه، مع خيار “رمي النرد” ليترك Whisk اختيار المشهد عشوائيًا.
  3. الأسلوب: يتيح للمستخدم تحديد أسلوب الصورة، مع اقتراحات من جوجل مثل “رائع”، أو “أنيمي كلاسيكي من التسعينيات”.
    بعد إدخال هذه الخيارات، يعمل نموذج “Gemini AI” خلف الكواليس لإنشاء مطالبة أكثر تفصيلًا بناءً على الاختيارات التي أدخلها المستخدم. ثم يقوم “Imagen 3” بإنشاء الصورة النهائية بناءً على تلك المطالبة المفصلة.
    إذا لم تكن النتيجة كما توقع المستخدم أو كان يرغب في مزيد من التخصيص، يمكنه عرض وتحرير المطالبة الأطول التي أنشأها نموذج “Gemini” لتعديل التفاصيل بما يتناسب مع رغباته.
    وتقول جوجل إن “Whisk” ليست مجرد أداة لتعديل الصور، بل هي “أداة إبداعية جديدة” تهدف إلى الاستكشاف البصري السريع، وليس تحرير الصور بدقة البكسل، وفي هذا السياق، تشير جوجل إلى أن “Whisk” تساعد المستخدمين في “استكشاف الأفكار بطرق جديدة وإبداعية”، مع القدرة على العمل من خلال العديد من الخيارات وتنزيل الصور التي تعجبهم.
    وأضافت جوجل: “لقد وصف الفنانون والمبدعون “Whisk” كأداة للاستكشاف البصري، مما يسمح لهم بالعمل مع عشرات الخيارات، وتحميل تلك التي تلهمهم، لتوسيع آفاق الإبداع.”