شركة OpenAI تطلق قدرات مع المدخلات المرئية في الوقت الفعلي لـ  ChatGPT

بعد يوم واحد من إصدار جوجل لنموذج من Gemini 2.0

شركة OpenAI تطلق قدرات مع المدخلات المرئية في الوقت الفعلي لـ  ChatGPT
نيفين نبيل

نيفين نبيل

5:12 م, السبت, 14 ديسمبر 24

أعلنت شركة “أوبن إيه آي” عن إطلاق ميزة الرؤية في “شات جي بي تي”، ما يسمح للروبوت الذكي بتحليل والتفاعل مع المدخلات المرئية في الوقت الفعلي. ويأتي هذا التحديث كتطوير إضافي لـGPT-4o، حيث كانت ميزة الصوت متاحة سابقًا فقط. الآن، يمكن للمستخدمين استخدام كاميرات هواتفهم الذكية للتفاعل مع ChatGPT، الذي بات قادرًا على رؤية ما يراه المستخدم.

التحديث الجديد يُمكّن ChatGPT من مناقشة السياق المرئي مباشرةً، سواء عبر فيديو مباشر أو من خلال مشاركة الشاشة. ويمكن تفعيل هذه الميزة عبر أيقونة فيديو جديدة في تطبيق الهاتف المحمول، مع توفر خاصية مشاركة الشاشة من خلال قائمة الخيارات. الميزة متاحة حاليًا لمشتركي باقات Plus، Pro، وTeam، في حين سيحصل مستخدمو باقات Enterprise وEdu على الوصول إليها بدءًا من يناير المقبل. كما أضافت OpenAI خاصية صوتية موسمية تتيح للمستخدمين الدردشة مع شخصية “سانتا”، في تجربة احتفالية محدودة حتى أوائل يناير.

وفي عرض توضيحي قدمه الرئيس التنفيذي للشركة، كيفن ويل، إلى جانب أعضاء الفريق، يوضح كيف كيف يساعد ChatGPT في مهام الحياة اليومية، مثل توجيه المستخدمين لصنع القهوة عبر توجيه الكاميرا إلى ماكينة القهوة. كما أظهر الفريق كيف يستطيع ChatGPT فهم الرسائل على شاشة الهاتف الذكي والتفاعل معها بذكاء، بما في ذلك الإشارة إلى تفاصيل مرئية مثل لحية سانتا التي كان يرتديها ويل.

ويأتي هذا التحديث بعد يوم واحد من إعلان جوجل عن أحدث إصدار من نموذج Gemini 2.0، الذي يتمتع أيضًا بقدرات على معالجة المدخلات المرئية والصوتية. ومع ذلك، يُبرز عرض OpenAI الأخير تفوق ChatGPT في التفاعل مع الكائنات والمهام اليومية بسلاسة، مما يعزز مكانته كأداة ذكية متعددة الاستخدامات في عالم الذكاء الاصطناعي.