Find Out More

Is your organization one of the Best Places to work in Egypt

workL

دراسة بحثية

دراسة: النماذج اللغوية مثل GPT-o4-mini نسب إجاباتها الخاطئة تتجاوز 70%

دراسة: النماذج اللغوية مثل GPT-o4-mini نسب إجاباتها الخاطئة تتجاوز 70%

3:02 م, الأربعاء, 7 مايو 25

سجل GPT-o3 معدل أخطاء بلغ 51%، في حين وصل أداء o4-mini إلى 79%