مواجهة بين أشهر 5 نماذج ذكاء اصطناعي.. إجابات غريبة من DeepSeek وGemin

مواجهة بين أشهر 5 نماذج ذكاء اصطناعي.. إجابات غريبة من DeepSeek وGemin
- أسعار الوقود
- ارتفاع أسعار
- استغلال السائقين
- القيادات التنفيذية
- المنتجات البترولية
- المهندسة نادية عبده
- النقل الجماعى
- تعريفة الركوب
- تعريفة ركوب
- جولة ميدانية
- أسعار الوقود
- ارتفاع أسعار
- استغلال السائقين
- القيادات التنفيذية
- المنتجات البترولية
- المهندسة نادية عبده
- النقل الجماعى
- تعريفة الركوب
- تعريفة ركوب
- جولة ميدانية
أجرت «الوطن»، مقارنة بين أشهر 5 نماذج ذكاء اصطناعي موجودة في الأسواق المحلية والعالمية وهي «ChatGPT،Copilot، DeepSeek - Grok- Gemini»، ووجهت أسئلة موحدة للتطبيقات من خلال الدكتور ماركو ممدوح، أستاذ الحاسبات والذكاء الاصطناعي، وجاءت الإجابات مختلفة ما يكشف حجم تدريب هذه النماذج ومدى تطورها.
جاءت المقارنة بين 3 أسئلة للكشف عن آخر تحديث للنماذج (من هو رئيس أمريكا الحالي)، والثاني: القدرة على حل المسائل الحسابية والتفكير المنطقي (ما هي السرعة المتوسطة لسيارة قطعت 60 ميلا في زمن قدره ساعة ونصف؟)، والثالث: المعلومات العامة (لماذا تبدو السماء زرقاء أثناء النهار؟)، حيث وجهت هذه الأسئلة للنماذج الـ5 باللغة الإنجليزية لعدم دعمها اللغة العربية.
مواجهة بين أشهر 5 نماذج ذكاء اصطناعي
وبحسب أستاذ الحاسبات والذكاء الاصطناعي، جاءت النتائج كالتالي:
السؤال الأول من هو رئيس أمريكا الحالي؟
1- ChatGPT: قام بالبحث عبر الإنترنت لإيجاد إجابة السؤال، وهذا يعني أنه غير محدث ويستخدم الإنترنت في البحث عن الإجابات التي تتعلق بمتغيرات الأوضاع الحالية.
2- Copilot: قام أيضا بالبحث عبر الإنترنت لإيجاد إجابة السؤال وتبين أنه أيضا غير محدث
3- DeepSeek: لم يبحث عبر الإنترنت لهذا كانت إجابته سريعة وخاطئة جو بايدن، لأن آخر تحديث للمعلومات العامة كان في أكتوبر 2023
4- Grok: قام أيضا بالبحث عبر الإنترنت لإيجاد إجابة السؤال وتبين أنه أيضا غير محدث
5- Gemini، فاجأ الجميع حيث امتنع عن الإجابة على السؤال وهو ما يعني أنه غير محدث منذ زمن بعيد.
ما هي السرعة المتوسطة لسيارة قطعت 60 ميل في زمن قدره ساعة ونصف؟
«الوطن»، وجهت سؤالا آخر ما هي السرعة المتوسطة لسيارة قطعت 60 ميل في زمن قدره ساعة ونصف؟، فجاءت الإجابات كالتالي:
1- ChatGPT: إجابة صحيحة واستدل بالمعادلة أن (السرعة = المسافة / الزمن) مع تنسيق ممتاز للإجابة والمعادلة.
2- Copilot: إجابة صحيحة واستدل بالمعادلة أن (السرعة = المسافة / الزمن) مع تنسيق ممتاز للإجابة والمعادلة.
3- DeepSeek: إجابة صحيحة واستدل بالمعادلة أن (السرعة = المسافة / الزمن) مع تنسيق ممتاز للإجابة والمعادلة.
4- Grok: إجابة صحيحة واستدل بالمعادلة أن (السرعة = المسافة / الزمن) مع تنسيق ممتاز للإجابة والمعادلة.
5- Gemini: إجابة صحيحة ولكنه الأسوأ في الشرح والأسوأ في تنسيق الإجابة.
السؤال الثالث لماذا تبدو السماء زرقاء أثناء النهار؟
جاءت الإجابات على السؤال الثالث مختلفة أيضا وهي:
1- ChatGPT: إجابة صحيحة وشرح واف لظاهرة تبعثر الضوء وعرفها بشكل صحيح باسم ظاهرة تشتت رايلي Rayleigh scattering.
2- Copilot: إجابة صحيحة وشرح واف لظاهرة تبعثر الضوء وعرفها بشكل صحيح باسم ظاهرة تشتت رايلي Rayleigh scattering.
3- DeepSeek: إجابة صحيحة وشرح واف لظاهرة تبعثر الضوء وعرفها بشكل صحيح باسم ظاهرة تشتت رايلي Rayleigh scattering.
4- Grok: إجابة صحيحة وشرح واف لظاهرة تبعثر الضوء وعرفها بشكل صحيح باسم ظاهرة تشتت رايلي Rayleigh scattering.
5- Gemini: إجابة صحيحة وشرح واف لظاهرة تبعثر الضوء وعرفها بشكل صحيح باسم ظاهرة تشتت رايلي Rayleigh scattering
الاستنتاج من المقارنة
في السؤال الأول: جميع النماذج غير محدثة بآخر الأحداث العالمية، والنماذج التي أجابت إجابة صحيحة كان بسبب إمكانية البحث على الإنترنت عن الإجابة، وهذه خاصية بحث برمجية يمكن إضافتها لأي نموذج منها دون تدريب، أما الأسوأ فكان نموذج جوجل Gemini لعدم الرد على السؤال من الأساس.
في السؤال الثاني: جميع النماذج أجابت بشكل صحيح على سؤال احتساب سرعة السيارة واستدلال صحيح بالمعادلة وإيجاد الإجابة الصحيحة
في السؤال الثالث: جميع النماذج أيضا أجابت بشكل صحيح، ولكن الشرح والتنسيق لعب دورا كبيرا في إجابة السؤال، حيث تفوق ChatGPT و DeepSeek وGrok وCopilot على نموذج جوجل Gemini، الذي كتب الإجابة بخطوات في سطور دون أي توضيح لشكل للمعادلة وهذا يعني أنه عند الأسئلة الرياضية الكبيرة سيكون الأسوأ في الشرح وكتابة المعادلات، لكنه وصل للإجابة الصحيحة على أي حال.
- أسعار الوقود
- ارتفاع أسعار
- استغلال السائقين
- القيادات التنفيذية
- المنتجات البترولية
- المهندسة نادية عبده
- النقل الجماعى
- تعريفة الركوب
- تعريفة ركوب
- جولة ميدانية
- أسعار الوقود
- ارتفاع أسعار
- استغلال السائقين
- القيادات التنفيذية
- المنتجات البترولية
- المهندسة نادية عبده
- النقل الجماعى
- تعريفة الركوب
- تعريفة ركوب
- جولة ميدانية