نقد دعوى أن نموذج 4.5 تجاوز اختبار تورنغ! ويا للسخافة!

قد طفح الإنترنت بمقالات وعناوين عن تجاوز تشات جي بي تي 4.5 لاختبار تورنغ، بادئ ذي بدء فإن الورقة لم تخضع لمراجعة الأقران، ولو كان المجال غير الذكاء الاصطناعي لهب الجميع للنقد، ولكن طالما أن الأمر له علاقة بالخزعبلات المفيدة تسويقيا فإن تقاليد البحث العلمي تُنسَى.

1) قد جرى الاختبار "أونلاين" مع مشاركين عشوائيين، وليس مع عالِم استعرافي Cognitive scientist –مثلا– الذي قد يقبض على تشات جي بي تي متلبسا.
2) التنسيق الذي جرى استخدامه تمثَّل في نسخة ثلاثة الأطراف! وذا قيدبعيد كل البعد عن مقترح تورنغ في اختباره، فلا بد من وجود محقق يعمل على التمييز بين الإنسان والآلة.
3) ذُكِر أن نسبة النجاح كانت 73%، ولكن ذلك لم يتم إلا بعد أن أُعطِيَ النموذج توجيها شخصياتيًّا persona prompt، ملقِّنا إياه كيفية الخداع.
4) من غير ذلك التوجيه وصلت النسبة 36% فحسب، مما يعني أنه قد جرى التعرف على النموذج على أنه آلة 64% من الجولات.
5) الدلاليات السطحية والقصيرة (أعني المحادثات) تسهِّل الخداع مقارنة بالمحادثات العميقة والطويلة، وقد كانت الحوارت قصيرة وسطحية.
6) لا نعرف إذا بذل المشاركون كل جهدهم في محاولة التعرف على النموذج.

النقطة الأهم بعد أن تَنَزّلنا لهم في النقاط السابقة: اختبار تورنغ هو تجربة فكرية thought experiment وليس شيئا تقوم به على الحاسوب!

ويظل الغباء مستفحلا!

نقض* بدلا من نقد.
لم يسمح لي التلغرام بالتعديل ولم أعرف لماذا