أول وكالة اخبارية خاصة انطلقت في الأردن

تواصل بلا حدود

أخر الأخبار
المبعوث الأمريكي: يمكن لحماس الاحتفاظ بدورها السياسي دون سلاح الأردن : ذهب “24” عند 70.50 دينار الأمن العام يطيح بعصابة انتحلت صفات أمنية وسرقت وافدين في عمان وفاة طفلة دهسا في الأغوار الشمالية رئيس الوزراء السابق العين بشر الخصاونة يتقدم لامتحان القبول في نقابة المحامين نتنياهو للإسرائيليين: لدي كشف دراماتيكي لحقائق ستزعزعكم- (فيديو) عدوان أمريكي جديد على اليمن .. قصف مطار الحديدة ومديرية مجزر قريباً .. فلم وثائقي عبر القنوات الاردنية يجسد بطولة الجيش العربي في إغاثة أهل غزة المجموعة العربية لدى الأمم المتحدة تدين قيام إسرائيل بخرق اتفاق وقف إطلاق النار في غزة الجغبير: معركة الكرامة انتصار أردني أعاد للأمة هيبتها حماس تتهم واشنطن بـ"قلب الحقائق" 6 شهداء و25 جريحا بغارات إسرائيلية على لبنان "أوقاف إربد الأولى" تخرج عددا من حفظة القرآن الكريم العواملة يسلم بلدية الشونة مستند الالتزام المالي بقيمة 200 ألف دينار لإنشاء قاعة عامة قصر "برقع" الأثري الإسلامي .. شامة مغيبة في صحراء البادية الشمالية وزير الشباب: الحركة الكشفية تعزز قيم الانتماء والعمل التطوعي الصفدي ونظيره اللبناني يشددان على ضرورة تنفيذ اتفاق وقف إطلاق النار بجميع بنوده “العمل” تنفي تعيين أي موظف أو مستشار شهيد و9 جرحى في غارات إسرائيلية على جنوب لبنان والبقاع أبو السمن: معركة الكرامة أعادت للأمة هيبتها وكرامتها
الصفحة الرئيسية علوم و تكنولوجيا أشهر روبوتات الدردشة لا يمكن الوثوق بها!

أشهر روبوتات الدردشة لا يمكن الوثوق بها!

أشهر روبوتات الدردشة لا يمكن الوثوق بها!

11-03-2025 09:58 PM

زاد الاردن الاخباري -

أكدت نتائج دراسة جديدة نصيحة لطالما ترددت وهي أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي لا ينبغي استخدامها للحصول على حقائق، أي أنه لا يمكن الوثوق بها في هذا الأمر.

وهناك مشكلتان رئيسيتان معروفتان عند محاولة استخدام نماذج اللغة الكبيرة مثل "شات جي بي تي" كبديل لعمليات البحث على الويب، وهما أن هذه النماذج غالبًا ما تكون مخطئة، وأنها غالبًا ما تكون واثقة جدًا من معلوماتها غير الصحيحة.





دراسة جديدة
وجدت دراسة استشهدت بها مجلة "Columbia Journalism Review" أنه حتى عندما تُعطى روبوتات الدردشة اقتباسًا دقيقًا من مقالة صحفية ويُطلب منها المزيد من التفاصيل، فإن معظمها يخطئ في أغلب الأحيان، بحسب تقرير لموقع "9TO5Mac".

وأجرى مركز تو للصحافة الرقمية اختبارات على ثمانية روبوتات دردشة تعمل بالذكاء الاصطناعي تدعي إجراء عمليات بحث على الويب للحصول على الحقائق.

وهذه الربوتات هي "شات جي بي تي" و"ديب سيك" و"غروك 2" و"غروك 3" و"Gemini" و"Copilot" و" Perplexity" و" Perplexity Pro".

وقدمت الدراسة لكل نظام اقتباسًا من مقال صحفي، وطلبت منه تنفيذ مهمة بسيطة: العثور على هذا المقال عبر الإنترنت وتوفير رابط إليه، مع العنوان والناشر الأصلي وتاريخ النشر.

وتم تصنيف روبوتات الدردشة على أساس ما إذا كانت صحيحة تمامًا، أو صحيحة ولكن مع بعض المعلومات المطلوبة مفقودة، أو غير صحيحة جزئيًا، أو غير صحيحة تمامًا، أو لا يمكنها الإجابة.

كما لاحظ القائمون على الدراسة مدى ثقة روبوتات الدردشة في عرض نتائجها. على سبيل المثال، هل قدموا إجاباتهم كحقائق فقط، أم استخدموا عبارات مؤهلة مثل "يبدو" أو تضمنوا اعترافًا بأنهم لم يتمكنوا من العثور على تطابق دقيق للاقتباس.


نتائج صادمة
في المتوسط، كانت أنظمة الذكاء الاصطناعي صحيحة في أقل من 40% من الوقت، وكان الأكثر دقة هو "Perplexity" بنسبة 63%، والأسوأ كان "غروك 3" الموجود عبر منصة "إكس" بنسبة 6% فقط.

كانت روبوتات الدردشة سيئة بشكل عام في رفض الإجابة على الأسئلة التي لا يمكنها الإجابة عليها بدقة، وعرضت إجابات غير صحيحة أو تخمينية بدلًا من ذلك.

وفي حين كان أداء "Perplexity" هو الأفضل، يبدو أن هذا يرجع إلى الغش. ويمكن للقائمين على المواقع الإلكترونية استخدام ملف "robots.txt" على مواقعهم لإخبار روبوتات الدردشة ما إذا كان ينبغي لها الوصول إلى الموقع أم لا.

وقد وجد "Perplexity" بشكل صحيح جميع الاقتباسات العشر على الرغم من حقيقة أن المقالات كانت محمية بجدار دفع ولم يكن لدى الشركة اتفاقية ترخيص.

ومن بين البقية، قدم "شات جي بي تي" أفضل النتائج على هذا الصعيد، أو بشكل أكثر دقة، كان الأقل سوءًا.

وعلى الرغم من ذلك، توضح الدراسة بالتأكيد ما كنا نعرفه بالفعل: أنه ينبغي استخدام روبوتات الدردشة للإلهام والأفكار، ولكن ليس أبدًا للحصول على إجابات للأسئلة حول الحقائق.








تابعونا على صفحتنا على الفيسبوك , وكالة زاد الاردن الاخبارية

التعليقات حالياً متوقفة من الموقع