أول وكالة اخبارية خاصة انطلقت في الأردن

أولاً.. وبكل التفاصيل

أخر الأخبار
الصفدي: نعمل سياسيا لوقف العدوان على لبنان ودعم سيادة الدولة دعاء البرق والرعد .. اللهم لا تجعلنا من القانطين عليها تقبل الهزيمة .. ترمب يتوعّد إيران بفتح أبواب الجحيم اتحاد الكرة يحدد موعد مباراة الحسين والفيصلي المؤجلة الصفدي للمملكة: لا انقسام حول حق الأردن في الدفاع عن نفسه الصفدي: الشكوى المقدمة من الأردن للأمم المتحدة بشأن الاعتداءات الإيرانية "إجراء ضروري" الصفدي: نريد لهذه الحرب أن تنتهي وفق أسس تضمن مستقبلا لا تكرر فيه التهديدات السابقة برلمان الكاميرون يمدد ولاية أعضائه لحين توفر ظروف مثالية للانتخابات غينيا تفكك شبكة متهمة بتمويل الإرهاب مسؤول تركي: ننقل رسائل بين إيران والولايات المتحدة لإنهاء الحرب الصفدي: الأردن سبق وأن وضع وثائق تتعلق بممارسات إيراينة تستهدف أمنه الصفدي: قرابة 7 آلاف شخص من 60 دولة عبروا الأردن الشهر الحالي بسبب التوترات ملادينوف يصف وضع غزة بـ"الصعب" ويكشف عن مناقشات لنزع السلاح ميتا تبدأ تسريح المئات من موظفيها لمواجهة تكاليف الذكاء الاصطناعي إنستغرام سينبه الآباء عند بحث المراهقين عن محتوى متعلق بالانتحار الخرابشة: مخزون الطاقة في الأردن آمن والمشتقات النفطية تكفي 30–60 يوماً رغم ارتفاع كلف الشحن القضاة: القطاع الصناعي والتجاري الأردني مستقر والمخزون الاستراتيجي من السلع الأساسية آمن إغلاق محمية البترا الأثرية أمام الزوار الخميس احترازياً بسبب الأحوال الجوية مشروبات تساعدك على النوم بشكل أفضل هل تساعد مشروبات المغنسيوم حقاً على النوم؟
الصفحة الرئيسية علوم و تكنولوجيا "شات جي بي تي" يفشل في تلخيص الأبحاث...

"شات جي بي تي" يفشل في تلخيص الأبحاث العلمية بدقة

"شات جي بي تي" يفشل في تلخيص الأبحاث العلمية بدقة

21-09-2025 08:39 PM

زاد الاردن الاخباري -

يُعدّ تلخيص النتائج العلمية المعقدة لجمهور غير متخصص من أهمّ المهام التي يقوم بها الصحفي العلمي يوميًا. وذُكِر إعداد ملخصات للنصوص المعقدة مرارًا وتكرارًا كأحد أفضل استخدامات نماذج اللغة الكبيرة، وهي نماذج الذكاء الاصطناعي التي تشغل روبوتات الدردشة.

مع وضع كل ذلك في الاعتبار، أجرى فريق الجمعية الأميركية لتقدم العلوم دراسة غير رسمية استمرت عامًا كاملًا لتحديد ما إذا كان "شات جي بي تي" قادرًا على إنتاج نوع من ملخصات الأخبار الموجزة التي يكتبها فريق "SciPak" التابع للجمعية بانتظام لمجلة "ساينس" العلمية، حيث تتبع هذه المقالات صياغة حددة ومبسطة تنقل المعلومات الأساسية، مثل فرضية الدراسة ومنهجيتها وسياقها، إلى الصحفيين الآخرين الذين قد يرغبون في الكتابة عنها.

ووجد باحثو الجمعية الأميركية لتقدم العلوم أن "شات جي بي تي" قادر على "محاكاة بنية الموجز العلمي على غرار SciPak بشكل مقبول"، لكنه يقدم نصوصًا "تميل إلى التضحية بالدقة من أجل البساطة" و"تتطلب تدقيقًا دقيقًا للحقائق من قِبل كُتّاب SciPak"، بحسب تقرير لموقع "Ars Technica" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".

وقالت أبيغيل آيزنشتات، الكاتبة لدى الجمعية الأميركية لتقدم العلوم: " هذه التقنيات قد تمتلك إمكانات كأدوات مساعدة للكتّاب العلميين، لكنها ليست جاهزة للاستخدام "بشكل أساسي" في الوقت الحالي بالنسبة لفريق SciPak".

ومن ديسمبر 2023 إلى ديسمبر 2024، اختار باحثو الجمعية ما يصل إلى ورقتين بحثيتين أسبوعيًا لتلخيصهما بواسطة "شات جي بي تي" باستخدام ثلاثة محاور بحثية مختلفة ذات دقة متفاوتة.

وركز الفريق على الأوراق البحثية التي تتضمن عناصر صعبة مثل المصطلحات التقنية، والرؤى المثيرة للجدل، والاكتشافات الرائدة، والمشاركين في التجارب العلمية، أو الصيغ غير التقليدية. واستخدمت الاختبارات النسخة "Plus" من أحدث نماذج "GPT" المتاحة للعامة خلال فترة الدراسة، والتي تشغل "شات جي بي تي".

وفي المجمل، تم تلخيص 64 ورقة بحثية، وخضعت هذه الملخصات لتقييم كمّي ونوعي من قِبل كُتّاب "SciPak" أنفسهم الذين أعدّوا الملخصات الأصلية لهذه الأوراق للجمعية.

ويشير الباحثون إلى أن تصميم هذه الاختبارات "لا يمكنه احتساب التحيزات البشرية"، والتي يمكننا القول إنها قد تكون ذات أهمية لدى الصحفيين الذين يُقيّمون أداةً تُهدد بالسيطرة على إحدى وظائفهم الأساسية.

مع ذلك، كانت نتائج الاستطلاع الكمّي بين هؤلاء الصحفيين مُتحيزة إلى حد كبير. ففي سؤال حول إمكانية دمج ملخصات "شات جي بي تي" مع بقية الملخصات التي تنتجها كصحفي، حصل الملخص في المتوسط على درجة 2.26 فقط على مقياس من 1 ("لا، إطلاقًا") إلى 5 ("بالتأكيد"). أما فيما يتعلق بمسألة "جاذبية" الملخصات، فقد حصلت ملخصات روبوت الدردشة على درجة 2.14 فقط على نفس المقياس. وفي كلا السؤالين، حصل ملخص واحد فقط على "5" من المُقيِّم البشري في أيٍّ منهما، مقارنةً بـ 30 تقييمًا بقيمة "1".

وطُلب من المقيمين البشريين أيضًا كتابة تقييمات نوعية للملخصات الفردية التي قيّموها. وفي هذه التقييمات، اشتكى الكُتّاب من أن "شات جي بي تي" غالبًا ما يخلط بين الارتباط والسببية، ويفشل في توفير السياق ويميل إلى المبالغة في النتائج من خلال الإفراط في استخدام كلمات مثل "مُبتكر" و"جديد".

بشكل عام، وجد الباحثون أن "شات جي بي تي" عادةً ما يكون جيدًا في "نسخ" ما كُتب في ورقة علمية، خاصةً إذا لم تكن تلك الورقة تحمل الكثير من التفاصيل الدقيقة. لكنه كان ضعيفًا في "ترجمة" تلك النتائج من خلال التعمق في المنهجيات أو القيود أو الدلالات الكبرة.

وكانت نقاط الضعف هذه واضحة بشكل خاص بالنسبة للأوراق التي قدمت نتائج متعددة ومختلفة، أو عندما طُلب من روبوت الدردشة تلخيص ورقتين بحثيتين مرتبطتين في ملخص واحد.









تابعونا على صفحتنا على الفيسبوك , وكالة زاد الاردن الاخبارية

التعليقات حالياً متوقفة من الموقع