Xfakesci ابتكار يفضح الأوراق البحثية المكتوبة بالذكاء الاصطناعي

(MENAFN- Al Watan) لطالما كان شعار الأوساط الأكاديمية ((النشر أو الضياع)).
ولكن ماذا يحدث عندما لا يكتب المنشورات أساتذة في طريقهم إلى الزوال، بل تتولى تأليفها أجهزة ذكاء اصطناعي منتجة على الدوام؟.
مع شق الذكاء الاصطناعي طريقه إلى الكتابة العلمية، يحاول أحد الباحثين الرد بأداة قد تغير قواعد اللعبة.
تطور متزايد
تستمر نماذج اللغة الكبيرة مثل ChatGPT في التطور بشكل متزايد، وهناك مخاوف متزايدة بشأن إساءة استخدامها المحتملة في الدوائر الأكاديمية والعلمية.
يمكن لهذه النماذج إنتاج نص يحاكي الكتابة البشرية، مما يثير المخاوف بشأن نزاهة الأدبيات العلمية.
الآن، طور أحمد عابدين حامد، وهو زميل أبحاث زائر في جامعة بينجهامبتون، خوارزمية رائدة قد تكون بمثابة الرصاصة الفضية في هذه اللعبة عالية المخاطر المتعلقة بالأصالة الأكاديمية.
والرصاصة الفضية هي وحسب بعض المعتقدات الشعبية الفلكلورية لدى بعض الدول، غالبا ما تكون بمثابة الحل المباشر وشبه السحري لمشكلة صعبة.
إن ابتكار حامد، الذي أطلق عليه اسم xFakeSci، ليس مجرد أداة كشف عادية. بل إنه خوارزمية تعلم آلي متطورة يمكنها اكتشاف الأوراق التي تم إنشاؤها بواسطة الذكاء الاصطناعي بدقة مذهلة تصل إلى 94 %.
وهذا ليس مجرد تحسن هامشي؛ بل إنه قفزة نوعية، حيث يضاعف تقريبًا معدل نجاح تقنيات استخراج البيانات التقليدية.
بحث رئيس
يقول حامد في بيان ((بحثي الرئيس هو المعلوماتية الطبية الحيوية، ولكن لأنني أعمل مع المنشورات الطبية والتجارب السريرية والموارد عبر الإنترنت وتعدين وسائل التواصل الاجتماعي، فأنا دائمًا أشعر بالقلق بشأن صحة المعرفة التي ينشرها شخص ما)).
ومخاوف حامد ليست بلا أساس، فقد شهد الوباء العالمي الأخير ـ كوفيد 19 ـ زيادة في الأبحاث الزائفة، وخاصة في المقالات الطبية الحيوية، مما يسلط الضوء على الحاجة الملحة إلى أساليب تحقق قوية.
تحت الاختبار
في دراسة نُشرت في مجلة Scientific Reports، قام حامد وزميله البروفيسور شين دونج وو من جامعة هيفاي للتكنولوجيا في الصين، بوضع برنامج xFakeSci تحت الاختبار. حيث توليا إنشاء منصة اختبار مكونة من 150 مقالة مزيفة باستخدام ChatGPT، موزعة بالتساوي على 3 موضوعات طبية ساخنة: الزهايمر والسرطان والاكتئاب. ثم تمت مقارنة هذه الأوراق التي تم إنشاؤها بواسطة الذكاء الاصطناعي بعدد متساوٍ من المقالات الأصلية حول نفس الموضوعات.
وقد كشفت الخوارزمية عن أنماط مميزة تميز المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي عن الأوراق التي ألفها البشر.
ويكمن أحد الاختلافات الرئيسة في استخدام الثنائيات - أزواج الكلمات التي تظهر معًا بشكل متكرر، مثل ((التجارب السريرية)) أو ((الأدبيات الطبية الحيوية)).
ومن المدهش أن الأوراق التي تم إنشاؤها بواسطة الذكاء الاصطناعي تحتوي على عدد أقل من الثنائيات الفريدة، ولكنها استخدمتها بشكل أكثر انتشارًا في جميع أنحاء النص.
((أول ما يلفت الانتباه هو أن عدد الثنائيات كان قليلًا جدًا في العالم المزيف، ولكن في العالم الحقيقي، كان الثنائيون أكثر ثراءً بكثير))، كما يلاحظ حامد. ((أيضًا، في العالم المزيف، بالرغم من حقيقة وجود عدد قليل جدًا من الثنائيات، فإنهم كانوا مرتبطين بكل شيء آخر)).
اختلاف أساسي
يعتقد الباحثون أن هذا النمط ينبع من الاختلاف الأساسي في أهداف نماذج الذكاء الاصطناعي والعلماء البشريين، ففي حين يهدف ChatGPT إلى إنتاج نص مقنع حول موضوع معين، يركز العلماء الحقيقيون على الإبلاغ بدقة عن أساليبهم ونتائجهم التجريبية.
((نظرًا لأن ChatGPT لا يزال محدودًا في معرفته، فإنه يحاول إقناعك باستخدام الكلمات الأكثر أهمية)) يوضح حامد. ((ليس من وظيفة العالم أن يقدم لك حجة مقنعة. تقدم ورقة البحث الحقيقية تقريرًا صادقًا عما حدث أثناء التجربة والطريقة المستخدمة. يتعلق ChatGPT بالعمق في نقطة واحدة، في حين أن العلم الحقيقي يتعلق بالاتساع)).
أكثر ضبابية
يحذر مؤلفو الدراسة من أنه مع تطور نماذج لغة الذكاء الاصطناعي، قد يصبح الخط الفاصل بين الأدبيات العلمية الحقيقية والمزيفة أكثر ضبابية.
يمكن أن تصبح أدوات مثل xFakeSci بوابات أساسية، مما يساعد في الحفاظ على سلامة المنشورات العلمية في عصر المحتوى المولد بواسطة الذكاء الاصطناعي.
ومع ذلك، يظل حامد متفائلًا بحذر. وفي حين يفخر بمعدل اكتشاف xFakeSci المذهل الذي يبلغ 94%، فإنه يسارع إلى الإشارة إلى أن هذا لا يزال يترك مجالاً للتحسين.
((نحن بحاجة إلى أن نكون متواضعين بشأن ما أنجزناه. لقد قمنا بشيء مهم للغاية من خلال رفع مستوى الوعي))، يلاحظ الباحث، معترفًا بأن 6 من كل 100 ورقة مزيفة لا تزال تفلت من الشبكة.
توسيع قدرات
في المستقبل، يخطط حامد لتوسيع قدرات xFakeSci إلى ما هو أبعد من الطب، والدخول في مجالات علمية أخرى وحتى العلوم الإنسانية.
وما الهدف النهائي؟.. إنه خوارزمية عالمية قادرة على اكتشاف المحتوى الذي يولده الذكاء الاصطناعي في جميع المجالات - بغض النظر عن نموذج الذكاء الاصطناعي المستخدم لإنشائه.
في غضون ذلك، هناك أمر واحد واضح، وهو أن المعركة ضد العلوم الزائفة التي يولدها الذكاء الاصطناعي بدأت للتو. ولكن مع أدوات مثل xFakeSci، أصبح المجتمع العلمي مجهزًا بشكل أفضل لمواجهة هذا التحدي بشكل مباشر، مما يضمن بقاء السعي وراء المعرفة في أيدي البشر.
المنهجية
استخدم الباحثون نهجًا مزدوجًا في دراستهم. أولاً، استخدموا ChatGPT لتوليد 150 ملخصًا علميًا مزيفًا، موزعة بالتساوي على 3 مواضيع طبية: الزهايمر والسرطان والاكتئاب. ثم تمت مقارنة هذه الملخصات التي تم إنشاؤها بواسطة الذكاء الاصطناعي بعدد متساوٍ من الملخصات العلمية الحقيقية من PubMed حول نفس الموضوعات.
تم تطوير خوارزمية xFakeSci لتحليل هذه النصوص، مع التركيز على ميزتين رئيستين: تواتر وتوزيع الثنائيات (أزواج الكلمات التي تظهر غالبًا معًا) وكيفية ارتباط هذه الثنائيات بكلمات ومفاهيم أخرى في النص.
تستخدم الخوارزمية تقنيات التعلم الآلي لتحديد الأنماط التي تميز النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي عن المقالات العلمية التي كتبها البشر.
النتائج الرئيسية
كشفت الدراسة عن اختلافات كبيرة بين المقالات العلمية التي تم إنشاؤها بواسطة الذكاء الاصطناعي وتلك التي كتبها البشر.
تميل النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي إلى احتواء عدد أقل من العبارات الثنائية الفريدة ولكنها تستخدمها على نطاق أوسع في جميع أنحاء الوثيقة.
أظهرت خوارزمية xFakeSci معدل دقة مثير للإعجاب يصل إلى 94% في تحديد العلوم المزيفة التي تم إنشاؤها بواسطة الذكاء الاصطناعي، متفوقة بشكل كبير على طرق تحليل البيانات التقليدية، والتي تحقق عادةً معدلات دقة تتراوح بين 38% و52%.
حدود الدراسة
ركز البحث في المقام الأول على الملخصات العلمية وليس المقالات الكاملة، والتي قد تظهر أنماطًا مختلفة. وتم إنشاء المحتوى الناتج عن الذكاء الاصطناعي باستخدام إصدار محدد من ChatGPT، وقد تختلف النتائج مع نماذج الذكاء الاصطناعي المختلفة أو مع تطور هذه النماذج.
بالإضافة إلى ذلك، تغطي الدراسة حاليًا 3 موضوعات طبية فقط، ولا يزال يتعين اختبار مدى قابلية تطبيقها على مجالات علمية أخرى. كما أقر الباحثون أنه حتى مع دقتها العالية، لا تزال أداة xFakeSci تفشل في اكتشاف 6 % من الأوراق المزيفة، مما يشير إلى وجود مجال للتحسين.
المناقشة والخلاصات
تسلط الدراسة الضوء على التحدي المتزايد المتمثل في الحفاظ على النزاهة العلمية في عصر نماذج لغة الذكاء الاصطناعي المتقدمة. وتشير إلى أن أدوات مثل xFakeSci يمكن أن تلعب دورًا حاسمًا في عملية النشر العلمي، مما يساعد في تصفية العلوم المزيفة التي يولدها الذكاء الاصطناعي.
ويؤكد الباحثون على الحاجة إلى التطوير المستمر لمثل هذه الأدوات لمواكبة قدرات الذكاء الاصطناعي المتطورة. كما يؤكدون على أهمية زيادة الوعي بهذه القضية في المجتمع العلمي ويدعون إلى تطوير المبادئ التوجيهية والسياسات الأخلاقية فيما يتعلق باستخدام الذكاء الاصطناعي في الكتابة والنشر العلمي.
نتائج الدراسة
ـ اختلافات كبيرة بين المقالات العلمية التي تم إنشاؤها بواسطة الذكاء الاصطناعي وتلك التي كتبها البشر
ـ تميل النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي إلى احتواء عدد أقل من العبارات الثنائية الفريدة
ـ النصوص المنشأة بالذكاء الاصطتاعي تستخدم العبارات الثنائية على نطاق أوسع
ـ خوارزمية xFakeSci حددت 94% من العلوم المزيفة التي تم إنشاؤها بواسطة الذكاء الاصطناعي
ـ طرق تحليل البيانات التقليدية تكشف عادة مت بين 38% و52% من الوثائق المنشأة بالذكاء الاصطناعي

MENAFN12092024000089011017ID1108669361

إخلاء المسؤولية القانونية:
تعمل شركة "شبكة الشرق الأوسط وشمال أفريقيا للخدمات المالية" على توفير المعلومات "كما هي" دون أي تعهدات أو ضمانات... سواء صريحة أو ضمنية.إذ أن هذا يعد إخلاء لمسؤوليتنا من ممارسات الخصوصية أو المحتوى الخاص بالمواقع المرفقة ضمن شبكتنا بما يشمل الصور ومقاطع الفيديو. لأية استفسارات تتعلق باستخدام وإعادة استخدام مصدر المعلومات هذه يرجى التواصل مع مزود المقال المذكور أعلاه.