ما هي أفضل أدوات الذكاء الاصطناعي للبحث؟ دليل مجلة “الطبيعة” – ترجمة* محمد جواد آل السيد ناصر الخضراوي

What are the best AI tools for research? Nature’s guide By: Elizabeth Gibney
(بقلم: إليزابيث غيبني – Elizabeth Gibney)

هناك العديد من نماذج اللغة الكبيرة للاختيار من بينها؛ بعضها متميز في البرمجة، في حين أن البعض الآخر أفضل في توليف المعلومات.

يتم إصدار أداة ذكاء اصطناعي جديدة وأكثر إثارة للإعجاب كل أسبوع تقريبًا، ويتدافع الباحثون لتجربتها. وسواء كانوا يتطلعون إلى تحرير المخطوطات أو كتابة التعليمات البرمجية أو إنشاء فرضيات، فإن الباحثين لديهم أدوات الذكاء الاصطناعي التوليدية أكثر إنتاجية للاختيار من بينها أكثر من أي وقت مضى.

حقوق نشر الصورة: ليونيل بزنافينتشر / وكالة الأنباء الفرنسية بولسطة غيتي

وأي نموذج لغوي كبير (Large Language Model – LLM) مناسب لمهام مختلفة. وبعضها متاح من خلال برامج الدردشة المجانية، في حين يستخدم البعض الآخر واجهة برمجة تطبيقات (Application Programming Interface – API) مدفوعة الأجر مما يعني أنه يمكن دمجها مع برامج أخرى. ويمكن أيضًا تحميل القليل منها، مما يسمح للباحثين ببناء نماذجهم المخصصة.

وعلى الرغم من أن نماذج اللغوية الكبيرة تنتج استجابات شبيهة بالإنسان، إلا أنها تظل جميعها عرضة للخطأ بحيث لا يمكن استخدامها بمفردها، كما تقول الدكتورة كاري رايت، عالمة البيانات في مركز فريد هاتشينسون للسرطان، ومقره في سياتل، بولاية واشنطن.

إذن، أي نموذج لغوي كبير هو الأفضل لأي مهمة؟ هنا، يشارك الباحثون نماذجهم المفضلة الحالية مع مجلة “الطبيعة” (Nature) للمساعدة في توجيه المحتاجين:

“أو3-ميني” (المُعْلِل)
قدمت شركة “أوبن ايه آي” (OpenAI)، التي تتخذ من مدينة سان فرانسيسكو بولاية كاليفورنيا مقراً لها، للعالم نماذج لغوية كبيرة في عام 2022م مع روبوت “تشات جي بي تي” المجاني. واستخدم العلماء الروبوت بشكل أساسي للبحث عن المعلومات أو كمساعد في الكتابة، على سبيل المثال لصياغة الملخصات، لكن النماذج الأحدث تعمل على توسيع نطاق الاستخدامات المحتملة للتقنية.

وفي سبتمبر [2024]، وفي أهم تقدم للشركة منذ ذلك الحين، أبهرت شركة “أوبن ايه آي” العلماء بنموذج ” المُعْلِل” الخاص بها “او1″، والذي تبعته بنموذج “او3” الأكثر تقدمًا في ديسمبر [2024]. ويعمل كلا النموذجين [المُعْلِلين] بشكل أبطأ من نموذج لغوي كبير وحده، لأنهما تم تدريبهما على الإجابة على الاستفسارات بطريقة خطوة بخطوة. وساعدتهم عملية “سلسلة الأفكار” هذه، التي تهدف إلى محاكاة المنطق البشري، على تحطيم معايير صعبة في العلوم والرياضيات. كما جعلتهم جيدين في المهام الفنية، مثل حل مشكلات البرمجة وإعادة تنسيق البيانات.

وبعد أن أطلقت شركة “ديب سيك” الصينية الناشئة غير المعروفة في مدينة هانغتشو أداة استدلال منافسة في 20 يناير [2025]، ردت “أوبن ايه آي” بمجموعة من الأدوات الجديدة. وتشمل هذه الأدوات أداة “أو3-ميني” السريعة ــ أداة استدلال مجانية لمستخدمي روبوتات الدردشة المسجلين ــ و”البحث العميق”، الذي يسمح لبعض المشتركين الذين يدفعون مقابل إنشاء تقارير تلخص المعلومات، مع الاستشهادات، من مئات المواقع الإلكترونية، على غرار إجراء مراجعة للأدبيات. ويقول أندرو وايت، الكيميائي وخبير الذكاء الاصطناعي في شركة “فيوتشر هاوس” (FutureHouse)، وهي شركة ناشئة في مدينة سان فرانسيسكو، إن النماذج تتفوق عند استخدامها مجتمعة.

ويقول البروفيسور سايمون فريدر، عالم الرياضيات وباحث الذكاء الاصطناعي في جامعة أكسفورد بالمملكة المتحدة، إنه عندما يتعلق الأمر بمهام مثل تحليل المفاهيم غير المألوفة في برهان رياضي جديد، فإن’أو3-ميني’ “يقوم بعمل جيد حقا”. ولكن حتى أفضل النماذج “لا تزال بعيدة عن منافسة عالم الرياضيات”، كما يقول.

ديب سيك (البرنامج الشامل)
يتمتع ديب سيك – آر1 (DeepSeek-R1)، الذي تم إطلاقه الشهر الماضي [يناير 2025]، بقدرات على قدم المساواة مع “أو1″، ولكنه متاح من خلال واجهة برمجة التطبيقات مقابل جزء بسيط من التكلفة. كما يتميز عن نماذج “أوبن أيه آي” لأنه مفتوح الوزن، مما يعني أنه على الرغم من عدم إصدار بيانات تدريبه، يمكن لأي شخص تنزيل النموذج الأساسي وتخصيصه لمشروع بحثي محدد. ويقول وايت إن ‘آر1‘ “فتح للتو نموذجًا جديدًا” حيث يمكن للمجتمعات، وخاصة تلك التي لديها موارد قليلة نسبيًا، بناء نماذج مُعْلِلة متخصصة.


ويتطلب تشغيل النموذج الكامل الوصول إلى رقائق حوسبة قوية، والتي يفتقر إليها العديد من الأكاديميين. ولكن الباحثين مثل البروفيسور بينيو وانغ، عالم الكمبيوتر في جامعة هونج كونج الصينية، بمدينة شنتشن، يقومون بإنشاء إصدارات يمكن تشغيلها أو تدريبها على جهاز واحد. ومثل “أو1″، فإن نقطة قوة “ديب سيك – آر1” هي مشاكل الرياضيات وكتابة التعليمات البرمجية. ولكنه جيد أيضًا في مهام مثل توليد الفرضيات، كما يقول وايت.

ويقول البروفيسور وانغ إن هذا يرجع إلى أن “ديب سيك” اختارت نشر “عمليات التفكير” الخاصة بالنموذج بالكامل، مما يسمح للباحثين بتحسين أسئلتهم المتابعة بشكل أفضل وتحسين مخرجاتها في نهاية المطاف. ويمكن أن تكون مثل هذه الشفافية قوية للغاية أيضًا للتشخيصات الطبية. ويقوم وانج بتكييف “آر1” في التجارب التي تستخدم قوى الاستدلال التي يتمتع بها النموذج لبناء “مسار واضح ومنطقي من تقييم المريض إلى التشخيص والتوصية بالعلاج”، كما يقول.

ولدى “ديب سيك آر1” بعض السلبيات. ويبدو أن النموذج لديه عملية “فكر” طويلة بشكل خاص، مما يبطئه ويجعله أقل فائدة للبحث عن المعلومات أو العصف الذهني. وأدت المخاوف بشأن أمان إدخال البيانات في واجهة برمجة التطبيقات و”ريبوت تشات” إلى دفع العديد من الحكومات إلى منع العاملين في الوكالات الوطنية من استخدامه.

ويبدو أيضًا أن “ديب سيك” اتخذت تدابير أقل للتخفيف من نماذجها التي تولد مخرجات ضارة مقارنة بمنافسيها التجاريين. فإضافة عوامل تصفية لمنع مثل هذه المخرجات – تعليمات صنع الأسلحة، على سبيل المثال – يستغرق وقتًا وجهدًا. ورغم أنه من غير المرجح أن يكون هذا قد تم عن قصد، فإن “الافتقار إلى الحواجز الواقية أمر مثير للقلق”، كما يقول سيمون.

كما اقترحت شركة “أوبن ايه آي” أن شركة “ديب سيك” ربما “استخلصت بشكل غير مناسب” نماذجها، في إشارة إلى طريقة لتدريب نموذج على مخرجات خوارزمية أخرى، والتي تحظرها شروط استخدام “أوبن ايه آي”. ولم يتسن الوصول إلى شركة “ديب سيك” للتعليق على هذه الانتقادات قبل نشر هذه المقالة.

ويرى بعض الباحثين أن مثل هذا الاستخلاص أمر شائع ويسعدهم استخدام “آر1″، لكن آخرين حذرون من استخدام أداة قد تخضع لدعاوى قضائية في المستقبل. وتقول آنا كاتارينا دي ألينكار، المحامية في شركة “إي آي تي مانيوفاكشرينغ” (EIT Manufacturing) في باريس والمتخصصة في قانون الذكاء الاصطناعي، إن هناك احتمالاً بأن يضطر العلماء الذين يستخدمون “آر1” إلى سحب أوراقهم، إذا اعتُبر استخدام النموذج انتهاكًا للمعايير الأخلاقية للمجلة. وتقول دي ألينكار إن موقفًا مماثلاً قد ينطبق على استخدام النماذج من قبل شركة “أوبن ايه آي” والشركات الأخرى المتهمة بانتهاكات الملكية الفكرية. وزعمت مؤسسات إخبارية أن الشركات استخدمت محتوى صحفيا لتدريب نماذجها دون إذن.

“لاما” (الحصان العامل)
لطالما كانت “لاما” بمثابة نموذج لغة كبير لمجتمع البحوث. وتم إصدار مجموعة من النماذج ذات الوزن المفتوح لأول مرة بواسطة “ميتا ايه آي” (Meta AI) في مينلو بارك، كاليفورنيا، في عام 2023، وتم تحميل إصدارات “لاما” أكثر من 600 مليون مرة من خلال منصة العلوم المفتوحة “هاغنغ فيس” (Hugging Face) وحدها. وتقول إليزابيث همفريز، عالمة البيانات في مركز فريد هاتشينسون للسرطان، إن حقيقة أنه يمكن تحميله والبناء عليه “ربما هي السبب وراء تبني مجتمع البحث لبرنامج ‘لاما‘”.

وتقول الدكتورة رايت إن القدرة على تشغيل نموذج لغة كبير على خوادم شخصية أو مؤسسية أمر ضروري عند العمل مع بيانات خاصة أو محمية، لتجنب إرسال معلومات حساسة إلى مستخدمين آخرين أو إلى المطورين.
وقد بنى الباحثون على نماذج “لاما” لإنشاء نماذج لغة كبيرة تتنبأ بالبنية البلورية للمواد، بالإضافة إلى محاكاة مخرجات الحاسوب الكمومي. ويقول البروفيسور تيانلونغ تشين، وهو عالم متخصص في التعلم الآلي بجامعة نورث كارولينا في تشابل هيل، إن “لاما” كان مناسبًا لمحاكاة الحاسوب الكمومي لأنه كان من السهل نسبيًا تكييفه لفهم لغة الكم المتخصصة.

لكن “لاما” يتطلب من المستخدمين طلب الإذن للوصول إليه، وهو ما يمثل نقطة احتكاك بسيطة بالنسبة للبعض، كما يقول وايت. ونتيجة لذلك، فإن النماذج المفتوحة الأخرى مثل “أولمو” (OLMo)، التي طورها معهد ألين للذكاء الاصطناعي في سياتل، أو “كوين” (Qwen)، التي بنتها شركة علي بابا كلاود الصينية، ومقرها مدينة هانغتشو، أصبحت الآن غالبًا الخيار الأول في البحث، كما يضيف. كما أن نموذج “في3” (V3) الأساسي الفعال لشركة “ديب سيك” هو أيضًا قاعدة منافسة لبناء النماذج العلمية.

كلود (المبرمج)
في وادي السليكون، يقسم العديد من الناس على “كلاود 3.5 سونيت” (Claude 3.5 Sonnet) لكتابة التعليمات البرمجية، كما يقول سايمون. ويمكن لـ “كلاود 3.5 سونيت”، الذي صنعته شركة الذكاء الاصطناعي “أنثروبيك” (Anthropic) ومقرها مدينة سان فرانسيسكو، أن يفسر أيضًا المعلومات المرئية، مثل المخططات والرسوم البيانية، إلى جانب النص. وبالإضافة إلى ذلك، يحتوي على وضع يسمح له بتشغيل حاسوب المستخدم عن بُعد، مما يسمح له بالتحكم في برامج أخرى.

وتحظى نماذج “كلاود” بالثناء على أسلوب كتابتها أيضًا. وعندما تزيل بعض نماذج اللغة الكبيرة، مثل “تشات جي بي تي”، اللغة الفنية، فإنها يمكنها أيضًا إزالة المعنى المهم، كما تقول الدكتورة رايت. ونماذج “كلاود” أفضل في تنعيم الكتابة مع الاحتفاظ بمعناها الأصلي. وتقول إن هذا يمكن أن يكون ميزة إضافية عند استخدام النموذج للبدء في اقتراح منحة أو لعمل تعليقات توضيحية على التعليمات البرمجية.

يقول البروفيسور هوان صن، الباحث في مجال الذكاء الاصطناعي بجامعة ولاية أوهايو في كولومبوس، إن أداء “كلاود 3.5 سونيت” كان جيدًا في تحديات البرمجة في اختبار معياري قائم على مهام علمية تعتمد على البيانات، والتي تم أخذها من أوراق حقيقية في مجالات مثل المعلوماتية الحيوية والكيمياء الحاسوبية. وعلى الرغم من أن “كلاود 3.5 سونيت” مجاني للاستخدام كبرنامج دردشة عبر الإنترنت، مثل نماذج “أوبن ايه آي”، لا يمكن للباحثين الحصول على التكامل الكامل إلا من خلال الوصول إليه من خلال واجهة برمجة تطبيقات مدفوعة.

ويقول البروفيسور صن: “مع تزايد قوة النماذج مفتوحة المصدر الأرخص، أعتقد أن الناس يفضلونها على واجهات برمجة التطبيقات ذات المصدر المغلق”.

“أولمو” (النموذج المفتوح حقًا)
سيحتاج الباحثون الذين يريدون فهم ما يجري تحت غطاء نموذج اللغة الكبير إلى شيء أكثر شفافية من النماذج التي تقدمها “لاما” و “ديب سيك”. ويقول لويس تونستال، الباحث في “هاغنغ فيس”، إن النماذج مفتوحة المصدر، وليس النماذج المفتوحة الوزن فقط، تأتي مع بيانات تدريب الخوارزمية، بالإضافة إلى البرنامج المستخدم لتدريب وتقييم النماذج. وفي الوقت الحالي، النموذج الأفضل أداءً من هذا النوع هو “أولمو 2”.

وتسمح دراسة مثل هذه النماذج للباحثين بتتبع مصادر التحيز في نموذج اللغة الكبيرة إلى بيانات تدريبه، فضلاً عن تحسين الكفاءة من خلال فهم أفضل لكيفية وصول الخوارزمية إلى مخرجاتها. وحاليًا، الجانب السلبي الرئيسي لأي نموذج مفتوح هو أن الباحثين يحتاجون عادةً إلى بعض الخبرة لتشغيلها، ولكن مع زيادة عدد الدورات التدريبية المجانية العملية المقدمة للمجتمع، “إن حاجز الدخول ينخفض كل يوم” كما يقول تونستال.

ويشير إلى أنه إذا قررت المحاكم أنه من غير القانوني تدريب الذكاء الاصطناعي على محتوى محمي بحقوق الطبع والنشر، فإن النماذج التي تم تدريبها على مجموعات بيانات “متساهلة” تسمح بإعادة الاستخدام والتعديل، مثل الجهود التي تقودها “هاغنغ فيس” لإعادة إنشاء “ديب سيك – آر1″، قد تكون النماذج الوحيدة الآمنة للاستخدام.

*تمت الترجمة بتصرف

المصدر:

https://www.nature.com/articles/d41586-025-00437-0

المهندس محمد جواد آل السيد ناصر الخضراوي

 

تعليق واحد

  1. عادل العلويات

    شكرا على المشاركة. مقارنة قيمة و ذات فائدة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *