Decoding the Black Box of AI – Scientists Uncover Unexpected Results
(UNIVERSITY OF BONN – بواسطة: جامعة بون)
ملخص المقالة:
يتقدم الذكاء الاصطناعي بسرعة، لكن أعماله الداخلية غامضة، وقد تحقق تقدم كبير على يد خبراء المعلوماتية الكيميائية في جامعة بون بابتكارهم تقنية تكشف الآليات التشغيلية لبعض أنظمة الذكاء الاصطناعي المستخدمة في الأبحاث الصيدلانية. والمدهش أن نتائجهم تشير إلى أن نماذج الذكاء الاصطناعي هذه تعتمد في المقام الأول على تذكر البيانات الموجودة بدلاً من تعلم تفاعلات كيميائية محددة للتنبؤ بفعالية الأدوية.
( المقالة )
يتدارس باحثون في جامعة بون الأعمال الداخلية لتطبيقات تعلم الآلة في أبحاث الأدوية.
يتقدم الذكاء الاصطناعي بسرعة، لكن أعماله الداخلية غالبا ما تظل غامضة، وتتميز بطبيعة “الصندوق الأسود” حيث تكون عملية التوصل إلى الاستنتاجات غير مرئية. ومع ذلك، فقد تم تحقيق تقدم كبير على يد البروفيسور (الدكتور) يورغن باجوراث وفريقه من خبراء المعلوماتية الكيميائية في جامعة بون. فقد ابتكروا تقنية تكشف الآليات التشغيلية لبعض أنظمة الذكاء الاصطناعي المستخدمة في الأبحاث الصيدلانية.
ومن المثير للدهشة أن النتائج التي توصلوا إليها تشير إلى أن نماذج الذكاء الاصطناعي هذه تعتمد في المقام الأول على تذكر البيانات الموجودة بدلاً من تعلم تفاعلات كيميائية محددة للتنبؤ بفعالية الأدوية. وقد نُشرت نتائجهم مؤخرًا في مجلة “الطبيعة – ذكاء الآلة” (Nature Machine Intelligence).
أي جزيء من الدواء أكثر فعالية؟ يبحث الباحثون بشكل محموم عن مواد نشطة فعالة لمكافحة الأمراض. وغالبًا ما ترتكز هذه المركبات على البروتين، والذي عادة ما يكون عبارة عن إنزيمات أو مستقبلات تؤدي إلى سلسلة محددة من الإجراءات الفسيولوجية.
وفي بعض الحالات، تهدف جزيئات معينة أيضًا إلى منع التفاعلات غير المرغوب فيها في الجسم – مثل الاستجابة الالتهابية المفرطة. ونظراً لكثرة المركبات الكيميائية المتوفرة، فإن هذا البحث يبدو للوهلة الأولى وكأنه يبحث عن إبرة في كومة قش. ولذلك يحاول اكتشاف الأدوية استخدام النماذج العلمية للتنبؤ بالجزيئات التي ستتصل بشكل أفضل بالبروتين المستهدف وترتبط بقوة. ويتم التحقيق في مرشحي الأدوية المحتملين هؤلاء بمزيد من التفصيل في دراسات تجريبية.
ومنذ تقدم الذكاء الاصطناعي، أصبحت أبحاث اكتشاف الأدوية تستخدم بشكل متزايد تطبيقات التعلم الآلي. وأحد هذه التطبيقات، “الشبكات العصبية البيانية” (Graph neural networks (GNNs)) يوفر واحدة من الفرص العديدة لمثل هذه التطبيقات. ويتم تكييفها للتنبؤ، على سبيل المثال، بمدى قوة ارتباط جزيء معين بالبروتين المستهدف. ولتحقيق هذه الغاية، يتم تدريب نماذج “الشبكات العصبية البيانية” باستخدام الرسوم البيانية التي تمثل المجمعات المتكونة بين البروتينات والمركبات الكيميائية (الليغاندات).وتتكون الرسوم البيانية عمومًا من عقد تمثل كائنات وحواف تمثل العلاقات بين العقد. ففي التمثيلات البيانية لمجمعات البروتين وليغاند، تربط الحواف فقط عقد البروتين أو ليغاند، التي تمثل بنياتها، على التوالي، أو عقد البروتين وليغاند، التي تمثل تفاعلات محددة بين البروتين وليغاند.
ويقول البروفيسور الدكتور يورغن باجوراث: “إن الطريقة التي تصل بها الشبكات العصبية البيانية إلى تنبؤاتها تشبه الصندوق الأسود الذي لا يمكننا إلقاء نظرة عليه”. الباحث في مجال المعلوماتية الكيميائية من معهد علوم الحياة والعلوم الطبية (LIMES) في جامعة بون، ومركز بون-آخن الدولي لتقنية المعلومات (B-IT)، ومعهد لامار للتعلم الآلي والذكاء الاصطناعي في بون، بالتعاون مع زملاء من جامعة سابينزا في روما قام بتحليل تفصيلي لما إذا كانت الشبكات العصبية البيانية تتعلم فعليًا تفاعلات البروتين وليغاند للتنبؤ بمدى قوة ارتباط المادة الفعالة بالبروتين المستهدف.
كيف تعمل تطبيقات الذكاء الاصطناعي؟
قام الباحثون بتحليل ما مجموعه ست بنيات مختلفة لـ “الشبكات العصبية البيانية” باستخدام طريقة “ايدج شابر” المطورة خصيصًا ومنهجية مختلفة من الناحية المفاهيمية للمقارنة. وتعمل برامج الكمبيوتر هذه على “فحص” ما إذا كانت الشبكات العصبية البيانية تتعلم أهم التفاعلات بين المركب والبروتين، وبالتالي تتنبأ بقوة ليغاند، كما هو مقصود ومتوقع من قبل الباحثين – أو ما إذا كان الذكاء الاصطناعي يصل إلى التنبؤات بطرق أخرى.
ويقول المؤلف الأول للدراسة، مرشح الدكتوراه أندريا ماستروبيترو من جامعة سابينزا في روما، والذي أجرى جزءًا من بحث الدكتوراه في مجموعة البروفيسور باجوراث في بون: “تعتمد الشبكات العصبية البيانية اعتمادًا كبيرًا على البيانات التي تم تدريبها عليها”.
وقام العلماء بتدريب الشبكات العصبية الست باستخدام الرسوم البيانية المستخرجة من هياكل مجمعات بروتين ليغاند، والتي كانت طريقة عملها وقوة ربط المركبات بالبروتينات المستهدفة معروفة بالفعل من خلال التجارب. ثم تم اختبار الشبكات العصبية البيانية المدربة على مجمعات أخرى. بعد ذلك، مكّن تحليل “ايدج شابر” اللاحق من فهم كيفية توليد الشبكات العصبية البيانية لتنبؤات واعدة على ما يبدو.
ويوضح البروفيسور باجوراث: “إذا قامت الشبكات العصبية البيانية بما هو متوقع منها، فإنها تحتاج إلى معرفة التفاعلات بين المركب والبروتين المستهدف ويجب تحديد التنبؤات من خلال تحديد أولويات تفاعلات محددة”. ولكن وفقا لتحليلات فريق البحث، فشلت الشبكات الست في الأساس في القيام بذلك. ولم تتعلم معظم الشبكات العصبية البيانية سوى عدد قليل من التفاعلات بين البروتين والأدوية وركزت بشكل أساسي على الليغاندات.
وقال [البروفيسور باجوراث]: “للتنبؤ بقوة ربط الجزيء بالبروتين المستهدف، تذكرت النماذج بشكل أساسي الجزيئات المماثلة كيميائيًا التي واجهوها أثناء التدريب وبيانات الارتباط الخاصة بها، بغض النظر عن البروتين المستهدف. هذه التشابهات الكيميائية المكتسبة حددت بعد ذلك التنبؤات بشكل أساسي”.
ووفقا للعلماء، فإن هذا يذكرنا إلى حد كبير بـ “تأثير هانز الذكي”[3]. ويشير هذا التأثير إلى حصان يمكن الاعتماد عليه على ما يبدو. وكان من المفترض أن يشير عدد المرات التي نقر فيها “هانز” على حافره إلى نتيجة عملية حسابية. ولكن كما تبين لاحقًا، لم يكن الحصان قادرًا على الحساب على الإطلاق، لكنه استنتج النتائج المتوقعة من الفروق الدقيقة في تعبيرات الوجه والإيماءات لرفيقه.
فماذا تعني هذه النتائج بالنسبة لأبحاث اكتشاف الأدوية؟ يقول [البروفيسور باجوراث] عالم المعلوماتية الكيميائية: “من غير المقبول عمومًا أن تتعلم الشبكات العصبية البيانية التفاعلات الكيميائية بين المواد الفعالة والبروتينات”. إن تنبؤاتها مبالغ فيها إلى حد كبير لأنه يمكن إجراء تنبؤات ذات جودة مكافئة باستخدام المعرفة الكيميائية وطرق أبسط. ومع ذلك، فإن البحث يوفر أيضًا فرصًا للذكاء الاصطناعي.
وقد أظهر اثنان من النماذج التي تم فحصها بواسطة الشبكات العصبية البيانية ميلًا واضحًا لمعرفة المزيد من التفاعلات عند زيادة فعالية مركبات الاختبار. ويقول البروفيسور باجوراث: “الأمر يستحق إلقاء نظرة فاحصة هنا”. وربما يمكن تحسين هذه الشبكات العصبية البيانية في الاتجاه المطلوب من خلال التمثيلات المعدلة وتقنيات التدريب. ومع ذلك، فإن الافتراض القائل بإمكانية تعلم الكميات الفيزيائية على أساس الرسوم البيانية الجزيئية يجب التعامل معه بحذر بشكل عام. ويقول البروفيسور باجوراث: “إن الذكاء الاصطناعي ليس سحرًا أسود”.
مزيد من الضوء في ظلام الذكاء الاصطناعي
في الواقع، يرى [البروفيسور باجوارث] أن المنشور السابق ذو الوصول المفتوح لـ”ايدج شابر” وأدوات التحليل الأخرى المطورة خصيصًا هي أساليب واعدة لتسليط الضوء على الصندوق الأسود لنماذج الذكاء الاصطناعي. ويركز نهج فريقه حاليًا على الشبكات العصبية البيانية و”نماذج اللغة الكيميائية” الجديدة.
ويقول البروفيسور باجوراث: “يعد تطوير طرق لشرح تنبؤات النماذج المعقدة مجالًا مهمًا لأبحاث الذكاء الاصطناعي. هناك أيضًا أساليب لبنيات الشبكات الأخرى، مثل نماذج اللغة التي تساعد على فهم أفضل لكيفية وصول تعلم الآلة إلى نتائجه”. ويتوقع أن تحدث أشياء مثيرة قريبًا أيضًا في مجال “الذكاء الاصطناعي القابل للتفسير” في معهد لامار، حيث يعمل كباحث رئيسي ورئيس قسم الذكاء الاصطناعي في علوم الحياة.
*تمت الترجمة بتصرف
المرجع: “Learning characteristics of graph neural networks predicting protein–ligand affinities” by Andrea Mastropietro, Giuseppe Pasculli and Jürgen Bajorath, 13 November 2023, Nature Machine Intelligence. DOI: 10.1038/s42256-023-00756-9
المصدر:
https://scitechdaily.com/decoding-the-black-box-of-ai-scientists-uncover-unexpected-results/
الهوامش:
[1] ليغاند (ligand) هو أيون أو جزيء يتبرع بزوج من الإلكترونات إلى ذرة أو أيون المعدن المركزي لتشكيل مجمع التنسيق. وهي كلمة مشتقة من اللغة اللاتينية وتعني “ربط أو وثاق [ربط]”. يمكن أن تكون الروابط أنيونات وكاتيونات وجزيئات محايدة. تعمل الروابط كقواعد لويس (تتبرع بأزواج الإلكترونات)، ويُنظر إلى ذرات المعدن المركزية على أنها أحماض لويس (مستقبلات لأزواج الإلكترونات). تختلف طبيعة الروابط من المعدن إلى الليغاند من الرابطة التساهمية إلى الرابطة الأيونية. المصدر: https://byjus.com/jee/ligands [2] “ايدج شابر” (EdgeSHAPer): تعتمد المنهجية على تقديرات قيم “شابلي” (Shapley) لتحديد أهمية الحافة لتنبؤ شبكات عصبية بيانية. يجد [ايدج شابر] تطبيقه في سياق الكيمياء الطبية، ولكنه يبدأ للأغراض العامة ويمكن تطبيقه على العديد من المهام القائمة على تصنيف الرسوم البيانية المعتمدة على شبكات عصبية بيانية والتي تتطلب قابلية للتفسير. المصدر: https://github.com/AndMastro/EdgeSHAPerبشكل أساسي، قيمة شابلي (Shapley) هي متوسط المساهمة الهامشية المتوقعة للاعب واحد بعد أخذ جميع التركيبات الممكنة في الاعتبار. تساعد قيمة شابلي في تحديد المكافأة لجميع اللاعبين عندما يكون كل لاعب قد ساهم أكثر أو أقل من الآخرين. تتمتع قيمة شابلي بالعديد من التطبيقات حيث يمكن للاعبين بدلاً من ذلك أن يكونوا العوامل اللازمة لتحقيق النتيجة المرجوة أو المردود. المصدر: https://www.investopedia.com/terms/s/shapley-value.asp
[3] يستخدم “تأثير هانز الذكي” في علم النفس لوصف الموقف عندما يشعر حيوان أو شخص بما يريد شخص ما أن يفعله، على الرغم من أنه لا يتم إعطاؤه إشارات عمدًا. ومن المهم أن يؤخذ هذا التأثير في الاعتبار عند اختبار ذكاء الحيوانات أو الذكاء البشري. قد يحتاج الحيوان إلى الانفصال عن مدربه إذا أردنا ملاحظة ذكائه الحقيقي. ومن ناحية أخرى، قد ينزعج الحيوان عندما لا يتمكن من رؤية مدربه، لذلك قد لا يعطي الإجابة الصحيحة. يمكن حل هذه المشكلة غالبًا عن طريق خلق موقف لا يعرف فيه المدرب الإجابة الصحيحة. ويكيبيديا.
احسنت سيدنا