!Talk with your hands? You might think with them too
(موقع جامعة اوساكا متروبوليتان – Osaka Metropolitan University)
تعليق المهندس حسن سلمان الحاجي
إحدى معضلات الذكاء الاصطناعي هي أنه قد يستطيع التعرف على الأشياء ولكنه لا يدرك معناها، فمثلاً يستطيع التعرف على جميع أنواع الأكواب أو المكانس اليدوية، كما ورد في الدراسة المترجمة أدناه، ولكنه لا يدرك “ماذا تعني كلمة “كوب” حتى لو أدرك أن الكوب يُستخدم لشرب السوائل فإنه لن يُدرك “ماذا تعني مفردة “شرب”.
هذه المعضلة في الحقيقة لم تنشأ مع تطور تقنيات الذكاء الاصطناعي ، بل هي مشكلة فلسفية جدلية قديمة، تنطوي تحت السؤال التالي: هل هناك فرق بين المعرفة والتجربة الذاتية؟ أي هل أن المعرفة شيء مختلف عن المشاعر، أم أنهما شيءُ واحد؟
فمثلًا، يستطيع الذكاء الاصطناعي أن يتعرف على المرأة في الأماكن المزدحمة ويميزها بشكل أسرع، وربما بشكل أفضل، من الإنسان، خصوصًا في الشعوب التي يصعب فيها تمييز المرأة عن الرجل، بيد أن الذكاء الاصطناعي لا يستطيع أن يدرك ماذا تعني مفردة “أنثى” ولا يستطيع أن يدرك ماذا تعني أن تكون تلك الأنثى أُماً أو زوجةً أو ملكة، وهنا مربط الفرس، فالذكاء الاصطناعي لا يملك “الوعي” الذي يعتبره بعض المفكرين خارج القوانين الفيزيائية، بينما المعرفة محكومة بالقوانين الفيزيائية.
( الدراسة المترجمة )
إثبات أنه قد يكون لآليات الإدراك المجسّد في الدماغ انعكاسات على الذكاء الاصطناعي
كيف نفهم الكلمات؟ لا يفهم الباحثون تمامًا ماذا يحدث عندما تصل إحدى الكلمات إلى الدماغ. أرادت مجموعة بحثية بقيادة البروفسورة شوغو ماكيوكا (Shogo Makioka) من كلية الدراسات العليا لعلوم النظم المستدامة في جامعة أوساكا متروبوليتان، اختبار فكرة الإدراك المجسّد(1).
تشير فكرة الإدراك المجسّد إلى أن الناس يفهمون الكلمات الخاصة بالأشياء من خلال مدى تفاعلهم معها، لذلك وضع الباحثون اختبارًا لرصد المعالجة الدلالية للكلمات [المترجم: المعالجة الدلالية هي فهم معنى الكلمة بعد سماعها وربطها بكلمات لها معانٍ مشابهة(2)] عندما تكون الأساليب التي يمكن للمشاركين من خلالها التفاعل مع الأشياء مقيدة.
يُعبر عن معنى الكلمات في سياق كلمات أخرى؛ “كوب” ، على سبيل المثال، يمكن أن يكون “وعاءً مصنوعًا من زجاج، ويستخدم للشرب”. بيد أنه لا يمكنك أن تستخدم الكوب إلا إذا فهمت أن فكرة الشرب من كوب ماء هي أن تمسكه بيدك وتقربه إلى فمك، أو إذا سقط منك على الأرض يتهشم. بدون أن يُفهم هذا المعنى، فمن شأن ذلك أن يجعل تصميم روبوت يمكنه التعامل مع كوب حقيقي أمرًا صعبًا جدًا. في أبحاث الذكاء الاصطناعي، تُعرف هذه المشكلات بإسم المشكلات المتعلقة بمشكلة الأساس الذي تستند اليه الكلمة أو الرمز (symbol grounding problems) [المترجم: الأسم والمسمى أو المدلول والمدول عليه كما فهمناه من معنى المصطلح] في طريقة حصولها على معنىً(3)، والتي تربط الرمز / الكلمة بالعالم الحقيقي.
كيف يحقق الناس الأساس الذي يستند اليه الرمز في طريقة حصوله على معناه؟ طرح علم النفس المعرفي والعلوم المعرفية مفهومَ الإدراك المجسد(1)، حيث تُعطى الأشياء معنىً من خلال التفاعلات مع الجسم والمحيط.
لاختبار فكرة الإدراك المجسد، أجرى الباحثون تجارب لمعرفة كيف تستجيب أدمغة المشاركين في التجربة للكلمات التي تصف اشياء يمكن حملها والتصرف فيها باليد، حين يتمكن المشاركون أن يحركوا أيديهم بحرية مقارنةً بحالة حين تكون حركة أيديهم مقيدة.
“وضع طريقة لقياس وتحليل نشاط الدماغ لم تكن بتلك السهولة. أوضحت البروفسورة ماكيوكا أن المؤلفة الأولى للورقة، السيدة ساي أونيشي (Sae Onishi)، عملت بإصرار للتوصل إلى طريقة تمكننا من قياس نشاط الدماغ بدقة كافية”.
خلال التجربة، كلمتان، مثلاً “كوب” و “مكنسة يدوية” عُرضتا على شاشة يراها المشاركون. طُلب منهم مقارنة الحجم النسبي لشيئين تمثلهما تلك الكلمتان والإجابة لفظيًا على أي منهما أكبر من الثاني – في هذه الحالة كانت “المكنسة اليدوية” بالفعل أكبر من الكوب. أجريت مقارنة بين الكلمتين، اللتين تصفان نوعين من الأشياء، الأشياء التي يمكن حملها والتصرف فيها باليد، مثل “الكوب” أو “المكنسة اليدوية” والأشياء التي لا يمكن حملها باليد، مثل “البناية” أو “عمود الإنارة” ، لرصد كيف يُعالج كل نوع من هذين النوعين من الأشياء.
أثناء الاختبارات، وضع المشاركون أيديهم على سطح مكتب، حيث كانت الأيدي إما مطلقة الحركة أو مقيدة الحركة بلوح شفاف من مادة الأكريليك. عندما عرضت الكلمتان على الشاشة، للإجابة على أيهما يمثل جسمًا أكبر من الثاني، احتاج المشاركون إلى التفكير في كلا الشكلين ومقارنة حجميهما، مما أجبرهم على معالجة معنى كل كلمة على حدة.
قيس نشاط الدماغ باستخدام مطياف الأشعة تحت الحمراء (fNIRS). ركزت القياسات على التلم داخل الفص الجداري (interparietal sulcus) والفصيص الجداري السفلي (inferior parietal lobule) (التلفيف فوق الهامشي “supramarginal gyrus” والتلفيف الزاوي – كلاهما جزء من الفص الجداري) لنصف الدماغ الأيسر، وهما المسؤولان عن المعالجة الدلالية المتعلقة بالأدوات [المترجم:الآلات كما يسميها النحات ومنه اسم الآلة]. قيست سرعة الاستجابة اللفظية لتحديد مدى سرعة إجابة المشارك بعد ظهور الكلمات على الشاشة.
بينت النتائج أن نشاط نصف الدماغ الأيسر استجابةً للأشياء التي يمكن حملها والتصرف فيها باليد قد انخفض بشكل كبير عندما كانت حركة اليدين مقيدة. كما تأثرت الاجابات اللفظية في حالة كانت حركة اليدين مقيدة. تشير هذه النتائج إلى أن تقييد حركة اليد يؤثر في معالجة معنى الجسم، مما يدعم فكرة الإدراك المجسد. تشير هذه النتائج إلى أن فكرة الإدراك المجسد يمكن أن تكون فعالة أيضًا بالنسبة للذكاء الاصطناعي ليتعلم معنى الأشياء. نشرت الورقة في دورية التقارير العلمية(4).
مصادر من داخل وخارج النص:
1- “الإدراك المجسّد أو الإدراك المكتسب بشكل محسوس (Embodied cognition)، هو النظرية القائلة بأن العديد من سمات الإدراك تتشكل من جوانب الجسم بأكمله. وتشمل سمات الإدراك مفاهيم عقلية عالية المستوى (مثل المفاهيم والتقسيمات) وأداء مختلف المهام المعرفية (مثل التفكير أو إصدار الحكم). تشمل جوانب الجسم النظام الحركي والنظام الحسي والتفاعلات الجسدية مع المحيط، والافتراضات حول العالم المدمجة في الكائن نفسه. الإدراك المتجسد يرتبط ارتباطًا وثيقا بأطروحات العقل الممتد، والتفاعلية (مع المحيط). تعتمد الرؤية الحديثة على رؤى مستمدة من الأبحاث الحديثة في علم النفس، واللسانيات، وعلوم الإدراك، والأنظمة الديناميكية، والذكاء الاصطناعي، والروبوتات، والإدراك الحيواني، وإدراك النباتات، وبيولوجيا الأعصاب. وفي الفلسفة، يرى الإدراك المجسد أن إدراك الكائن يتأثر بشدة بجوانب جسم الكائن خارج الدماغ نفسه.
“مصطلح “المجسَّد” يعني إبراز نقطتين: أولا ، اعتماد الإدراك على نوع الخبرة التي تأتي من وجود جسم لديه قدرات مختلفة من المشعرات / المجسات والحواس، وثانيًا، هذه القدرات الفردية للإحساس هي نفسها راسخة ضمن السياق البيولوجي والنفسي والثقافي الشامل له.” يستند فصل الإدراك المجسد عن الإدراك الموسع والإدراك الواقعي على فرضية التجسيد: تتجسد العديد من سمات الإدراك في أنها تعتمد اعتمادًا عميقًا على خصائص الجسم الفيزيائي لعامل ما، بحيث يؤدي العامل خارج الدماغ دورًا سببيًا هامًا، أو دورًا تكوينيًا جسديًا، في المعالجة الإدراكية لهذا العامل. وتغفل هذه رسالة التجسيد هذه الإشارة المباشرة إلى بعض جوانب “السياق البيولوجي والنفسي والثقافي الأكثر شمولا”. وتؤكد أطروحة العقل الموسع، على النقيض من رسالة التجسيد، أن المعالجة المعرفية لا تقتصر على الدماغ ولا حتى على الجسم، بل تمتد إلى الخارج إلى عالم العامل.
الإدراك المتجسد هو موضوع بحث في علم النفس الاجتماعي والإدراكي، يغطي مسائل مثل التفاعل الاجتماعي وصنع القرار. يعكس الإدراك المجسد الحجة القائلة بأن النظام الحركي يؤثر في إدراكنا، تمامًا كما يؤثر الدماغ في الأفعال الجسدية. على سبيل المثال، عندما يحمل المشاركون قلم رصاص في أسنانهم ويبتسمون، يستوعبون الجمل السارة أسرع من الجمل غير السارة.
في اللغة يوسع بعض الباحثين نطاق الإدراك المجسد ليشمل اللغة. ويصفون اللغة بأنها أداة تساعد على توسيع إحساسنا بالجسم. على سبيل المثال، عندما يطلب منا تحديد هذا الشيء، يختار المشاركون في أغلب الأحيان جسما بالقرب منهم. وفي المقابل، عندما يطلب منهم تحديد “ذلك الشيء”، يختار المشاركون شيئًا بعيدًا عنهم. تسمح لنا اللغة بالتمييز بين المسافات بطرق أكثر تعقيدًا من الفرق الحسي البسيط بين الكائنات القريبة والبعيدة.
طرح جورج لاكوف ومعاونوه عدة أدلة تشير إلى أن الناس يستخدمون فهمهم للأجسام العادية، والتصرفات والحالات (مثل الحاويات، المساحات، المسارات) لفهم مجالات أخرى أكثر تعقيدًا (مثل الرياضيات، العلاقات، الموت). ويزعم لاكوف أن كل الإدراك يقوم على المعرفة التي تأتي من الجسم وأن مجالات أخرى رُسمت على معرفتنا المجسدة باستخدام مزيج من المجاز المفاهيمي، ومخطط الصورة والنماذج الأولية: https://ar.wikipedia.org/wiki/إدراك_مجسد
2- https://en.wikipedia.org/wiki/Semantic_processing
3- http://www.scholarpedia.org/article/Symbol_grounding_problem
4- https://www.nature.com/articles/s41598-022-17702-1
المصدر الرئيس:
https://www.upc-osaka.ac.jp/new-univ/en-research/news/220915/