It took a pandemic, but the US finally has (some) centralized medical data
(Cat Ferguson – بواسطة: كات فيرغسون)
ملخص المقالة:
تمكن العلماء من معرفة الكثير عن مرض كوفيد – أسرع من معرفة أي مرض آخر في التاريخ – ولكن في الوقت نفسه كان هناك توتر خطير، بين ما يريد الجمهور معرفته وما استطاع العلماء قوله على وجه اليقين، وقد صُدم الجمهور عندما لا يستطيع الأطباء الإجابة على الأسئلة التي تبدو أساسية: ما هي أعراض كوفيد-19؟ كيف ينتشر؟ من هو الأكثر عرضة للإصابة؟ ما هي أفضل طريقة لمعالجتها؟ وكان هذا التوتر والصراع أكثر وضوحًا في الولايات المتحدة الامريكية، التي تنفق ما يقرب من خُمس ناتجها المحلي الإجمالي على الرعاية الصحية ولكنها تحقق نتائج أسوأ من أي دولة غنية أخرى. وكان العثور على الإجابات معقدًا لأن الرعاية الصحية الأمريكية مبنية على خليط من الأنظمة القديمة غير المتوافقة. وقد أدركت مجموعة من الباحثين بتمويل من المعاهد الوطنية الأمريكية للصحة (NIH)، أن الإجابة على العديد من الأسئلة حول كوفيد-19 مستحيلة، بدون كسر الحواجز أمام مشاركة البيانات. ولذلك طوروا إطار عمل لدمج سجلات المرضى الفعلية من مؤسسات مختلفة بطريقة يمكن أن تكون خاصة ومفيدة، وكانت النتيجة هي مجموعة كوفيد التعاونية الوطنية، التي تجمع سجلات ملايين المرضى الطبية في جميع أنحاء البلاد، وتغربلها، ومن ثم تمنح الوصول إلى المجموعات التي تدرس كل شيء من وقت استخدام جهاز التنفس الصناعي إلى كيفية تأثير الجوع على دورات الحيض. وتعد قاعدة البيانات الآن واحدة من أكبر مجموعات سجلات كوفيد في العالم، مع 6.3 مليون سجل مريض من 56 مؤسسة وإحصاء، بما في ذلك سجلات من 2.1 مليون مريض بالفيروس، يعود معظمها إلى عام 2018.
( المقالة )
كشفت كوفيد الحقيقة المجزأة للسجلات الصحية الأمريكية. الآن بدأت الجهود المبذولة لجمع البيانات من ملايين المرضى تظهر نتائجها.
نقاط مختصرة:
- 6.3 مليون سجل مجهولة الهوية موجودة حاليًا في قاعدة بيانات مجموعة كوفيد التعاونية الوطنية للمعاهد الوطنية للصحة (NIH N3C).
- أصبحت قاعدة البيانات واحدة من أكبر مجموعات سجلات مرضى كوفيد في العالم.
- يتجنب المخطط صوامع البيانات [١] وقضايا الخصوصية التي تحير نظام الرعاية الصحية في الولايات المتحدة.
طوال فترة جائحة كوفيد، كان هناك توتر خطير بين ما يريد الجمهور أن يعرفه وما استطاع العلماء أن يقولوه على وجه اليقين. وقد تمكن العلماء من معرفة المزيد عن مرض كوفيد – أسرع من معرفة أي مرض آخر في التاريخ – ولكن في الوقت نفسه، صُدم الجمهور عندما لا يستطيع الأطباء الإجابة على الأسئلة التي تبدو أساسية: ما هي أعراض كوفيد-19؟ كيف ينتشر؟ من هو الأكثر عرضة للإصابة؟ ما هي أفضل طريقة لمعالجتها؟
ولم يكن هذا الصراع أكثر وضوحًا في أي مكان من الولايات المتحدة، التي تنفق ما يقرب من خُمس ناتجها المحلي الإجمالي على الرعاية الصحية ولكنها تحقق نتائج أسوأ من أي دولة غنية أخرى. وكان العثور على الإجابات معقدًا ليس فقط لأن العلم صعب، ولكن لأن الرعاية الصحية الأمريكية مبنية على خليط من الأنظمة القديمة غير المتوافقة.
ففي الولايات المتحدة، تقرر كل ولاية كيفية الإبلاغ عن نتائج اختبارات كوفيد -19. والنتيجة هي نظام فوضوي يضر باستجابتنا للوباء.
وعبر الأمة، تتداخل قوانين الخصوصية الفيدرالية والمحلية وعلى مستوى الولاية، وتتعارض أحيانًا مع بعضها البعض. وفي الوقت نفسه، فإن السجلات الطبية فوضوية ومجزأة ومنفصلة بشدة من قبل المؤسسات التي تمتلكها – لأسباب تتعلق بالخصوصية ولأن بيع بيانات طبية مجهولة الهوية أمر مربح بشكل لا يصدق.
ولكن الوصول إلى البيانات المحصورة في هذه الصوامع هو الطريقة الوحيدة للإجابة على أسئلة حول فيروس كورونا. ولهذا السبب تم إجراء الكثير من الأبحاث الحيوية في الخارج، في البلدان التي لديها أنظمة رعاية صحية وطنية، على الرغم من أن الولايات المتحدة لديها عدد كبير من مرضى كوفيد-19 والمؤسسات البحثية. وجاءت بعض أقوى البيانات حول عوامل الخطر لوفيات فيروس كورونا وخصائص فيروس كورونا الطويل من المملكة المتحدة، على سبيل المثال. وهناك، يمكن لباحثي الصحة العامة الوصول إلى بيانات من 56 مليون سجل طبي لمرضى النظام الصحي الوطني البريطاني (NHS).
وفي بداية الوباء، أدركت مجموعة من الباحثين بتمويل من المعاهد الوطنية الأمريكية للصحة (NIH)، أن العديد من الأسئلة حول كوفيد-19 سيكون من المستحيل الإجابة عليها دون كسر الحواجز أمام مشاركة البيانات. ولذلك طوروا إطار عمل لدمج سجلات المرضى الفعلية من مؤسسات مختلفة بطريقة يمكن أن تكون خاصة ومفيدة.
والنتيجة هي مجموعة كوفيد التعاونية الوطنية (National COVID Cohort Collaborative – N3C) ، التي تجمع السجلات الطبية من ملايين المرضى في جميع أنحاء البلاد، وتغربلها، ومن ثم تمنح الوصول إلى المجموعات التي تدرس كل شيء من وقت استخدام جهاز التنفس الصناعي إلى كيفية تأثير الجوع على دورات الحيض.
تقول البروفيسور ميليسا هايندل، أستاذة المعلوماتية البحثية فيح م أنتشوتز الطبي في جامعة كولورادو، وأحد قادة مجموعة كوفيد التعاونية الوطنية: “إنه لأمر مروع أنه لم يكن لدينا بيانات صحية مجمعة منسقة للبحث في مواجهة الجائحة”. وأضافت: “لم نكن لنجعل الجميع يقدمون لنا هذه الدرجة من البيانات خارج سياق الجائحة، ولكن الآن بعد أن فعلنا ذلك، يعد هذا دليلًا على أنه يمكن تنسيق البيانات السريرية ومشاركتها على نطاق واسع بطريق آمن وبطريق شفاف”.
وتعد قاعدة البيانات الآن واحدة من أكبر مجموعات سجلات كوفيد في العالم ، مع 6.3 مليون سجل مريض من 56 مؤسسة وإحصاء، بما في ذلك سجلات من 2.1 مليون مريض بالفيروس. وتعود معظم السجلات إلى عام 2018 ، وقد تعهدت المنظمات المساهمة بمواصلة تحديثها لمدة خمس سنوات. وهذا يجعل مجموعة كوفيد التعاونية الوطنية ليس فقط أحد أكثر الموارد المفيدة لدراسة المرض اليوم، ولكنه أحد أكثر الطرق الواعدة لدراسة مرض كوفيد-19.
إن نظامًا تُرسل فيه المؤسسات السجلات، بكميات كبيرة، إلى حكومة فيدرالية مركزية هو شذوذ في الرعاية الصحية الأمريكية. وإذا استخدمته بشكل جيد، فمن المحتمل أن يجيب على الأسئلة التفصيلية بعد فترة طويلة من الجائحة. وقد يكون بمثابة “اثبات المفهوم” لجهود مماثلة في المستقبل.
بيانات مفتوحة المصدر
للمساهمة بالمعلومات في قاعدة البيانات، يختار مقدمو الخدمات المشاركون أولاً مجموعتين من المرضى: الأشخاص الذين ثبتت إصابتهم بفيروس كوفيد، وآخرون سيعملون كمجموعة تحكم. ثم يقومون بعد ذلك باستبعاد كل ما يجعل البيانات قابلة للتعريف شخصيًا، باستثناء الرمز البريدي وتواريخ الخدمة، ثم يقومون بنقلها بشكل آمن إلى مجموعة كوفيد التعاونية الوطنية. وهناك، يقوم الفنيون بمهمة تنظيف البيانات وهي غير سهلة دائما، وإدخالها في قاعدة البيانات.
ويمكن لأي شخص تقديم اقتراح بحث من خلال لوحة معلومات مجموعة كوفيد التعاونية الوطنية، سواء أكان تابعًا لمؤسسة مقدمة أم لا. ويمكن حتى للعلماء المواطنين طلب الوصول إلى نسخة مجهولة المصدر من مجموعة البيانات.
وتقوم لجنة في جونز هوبكنز بمراجعة كل اقتراح وتقرر أي نسخة من البيانات سيتمكن الباحثون من الوصول إليها. وهناك عدة مستويات من المعلومات: مجموعة بيانات محدودة، ومستوى ثان يحتوي على سجلات حقيقية برموز بريدية وتواريخ محجوبة، وثالث مصنوع من سجلات “اصطناعية” تم إنشاؤها بواسطة الكمبيوتر، والتي تحاول الاحتفاظ بنفس السمات مثل السجلات الحقيقية بدون أن تحتوي على أي بيانات مريض حقيقية. ويجب على الجميع الخضوع للتدريب على أمن البيانات قبل الوصول.
وقد تمت الموافقة حتى الآن على 215 مشروعًا بحثيًا، بما في ذلك دراسات لتتبع نتائج المرضى الذين تلقوا لقاحات مختلفة لفيروس كوفيد وفحص معدلات مضاعفات العمليات الجراحية الاختيارية في المرضى غير المصابين بالفيروس أثناء الجائحة. وكان الإصدار الأول من التعاونية تحليلا لعوامل خطر الوفاة لدى مرضى السرطان الذين التقطوا فيروس سارس-كورونا 2، وأُذِنَ بنشر عدة إصدارات قبل الطبع على مواضيع بما في ذلك نتائج كوفيد للمرضى الذين يعانون من أمراض الكبد، والأشخاص الذين يعانون من فيروس نقص المناعة البشرية.
مزيد من المساءلة، علم أفضل
تعد البيانات النظيفة والدقيقة أمرًا حيويًا لمثل هذه الدراسات، ولكن كان من الصعب الحصول عليها في ظل فوضى الجائحة. وفي شهر يونيو الماضي (2020)، سحبت مجلتان رئيسيتان هما بي ام جي (BMG) و “ذي لانست” (The Lancet) أوراقهما العلمية المستندة إلى “بيانات” من شركة “سيرجيسفير” (Surgisphere) ، وهي شركة بيانات طبية غير معروفة ولديها عدد قليل من الموظفين. وادعت أن لديها إمكانية الوصول إلى السجلات الطبية في الوقت الفعلي لما يقرب من 100,000 مريض كوفيد في 700 مستشفى حول العالم. وفي بعض الحالات، كانت الأرقام تمثل عددًا أكبر من المرضى الذين تم تشخيصهم بالفعل في بلد معين.
وقبل التراجع، أدت الأوراق العلمية إلى قرارات بوقف التجارب السريرية وتغيير الممارسات الطبية. ولكن عندما أصبح الباحثون مرتابين – لا سيما بالنظر إلى أن اتفاقية واحدة بشأن نقل البيانات الطبية تستغرق وقتًا وعملاً هائلين – رفضت الشركة السماح لأي شخص بمراجعة البيانات. وفي الواقع، لا يوجد دليل على وجود قاعدة البيانات على الاطلاق.
وقد فشلت الولايات المتحدة في تحديد أولويات التدخل الفعال والاقتصادي للغاية – مما يوفر وصولاً سريعًا وسهلاً إلى بيانات فيروس كورونا.
وتخضع مجموعة كوفيد التعاونية الوطنية من ناحية أخرى، للتدقيق من قبل آلاف الباحثين ويخضع للمساءلة أمامهم في مئات المؤسسات المشاركة، مع تركيز قوي على الشفافية وقابلية إعادة الإنتاج. ويتم الحفاظ بعناية على كل ما يفعله المستخدمون من خلال الواجهة، التي تستخدم منصة السحابة الحكومية التابعة لشركة پالانتير، بحيث يمكن لأي شخص لديه إمكانية الوصول تتبع خطواته.
“هذا ليس علم الصواريخ، وهو ليس جديدًا حقًا. إنه مجرد عمل شاق” ، كما يقول كريستوفر شوت، أستاذ الطب بجامعة جونز هوبكنز والذي شارك أيضًا في قيادة مجموعة كوفيد التعاونية الوطنية. ويضيف: “إنه أمر ممل، ويجب القيام به بعناية، وعلينا التحقق من صحة كل خطوة. أسوأ شيء يمكننا القيام به هو تحويل البيانات بشكل منهجي إلى بيانات غير صحيحة من شأنها أن تقدم لنا إجابات خاطئة”.
القوة الغاشمة
تشير البروفيسور هاينديل إلى أن هذه الجهود لم تكن سهلة. وتقول: “التنوع في الخبرة الذي يتطلبه الأمر لتحقيق ذلك – المثابرة والتفاني، وبصراحة القوة الغاشمة – لم يسبق له مثيل”.
لقد أتت هذه القوة الغاشمة من عدة مجالات مختلفة تتجاوز الطب فقط.
“لقد ساعدت مشاركة الجميع من جميع جوانب العلوم حقًا” ، تقول البروفيسور ماري بولاند، أستاذة المعلوماتية في جامعة بنسلفانيا. وتتابع: “خلال فترة الإصابة بفيروس كورونا، كان الناس أكثر استعدادًا للتعاون. يمكن أن يكون لديك مهندسين، يمكن أن يكون لديك علماء كمبيوتر، فيزيائيون – كل هؤلاء الأشخاص الذين قد لا يشاركون عادة في أبحاث الصحة العامة”.
إن البروفيسور بولاند هي جزء من مجموعة تستخدم بيانات مجموعة كوفيد التعاونية الوطنية للنظر في ما إذا كان كوفيد يزيد من النزيف غير المنتظم لدى النساء المصابات بمتلازمة تكيس المبايض. وفي المعتاد، يتعين على معظم الباحثين استخدام بيانات مطالبات التأمين للحصول على قاعدة بيانات كبيرة بما يكفي لتحليلات مستوى السكان، كما تقول البروفيسور بولاند.
ويمكن لبيانات الادعاءات الإجابة على بعض الأسئلة حول مدى جودة عمل الأدوية في العالم الحقيقي، على سبيل المثال. ولكن قواعد البيانات هذه تفتقد إلى كميات هائلة من المعلومات، بما في ذلك نتائج المختبر، والأعراض التي يبلغ عنها الأشخاص، وحتى البيانات حول ما إذا كان المرضى على قيد الحياة أو يموتون.
الجمع والتنظيف
خارج قواعد بيانات مطالبات التأمين، يستخدم معظم التعاون في مجال البيانات الصحية في الولايات المتحدة نموذجًا فيدراليًا. ويوافق جميع المشاركين في هذه الدراسات على تنسيق مجموعات البيانات الخاصة بهم في تنسيق مشترك ثم إجراء استفسارات من المجموعة، مثل نسبة حالات الإصابة الخطيرة بالفيروس حسب الفئة العمرية. إن العديد من مجموعات أبحاث كوفيد الدولية، بما في ذلك علوم ومعلوماتية بيانات الصحة المراقبة (OHDSI) التي تُنطق “أوديسي” ، تعمل هكذا متجنبة المشكلات القانونية والسياسية المتعلقة ببيانات المرضى العابرة للحدود.
وقد تأسست “اوديسي” في عام 2014 ، ولديها باحثون من 30 دولة وتحتفظ بسجلات لـ 600 مليون مريض.
وتقول البروفيسور بولاند: “ذلك يسمح لكل مؤسسة بالاحتفاظ ببياناتها خلف جدران الحماية الخاصة بها، مع توفير وسائل حماية البيانات الخاصة بها” ، وتضيف: “إنها لا تتطلب أي بيانات للمرضى للتحرك ذهابًا وايابًا. هذا مريح للعديد من الأماكن، خاصة مع كل عمليات القرصنة التي تحدث مؤخرًا”.
ولكن الاعتماد على كل مؤسسة لإعداد بياناتها الخاصة لمثل هذا النظام يحمل في طياته الكثير من المخاطر.
وتقول البروفيسور بولاند: “إن الحصول على البيانات في تنسيق بيانات مشترك هو التحدي الأكبر، لأنه حتى أسماء الأدوية – قد تعتقد أن ذلك سيكون موحدًا في جميع أنحاء الولايات المتحدة ، لكنه ليس كذلك في الحقيقة. وغالبًا ما يكون لدى الصيدليات الأدوية الجنيسة، وقد تحتوي على مكونات مختلفة قليلاً بسبب قوانين براءات الاختراع. كل واحد من هؤلاء هو اسم الدواء الخاص به”.
ومن ناحية أخرى، تطلب مجموعة كوفيد التعاونية الوطنية من جميع المشاركين إرسال سجلاتهم الأولية الغير مرتبة إلى مكان واحد والسماح للجسم المركزي بتنظيفها وتوحيدها. وفي حين أن هناك العديد من الفوائد الواضحة، إلا أن هناك عقبات قانونية واجتماعية كبيرة تحول دون المشاركة بهذه الطريقة، سواء في أمريكا أو على الصعيد الدولي؛ العديد من المؤسسات، على سبيل المثال، لا يمكنها المساهمة في مجموعة كوفيد التعاونية الوطنية بسبب قوانين الخصوصية في ولاياتهم.
كما أنها تمثل تحديًا تقنيًا. ويعتبر الجمع بين مجموعتين من السجلات الطبية الإلكترونية أمرًا صعبًا للغاية ويتطلب عمالة مكثفة؛ غالبًا ما تكون جودة البيانات منخفضة، وهناك القليل من التقييس (التوحيد القياسي). وفي مؤسسات الرعاية الصحية متعددة المواقع،1 من كل 5 من السجلات الطبية التي تصل هي ملفات مكررة، غالبًا نتيجة أخطاء إدخال البيانات أثناء المواعيد أو تسجيل الوصول، وفقًا لورقة “بيو” لعام 2018.
وغالبًا ما يدعي هؤلاء المدافعون عن النماذج الفيدرالية أنهم يقومون بمراقبة الجودة الخاصة بهم خلف جدار الحماية الخاص بهم. ولكن الباحثين في مجموعة كوفيد التعاونية الوطنية صُدموا عندما اكتشفوا مدى فوضوية البيانات.
“كان هناك قدر معين من الشك من المواقع، مثل ، ‘لا نحتاج حقًا إلى هذا النوع من إطار عمل جودة البيانات – نحن نفعل ذلك بالفعل في مواقعنا الخاصة بسرية ، خلف جدار الحماية الخاص بنا. نحن لسنا بحاجة إلى أدوات التنسيق المنتنة الخاصة بك” ، كما تقول هاينديل. وتتابع: “لكننا تعلمنا أن مقاييس الجودة هذه غير كافية عندما تنظر إلى البيانات بشكل إجمالي”.
وبعض مشكلات جودة البيانات وصلت الى حد العبث.
“في بعض الحالات، فشلت المنظمات في وضع وحدات قياس. لذلك كان هناك وزن، لكن لم تكن هناك وحدة قياس، كما كان من المفترض أن نعرف”، يقول شوت. ولكن امتلاك هذا العدد الهائل من السجلات منحهم ميزة، والسماح لهم بحفظ العديد من نقاط البيانات التي كان من الممكن التخلص منها لولا ذلك.
ويقول: “لقد تمكنا من النظر في توزيعات البيانات التي لدينا وحدات لها، ومعرفة أين تتلاءم البيانات الغامضة. يمكنك فقط أن تقيسها – أوه ، من الواضح أن هذا رطل أو كيلوغرام”.
سمكة كبيرة في محيط أكبر بكثير
على الرغم من كونها واسعة النطاق، فإن قاعدة بيانات مجموعة كوفيد التعاونية الوطنية تتضاءل أمام حجم البيانات التي تم جمعها والمحافظة عليها في أماكن أخرى في نظام الرعاية الصحية في الولايات المتحدة، من الوكالات الحكومية إلى المستشفيات، ومختبرات الفحص، وشركات التأمين، وغيرها. وتتعقب وزارة الصحة والخدمات الإنسانية أكثر من 2000 مجموعة بيانات متعلقة بالصحة من الوكالات الفيدرالية والمحلية ووكالات الولايات وحدها.
لقد صنع أحدهم نموذجًا للتعلم الآلي في غضون أسبوع وقام بتشغيله يوميًا على جهاز الكمبيوتر المحمول الخاص به (استغرق الأمر ساعة واحدة فقط) ، مما أدى إلى تنبؤات دقيقة بشكل ملحوظ حول فيروس كورونا.
وفائدة كل منها محدودة من خلال الصوامع: من المستحيل أساسًا على الباحثين الذين يعملون بمفردهم ربط مطالبات الرعاية الطبية، سجلات من مسجلي اللقاحات، بيانات الولايات العرقية والاثنية الخاصة بالتطعيمات، أو قواعد البيانات الخاصة بمتغيرات كوفيد-19 المتسلسلة من عينات المرضى من أنحاء البلاد. وفي الواقع، يعد تحويل السجلات الأولية إلى معلومات مفيدة أمرًا صعبًا للغاية لدرجة أنه أصبح صناعة خاصة مزدهرة: يشتري سماسرة البيانات السجلات المجهولة الهوية بكميات كبيرة، ويحللون الارتباطات بين المتغيرات، ويبيعون تحليلاتهم – أو البيانات نفسها – للباحثين والحكومات.
وتقول البروفيسور هاينديل: “نحن على استعداد لتقديم جميع بياناتنا إلى كيان تجاري والسماح لهم ببيعها لنا مرة أخرى، لكننا غير مستعدين لدفع ثمن البنية التحتية الأساسية للصحة العامة. هذا الجهد التطوعي في مواجهة الوباء أمر مذهل، لكنه ليس حلاً مستدامًا طويل الأجل للتعامل مع الأوبئة المستقبلية، أو مجرد الرعاية الصحية بشكل عام”.
ويبتعد نهج مجموعة كوفيد التعاونية الوطنية عن بعض تلك المشكلات، ولكن هناك ثغرات كبيرة في بياناتها، لا سيما المعلومات المتعلقة بالتطعيمات. ويتم إعطاء معظم اللقاحات في مواقع المجتمع، في حين أن سجلات التعاونية هي من زيارات الرعاية الأولية والاستشفاء، مما يعني أنه تم تسجيل 245,000 لقاح من شركة فايزر و 104,000 لقاح موديرنا في السجلات. وتقوم شركة تحليلات الرعاية الصحية ببناء أداة لدمج سجلات المرضى بشكل آمن من مصادر متعددة، ولكنها لن تكون متاحة لبضعة أشهر على الأقل.
وحتى مع هذه الثغرات، فإن قاعدة بيانات مجموعة كوفيد التعاونية الوطنية الهائلة تقدم واحدة من أفضل الموارد للباحثين الذين يتطلعون إلى الإجابة على العديد من الأسئلة التي لم يتم حلها حول كوفيد.
وتقول البروفيسور هاينديل: “هذا هو نوع ما نحن عالقون الآن. نحتاج حقًا إلى خبراء في المجال في جميع الجوانب المختلفة للرعاية السريرية، والعلم الذي يقف وراءهم، لمساعدتنا في العثور على جميع الإبر في أكوام القش”.
ملحوظة: هذه القصة جزء من مشروع تكنولوجيا الجائحة، بدعم من مؤسسة روكفلر.
*تمت الترجمة بتصرف
المصدر:
https://www.technologyreview.com/2021/06/21/1026590/us-covid-database-n3c-nih-privacy/
الهوامش:
[١] صومعة البيانات هي مجموعة من البيانات التي تحتفظ بها مجموعة واحدة والتي لا يمكن الوصول اليها بسهولة او بشكل كامل من قبل المجموعات الأخرى.