فرض کنید شما علاقه مند به اندازه گیری رابطه بین دیابت نوع 2 (T2DM) و افسردگی هستید. در بسیاری از موارد، می توان از داده های پرونده الکترونیک سلامت استفاده کرد و یک رگرسیون لجستیک با افسردگی به عنوان متغیر وابسته و T2DM (به طور بالقوه همراه با جمعیت شناسی و سایر بیماری های همراه) به عنوان متغیرهای مستقل انجام داد. با این حال، استفاده از EHR به طور بالقوه مشکل ساز است. همانطور که در گلدشتاین و همکاران اشاره شد. (2016)، خطر وجود دارد “حضور آگاهانه” از آنجایی که نمونه بیماران در EHR احتمالاً با افراد عمومی متفاوت است، زیرا افراد فقط زمانی ظاهر می شوند که یک برخورد پزشکی داشته باشند.
به طور خاص، گلدشتاین و همکارانش اشاره می کنند که بازدیدهای مکرر احتمال تشخیص بیماری را افزایش می دهد:
کوان و همکاران حساسیتها را بر اساس طبقهبندی بینالمللی بیماریها، ویرایش نهم، کدهای 32 شرایط رایج ارزیابی کرد. آنها دریافتند که حساسیت برای شیوع یک بیماری از 9.3٪ (کاهش وزن) تا 83.1٪ (سرطان متاستاتیک) متغیر است. به عنوان مثال، دیابت با عوارض دارای حساسیت 63.6٪ است. بنابراین، هرچه برخوردهای پزشکی بیشتر باشد، احتمال وجود دیابت بیشتر می شود.
در عین حال، در حالی که برخوردهای بیشتر احتمال منفی کاذب را کاهش می دهد، خطر مثبت کاذب را نیز به دلیل تشخیص های رد شده افزایش می دهد.
از آنجایی که الگوریتمهای فنوتیپ عموماً برای تشخیص شیوع یک بیماری از طریق الگوریتمهای هرگز/هرگز طراحی شدهاند (شما یا این شرایط را دارید یا ندارید)، هر چه فردی با مراقبتهای بهداشتی بیشتری برخورد کند، احتمال تشخیص مثبت کاذب بیشتر میشود.
دو نوع سوگیری ممکن است ایجاد شود:
- تعصب نسبت به تعداد مراجعات به پزشک. شکل 1A از این مقاله نشان می دهد که تعداد برخوردها ممکن است یک عامل مخدوش کننده باشد. با این حال، شواهدی وجود ندارد که آیا احتمال وجود سوگیری M، سوگیری ناشی از شرطی شدن در برخورددهنده وجود دارد یا خیر. برخورد دهنده متغیری است که برآیند 2 متغیر دیگر است.
- تعصب به دلیل بیماری عمومی. نویسندگان خاطرنشان می کنند که یک بیماری عمومی ممکن است علت دیابت و افسردگی باشد. به عنوان مثال، ممکن است فردی آسیب دیده باشد که باعث شود کمتر ورزش کند و غذای سالم کمتری بخورد (باعث T2DM) و خود آسیب نیز افسردگی را افزایش دهد. در حالی که مثال من آسیب خاصی را نشان می دهد، “بیماری عمومی” در مقاله گلدشتاین ممکن است به طور کامل شناسایی یا شناخته نشده باشد. بنابراین، نویسندگان ادعا می کنند که تعداد برخوردها ممکن است بتواند به عنوان نماینده ای برای بیماری عمومی باشد.
به طور خلاصه، نویسندگان استدلال میکنند که کنترل تعداد ویزیتها میتواند برای (i) کنترل این حقیقت که تشخیص با تعداد برخوردها مرتبط است و (ii) تعداد برخوردها ممکن است نماینده بیماری عمومی باشد مفید باشد.
سپس نویسندگان یک تمرین شبیه سازی را با استفاده از داده های EHR از سیستم بهداشت دانشگاه دوک انجام می دهند. نویسندگان 4 تجزیه و تحلیل را انجام می دهند که رابطه بین پیامد و کنترل مواجهه را برای موارد زیر بررسی می کند: (1) فقط جمعیت شناسی، (2) برخوردهای پزشکی، (iii) شاخص همبودی چارلسون (CCI)، و (IV) برخوردهای پزشکی و CCI.
نویسندگان یافته های خود را به شرح زیر خلاصه می کنند:
اگر وجود یک وضعیت پزشکی با احتمال زیاد (به عنوان مثال، حساسیت بالا) ثبت نشود، پتانسیل افزایش تخمین اثر برای ارتباط با وضعیت دیگری وجود دارد. این پتانسیل سوگیری زمانی تشدید میشود که شرایط پزشکی منجر به برخورد بیشتر با بیماران شود… تئوری نشان میدهد، و شبیهسازیهای ما تأیید میکنند که شرطی کردن تعداد برخوردهای مراقبتهای بهداشتی میتواند این سوگیری را از بین ببرد. تأثیر شرطیسازی برای تشخیصهایی که با حساسیت کم گرفته میشوند بیشترین است.
نویسندگان خاطرنشان می کنند که در حالی که برخی نگرانی ها در مورد سوگیری M وجود دارد – از آنجایی که تعداد برخوردها احتمالاً یک برخورد دهنده است – سوگیری M احتمالاً به طور قابل توجهی کمتر از سوگیری مخدوش کننده مشکل ساز است. مطالعات دیگر (لیو و همکاران 2012) تأیید کرده اند که سوگیری M اغلب کوچکتر از سوگیری مخدوش کننده است.
یک نکته: تعصب برکسون
مشکل بیماران بیمارتر که در داده های EHR ظاهر می شوند باعث بروز سوگیری برکسون می شود:
از آنجایی که نمونهها از جمعیت بیماران بستری در بیمارستان گرفته میشوند، نه از عموم مردم، این میتواند منجر به یک ارتباط منفی کاذب بین بیماری و عامل خطر شود. به عنوان مثال، اگر عامل خطر دیابت باشد و بیماری کوله سیستیت باشد، احتمال ابتلا به کوله سیستیت در یک بیمار بیمارستانی بدون دیابت بیشتر از یک عضو جمعیت عمومی است، زیرا بیمار باید برخی از بیماری های غیر دیابتی داشته باشد (احتمالاً باعث کوله سیستیت می شود). دلیل ورود به بیمارستان در وهله اول این نتیجه صرف نظر از وجود ارتباط بین دیابت و کوله سیستیت در جمعیت عمومی به دست می آید.