مدلسازی هزینههای مراقبتهای بهداشتی اغلب مشکلساز است، زیرا به شیوهای غیرعادی توزیع میشوند. به طور معمول، تعداد زیادی مشاهدات 0 دلاری (یعنی افرادی که از هیچ مراقبت بهداشتی استفاده نمی کنند) و توزیع هزینه وجود دارد که به شدت در میان کاربران مراقبت های بهداشتی به دلیل تعداد نامتناسب افراد با هزینه های بسیار بالای مراقبت های بهداشتی منحرف است. این مشاهدات توسط اقتصاددانان سلامت به خوبی شناخته شده است، اما یک عامل پیچیده برای مدلسازان، ترسیم هزینه بیماری برای ایالات خاص مراقبتهای بهداشتی است. به عنوان مثال، در حالی که هزینه مراقبت از سرطان ممکن است بر اساس مرحله بیماری و اینکه آیا سرطان پیشرفت کرده است متفاوت باشد. هزینه بیماری قلبی عروقی در صورتی که بیمار انفارکتوس میوکارد داشته باشد متفاوت خواهد بود.
مقاله ای از ژو و همکاران. (2023) آموزش خوبی در مورد چگونگی برآورد هزینه ها با حالت های مدل بیماری با استفاده از مدل های خطی تعمیم یافته ارائه می دهد. این آموزش شامل مراحل اصلی است.
مرحله 1: آماده سازی مجموعه داده:
- مجموعه داده معمولاً به محاسبه هزینه برای دوره های زمانی گسسته نیاز دارد. به عنوان مثال، اگر دادههای ادعایی دارید، ممکن است اطلاعاتی در مورد هزینه بر اساس تاریخ داشته باشید، اما برای اهداف تحلیلی ممکن است بخواهید مجموعه دادهای با اطلاعات هزینه توسط شخص (ردیفها) داشته باشید که ستونها هزینه سال (یا ماه) هستند. از طرف دیگر، می توانید واحد مشاهده را به عنوان سال فرد (یا فرد-ماه) ایجاد کنید و هر ردیف یک رکورد سال فرد جداگانه باشد.
- در مرحله بعد، باید حالت های بیماری را مشخص کرد. در هر دوره زمانی، فرد به یک وضعیت بیماری اختصاص داده می شود. چالشها عبارتند از تعیین اینکه چگونه حالتها را دانهبندی کنیم (مثلاً فقط MI در مقابل زمانبندی از زمان MI) و نحوه رسیدگی به سناریوهای چند حالته.
- وقتی داده ها سانسور می شوند، می توان (i) یک متغیر کمکی اضافه کرد تا نشان دهد داده ها سانسور شده اند یا (ب) مشاهدات با داده های جزئی را حذف کرد. اگر دادههای هزینه وجود نداشته باشد (اما بیمار در غیر این صورت سانسور نمیشود)، ممکن است از روشهای انتساب چندگانه استفاده شود. شکلدهی دورههای زمانی تحلیل نیازمند نگاشت به طول چرخه مدل تصمیم، مدیریت مناسب سانسور و تبدیل دادههای بالقوه است.
- یک مجموعه داده نمونه در زیر نشان داده شده است.
مرحله 2: انتخاب مدل:
- این مقاله استفاده از یک مدل دو قسمتی با چارچوب مدل خطی تعمیم یافته (GLM) را توصیه میکند، زیرا مفروضات OLS در مورد نرمال بودن و همسویی بودن در باقیماندهها اغلب نقض میشوند.
- همانطور که در فرمول زیر نشان داده شده است، با GLM، ارزش مورد انتظار هزینه به صورت غیر خطی تبدیل می شود. شما باید هم تابع پیوند و هم توزیع عبارت خطا را تخمین بزنید. محبوبترین آنها (ترکیبی از عملکرد پیوند و توزیع) برای هزینههای مراقبتهای بهداشتی، رگرسیون خطی (پیوند هویت با توزیع گاوسی) و رگرسیون گاما با پیوند لگاریتمی طبیعی است.)
- برای ترکیب GLM با یک مدل دو بخشی، به سادگی معادله بالا را بر روی تمام مقادیر مثبت تخمین زده و سپس یک مدل لاجیت یا پروبیت را برای احتمال هزینه مثبت یک فرد محاسبه میکند.
مرحله 3: انتخاب مدل نهایی.
- انتخاب مدل ابتدا باید در نظر بگیرد که کدام متغیرهای کمکی در رگرسیون گنجانده شده اند که می تواند با انتخاب گام به گام با استفاده از یک معناداری آماری از پیش تعیین شده به دست آید. با این حال این می تواند منجر به تناسب بیش از حد شود. روشهای انتخاب متغیر کمکی جایگزین شامل انتخاب گام به گام راهاندازی و تکنیکهای جریمهشده (مانند انتخاب حداقل زاویه و عملگر انقباض، LASSO) است. تعامل بین متغیرهای کمکی نیز می تواند در نظر گرفته شود.
- تناسب کلی را می توان با استفاده از میانگین خطا، میانگین خطای مطلق و ریشه میانگین مربع خطا (آخری که بیشترین استفاده را دارد) ارزیابی کرد. مدل های مناسب تر خطاهای کمتری دارند.
مرحله 4: پیش بینی مدل
- در حالی که انجام هزینه های پیش بینی شده آسان است، تاثیر وضعیت بیماری بر هزینه پیچیده تر است. نویسندگان موارد زیر را توصیه می کنند:
برای یک مدل غیر خطی یک بخشی یا یک مدل دو بخشی، اثرات حاشیه ای را می توان با استفاده از پیش بینی بازیافتی به دست آورد. این شامل دو مرحله زیر است: (1) اجرای دو سناریو در سراسر جمعیت هدف با تنظیم وضعیت مورد علاقه بیماری (الف) وجود (مثلاً سرطان عود کننده) یا (ب) وجود ندارد (مثلاً عدم عود سرطان). (2) تفاوت در هزینه های متوسط بین دو سناریو را محاسبه کنید. خطاهای استاندارد اختلاف میانگین را می توان با استفاده از بوت استرپ تخمین زد.
نویسندگان همچنین یک مثال گویا را با استفاده از این رویکرد برای مدلسازی هزینه بیمارستان مرتبط با حوادث قلبی عروقی در بریتانیا ارائه میکنند. نویسندگان همچنین کد نمونه را در R نیز ارائه می دهند و می توانید آن را دانلود کنید اینجا.