آموزش برآورد هزینه های مرتبط با کشورهای مدل بیماری با استفاده از GLM – اقتصاددان بهداشت و درمان






مدل‌سازی هزینه‌های مراقبت‌های بهداشتی اغلب مشکل‌ساز است، زیرا به شیوه‌ای غیرعادی توزیع می‌شوند. به طور معمول، تعداد زیادی مشاهدات 0 دلاری (یعنی افرادی که از هیچ مراقبت بهداشتی استفاده نمی کنند) و توزیع هزینه وجود دارد که به شدت در میان کاربران مراقبت های بهداشتی به دلیل تعداد نامتناسب افراد با هزینه های بسیار بالای مراقبت های بهداشتی منحرف است. این مشاهدات توسط اقتصاددانان سلامت به خوبی شناخته شده است، اما یک عامل پیچیده برای مدل‌سازان، ترسیم هزینه بیماری برای ایالات خاص مراقبت‌های بهداشتی است. به عنوان مثال، در حالی که هزینه مراقبت از سرطان ممکن است بر اساس مرحله بیماری و اینکه آیا سرطان پیشرفت کرده است متفاوت باشد. هزینه بیماری قلبی عروقی در صورتی که بیمار انفارکتوس میوکارد داشته باشد متفاوت خواهد بود.

مقاله ای از ژو و همکاران. (2023) آموزش خوبی در مورد چگونگی برآورد هزینه ها با حالت های مدل بیماری با استفاده از مدل های خطی تعمیم یافته ارائه می دهد. این آموزش شامل مراحل اصلی است.

مرحله 1: آماده سازی مجموعه داده:

  • مجموعه داده معمولاً به محاسبه هزینه برای دوره های زمانی گسسته نیاز دارد. به عنوان مثال، اگر داده‌های ادعایی دارید، ممکن است اطلاعاتی در مورد هزینه بر اساس تاریخ داشته باشید، اما برای اهداف تحلیلی ممکن است بخواهید مجموعه داده‌ای با اطلاعات هزینه توسط شخص (ردیف‌ها) داشته باشید که ستون‌ها هزینه سال (یا ماه) هستند. از طرف دیگر، می توانید واحد مشاهده را به عنوان سال فرد (یا فرد-ماه) ایجاد کنید و هر ردیف یک رکورد سال فرد جداگانه باشد.
  • در مرحله بعد، باید حالت های بیماری را مشخص کرد. در هر دوره زمانی، فرد به یک وضعیت بیماری اختصاص داده می شود. چالش‌ها عبارتند از تعیین اینکه چگونه حالت‌ها را دانه‌بندی کنیم (مثلاً فقط MI در مقابل زمان‌بندی از زمان MI) و نحوه رسیدگی به سناریوهای چند حالته.
  • وقتی داده ها سانسور می شوند، می توان (i) یک متغیر کمکی اضافه کرد تا نشان دهد داده ها سانسور شده اند یا (ب) مشاهدات با داده های جزئی را حذف کرد. اگر داده‌های هزینه وجود نداشته باشد (اما بیمار در غیر این صورت سانسور نمی‌شود)، ممکن است از روش‌های انتساب چندگانه استفاده شود. شکل‌دهی دوره‌های زمانی تحلیل نیازمند نگاشت به طول چرخه مدل تصمیم، مدیریت مناسب سانسور و تبدیل داده‌های بالقوه است.
  • یک مجموعه داده نمونه در زیر نشان داده شده است.

مرحله 2: انتخاب مدل:

  • این مقاله استفاده از یک مدل دو قسمتی با چارچوب مدل خطی تعمیم یافته (GLM) را توصیه می‌کند، زیرا مفروضات OLS در مورد نرمال بودن و همسویی بودن در باقیمانده‌ها اغلب نقض می‌شوند.
  • همانطور که در فرمول زیر نشان داده شده است، با GLM، ارزش مورد انتظار هزینه به صورت غیر خطی تبدیل می شود. شما باید هم تابع پیوند و هم توزیع عبارت خطا را تخمین بزنید. محبوب‌ترین آن‌ها (ترکیبی از عملکرد پیوند و توزیع) برای هزینه‌های مراقبت‌های بهداشتی، رگرسیون خطی (پیوند هویت با توزیع گاوسی) و رگرسیون گاما با پیوند لگاریتمی طبیعی است.)
  • برای ترکیب GLM با یک مدل دو بخشی، به سادگی معادله بالا را بر روی تمام مقادیر مثبت تخمین زده و سپس یک مدل لاجیت یا پروبیت را برای احتمال هزینه مثبت یک فرد محاسبه می‌کند.

مرحله 3: انتخاب مدل نهایی.

  • انتخاب مدل ابتدا باید در نظر بگیرد که کدام متغیرهای کمکی در رگرسیون گنجانده شده اند که می تواند با انتخاب گام به گام با استفاده از یک معناداری آماری از پیش تعیین شده به دست آید. با این حال این می تواند منجر به تناسب بیش از حد شود. روش‌های انتخاب متغیر کمکی جایگزین شامل انتخاب گام به گام راه‌اندازی و تکنیک‌های جریمه‌شده (مانند انتخاب حداقل زاویه و عملگر انقباض، LASSO) است. تعامل بین متغیرهای کمکی نیز می تواند در نظر گرفته شود.
  • تناسب کلی را می توان با استفاده از میانگین خطا، میانگین خطای مطلق و ریشه میانگین مربع خطا (آخری که بیشترین استفاده را دارد) ارزیابی کرد. مدل های مناسب تر خطاهای کمتری دارند.

مرحله 4: پیش بینی مدل

  • در حالی که انجام هزینه های پیش بینی شده آسان است، تاثیر وضعیت بیماری بر هزینه پیچیده تر است. نویسندگان موارد زیر را توصیه می کنند:

برای یک مدل غیر خطی یک بخشی یا یک مدل دو بخشی، اثرات حاشیه ای را می توان با استفاده از پیش بینی بازیافتی به دست آورد. این شامل دو مرحله زیر است: (1) اجرای دو سناریو در سراسر جمعیت هدف با تنظیم وضعیت مورد علاقه بیماری (الف) وجود (مثلاً سرطان عود کننده) یا (ب) وجود ندارد (مثلاً عدم عود سرطان). (2) تفاوت در هزینه های متوسط ​​بین دو سناریو را محاسبه کنید. خطاهای استاندارد اختلاف میانگین را می توان با استفاده از بوت استرپ تخمین زد.

نویسندگان همچنین یک مثال گویا را با استفاده از این رویکرد برای مدل‌سازی هزینه بیمارستان مرتبط با حوادث قلبی عروقی در بریتانیا ارائه می‌کنند. نویسندگان همچنین کد نمونه را در R نیز ارائه می دهند و می توانید آن را دانلود کنید اینجا.





Source link