متغیرهای ابزاری محلی (LIV) در مقابل حداقل مربعات دو مرحله ای (2SLS) – بهداشت و درمان اقتصاد

یک مقاله جالب اخیر توسط Moler-Zapata، Grieve، Basu و O’Neill (2023) متغیرهای ابزاری محلی (LIV) را با حداقل مربعات دو مرحله ای (2SLS) تا IV مقایسه می کند.

رویکردهای متغیر ابزاری محلی (LIV) از متغیرهای ابزاری پیوسته/چند ارزشی (IV) برای ایجاد برآوردهای ثابت از اثرات متوسط درمان (ATEs) و اثرات میانگین درمان شرطی (CATEs) استفاده می‌کنند. شواهد کمی در مورد نحوه عملکرد روش های LIV با توجه به قدرت IV یا با اندازه های مختلف نمونه وجود دارد. مطالعه شبیه‌سازی ما عملکرد یک روش LIV و یک رویکرد حداقل مربعات دو مرحله‌ای (2SLS) را در اندازه‌های مختلف نمونه و نقاط قوت IV مورد بررسی قرار داد. ما چهار سناریو «ناهمگونی» را در نظر گرفتیم: همگنی، ناهمگنی آشکار (بیش از متغیرهای کمکی اندازه‌گیری شده)، ناهمگونی اساسی (بدون اندازه‌گیری)، و ناهمگنی آشکار و ضروری ترکیبی. در تمام سناریوها، LIV برآوردهایی را با سوگیری کم حتی با کوچکترین حجم نمونه گزارش کرد، مشروط بر اینکه ابزار قوی بود. در مقایسه با 2SLS، LIV تخمین‌هایی را برای ATE و CATE با سطوح پایین‌تر بایاس و خطای میانگین مربعات ریشه ارائه کرد. با اندازه‌های نمونه کوچک‌تر، هر دو رویکرد به IVهای قوی‌تری برای اطمینان از سوگیری کم نیاز داشتند. ما هر دو روش را در ارزیابی جراحی اورژانسی (ES) برای سه بیماری حاد گوارشی در نظر گرفتیم. در حالی که 2SLS بر اساس زیرگروه هیچ تفاوتی در اثربخشی ES پیدا نکرد، LIV گزارش داد که بیماران ضعیف‌تر پیامدهای بدتری به دنبال ES داشتند. در تنظیمات با IV های مداوم با قدرت متوسط، رویکردهای LIV بهتر از 2SLS برای تخمین پارامترهای اثر درمان مرتبط با سیاست مناسب هستند.

LIV برتر به نظر می رسد، اما نکته کلیدی تنها داشتن یک ابزار قوی نیست، بلکه ابزار باید چند ارزشی (یعنی غیر باینری) باشد و از پشتیبانی کافی برخوردار باشد. کاربرد تجربی برای مطالعه ESORT (جراحی اورژانسی یا نه) بود که جراحی اضطراری را برای سه بیماری گوارشی بررسی می‌کرد: آپاندیسیت حاد، بیماری سنگ کیسه صفرا و فتق دیواره شکم. LIV دارای سوگیری کمتری است، به خصوص در اندازه های نمونه کوچک، نسبت به 2SLS و – همانطور که در شکل زیر با استفاده از ریشه میانگین مربعات خطا (RMSE) نشان داده شده است، LIV همچنین تخمین های دقیق تری را ارائه می دهد، به ویژه با حجم نمونه کوچکتر. این امر حتی زمانی که ناهمگونی وجود دارد نیز صادق است.

ریشه میانگین مربعات خطا (RMSE) برای تخمین‌های میانگین اثر درمان (ATE) از 2SLS (خط چین) و LIV (خط توپر) در سراسر سناریوها، با حجم نمونه (ن) از 5000 (چپ)، 10000 (وسط) و 50000 (راست).

می توانید مقاله کامل را بخوانید اینجا.