آیا باید به تخمین‌های تفاوت در تفاوت‌ها اعتماد کنیم؟ – اقتصاددان بهداشت و درمان

این سوالی است که در مقاله توسط بیکر، لارکر و وانگ (2022) مطرح شده است. من استدلال های کلیدی آنها را در زیر خلاصه می کنم.

اعتبار…[the DiD]…رویکرد بر این فرض مرکزی استوار است که روند مشاهده شده در نتایج واحدهای کنترل از روند نتایج واحدهای درمانی در صورتی که درمان دریافت نکرده باشند تقلید می کند. همانطور که نویسندگان می نویسند:

اولاً، تخمین‌های DiD در محیط‌هایی با یک دوره درمانی بی‌طرفانه هستند، حتی زمانی که اثرات درمانی پویا وجود دارد. دوم، تخمین‌های DiD نیز در تنظیمات با زمان‌بندی تکان‌دهنده تخصیص درمان و اثر درمان همگن در بین شرکت‌ها و در طول زمان بی‌طرفانه هستند. در نهایت، زمانی که تنظیمات تحقیقاتی زمان‌بندی مبهم اثرات درمان و ناهمگونی اثر درمان را ترکیب می‌کنند، تخمین‌های مبهم DiD احتمالاً مغرضانه هستند.

اغلب، DiD با استفاده از یک مدل رگرسیون مبتنی بر حداقل مربعات معمولی (OLS) به شرح زیر پیاده‌سازی می‌شود:

هنگامی که بیش از دو گروه و بیش از و دو دوره زمانی وجود دارد، مدل‌های DiD مبتنی بر رگرسیون معمولاً بر اثر ثابت دو طرفه (TWFE) از فرم تکیه می‌کنند:

که در آن دو ضریب اول اثرات واحد و دوره زمانی ثابت هستند. توجه داشته باشید که تحقیقات قبلی گودمن-بیکن (2021) نشان می‌دهد که اشکال استاتیک TWFE DiD در واقع «میانگین وزنی همه تخمین‌زن‌های احتمالی دو گروهی/دو دوره‌ای DiD در داده‌ها است».

هنگامی که اثرات درمان می تواند در طول زمان تغییر کند («اثرات درمان پویا»)، تخمین های متحرک اثر درمان DiD در واقع می تواند نشانه مخالف ATT واقعی را به دست آورد، حتی اگر محقق بتواند تخصیص درمان را تصادفی کند (بنابراین در جایی که فرض روندهای موازی برقرار است. ).

دلیل این امر این است که گودمن-بیکن (2021) نشان می دهد که TWFE استاتیک DiD در واقع از 3 جزء تشکیل شده است:

میانگین وزنی واریانس اثر درمان روی تیمار شده (VWATT)
روندهای خلاف واقع میانگین وزنی واریانس (VWCT)
مجموع وزنی تغییر در میانگین درمان در گروه درمان شده در دوره پس از دوره درمان و در اطراف پنجره درمان واحد درمان شده بعدی (ΔATT)

اولین اصطلاح اصطلاح مورد علاقه است. اگر روندهای موازی رخ دهد، VWCT = 0. آخرین اصطلاح به این دلیل به وجود می‌آید که، تحت TWFE DiD ایستا، گروه‌هایی که قبلاً درمان شده‌اند، به‌طور مؤثری مانند گروه‌های مقایسه برای گروه‌هایی که بعداً درمان شده‌اند، استفاده می‌شوند. با این حال، اگر DiD در یک مدل دو دوره ای تخمین زده شود، این عبارت ناپدید می شود و هیچ سوگیری وجود ندارد. متناوباً، اگر اثرات درمان ثابت باشد (یعنی در طول زمان پس از مداخله تغییر نکند)، ΔATT = 0 و TWFE DiD معتبر است.

با این حال، چالش ها زمانی رخ می دهد که اثرات درمان پویا باشد. در این مورد ΔATT ≠ 0 و TWFE DiD بایاس است.

پس چه می توان کرد؟ نویسندگان 3 راه حل ارائه می دهند:

کالاوی و سانتا آنا (2021). در اینجا، نویسندگان به فرد اجازه می‌دهند تا اثر درمان را برای یک گروه خاص (درمان در زمان g) با استفاده از مشاهدات در زمان τ و g-1 از مجموعه‌ای تمیز از کنترل‌ها برآورد کند. اینها اساساً گروه هایی هستند که هنوز درمان نشده اند، آخرین درمان شده اند یا هرگز درمان نشده اند.
خورشید و ابراهیم (2021). روش مشابهی مانند CS استفاده می‌شود، اما واحدهایی که همیشه درمان می‌شوند حذف می‌شوند و تنها واحدهایی که می‌توانند به‌عنوان کنترل‌های مؤثر مورد استفاده قرار گیرند، آن‌هایی هستند که هرگز درمان نمی‌شوند یا آخرین درمان می‌شوند. علاوه بر این، این رویکرد کاملاً پارامتریک است.
برآوردگرهای رگرسیون انباشته. چنگیز (2019) این رویکرد را اجرا می کند. هدف «ایجاد مجموعه داده‌های «2×2 تمیز» ویژه رویداد، از جمله متغیر نتیجه و کنترل‌های گروه درمان‌شده و همه مشاهدات دیگری است که کنترل‌های «پاک» در پنجره درمان هستند (به عنوان مثال، هنوز، آخرین – یا واحدهایی که هرگز درمان نشده اند). برای هر مجموعه داده 2×2 تمیز، محقق یک متغیر شناسایی خاص مجموعه داده تولید می کند. سپس این مجموعه داده‌های ویژه رویداد با هم انباشته می‌شوند، و یک رگرسیون TWFE DiD بر روی مجموعه داده‌های انباشته شده، با اثرات واحد و زمان ثابت مختص مجموعه داده‌ها تخمین زده می‌شود… در اصل، رگرسیون انباشته، DiD را از هر یک از 2 تمیز تخمین می‌زند. × 2 مجموعه داده، سپس وزن واریانس را اعمال می کند تا اثرات درمان را در گروه ها به طور موثر ترکیب کند.

در حالی که در این پست ریاضیات زیادی وجود دارد، اگر محققان این برآوردگرهای جایگزین DiD را به کار ببرند، نویسندگان عاقلانه توصیه می‌کنند که «محققان باید انتخاب گروه‌های مقایسه «پاک» خود را توجیه کنند – هنوز درمان نشده، آخرین درمان یا هرگز درمان نشده است. و توضیح دهید که چرا فرض روندهای موازی احتمالاً اعمال می شود.

می توانید مقاله کامل را بخوانید اینجا.