این سوالی است که در مقاله توسط بیکر، لارکر و وانگ (2022) مطرح شده است. من استدلال های کلیدی آنها را در زیر خلاصه می کنم.
اعتبار…[the DiD]…رویکرد بر این فرض مرکزی استوار است که روند مشاهده شده در نتایج واحدهای کنترل از روند نتایج واحدهای درمانی در صورتی که درمان دریافت نکرده باشند تقلید می کند. همانطور که نویسندگان می نویسند:
اولاً، تخمینهای DiD در محیطهایی با یک دوره درمانی بیطرفانه هستند، حتی زمانی که اثرات درمانی پویا وجود دارد. دوم، تخمینهای DiD نیز در تنظیمات با زمانبندی تکاندهنده تخصیص درمان و اثر درمان همگن در بین شرکتها و در طول زمان بیطرفانه هستند. در نهایت، زمانی که تنظیمات تحقیقاتی زمانبندی مبهم اثرات درمان و ناهمگونی اثر درمان را ترکیب میکنند، تخمینهای مبهم DiD احتمالاً مغرضانه هستند.
اغلب، DiD با استفاده از یک مدل رگرسیون مبتنی بر حداقل مربعات معمولی (OLS) به شرح زیر پیادهسازی میشود:
هنگامی که بیش از دو گروه و بیش از و دو دوره زمانی وجود دارد، مدلهای DiD مبتنی بر رگرسیون معمولاً بر اثر ثابت دو طرفه (TWFE) از فرم تکیه میکنند:
که در آن دو ضریب اول اثرات واحد و دوره زمانی ثابت هستند. توجه داشته باشید که تحقیقات قبلی گودمن-بیکن (2021) نشان میدهد که اشکال استاتیک TWFE DiD در واقع «میانگین وزنی همه تخمینزنهای احتمالی دو گروهی/دو دورهای DiD در دادهها است».
هنگامی که اثرات درمان می تواند در طول زمان تغییر کند («اثرات درمان پویا»)، تخمین های متحرک اثر درمان DiD در واقع می تواند نشانه مخالف ATT واقعی را به دست آورد، حتی اگر محقق بتواند تخصیص درمان را تصادفی کند (بنابراین در جایی که فرض روندهای موازی برقرار است. ).
دلیل این امر این است که گودمن-بیکن (2021) نشان می دهد که TWFE استاتیک DiD در واقع از 3 جزء تشکیل شده است:
- میانگین وزنی واریانس اثر درمان روی تیمار شده (VWATT)
- روندهای خلاف واقع میانگین وزنی واریانس (VWCT)
- مجموع وزنی تغییر در میانگین درمان در گروه درمان شده در دوره پس از دوره درمان و در اطراف پنجره درمان واحد درمان شده بعدی (ΔATT)
اولین اصطلاح اصطلاح مورد علاقه است. اگر روندهای موازی رخ دهد، VWCT = 0. آخرین اصطلاح به این دلیل به وجود میآید که، تحت TWFE DiD ایستا، گروههایی که قبلاً درمان شدهاند، بهطور مؤثری مانند گروههای مقایسه برای گروههایی که بعداً درمان شدهاند، استفاده میشوند. با این حال، اگر DiD در یک مدل دو دوره ای تخمین زده شود، این عبارت ناپدید می شود و هیچ سوگیری وجود ندارد. متناوباً، اگر اثرات درمان ثابت باشد (یعنی در طول زمان پس از مداخله تغییر نکند)، ΔATT = 0 و TWFE DiD معتبر است.
با این حال، چالش ها زمانی رخ می دهد که اثرات درمان پویا باشد. در این مورد ΔATT ≠ 0 و TWFE DiD بایاس است.
پس چه می توان کرد؟ نویسندگان 3 راه حل ارائه می دهند:
- کالاوی و سانتا آنا (2021). در اینجا، نویسندگان به فرد اجازه میدهند تا اثر درمان را برای یک گروه خاص (درمان در زمان g) با استفاده از مشاهدات در زمان τ و g-1 از مجموعهای تمیز از کنترلها برآورد کند. اینها اساساً گروه هایی هستند که هنوز درمان نشده اند، آخرین درمان شده اند یا هرگز درمان نشده اند.
- خورشید و ابراهیم (2021). روش مشابهی مانند CS استفاده میشود، اما واحدهایی که همیشه درمان میشوند حذف میشوند و تنها واحدهایی که میتوانند بهعنوان کنترلهای مؤثر مورد استفاده قرار گیرند، آنهایی هستند که هرگز درمان نمیشوند یا آخرین درمان میشوند. علاوه بر این، این رویکرد کاملاً پارامتریک است.
- برآوردگرهای رگرسیون انباشته. چنگیز (2019) این رویکرد را اجرا می کند. هدف «ایجاد مجموعه دادههای «2×2 تمیز» ویژه رویداد، از جمله متغیر نتیجه و کنترلهای گروه درمانشده و همه مشاهدات دیگری است که کنترلهای «پاک» در پنجره درمان هستند (به عنوان مثال، هنوز، آخرین – یا واحدهایی که هرگز درمان نشده اند). برای هر مجموعه داده 2×2 تمیز، محقق یک متغیر شناسایی خاص مجموعه داده تولید می کند. سپس این مجموعه دادههای ویژه رویداد با هم انباشته میشوند، و یک رگرسیون TWFE DiD بر روی مجموعه دادههای انباشته شده، با اثرات واحد و زمان ثابت مختص مجموعه دادهها تخمین زده میشود… در اصل، رگرسیون انباشته، DiD را از هر یک از 2 تمیز تخمین میزند. × 2 مجموعه داده، سپس وزن واریانس را اعمال می کند تا اثرات درمان را در گروه ها به طور موثر ترکیب کند.
در حالی که در این پست ریاضیات زیادی وجود دارد، اگر محققان این برآوردگرهای جایگزین DiD را به کار ببرند، نویسندگان عاقلانه توصیه میکنند که «محققان باید انتخاب گروههای مقایسه «پاک» خود را توجیه کنند – هنوز درمان نشده، آخرین درمان یا هرگز درمان نشده است. و توضیح دهید که چرا فرض روندهای موازی احتمالاً اعمال می شود.
می توانید مقاله کامل را بخوانید اینجا.