Синтетический контроль

Материал из testwiki
Перейти к навигации Перейти к поиску
Сравнение реального благосостояния жителей ФРГ после объединения с ГДР в 1990 и гипотетического, если бы объединения не состоялось, с опорой на данные других стран ОЭСР[1].

Синтетический контроль (Шаблон:Lang-en, SCM) — эконометрический метод анализа данных в рамках Шаблон:Нп4, позволяющий проводить Шаблон:Нп4 в сравнительных кейс-стади. Метод направлен на оценку эффектов исследуемого воздействия (например, экономической реформы) на примере небольшого числа кейсов с помощью моделирования их количественных показателей в гипотетической ситуации, где воздействие не было оказано, на основе ограниченного круга похожих контрольных наблюдений посредством присвоения этим переменным определённых весов.

Формальный вывод

Рассмотрим i-й регион, или какой-то другой объект наблюдения, причём i=1,,J+1, где J+1 — число регионов, среди которых 1 испытал на себе исследуемое воздействие, а остальные J — нет, являясь контрольной группой (их совокупность называется «пулом доноров», Шаблон:Lang-en), в период времени t, где t=1,,T.

Пусть исследуемое воздействие будет оказано в период T0+1, где 1T0<T, и тогда T0 — число периодов до воздействия. Обозначим отклик показателя в регионе i в период времени t в отсутствие исследуемого воздействия через YitN, а в его присутствие — YitI. Сделаем допущение о том, что при t=1T0, YitN=YitI: до наступления исследуемого воздействия, оно не оказывает эффекта на отклик в выбранном регионе. Также допустим, что воздействие, имевшее место в рассматриваемом регионе, не оказывает влияния на регионы из контрольной группы. Эффект исследуемого воздействия обозначим как ait=YitIYitN. Поскольку воздействие имеет место только в i=1 и t>T0, целью SCM является определение a1t=Y1tIY1tN, где Y1tI=Y1t — собственно, наблюдаемый в рассматриваемом регионе показатель, а Y1tN — ненаблюдаемый отклик, который можно представить в качестве следующей факторной модели:

YitN=δt+θt𝐙i+λtμi+ϵit,

где

δt

— общий для всех регионов фактор,

𝐙i

— вектор наблюдаемых, независимых от воздействия ковариат,

θt

— вектор их оценённых для данной выборки регионов коэффициентов,

λt

— вектор ненаблюдаемых латентных факторов,

μi

— вектор соответствующих им факторных нагрузок и

ϵit

— специфичности, или шум. Эту модель можно переписать в виде:

jwjYitN=δt+θtjwj𝐙i+λtjwjμi+jwjϵit,

где wj — это j-тое значение вектора 𝐖=(w2,,wJ+1), такого, что j:wj>0jwj=1. Метод синтетического контроля заключается в подборе такого набора весов (w~2,,w~J+1), что при tT0, jw~jYjt=Y1t (то есть до воздействия веса сохраняют наблюдаемое значения отклика неизменным) и jw~j𝐙j=𝐙1 (и при этом эти веса позволяют точно моделировать ковариаты рассматриваемого региона через ковариаты регионов контрольной группы).

В литературе было показано, что если отклонения специфичностей ϵit незначительны при данном T0, размере периода до воздействия, Y1tNjwjYit0, то есть разница между моделируемым, ненаблюдаемым откликом в отсутствие воздействия и взвешенным, но наблюдаемым в его присутствии, в таких условиях ничтожно. Соответственно, предлагается такая оценка эффекта воздействия (ait=YitIYitN)[2]Шаблон:Rp:

a^1t=Y1tjw~jYjt

Оптимизация алгоритма

С вычислительной точки зрения, расчёт искомых весов связан с минимизацией по вектору весов 𝐖 нормы 𝐗1𝐗0𝐖, где 𝐗1 — вектор значений ковариатов для исследуемого региона до момента T0+1, а 𝐗0 — матрица значений ковариатов для контрольных регионов. Вне зависимости от выбора исследователем положительно определённой матрицы 𝐕, оптимизируемая норма раскрывается как 𝐗1𝐗0𝐖𝐕=(𝐗1𝐗0𝐖)𝐕(𝐗1𝐗0𝐖) [2]Шаблон:Rp.

Для того, чтобы получить конечное значение 𝐕, проводят внешнюю оптимизацию по параметру 𝐕 с использованием коэффициентом дисконтирования β, повышающим вес недавних наблюдений. Эту оптимизацию можно описать следующим образом: t=1TβTt(Y1tj=2J+1W~j(V)Yjt)2min, где 𝐖~ — вектор минимальных весов, полученный на предыдущем этапе[3]Шаблон:Rp.

Статистическая значимость результатов

Определение статистической значимости полученных оценок может быть проведено посредством различных техник. В статье 2003 года, оценивающей влияние терроризма и прочих проявлений политического насилия на экономику Страны Басков, рассчитанный эффект был подвергнут т. н. плацебо-тесту (placebo test), заключавшемуся в осуществлении идентичного алгоритма синтетического контроля к Каталонии, также известной своим значительным сепаратистским движением, но не испытывавшей проблем с террористическими проявлениями этого движения[4].

Плацебо-тесты в литературе, использующей метод синтетического контроля, являются примером непараметрических пермутационных тестов. Моделирование синтетического отклика для всех контрольных кейсов в выборке позволяет в явном виде работать с вероятностным распределением и проверять нулевую гипотезу об отсутствии казуальных эффектов в рассматриваемом кейсе. При этом нет необходимости асимптотически приближать распределение этих эффектов у контрольных кейсов к тому или иному распределению, что и делает тесты подобного типа пермутационными[5].

Синтетический контроль как метод предсказания

В литературе было предложено использовать SCM не только для оценки причинно-следственных связей, но и построения прогнозов. В рамках пилотного исследования была предпринята попытка спрогнозировать экономический рост в Соединённых Штатах Америки, однако использующийся для получения весов «пул доноров» состоял уже не из стран с похожими характеристиками, но из показателей экономического роста с определённым временным лагом[3]Шаблон:Rp.

Синтетический контроль и другие методы

Синтетический контроль совмещает элементы других каузальных статистических методов: Шаблон:Нп4 и Шаблон:Нп4.

По сравнению с разностью разностей синтетический контроль предлагает более упорядоченную процедуру подбора весов для наблюдений из контрольной группы, использует больший временной промежуток перед воздействием и требует максимально возможного приближения характеристик контрольной группы к характеристикам исследуемого объекта в ходе подбора весов.

Метод синтетического контроля обладает набором сходств с линейной регрессией. Так и синтетический контроль, и регрессионный анализ предполагают линейную комбинацию весов и переменных (в последнем веса, как правило, называются регрессионными коэффициентами), причём сумма весов равняется 1. Основным различием является то, что в SCM значения этих весов заключены в [0,1], тогда как в регрессионном анализе такого ограничения нет и коэффициенты практически не интерпретируются как веса[1]Шаблон:Rp Так контрфактуальная Германия из исследования 2015 года[1] была «синтезирована» на основании подушного ВВП, уровня инвестиций, торговой открытости, количества школ и доли промышленности в прибавочном продукте Австрии (42%), США (22%), Японии (16%), Швейцарии (11%) и Нидерландов (9%)[6].

Симуляции показали, что панельный метод Сяо (фиксированные эффекты с эффектами взаимодействия) для исследования каузальных эффектов является менее робастным к изменению в пуле доноров, нежели синтетический контроль, хотя использование обоих подходов приводит к удовлетворительным результатам. Отмечалось, что синтетический контроль является более предпочтительным, если у исследователя есть данные по дополнительным временным периодам[7]Шаблон:Rp[8].

Применение

Область применения метода синтетического контроля охватывает исследования политики в сфере здравоохранения[9], криминологию[10], политическую науку[1], различные разделы экономики.

В политологии SCM рассматривается как компромисс между конвенциональными количественными и качественными методами, позволяющий совмещать фокус на одном или нескольких кейсах со строгими критериями их подбора. Посредством этого метода изучались: экономический эффект от объединения Германии для собственно ФРГ[1], последствия Шаблон:Нп4 для расходов на социальное обеспечение[11].

В географии SCM используется в исследованиях антропогенных ландшафтов (в рамках land systems science)[12]Шаблон:Rp.

В статистических пакетах

Существуют пакеты для анализа данных посредством метода синтетического контроля в статистическом программном обеспечением. Для языка R был разработан пакет Synth[13].

См. также

Примечания

Шаблон:Примечания