Причинно-следственный анализ
Причи́нно-сле́дственный ана́лиз (англ. causal inference, CI) — процесс выяснения действительных причин тех или иных явлений или наблюдений. Основные вопросы причинно-следственного анализа — почему что-то происходит и что можно сделать, чтобы изменить результат[1].
Ассоциация и причинность
Стандартный статистический анализ выводит ассоциативные зависимости между переменными. Вместе с тем, совместное распределение двух переменных, таких как наличие симптомов и наличие болезни, не позволяет утверждать, что изменение одной переменной (лечение симптомов) позволит изменить другую (вылечить болезнь). Это выражается известной формулой «корреляция не означает причинно-следственной связи»[2]. На практике ассоциация двух величин может быть вызвана другими причинами, например, третьими величинами. Это делает причинно-следственный анализ особенно важным, так как он позволяет отличать между собой простые корреляции от действительных причинно-следственных связей[3][4].
Фундаментальной проблемой анализа причинно-следственных связей является невозможность наблюдать одновременно наличие и отсутствие воздействия на исследуемый объект. Из-за этого нельзя определить индивидуальный эффект воздействия, так как мы можем наблюдать только один из возможных исходов.
Пусть — наличие воздействия (лечения, вмешательства) на объект , — значение результирующей переменной при наличии воздействия на объект, — значение результирующей переменной при отсутствии воздействия. Тогда определяется средний эффект воздействия (англ. average treatment effect, ATE):
Более простой для оценки величиной является средний эффект воздействия для тех, кто подвергся воздействию (англ. average treatment effect on the treated, ATT):
На первый взгляд, ATE можно оценить, сравнив средние значения для объектов, подвергшихся и не подвергшихся воздействию. Однако, это является ошибкой. Значение выражает ассоциацию. Прибавим и вычтем значение — контрафактический результат:
Первое слагаемое соответствует ATT, а последующие дают смещение. Оно обусловлено различиями между двумя группами объектов в ситуации отсутствия воздействия. Отсюда можно сделать вывод, что ассоциация является причинно-следственной связью, если — то есть, до начала воздействия обе группы одинаковы[5].
Методы
Графовые модели
Своеобразным языком причинности выступают графовые модели. Каждая вершина соответствует случайной величине, а рёбра выражают причинно-следственные связи между ними[6].
Основные структуры, выделяемые в графовой модели:
- Цепочка
- является причиной , является причиной
- Вилка
- Одна и та же переменная является причиной двух других переменных
- Коллайдер
- Переменная, на которую влияют две переменные
Одним из важнейших предположений, необходимых для корректности причинно-следственного вывода, является условная независимость переменных. Условную независимость переменных можно определить по графу, воспользовавшись понятием d-отделимости. Набор вершин называется блокирующим путь , если верно одно из условий:
- содержит вершину из , из которой исходят дуги;
- содержит коллайдер вне , у которого нет потомков из .
Если блокирует все пути из в , то оно называется d-отделяющим и , и в таком случае [2].
Графовые модели позволяют выяснить природу смещения и определить средства, необходимые для его корректировки[6].
- Смещение из-за спутывающих факторов
- Спутывающий (искажающий) фактор возникает, когда воздействие и результат имеют общую причину[7].
- Смещение из-за отбора
- Смещение из-за отбора возникает, когда мы учитываем больше переменных, чем следовало бы. Проблемными оказываются условия, являющиеся общими следствиями или медиаторами[8].
Вмешательства и структурный подход
В идеале мы хотим узнать, что бы произошло, если бы мы применили одно воздействие, а что бы произошло, если бы мы применили другое воздействие. В таких случаях мы производим вмешательство в систему, фиксируя значения «лечения». В таком сценарии поведение системы меняется. Распределение вероятностей в этом случае обозначается как , где обозначает факт вмешательства. В графе в таком случае все дуги, указывающие на , удаляются[9].
Другой способ записать вмешательства предоставляет структурный подход[10]. Его центральной идеей является запись общих характеристик зависимости без конкретной функциональной формы. Так, можно записать:
Здесь обозначают совместно независимые переменные с произвольным распределением. Они представляют неизвестные факторы[10]. Вмешательство показывается заменой функциональной зависимости на присвоенное значение (например, )[2].
Понятие вмешательства позволяет записать формулу корректировки для переменной , определяющей группу, к которой принадлежит объект[11]:
Мера склонности
Формула корректировки работает, только если верно предположение о положительности: . Оно эквивалентно утверждению, что для каждого объекта можно найти объект с похожими характеристиками, воздействие на который было противоположным. Эти соответствия можно определить при помощи меры склонности (или оценки склонности, англ. propensity score). Формально, она отражает вероятность, что любой объект с теми же характеристиками получит определённое воздействие[12].
Для достижения независимости результатов воздействия достаточно поставить условием именно оценку склонности: , где — оценка склонности. Также мера склонности используется для взвешивания тестовой и контрольной групп в эксперименте[13].
Мера склонности предоставляет визуальный способ оценить соблюдение предположения о положительности: выяснить, где перекрываются носители распределений мер склонности для групп[14]:
- Если носители не пересекаются, то вычисление ATE невозможно;
- Если имеется полное перекрытие носителей, то можно безопасно продолжать вычисление ATE;
- Если пересечение наблюдается для подмножества объектов, то можно продолжить исследование именно на этом подмножестве.
Также с помощью меры склонности можно переписать формулу корректировки (здесь — вектор искажающих факторов, а — мера склонности)[15]:
Инструментальные переменные
Использование формулы корректировки в случаях, когда искажающие факторы не наблюдаются, может привести к неверным выводам. В таких случаях может оказаться полезным метод инструментальных переменных (IV)[16]. Для его применения необходимо наличие инструмента — переменной, которая влияет на переменную воздействия и коррелирует с переменной результата только через неё[17].
Формально, пусть — инструмент, — переменная воздействия, — исход, — ненаблюдаемые искажающие факторы. Ключевыми предположениями, необходимыми для применения IV, являются[18]:
- Релевантность
- оказывает влияние на
- Экзогенность
- На не влияют никакие факторы из
- Исключительность
- Всё влияние на оказывается через
Тогда можно оценить эффект по , масштабировать его по эффекту на и получить эффект [19].
Метод разности разностей
В ряде задач имеются периоды до и после вмешательства, и требуется отделить его влияние от общего тренда. Пусть — потенциальный результат воздействия в момент времени . Если бы была возможность наблюдать контрафактический результат, то мы бы оценили эффект интервенции как . Поскольку его измерить нельзя, можно сравнить результаты до и после интервенции: .
Однако, в случае наличия тренда у результирующей переменной вывод получится неверным. Тогда можно сравнить тестовую и контрольную группы после интервенции: . Но этот подход будет верным, если тестовая и контрольная группы сопоставимы.
Метод разности разностей учитывает обе возможные проблемы:
Метод получил название за счёт того, что в нём из разницы средних значений в тестовой группе до и после интервенции вычитается разница в контрольной группе[20].
Синтетический контроль
Метод разности разностей даёт смещённый результат, если тренд в тестовой группе отличается от тренда в контрольной. В таком случае одним из решений оказывается синтетический контроль[21].
Синтетический контроль определяется как средневзвешенное значение для объектов в контрольной группе. Пусть мы подействовали на объект из объектов. Определим как потенциальный результат без вмешательства, а — как потенциальный результат с вмешательством. Тогда оценку можно получить, задав веса , как:
Веса в синтетическом контроле можно оценить с помощью линейной регрессии на значениях до вмешательства[22].
Синтетический контроль основывается на ряде предположений, которые обязательно должны выполняться для его хорошей работы. Пусть — временной ряд результатов, в момент времени происходит событие, чей причинный эффект мы оценивает, а — другой временной ряд, выступающий в роли контрольного. Тогда должно быть верно[23]:
- можно использовать для создания модели, прогнозирующей на данных до ;
- событие в момент не влияет на контрольный ряд;
- никакие события, кроме исследуемого, не искажают связь между и .
Связь с машинным обучением
И машинное обучение, и причинно-следственный анализ моделируют связи между переменными. Однако, они делают это принципиально разными методами с принципиально разными целями. Тем не менее, они могут дополнять друг друга. Например, методы машинного обучения могут быть полезными при наличии большого количества искажающих факторов, которые нужно учесть[24].
Причинно-следственный анализ влияет на ряд областей машинного обучения.
- Обучение с подкреплением
- Обучение с подкреплением выбирает поведение, оптимизирующее целевую функцию, в то время как причинно-следственный анализ выясняет, что было бы в других условиях. Тем самым, они охватывают разные стороны одного и того же: контрафактических связей[25].
- Справедливость
- Применение моделей машинного обучения в таких областях, как медицина, поддержание правопорядка, образование и финансы, сталкивается с вопросами справедливости, когда на исторические данные оказывали влияние раса, пол, сексуальная ориентация и другие признаки. Причинно-следственный анализ позволяет выявить такие отклонения и избежать тем самым дискриминации[26][27].
- Ложные корреляции
- Модели могут основывать свои прогнозы на ложных корреляциях. Причинно-следственный анализ позволяет влияние таких корреляций уменьшить, тем самым позволяя обобщение на область вне обучающих данных[28][29][30][31].
- Обработка естественного языка
- Исследование причинности в обработке естественного языка представляет из себя малоизученную, но активно развивающуюся область. Текст может представлять из себя воздействие, исход или искажающий фактор, и тем самым представлять объект изучения причинно-следственного анализа[32]. Методы NLP, в особенности большие языковые модели, могут быть полезными при решении задач причинно-следственного анализа[33].
- Объяснимость
- Причинно-следственный анализ может быть полезен для интерпретации результатов работы модели и понимания, почему она работает именно так[34][35].
Причинно-следственный анализ в науке
Эпидемиология
С XIX века для определения причинно-следственной связи между микроорганизмом и болезнью использовались постулаты Коха. В 1965 году были сформулированы критерии Брэдфорда Хилла для выявления причинно-следственных связей в эпидемиологических данных[36].
Причинно-следственный анализ также применяется для определения эффективности лечения. Если положительный эффект не гарантирован, решение о назначении лечения принимается на основе экспертных знаний о причинно-следственных связях, которых может не быть для новых болезней. В таких случаях для построения причинно-следственной модели может быть полезно машинное обучение[37].
Общественные науки
В общественных науках наблюдается тенденция к учёту количественных показателей при определении причинности, что позволяет улучшить качество выводов. В публикации «Designing Social Inquiry» авторы настаивали на необходимости внедрения статистических методов в исследования[38][39]. Учёные разработали инструменты, позволяющие осуществлять причинно-следственный анализ с использованием и качественных, и количественных подходов[40][41].
В экономике и политологии причинно-следственный анализ оказывается особенно трудным из-за сложности политических и экономических явлений и невозможности воссоздать многие из них в экспериментах. Вместе с тем, методология и строгость причинно-следственных выводов постепенно улучшаются за счёт развития технологий, увеличения количества исследователей и улучшения методов[42].
Вместе с тем, в общественных науках по-прежнему сохраняются опасения, что многие исследователи уделяют недостаточно времени причинно-следственному анализу[43][44].
Примечания
- ↑ де Вилья Роберт, 2025, с. 29.
- ↑ 1 2 3 Pearl, Judea (2009). Causal inference in statistics: An overview (PDF). Statistics Surveys (англ.). 3: 96—146. doi:10.1214/09-SS057. ISSN 1935-7516.
- ↑ де Вилья Роберт, 2025, с. 30.
- ↑ Факур, 2025, с. 15.
- ↑ Факур, 2025, с. 17—25.
- ↑ 1 2 Факур, 2025, с. 56—65.
- ↑ Факур, 2025, с. 66.
- ↑ Факур, 2025, с. 70—72.
- ↑ де Вилья Роберт, 2025, с. 70—73.
- ↑ 1 2 де Вилья Роберт, 2025, с. 79—80.
- ↑ де Вилья Роберт, 2025, с. 74.
- ↑ де Вилья Роберт, 2025, с. 164—165.
- ↑ Факур, 2025, с. 186—188.
- ↑ де Вилья Роберт, 2025, с. 183—184.
- ↑ де Вилья Роберт, 2025, с. 187.
- ↑ де Вилья Роберт, 2025, с. 308.
- ↑ Факур, 2025, с. 132.
- ↑ де Вилья Роберт, 2025, с. 312.
- ↑ Факур, 2025, с. 134.
- ↑ Факур, 2025, с. 215—218.
- ↑ Факур, 2025, с. 221.
- ↑ Факур, 2025, с. 245—248.
- ↑ де Вилья Роберт, 2025, с. 378—379.
- ↑ де Вилья Роберт, 2025, с. 125—126.
- ↑ Causal Reinforcement Learning.
- ↑ Plečko, Drago; Bareinboim, Elias (2024). Causal Fairness Analysis (PDF). Foundations and Trends® in Machine Learning (англ.). 17 (3): 1—238. doi:10.1561/2200000106.
- ↑ Kusner, Matthew; et al. (Matt J. Kusner, Joshua R. Loftus, Chris Russell, Ricardo Silva) (20 марта 2017). Counterfactual Fairness (англ.). arXiv:1703.06856.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Wald, Yoav; et al. (Yoav Wald, Amir Feder, Daniel Greenfeld, Uri Shalit) (20 февраля 2021). On Calibration and Out-of-domain Generalization (англ.). arXiv:2102.10395.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Arjovsky, Martin; et al. (Martin Arjovsky, Léon Bottou, Ishaan Gulrajani, David Lopez-Paz) (5 июля 2019). Invariant Risk Minimization (англ.). arXiv:1907.02893.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Ribeiro, Marco Tulio; et al. (Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin) (16 февраля 2016). "Why Should I Trust You?": Explaining the Predictions of Any Classifier (англ.). arXiv:1602.04938.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Peters, Jonas; et al. (Jonas Peters, Peter Bühlmann, Nicolai Meinshausen) (6 января 2015). Causal inference using invariant prediction: identification and confidence intervals (англ.). arXiv:1501.01332.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Feder, Amir; et al. (Amir Feder, Katherine A. Keith, Emaad Manzoor, Reid Pryzant, Dhanya Sridhar, Zach Wood-Doughty, Jacob Eisenstein, Justin Grimmer, Roi Reichart, Margaret E. Roberts, Brandon M. Stewart, Victor Veitch, Diyi Yang) (2 сентября 2021). Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond (англ.). arXiv:2109.00725.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Ma, Jing (15 сентября 2024). Causal Inference with Large Language Model: A Survey (англ.). arXiv:2409.09822.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Malinsky, Daniel; et al. (Numair Sani, Daniel Malinsky, Ilya Shpitser) (3 июня 2020). Explaining the Behavior of Black-Box Prediction Algorithms with Causal Learning (англ.). arXiv:2006.02482.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Mothilal, Ramaravind Kommiya; et al. (Ramaravind Kommiya Mothilal, Divyat Mahajan, Chenhao Tan, Amit Sharma). Towards Unifying Feature Attribution and Counterfactual Explanations: Different Means to the Same End (англ.). arXiv:2011.04917.
{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка) - ↑ Hill, Austin Bradford (1965). The Environment and Disease: Association or Causation?. Proceedings of the Royal Society of Medicine. 58 (5): 295—300. doi:10.1177/003591576505800503. PMC 1898525. PMID 14283879. Архивировано 19 февраля 2021. Дата обращения: 5 декабря 2025.
- ↑ Louizos, Christos; Shalit, Uri; Mooij, Joris; Sontag, David; Zemel, Richard; Welling, Max (2017). Causal Effect Inference with Deep Latent-Variable Models. arXiv:1705.08821 [stat.ML].
- ↑ King, Gary. Designing social inquiry : scientific inference in qualitative research. — Princeton Univ. Press, 2012. — ISBN 978-0691034713.
- ↑ Mahoney, James (Январь 2010). After KKV. World Politics. 62 (1): 120—147. doi:10.1017/S0043887109990220. JSTOR 40646193. S2CID 43923978.
- ↑ Creswell, John W. Designing and Conducting Mixed Methods Research : [англ.] / John W. Creswell, Vicki L. Plano Clark. — SAGE Publications, 2011. — ISBN 9781412975179.
- ↑ Seawright, Jason. Multi-Method Social Science by Jason Seawright : [англ.]. — Cambridge Core, September 2016. — ISBN 9781316160831. — doi:10.1017/CBO9781316160831.
- ↑ Angrist, Joshua D.; Pischke, Jörn-Steffen (Июнь 2010). The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics. Journal of Economic Perspectives (англ.). 24 (2): 3—30. doi:10.1257/jep.24.2.3. hdl:1721.1/54195. ISSN 0895-3309.
- ↑ Schrodt, Philip A (1 марта 2014). Seven deadly sins of contemporary quantitative political analysis. Journal of Peace Research (англ.). 51 (2): 287—300. doi:10.1177/0022343313499597. ISSN 0022-3433. S2CID 197658213. Архивировано 15 августа 2021. Дата обращения: 5 декабря 2025.
- ↑ Achen, Christopher H. (Июнь 2002). Toward a new political methodology: Microfoundations and ART. Annual Review of Political Science (англ.). 5 (1): 423—450. doi:10.1146/annurev.polisci.5.112801.080943. ISSN 1094-2939.
Литература
- Алекс Руис де Вилья Роберт. Причинно-следственный анализ в науке о данных = Causal Inference for Data Science / А. Н. Киселёв. — М. : ДМК Пресс, 2025. — ISBN 978-5-93700-365-2.
- Факур, Матеус. Причинно-следственный анализ для смелых и честных = Causal Inference for The Brave and True / Матеус Факур, Артём Груздев. — М. : ДМК Пресс, 2025. — ISBN 978-5-93700-349-2.