Причинно-следственный анализ

Причи́нно-сле́дственный ана́лиз (англ. causal inference, CI) — процесс выяснения действительных причин тех или иных явлений или наблюдений. Основные вопросы причинно-следственного анализа — почему что-то происходит и что можно сделать, чтобы изменить результат[1].

Ассоциация и причинность

Стандартный статистический анализ выводит ассоциативные зависимости между переменными. Вместе с тем, совместное распределение двух переменных, таких как наличие симптомов и наличие болезни, не позволяет утверждать, что изменение одной переменной (лечение симптомов) позволит изменить другую (вылечить болезнь). Это выражается известной формулой «корреляция не означает причинно-следственной связи»[2]. На практике ассоциация двух величин может быть вызвана другими причинами, например, третьими величинами. Это делает причинно-следственный анализ особенно важным, так как он позволяет отличать между собой простые корреляции от действительных причинно-следственных связей[3][4].

Фундаментальной проблемой анализа причинно-следственных связей является невозможность наблюдать одновременно наличие и отсутствие воздействия на исследуемый объект. Из-за этого нельзя определить индивидуальный эффект воздействия, так как мы можем наблюдать только один из возможных исходов.

Пусть  — наличие воздействия (лечения, вмешательства) на объект ,  — значение результирующей переменной при наличии воздействия на объект,  — значение результирующей переменной при отсутствии воздействия. Тогда определяется средний эффект воздействия (англ. average treatment effect, ATE):

Более простой для оценки величиной является средний эффект воздействия для тех, кто подвергся воздействию (англ. average treatment effect on the treated, ATT):

На первый взгляд, ATE можно оценить, сравнив средние значения для объектов, подвергшихся и не подвергшихся воздействию. Однако, это является ошибкой. Значение выражает ассоциацию. Прибавим и вычтем значение  — контрафактический результат:

Первое слагаемое соответствует ATT, а последующие дают смещение. Оно обусловлено различиями между двумя группами объектов в ситуации отсутствия воздействия. Отсюда можно сделать вывод, что ассоциация является причинно-следственной связью, если  — то есть, до начала воздействия обе группы одинаковы[5].

Методы

Графовые модели

Своеобразным языком причинности выступают графовые модели. Каждая вершина соответствует случайной величине, а рёбра выражают причинно-следственные связи между ними[6].

Основные структуры, выделяемые в графовой модели:

Цепочка
является причиной , является причиной
Вилка
Одна и та же переменная является причиной двух других переменных
Коллайдер
Переменная, на которую влияют две переменные

Одним из важнейших предположений, необходимых для корректности причинно-следственного вывода, является условная независимость переменных. Условную независимость переменных можно определить по графу, воспользовавшись понятием d-отделимости. Набор вершин называется блокирующим путь , если верно одно из условий:

  • содержит вершину из , из которой исходят дуги;
  • содержит коллайдер вне , у которого нет потомков из .

Если блокирует все пути из в , то оно называется d-отделяющим и , и в таком случае [2].

Графовые модели позволяют выяснить природу смещения и определить средства, необходимые для его корректировки[6].

Смещение из-за спутывающих факторов
Спутывающий (искажающий) фактор возникает, когда воздействие и результат имеют общую причину[7].
Смещение из-за отбора
Смещение из-за отбора возникает, когда мы учитываем больше переменных, чем следовало бы. Проблемными оказываются условия, являющиеся общими следствиями или медиаторами[8].

Вмешательства и структурный подход

В идеале мы хотим узнать, что бы произошло, если бы мы применили одно воздействие, а что бы произошло, если бы мы применили другое воздействие. В таких случаях мы производим вмешательство в систему, фиксируя значения «лечения». В таком сценарии поведение системы меняется. Распределение вероятностей в этом случае обозначается как , где обозначает факт вмешательства. В графе в таком случае все дуги, указывающие на , удаляются[9].

Другой способ записать вмешательства предоставляет структурный подход[10]. Его центральной идеей является запись общих характеристик зависимости без конкретной функциональной формы. Так, можно записать:

Здесь обозначают совместно независимые переменные с произвольным распределением. Они представляют неизвестные факторы[10]. Вмешательство показывается заменой функциональной зависимости на присвоенное значение (например, )[2].

Понятие вмешательства позволяет записать формулу корректировки для переменной , определяющей группу, к которой принадлежит объект[11]:

Мера склонности

Формула корректировки работает, только если верно предположение о положительности: . Оно эквивалентно утверждению, что для каждого объекта можно найти объект с похожими характеристиками, воздействие на который было противоположным. Эти соответствия можно определить при помощи меры склонности (или оценки склонности, англ. propensity score). Формально, она отражает вероятность, что любой объект с теми же характеристиками получит определённое воздействие[12].

Для достижения независимости результатов воздействия достаточно поставить условием именно оценку склонности: , где  — оценка склонности. Также мера склонности используется для взвешивания тестовой и контрольной групп в эксперименте[13].

Мера склонности предоставляет визуальный способ оценить соблюдение предположения о положительности: выяснить, где перекрываются носители распределений мер склонности для групп[14]:

  • Если носители не пересекаются, то вычисление ATE невозможно;
  • Если имеется полное перекрытие носителей, то можно безопасно продолжать вычисление ATE;
  • Если пересечение наблюдается для подмножества объектов, то можно продолжить исследование именно на этом подмножестве.

Также с помощью меры склонности можно переписать формулу корректировки (здесь  — вектор искажающих факторов, а  — мера склонности)[15]:

Инструментальные переменные

Использование формулы корректировки в случаях, когда искажающие факторы не наблюдаются, может привести к неверным выводам. В таких случаях может оказаться полезным метод инструментальных переменных (IV)[16]. Для его применения необходимо наличие инструмента — переменной, которая влияет на переменную воздействия и коррелирует с переменной результата только через неё[17].

Формально, пусть  — инструмент,  — переменная воздействия,  — исход,  — ненаблюдаемые искажающие факторы. Ключевыми предположениями, необходимыми для применения IV, являются[18]:

Релевантность
оказывает влияние на
Экзогенность
На не влияют никакие факторы из
Исключительность
Всё влияние на оказывается через

Тогда можно оценить эффект по , масштабировать его по эффекту на и получить эффект [19].

Метод разности разностей

В ряде задач имеются периоды до и после вмешательства, и требуется отделить его влияние от общего тренда. Пусть  — потенциальный результат воздействия в момент времени . Если бы была возможность наблюдать контрафактический результат, то мы бы оценили эффект интервенции как . Поскольку его измерить нельзя, можно сравнить результаты до и после интервенции: .

Однако, в случае наличия тренда у результирующей переменной вывод получится неверным. Тогда можно сравнить тестовую и контрольную группы после интервенции: . Но этот подход будет верным, если тестовая и контрольная группы сопоставимы.

Метод разности разностей учитывает обе возможные проблемы:

Метод получил название за счёт того, что в нём из разницы средних значений в тестовой группе до и после интервенции вычитается разница в контрольной группе[20].

Синтетический контроль

Метод разности разностей даёт смещённый результат, если тренд в тестовой группе отличается от тренда в контрольной. В таком случае одним из решений оказывается синтетический контроль[21].

Синтетический контроль определяется как средневзвешенное значение для объектов в контрольной группе. Пусть мы подействовали на объект из объектов. Определим как потенциальный результат без вмешательства, а  — как потенциальный результат с вмешательством. Тогда оценку можно получить, задав веса , как:

Веса в синтетическом контроле можно оценить с помощью линейной регрессии на значениях до вмешательства[22].

Синтетический контроль основывается на ряде предположений, которые обязательно должны выполняться для его хорошей работы. Пусть  — временной ряд результатов, в момент времени происходит событие, чей причинный эффект мы оценивает, а  — другой временной ряд, выступающий в роли контрольного. Тогда должно быть верно[23]:

  • можно использовать для создания модели, прогнозирующей на данных до ;
  • событие в момент не влияет на контрольный ряд;
  • никакие события, кроме исследуемого, не искажают связь между и .

Связь с машинным обучением

И машинное обучение, и причинно-следственный анализ моделируют связи между переменными. Однако, они делают это принципиально разными методами с принципиально разными целями. Тем не менее, они могут дополнять друг друга. Например, методы машинного обучения могут быть полезными при наличии большого количества искажающих факторов, которые нужно учесть[24].

Причинно-следственный анализ влияет на ряд областей машинного обучения.

Обучение с подкреплением
Обучение с подкреплением выбирает поведение, оптимизирующее целевую функцию, в то время как причинно-следственный анализ выясняет, что было бы в других условиях. Тем самым, они охватывают разные стороны одного и того же: контрафактических связей[25].
Справедливость
Применение моделей машинного обучения в таких областях, как медицина, поддержание правопорядка, образование и финансы, сталкивается с вопросами справедливости, когда на исторические данные оказывали влияние раса, пол, сексуальная ориентация и другие признаки. Причинно-следственный анализ позволяет выявить такие отклонения и избежать тем самым дискриминации[26][27].
Ложные корреляции
Модели могут основывать свои прогнозы на ложных корреляциях. Причинно-следственный анализ позволяет влияние таких корреляций уменьшить, тем самым позволяя обобщение на область вне обучающих данных[28][29][30][31].
Обработка естественного языка
Исследование причинности в обработке естественного языка представляет из себя малоизученную, но активно развивающуюся область. Текст может представлять из себя воздействие, исход или искажающий фактор, и тем самым представлять объект изучения причинно-следственного анализа[32]. Методы NLP, в особенности большие языковые модели, могут быть полезными при решении задач причинно-следственного анализа[33].
Объяснимость
Причинно-следственный анализ может быть полезен для интерпретации результатов работы модели и понимания, почему она работает именно так[34][35].

Причинно-следственный анализ в науке

Эпидемиология

С XIX века для определения причинно-следственной связи между микроорганизмом и болезнью использовались постулаты Коха. В 1965 году были сформулированы критерии Брэдфорда Хилла для выявления причинно-следственных связей в эпидемиологических данных[36].

Причинно-следственный анализ также применяется для определения эффективности лечения. Если положительный эффект не гарантирован, решение о назначении лечения принимается на основе экспертных знаний о причинно-следственных связях, которых может не быть для новых болезней. В таких случаях для построения причинно-следственной модели может быть полезно машинное обучение[37].

Общественные науки

В общественных науках наблюдается тенденция к учёту количественных показателей при определении причинности, что позволяет улучшить качество выводов. В публикации «Designing Social Inquiry» авторы настаивали на необходимости внедрения статистических методов в исследования[38][39]. Учёные разработали инструменты, позволяющие осуществлять причинно-следственный анализ с использованием и качественных, и количественных подходов[40][41].

В экономике и политологии причинно-следственный анализ оказывается особенно трудным из-за сложности политических и экономических явлений и невозможности воссоздать многие из них в экспериментах. Вместе с тем, методология и строгость причинно-следственных выводов постепенно улучшаются за счёт развития технологий, увеличения количества исследователей и улучшения методов[42].

Вместе с тем, в общественных науках по-прежнему сохраняются опасения, что многие исследователи уделяют недостаточно времени причинно-следственному анализу[43][44].

Примечания

  1. де Вилья Роберт, 2025, с. 29.
  2. 1 2 3 Pearl, Judea (2009). Causal inference in statistics: An overview (PDF). Statistics Surveys (англ.). 3: 96—146. doi:10.1214/09-SS057. ISSN 1935-7516.
  3. де Вилья Роберт, 2025, с. 30.
  4. Факур, 2025, с. 15.
  5. Факур, 2025, с. 17—25.
  6. 1 2 Факур, 2025, с. 56—65.
  7. Факур, 2025, с. 66.
  8. Факур, 2025, с. 70—72.
  9. де Вилья Роберт, 2025, с. 70—73.
  10. 1 2 де Вилья Роберт, 2025, с. 79—80.
  11. де Вилья Роберт, 2025, с. 74.
  12. де Вилья Роберт, 2025, с. 164—165.
  13. Факур, 2025, с. 186—188.
  14. де Вилья Роберт, 2025, с. 183—184.
  15. де Вилья Роберт, 2025, с. 187.
  16. де Вилья Роберт, 2025, с. 308.
  17. Факур, 2025, с. 132.
  18. де Вилья Роберт, 2025, с. 312.
  19. Факур, 2025, с. 134.
  20. Факур, 2025, с. 215—218.
  21. Факур, 2025, с. 221.
  22. Факур, 2025, с. 245—248.
  23. де Вилья Роберт, 2025, с. 378—379.
  24. де Вилья Роберт, 2025, с. 125—126.
  25. Causal Reinforcement Learning.
  26. Plečko, Drago; Bareinboim, Elias (2024). Causal Fairness Analysis (PDF). Foundations and Trends® in Machine Learning (англ.). 17 (3): 1—238. doi:10.1561/2200000106.
  27. Kusner, Matthew; et al. (Matt J. Kusner, Joshua R. Loftus, Chris Russell, Ricardo Silva) (20 марта 2017). Counterfactual Fairness (англ.). arXiv:1703.06856.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  28. Wald, Yoav; et al. (Yoav Wald, Amir Feder, Daniel Greenfeld, Uri Shalit) (20 февраля 2021). On Calibration and Out-of-domain Generalization (англ.). arXiv:2102.10395.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  29. Arjovsky, Martin; et al. (Martin Arjovsky, Léon Bottou, Ishaan Gulrajani, David Lopez-Paz) (5 июля 2019). Invariant Risk Minimization (англ.). arXiv:1907.02893.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  30. Ribeiro, Marco Tulio; et al. (Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin) (16 февраля 2016). "Why Should I Trust You?": Explaining the Predictions of Any Classifier (англ.). arXiv:1602.04938.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  31. Peters, Jonas; et al. (Jonas Peters, Peter Bühlmann, Nicolai Meinshausen) (6 января 2015). Causal inference using invariant prediction: identification and confidence intervals (англ.). arXiv:1501.01332.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  32. Feder, Amir; et al. (Amir Feder, Katherine A. Keith, Emaad Manzoor, Reid Pryzant, Dhanya Sridhar, Zach Wood-Doughty, Jacob Eisenstein, Justin Grimmer, Roi Reichart, Margaret E. Roberts, Brandon M. Stewart, Victor Veitch, Diyi Yang) (2 сентября 2021). Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond (англ.). arXiv:2109.00725.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  33. Ma, Jing (15 сентября 2024). Causal Inference with Large Language Model: A Survey (англ.). arXiv:2409.09822.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  34. Malinsky, Daniel; et al. (Numair Sani, Daniel Malinsky, Ilya Shpitser) (3 июня 2020). Explaining the Behavior of Black-Box Prediction Algorithms with Causal Learning (англ.). arXiv:2006.02482.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  35. Mothilal, Ramaravind Kommiya; et al. (Ramaravind Kommiya Mothilal, Divyat Mahajan, Chenhao Tan, Amit Sharma). Towards Unifying Feature Attribution and Counterfactual Explanations: Different Means to the Same End (англ.). arXiv:2011.04917.{{cite arXiv}}: Википедия:Обслуживание CS1 (пропущен class) (ссылка)
  36. Hill, Austin Bradford (1965). The Environment and Disease: Association or Causation?. Proceedings of the Royal Society of Medicine. 58 (5): 295—300. doi:10.1177/003591576505800503. PMC 1898525. PMID 14283879. Архивировано 19 февраля 2021. Дата обращения: 5 декабря 2025.
  37. Louizos, Christos; Shalit, Uri; Mooij, Joris; Sontag, David; Zemel, Richard; Welling, Max (2017). Causal Effect Inference with Deep Latent-Variable Models. arXiv:1705.08821 [stat.ML].
  38. King, Gary. Designing social inquiry : scientific inference in qualitative research. — Princeton Univ. Press, 2012. — ISBN 978-0691034713.
  39. Mahoney, James (Январь 2010). After KKV. World Politics. 62 (1): 120—147. doi:10.1017/S0043887109990220. JSTOR 40646193. S2CID 43923978.
  40. Creswell, John W. Designing and Conducting Mixed Methods Research : [англ.] / John W. Creswell, Vicki L. Plano Clark. — SAGE Publications, 2011. — ISBN 9781412975179.
  41. Seawright, Jason. Multi-Method Social Science by Jason Seawright : [англ.]. — Cambridge Core, September 2016. — ISBN 9781316160831. — doi:10.1017/CBO9781316160831.
  42. Angrist, Joshua D.; Pischke, Jörn-Steffen (Июнь 2010). The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics. Journal of Economic Perspectives (англ.). 24 (2): 3—30. doi:10.1257/jep.24.2.3. hdl:1721.1/54195. ISSN 0895-3309.
  43. Schrodt, Philip A (1 марта 2014). Seven deadly sins of contemporary quantitative political analysis. Journal of Peace Research (англ.). 51 (2): 287—300. doi:10.1177/0022343313499597. ISSN 0022-3433. S2CID 197658213. Архивировано 15 августа 2021. Дата обращения: 5 декабря 2025.
  44. Achen, Christopher H. (Июнь 2002). Toward a new political methodology: Microfoundations and ART. Annual Review of Political Science (англ.). 5 (1): 423—450. doi:10.1146/annurev.polisci.5.112801.080943. ISSN 1094-2939.

Литература

  • Алекс Руис де Вилья Роберт. Причинно-следственный анализ в науке о данных = Causal Inference for Data Science / А. Н. Киселёв. — М. : ДМК Пресс, 2025. — ISBN 978-5-93700-365-2.
  • Факур, Матеус. Причинно-следственный анализ для смелых и честных = Causal Inference for The Brave and True / Матеус Факур, Артём Груздев. — М. : ДМК Пресс, 2025. — ISBN 978-5-93700-349-2.

Ссылки