Inferência causal

A inferência causal é o processo de determinar o efeito real e independente de um fenômeno particular que é um componente de um sistema maior. A principal diferença entre inferência causal e inferência de associação é que a inferência causal analisa a resposta de uma variável de efeito quando uma causa da variável de efeito é alterada.[1][2] A ciência de por que as coisas ocorrem é chamada de etiologia. Diz-se que a inferência causal fornece a evidência da causalidade teorizada pelo raciocínio causal.

A inferência causal é amplamente estudada em todas as ciências. Várias inovações no desenvolvimento e implementação de metodologias destinadas a determinar a causalidade proliferaram nas últimas décadas. A inferência causal permanece especialmente difícil onde a experimentação é difícil ou impossível, o que é comum na maioria das ciências.

DefiniçãoEditar

Inferir a causa de algo tem sido descrito como:

  • "raciocínio para a conclusão de que algo é, ou provavelmente é, a causa de outra coisa".[3]
  • "Identificação da causa ou causas de um fenômeno, estabelecendo covariação de causa e efeito, uma relação temporal com a causa anterior ao efeito e a eliminação de causas alternativas plausíveis." [4]

MetodologiaEditar

Em geralEditar

A inferência causal é conduzida através do estudo de sistemas onde a medida de uma variável é suspeita de afetar a medida de outra. A inferência causal é conduzida em relação ao método científico. O primeiro passo da inferência causal é formular uma hipótese nula falseável, que é posteriormente testada com métodos estatísticos. A inferência estatística frequencista é o uso de métodos estatísticos para determinar a probabilidade de que os dados ocorram sob a hipótese nula por acaso: a inferência bayesiana é usada para determinar o efeito de uma variável independente.[5] A inferência estatística em geral é usada para determinar a diferença entre as variações nos dados originais que são variações aleatórias ou o efeito de um mecanismo causal bem especificado. Notavelmente, a correlação não implica causalidade, então o estudo da causalidade está tão preocupado com o estudo de mecanismos causais potenciais quanto com a variação entre os dados. Um padrão de inferência causal frequentemente procurado é um experimento onde o tratamento é atribuído aleatoriamente, mas todos os outros fatores de confusão são mantidos constantes. A maioria dos esforços em inferência causal está na tentativa de replicar condições experimentais.

Os estudos epidemiológicos empregam diferentes métodos epidemiológicos de coleta e medição de evidências de fatores de risco e efeito e diferentes formas de medir a associação entre os dois. Os resultados de uma revisão de métodos para inferência causal em 2020 descobriram que usar a literatura existente para programas de treinamento clínico pode ser desafiador. Isso ocorre porque os artigos publicados geralmente presumem uma base técnica avançada, podem ser escritos a partir de múltiplas perspectivas estatísticas, epidemiológicas, da ciência da computação ou filosóficas, as abordagens metodológicas continuam a se expandir rapidamente e muitos aspectos da inferência causal recebem cobertura limitada.[6]

Estruturas comuns para inferência causal incluem o modelo de pizza causal (componente-causa), o modelo causal estrutural de Pearl, modelagem de equação estrutural e modelo causal de Rubin (resultado potencial), que são frequentemente usados em áreas como como ciências sociais e epidemiologia.[7]

ExperimentalEditar

A verificação experimental de mecanismos causais é possível usando métodos experimentais. A principal motivação por trás de um experimento é manter constantes outras variáveis experimentais enquanto se manipula propositalmente a variável de interesse. Se o experimento produzir efeitos estatisticamente significativos como resultado da manipulação apenas da variável de tratamento, há motivos para acreditar que um efeito causal pode ser atribuído à variável de tratamento, supondo que outros padrões para o desenho experimental tenham sido atendidos.

Abordagens em epidemiologiaEditar

A epidemiologia estuda padrões de saúde e doença em populações definidas de seres vivos para inferir causas e efeitos. Uma associação entre uma exposição a um suposto fator de risco e uma doença pode ser sugestiva, mas não é equivalente à causalidade, pois a correlação não implica causalidade. Historicamente, os postulados de Koch têm sido usados desde o século 19 para decidir se um microrganismo era a causa de uma doença. No século 20 os critérios de Bradford Hill, descritos em 1965,[8] foram usados para avaliar a causalidade de variáveis fora da microbiologia, embora mesmo esses critérios não sejam formas exclusivas de determinar a causalidade.

Abordagens em informáticaEditar

A determinação de causa e efeito a partir de dados observacionais conjuntos para duas variáveis independentes do tempo, digamos X e Y, foi abordada usando assimetria entre evidências para algum modelo nas direções, X → Y e Y → X. As abordagens primárias são baseadas em algoritmos modelos de teoria da informação e modelos de ruído. 

Modelos de ruídoEditar

Incorpore um termo de ruído independente no modelo para comparar as evidências das duas direções.

Aqui estão alguns dos modelos de ruído para a hipótese Y → X com o ruído E:

  • Ruído aditivo:[9]  
  • Ruído linear:[10]  
  • Pós não linear:[11]  
  • Ruído heterocedástico:  
  • Ruído funcional:[12]  

Abordagens em ciências sociaisEditar

Economia e ciencia politicaEditar

Nas ciências econômicas e na ciência política, a inferência causal é muitas vezes difícil, devido à complexidade do mundo real das realidades econômicas e políticas e à incapacidade de recriar muitos fenômenos de grande escala dentro de experimentos controlados. A inferência causal nas ciências econômicas e políticas continua a ver melhorias na metodologia e no rigor, devido ao aumento do nível de tecnologia disponível para os cientistas sociais, o aumento no número de cientistas sociais e pesquisas e melhorias nas metodologias de inferência causal em todas as ciências sociais.[13]

Veja tambémEditar

ReferênciasEditar

  1. Pearl, Judea (1 de janeiro de 2009). «Causal inference in statistics: An overview» (PDF). Statistics Surveys. 3: 96–146. doi:10.1214/09-SS057 . Consultado em 24 de setembro de 2012. Cópia arquivada (PDF) em 6 de agosto de 2010 
  2. Morgan, Stephen; Winship, Chris (2007). Counterfactuals and Causal inference. [S.l.]: Cambridge University Press. ISBN 978-0-521-67193-4 
  3. «causal inference». Encyclopædia Britannica, Inc. Consultado em 24 de agosto de 2014. Arquivado do original em 3 de maio de 2015 
  4. John Shaughnessy; Eugene Zechmeister; Jeanne Zechmeister (2000). Research Methods in Psychology. [S.l.]: McGraw-Hill Humanities/Social Sciences/Languages. pp. Chapter 1 : Introduction. ISBN 978-0077825362. Consultado em 24 de agosto de 2014. Cópia arquivada em 15 de outubro de 2014 
  5. Schrodt, Philip A (1 de março de 2014). «Seven deadly sins of contemporary quantitative political analysis». Journal of Peace Research (em inglês). 51 (2): 287–300. ISSN 0022-3433. doi:10.1177/0022343313499597. Consultado em 16 de fevereiro de 2021. Cópia arquivada em 15 de agosto de 2021 
  6. Landsittel, Douglas; Srivastava, Avantika; Kropf, Kristin (2020). «A Narrative Review of Methods for Causal Inference and Associated Educational Resources». Quality Management in Health Care (em inglês). 29 (4): 260–269. ISSN 1063-8628. PMID 32991545. doi:10.1097/QMH.0000000000000276. Consultado em 26 de fevereiro de 2021. Cópia arquivada em 15 de agosto de 2021 
  7. Greenland, Sander; Brumback, Babette (outubro de 2002). «An overview of relations among causal modelling methods». International Journal of Epidemiology (em inglês). 31 (5): 1030–1037. ISSN 1464-3685. PMID 12435780. doi:10.1093/ije/31.5.1030. Consultado em 17 de fevereiro de 2022. Cópia arquivada em 23 de abril de 2022 
  8. Hill, Austin Bradford (1965). «The Environment and Disease: Association or Causation?». Proceedings of the Royal Society of Medicine. 58 (5): 295–300. PMC 1898525 . PMID 14283879. doi:10.1177/003591576505800503. Consultado em 25 de fevereiro de 2014. Cópia arquivada em 19 de fevereiro de 2021 
  9. Hoyer, Patrik O., et al. "Nonlinear causal discovery with additive noise models Arquivado 2020-11-02 no Wayback Machine." NIPS. Vol. 21. 2008.
  10. Shimizu, Shohei; et al. (2011). «DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model» (PDF). The Journal of Machine Learning Research. 12: 1225–1248. arXiv:1101.2489 . Consultado em 27 de julho de 2019. Cópia arquivada (PDF) em 23 de julho de 2021 
  11. Zhang, Kun, and Aapo Hyvärinen. "On the identifiability of the post-nonlinear causal model Arquivado 2021-10-19 no Wayback Machine." Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. AUAI Press, 2009.
  12. Mooij, Joris M., et al. "Probabilistic latent variable models for distinguishing between cause and effect Arquivado 2020-07-22 no Wayback Machine." NIPS. 2010.
  13. Angrist, Joshua D.; Pischke, Jörn-Steffen (junho de 2010). «The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics». Journal of Economic Perspectives (em inglês). 24 (2): 3–30. ISSN 0895-3309. doi:10.1257/jep.24.2.3