#acessibilidade Imagem com fundo escuro e quatro gráficos com linhas se cruzando. As variáveis tem como nomes as primeiras letras do alfabeto.
Antes da Copa do Mundo de 2014 uma empresa alimentícia iniciou uma campanha chamada #JogaPraMim. Em um dos comerciais, crianças de 7, 10 e 8 anos diziam suas idade e completavam dizendo que nunca tinham visto o Brasil ser campeão (o último título mundial da seleção masculina de futebol foi em 2002). Há uma correlação aqui: todos os títulos do Brasil se deram antes dos garotos nascerem, depois que eles nasceram não houve mais títulos. Então, o nascimento dessas crianças foi a causa das últimas derrotas em Copas do Mundo? Eles são os culpados pelo 7 x 1? Não é bem assim.
Correlação é a relação estatística entre duas variáveis, mas nem sempre correlação implica causalidade. Você já ouviu um galo cantar? Então certamente você pode notar a correlação entre o canto do galo e o nascer do Sol. Apesar do galo sempre cantar antes do amanhecer, não é verdade que amanhece por causa do canto do galo. Isso é uma falácia lógica chamada “Post hoc ergo propter hoc” (“depois disso, logo, por causa disso”). Todas as pessoas que já morreram certamente beberam água, mas isso não quer dizer que beber água mate, não é mesmo? Da mesma forma, será que o seu time ganhou porque você estava usando suas meias da sorte? Provavelmente não (mas pode continuar usando, vai que né ¯\_(ツ)_/¯).
Mesmo eventos claramente sem relação causal podem ter uma alta correlação. Veja a imagem abaixo:
#acessibilidade Gráfico de linha mostrando o número de pessoas que se afogaram caindo em uma piscina em vermelho e o número de filmes com o ator Nicolas Cage em preto no período entre 1999 e 2009. O número de afogamentos varia de 80 a 140 e o número de filmes de 0 a 6. As linhas de ambos apresentam uma correlação de 66,6%.
Há uma correlação entre o número de afogamentos em piscinas nos Estados Unidos no período entre 1999 e 2009 e o número de filmes com a participação do ator Nicolas Cage no mesmo período, mas essa é uma correlação espúria, onde não há relação de causa e efeito.
Talvez você tenha algum parente que diz ter se curado de uma enfermidade ao tomar um chá de boldo ou de erva-doce (com Tamiflu e tudo), mas será que o chá cura mesmo? É possível descobrir através do método científico. Em ensaios clínicos, onde uma droga é testada em pessoas para saber se funciona ou não para determinado fim, é utilizado um método chamado duplo-cego. Resumidamente, neste método os participantes do estudo são divididos em dois grupos e os dois recebem cápsulas que podem ou não conter a droga que está sendo testada. Ele é chamado duplo-cego porque nem o médico nem o paciente sabem qual cápsula contém a droga e qual não.
Com este método é possível observar o efeito placebo. Placebo, neste contexto, é algo que causa resultados positivos em um paciente mesmo sendo inerte. Se 20% dos pacientes que receberam as cápsulas com a droga melhoraram, mas 20% dos que receberam as cápsulas sem a droga também melhoraram, então quer dizer que não foi a droga que os fez melhorar. É por isso que evidências anedóticas (experiências pessoais subjetivas) não servem como prova científica. Não é porque o seu familiar disse que se curou tomando um chá que esse chá é a cura. Ele pode ter tomado o chá e se curado, mas isso não quer dizer que ele se curou por causa do chá. Pode até ser o caso, mas ele também pode ter tomado vários outros remédios, mudado alguns hábitos ou o próprio sistema imunológico cuidou disso.
Ainda que correlação não implique causalidade, ela pode ser uma dica. Se eu analisar o número de substantivos e o número de palavras dos textos que escrevo, provavelmente a correlação será bem alta, mas será que a quantidade de substantivos é alta por causa da quantidade de palavras? Neste caso é óbvio que sim, mas para casos mais complexos, é melhor deixar os cientistas analisarem e ouvir o que eles dizem.
E aí, este texto te ajudou a entender a diferença entre correlação e causalidade? Só há uma resposta certa a esta pergunta.
#acessibilidade Quadrinho em preto e branco com três quadros e um homem e uma mulher desenhados em forma de palitos conversando. No primeiro quadro o homem diz “Eu achava que correlação implicava causalidade.”, no segundo quadro “Então tive aulas de estatística. Agora não acho mais.” e no terceiro quadro a mulher diz “Parece que as aulas ajudaram.”, ao que ele responde “Bom… talvez.”.
Fontes:
Fonte da imagem destacada: Infográfico vetor criado por freepik – br.freepik.com
Fonte da imagem 1: traduzido e adaptado de tylervigen.com
Fonte da imagem 2: traduzido e adaptado de xkcd
Para saber mais:
Outros divulgadores:
Episódio 24 – Estatisticamente Comprovado do podcast Alô, Ciência?
Correlação é um conceito que se refere à medida da relação entre duas variáveis.
Causalidade é a relação entre uma variável A e uma variável B, onde a variável A é causa da variável B.