#acessibilidade Ilustração de uma mulher sorrindo sentada em um banco em frente a uma mesa mexendo em um notebook com um balão de diálogo com reticências enquanto um homem de costas ao fundo aponta para um gráfico de barras. No gráfico é possível ver seis barras vermelhas e azuis. A primeira azul é menor que a segunda, vermelha. A terceira, azul, é menos do que a quarta, vermelha. Já a quinta, azul, é maior do que a sexta, que é vermelha.
O paradoxo de Simpson é um paradoxo da estatística no qual um conjunto de dados completo aponta em uma direção, mas uma análise de subconjuntos aponta na direção contrária. Simples? Complicado? Vejamos alguns exemplos práticos.
Em 1986 um estudo inglês buscou comparar três tratamentos diferentes para cálculo renal, dentre eles dois sobre os quais vale a pena falar: tratamento 1 (cirurgias abertas: nefrolitotomia/pielolitotomia, pielolitotomia ou uretrotomia) e tratamento 2 (nefrolitotomia percutânea). O objetivo era que após três meses todas as pedras tivessem desaparecido ou sido reduzidas a menos de 2 mm de diâmetro O tratamento 1 teve sucesso em 78% dos casos (273 de 350), enquanto o tratamento 2 teve sucesso em 83% (289 de 350). O tratamento 2 é melhor, certo?
O que essa análise não leva em consideração é o tamanho das pedras. Para pedras pequenas, com menos de 2 cm de diâmetro, o tratamento 1 teve 93% de sucesso (81 de 87) e o tratamento 2 teve 87% (234 de 270). Já para pedras grandes, com mais de 2 cm de diâmetro, o tratamento 1 teve 73% de sucesso (192 de 263) e o tratamento 2 69% (55 de 80).
Tratamento 1 | Tratamento 2 | |||
Pedras pequenas | 81/87 | 93% | 234/270 | 87% |
Pedras grandes | 192/263 | 73% | 55/80 | 69% |
Total | 273/350 | 78% | 289/350 | 83% |
Ao analisar os grupos separadamente é possível perceber que o tratamento 1 se sai melhor do que o tratamento 2 em ambos os casos, mesmo que ao somá-los pareça o contrário.
Em outro exemplo, um estudo de 1973 da UC-Berkeley (Universidade da Califórnia em Berkeley) buscou entender um suposto viés de gênero na admissão dos cursos de pós-graduação da universidade. Dentre os candidatos, cerca de 8000 homens e 4000 mulheres, 44% dos homens eram admitidos, enquanto apenas 35% das mulheres. A diferença era grande demais para ser fruto do acaso.
Observando cada um dos 85 departamentos separadamente, 6 deles tinham um viés contra homem, 4 tinham um viés contra mulheres. Com os dados agrupados e corrigidos, um pequeno viés em favor das mulheres aparece. A conclusão do trabalho foi que as mulheres se inscreviam mais em departamentos concorridos, como o Departamento de Inglês, enquanto os homens optavam por departamentos onde era mais fácil ser admitido, como os Departamentos de Química e de Engenharia.
Pensando em dois departamentos hipotéticos: departamento de matemática e o departamento de bem-estar social. Digamos que no primeiro tenham se inscrito 400 homens e 200 mulheres, sendo que a metade de cada grupo foi recusados; no segundo foram 150 homens e 450 mulheres, com dois terços sendo recusados. Se somamos os números dos dois departamentos, podemos chegar à conclusão de que mulheres são mais rejeitadas que homens, embora isso não seja verdade neste caso.
Homens | Mulheres | |||
Dept. de Matemática | 200/400 | 50% | 100/200 | 50% |
Dept. de Bem-estar Social | 50/150 | 33% | 150/450 | 33% |
Total | 250/550 | 45% | 250/650 | 38% |
Neste caso específico, a análise de todas as candidaturas levava a uma conclusão de que havia um viés de gênero na admissão, diferente da análise dos departamentos separadamente, que apontava o contrário.
Como um último exemplo hipotético, digamos que você tenha uma página no Facebook e mensalmente faça um levantamento do número de curtidas. Digamos que nos últimos cinco meses esse número sido relativamente constante, com pouquíssima alteração. Será que as pessoas não se interessam pela sua página? Será que você falhou na divulgação? Talvez, mas vale a pena investigar outras possibilidades.
Felizmente o Facebook possui uma ferramenta que mostra o número de curtidas e descurtidas diárias da sua página. Ao analisar o gráfico e os dados disponibilizados você pode perceber que muitas pessoas vêm curtindo sua página nas últimas semanas, porém também há um número quase igual de descurtidas. Ao analisar mais profundamente você descobre que quase a totalidade dessas descurtidas são contas desativadas, suspensas ou transformadas em memorial. Parece que as pessoas não desistiram de curtir a sua página afinal, que tal curtir a minha?
Fontes:
Fonte da imagem destacada: Infográfico vetor criado por slidesgo – br.freepik.com
CHARIG, Clive R. et al. Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy. Br Med J (Clin Res Ed), v. 292, n. 6524, p. 879-882, 1986.
BICKEL, Peter J.; HAMMEL, Eugene A.; O’CONNELL, J. William. Sex bias in graduate admissions: Data from Berkeley. Science, v. 187, n. 4175, p. 398-404, 1975.
https://en.wikipedia.org/wiki/Simpson%27s_paradox
Outros divulgadores
Vídeo Você conhece o Paradoxo de Simpson em estatística? do canal Minuto da Física no Youtube
O Paradoxo de Simpson diz que uma tendência ou resultado que está presente quando os dados são colocados em grupos, se inverte ou desaparece quando os dados são combinados.
Ou seja: o mesmo conjunto de dados pode parecer mostrar tendências opostas, dependendo de como está agrupado
O paradoxo de simpson pode mostrar uma visão paradoxal/utópica de uma estatística ou acontecimento, que “uma pessoa pode interpretar de uma forma e outra de outra forma” (O paradoxo de simpson mostra que nem tudo é o que parece ser).