Nem tudo o que parece é. Não obstante a existência de paradoxos, é por norma boa prática assumir que uma contradição merece escrutínio. Neste artigo vou abordar uma aparente contradição que por vezes emerge quando analisamos dados de forma categorizada e de forma conjunta. Este tipo de contradição é conhecida como Paradoxo de Simpson, em referência ao matemático britânico Edward Simpson (1922-?) que descreveu o fenómeno em 1951.
Consideremos os resultados de exames em dois estados dos Estados Unidos, Wisconsin e Texas: em 2009, a média em Wisconsin foi de 157, e em 2011 e 2015 foi de 159; em contraste, no Texas a média foi de 150 em 2009, seguindo-se 153 e 156 em 2011 e 2015, respectivamente [1]. Olhando para estes números deduzimos que Wisconsin parecia estar a ensinar melhor os seus alunos. Será que o Texas deve procurar imitar Wisconsin nas suas políticas de ensino?
Antes de nos precipitarmos na tomada de medidas, categorizemos os alunos por etnicidade. Este critério não deve ser desprezado porque sabe-se que o mesmo está correlacionado com o rendimento médio das famílias, o qual por sua vez influencia as condições de vida e de estudo dos alunos. Neste caso, observa-se que as notas médias dos negros, hispânicos e brancos foram respectivamente 120, 138 e 166 em Wisconsin, enquanto que no Texas foram 137, 145 e 169! Ou seja, todos os grupos tiveram melhores notas no Texas!
Como é que olhando para as médias gerais por ano parecia que os estudantes de Wisconsin eram melhores que os do Texas? Porque Wisconsin tinha uma maior proporção de estudantes brancos que o Texas! Deve afinal ser Wisconsin a copiar as políticas de ensino do Texas? Não necessariamente, pois podem haver outros factores relevantes a ter em consideração!
Não é só na política que o Paradoxo de Simpson pode condicionar a tomada de decisões. Consideremos a seguinte tabela retirada de um estudo real sobre dois tipos de cirúrgias para remover pedras nos rins [2]:
Eficácia de cirurgia aberta (A) |
Eficácia de cirurgia com pequena perfuração (B) |
|
Pacientes com pedras pequenas nos rins |
Grupo 1 93% (81/87) |
Grupo 2 87% (234/270) |
Pacientes com pedras grandes nos rins |
Grupo 3 73% (192/263) |
Grupo 4 69% (55/80) |
Todos os pacientes |
78% (273/350) |
83% (289/350) |
De uma população de 700 pacientes com pedras nos rins, 357 tinham pedras pequenas, enquanto que 343 tinham pedras grandes. Dos 357 com pedras pequenas, 87 receberam um tratamento A, cirurgia aberta (grupo 1), tendo sido bem sucedida em 81, ou seja, 93% dos casos. Os outros 270 pacientes submeteram-se ao tratamento B, cirurgia com uma pequena perfuração (grupo 2), dos quais 234 ficaram bem (87%). No caso dos pacientes com pedras grandes nos rins, 263 recebeu o tratamento A (grupo 3), dos quais 192 beneficiaram de uma cirurgia favorável (73%). Em contraste, o grupo 4 que tinha também pedras grandes nos rins e recebeu o tratamento B, apenas 55 pacientes tiveram uma boa recuperação dos 80 que se submeteram ao procedimento (69%). Em ambos os grupos de pacientes com pedras pequenas ou grandes, observou-se uma maior proporção de casos bem sucedidos no uso do tratamento A (cirurgia aberta). Contudo, se reunirmos os dados de todos os pacientes sem ter em consideração se tinham pedras pequenas ou grandes nos rins, vemos que 81+192=273 dos 350 pacientes que se submeteram ao tratamento A tiveram uma recuperação positiva (78%), enquanto que 83% (234+55=289) dos que receberam o tratamento B ficaram bem após o procedimento. O tratamento B parece ser mais eficaz!
Então afinal qual é o melhor procedimento cirúrgico? E qual a razão para obtermos resultados diferentes quando olhamos para os dados de formas diferentes?
Olhando de forma crítica para os dados verificamos que dependendo da severidade do problema (tamanho das pedras), os médicos escolheram procedimentos diferentes, sendo que ofereceram a cirurgia com uma pequena perfuração na maior parte dos casos em que as pedras nos rins eram pequenas, enquanto que recorreram à cirurgia aberta na maioria dos pacientes com pedras grandes. Independentemente do procedimento cirúrgico, verifica-se que os pacientes com pedras pequenas tiveram um maior número de recuperações favoráveis do que os que tinham pedras grandes nos rins. Assim, a razão pela qual o procedimento B parece ser erroneamente mais bem sucedido que o A quando juntamos os dados deve-se ao facto de estarmos a ignorar um factor preponderante: o procedimento B foi usado mais vezes nos casos mais fáceis (pedras pequenas) e por isso saiu beneficiado em comparação com o procedimento A que foi usado mais vezes nos casos mais difíceis (pedras grandes).
Embora o problema seja óbvio quando olhamos para os números divididos por factores relevantes, a verdade é que nem sempre é claro como determinar os factores que podem influenciar uma certa medida. Note-se que se dividirmos os dados em subcategorias aleatórias podemos encontrar todo o tipo de conclusões erradas! Por exemplo, poderia dar-se o caso de que todos os pacientes que receberam cirurgias com a pequena perfuração e que foram bem sucedidas tinham carros de cor azul, o que poderia parecer indicar que a cor do carro do paciente deveria ser um critério a considerar nestas cirurgias! Mais uma vez recordo: correlação não implica causalidade.
Em suma, não é difícil tomarem-se decisões erradas devido a análises superficiais ou incompletas de dados disponíveis. É claro que o Paradoxo de Simpson nem sempre está presente, contudo é importante ter a noção que pode estar!
“Quatro.” – “Não, três.”
[1] O exemplo em causa foi retirado do seguinte vídeo do minutephysics sobre o Paradoxo de Simpson.
[2] Este exemplo está exposta na wikipedia e é baseado neste estudo.
Marinho Lopes
2 comentários
1) É fácil mentir com números em geral, pois as pessoas não estão habituadas a pensar neles. Até com gráficos é fácil: https://ed.ted.com/lessons/how-to-spot-a-misleading-graph-lea-gaslowitz
2) É claro. 😀
3) Pode ser que inventem algo melhor entretanto. 🙂
Abraço!
3 considerações:
1 – É fácil mentir com estatísticas 😉
2 – É óbvio que no Texas tiveram melhores notas… foram todos meus alunos 😛
3 – Frequentemente tenho pedras no rim e detesto cirurgias, por isso a pequena perfuração parece-me o procedimento ideal 😛
abraço! 🙂