terça-feira, 26 de março de 2013

Desmistificando idéias equivocadas sobre Estatística - parte II

Correlação não define causalidade

http://media.photobucket.com

Um outro exemplo de mau uso de Estatística para fins escusos está associado à determinação de causalidade. Estatística consiste basicamente em estudos apoiados em análise de dados. Entender isso é fundamental para compreender que tudo que a Estatística faz é desvendar ou revelar padrões existentes em conjuntos de dados. Conjuntos de dados usados em muitas análises são construídos sem a intervenção de um estatístico ou de um cientista experiente da área em questão. Assim, nada impede que ele contenha variáveis disparatadas e que não tenham nenhuma relação entre si. Apesar disso, elas podem ter padrão de variação semelhante. Isso poderia levar desavisados (bem ou mal intencionados) a concluir que elas estão relacionadas ou, ainda pior, que uma delas é causadora da outra. Isso acontece inúmeras vezes e em muitas delas não há fins escusos justificando o equívoco mas apenas pura e simples ignorância.

A literatura está repleta de exemplos desse tipo. Note que vários padrões são possíveis:
  • 2 variáveis podem variar na mesma direção simultaneamente sem nenhuma relação entre elas. Exemplo: o número de piratas e a temperatura ambiente (ver gráfico acima);
  • 2 variáveis podem variar na mesma direção simultaneamente sem nenhuma relação direta entre elas, mas causadas concomitantemente por uma 3a variável. Exemplo: dormir com a luz acessa causa miopia em crianças;
  • 2 variáveis podem variar na mesma direção simultaneamente com a 1a variável sendo a causadora da 2a mas nada impede que leituras desavisadas entendam o contrário. Exemplo: o uso de guardachuvas causa chuva.
O exemplo da miopia é particularmente esclarecedor: trata-se de um estudo científico da Universidade da Pensilvânia, publicado no prestigioso periódico científico Nature em 1999. Uma análise mais criteriosa   desse estudo observou que ele não levou em conta se os pais das crianças tinham miopia. Esses pais tendem a deixar a luz acessa mais frequentemente por motivos óbvios. Provavelmente a causa da miopia nessas crianças era a miopia dos pais e não a luz que eles deixavam acessa para poderem atender seus filhos mais facilmente à noite! Estudo  da Universidade de Ohio (ver http://researchnews.osu.edu/archive/nitelite.htm), publicado na mesma Nature no ano seguinte,  e conduzido com maior rigor científico não encontrou nenhuma relação entre a luz acessa e a miopia.

Esse exemplo ilustra um fenômeno comum, também conhecido como variável de confundimento. Neste caso, a variável que confunde (pela sua ausência) é a informação sobre a miopia dos pais. Sua identificação é muito importante para correta identificação das reais causas dos fenômenos observados. Sua omissão na análise leva a uma série de problemas, entre as quais, falácia ecológica, que será objeto de postagem futura,
e correlação espúria, cujo nome já é auto-explicativo.

Os exemplos acima revelam erros comumente encontrados na literatura. Como evitá-los? Novamente, precisamos recorrer ao bom uso da ciência, incluindo ai a Estatística. Fica claro também que a Estatística não pode ser usada para provar nada. Ela apenas confirma se uma teoria ou hipótese de trabalho é verificada na prática, através de apropriada análise de dados.

A Estatística não tem como papel, ném foi projetada para, verificar se uma teoria é plausível. A verificação da plausibilidade de uma hipótese postulada deve ser feita antes de tudo. Ela é essencial para o adequado uso da Estatística e diz respeito à área onde se pretende que a Estatística seja aplicada. Uma vez estabelecido de forma precisa e rigorosa que uma teoria é plausível, ai sim vem a hora da Estatística. Através de suas ferramentas, é possível verificar se a teoria é comprovável empiricamente e com que nível de relevância ou, preferivelmente, com que probabilidade. 


Nenhum comentário:

Postar um comentário