terça-feira, 9 de abril de 2013

Grandes nomes da Estatística: I - George Box

famestatisticians.blogspot.com

A comunidade estatística mundial acabou de ser informada no final do mês passado da morte de um de seus ícones: George E. P. Box. Achei importante então abrir espaço na agenda para não deixar de prestar minha homenagem, fazendo um breve relato do seu legado.

George Box era um exemplar raro, muito difícil de ser repetido nos dias de hoje. Após uma formação tradicional em pesquisa com um doutorado em Estatística, Box trabalhou por uns 7-8 anos na ICI (Imperial Chemical Industries), um conglomerado de empresas britânicas (que também não existe mais). A ICI teve importância muita grande na Ciência, pelo menos na Estatística. Lá, estatísticos eram constantemente confrontados com problemas envolvendo análises de dados gerados dentro da própria empresa mas também tinham espaço para refletir e propor soluções inovadoras. Acredito que essa experiência tenha sido fundamental na visão que Box adquiriu da Ciência e da Estatística. Coincidentemente, a ICI forneceu a Box e outros importantes nomes da Estatística que por lá passaram a mesma formação eclética dada a Fisher pela estação agronômica experimental de Rothamsted. (No caso de Box, não sei se pode-se falar em coincidência pois ele acabou por se casar com uma das filhas de Fisher.)

Seja o que for, Box teve contribuições muito importantes para o desenvolvimento de várias áreas da Estatística. Alguns de seus livros se tornaram pedras fundamentais para as áreas que eles trataram. Destaco aqui os livros Time Series Analysis: Forecasting and Control (1a ed., 1970, apenas com Gwilym Jenkins e 4a ed., 2008, também com Gregory C. Reinsel) e Bayesian Inference in Statistical Analysis. (1973, com George C. Tiao).  

Ambos os livros estavam na fronteira de novidade científica na década de 70, mas com o enorme mérito de propor uma sistematização inédita até então. O primeiro livro permanece até hoje como uma das principais referências de séries temporais sob o enfoque frequentista. Ele apresentou ao mundo uma visão integrada dos modelos ARIMA que, a partir do livro, se tornaram o caminho prioritário para analisar séries temporais. Descrição similar pode ser feita do 2o livro trocando apenas a área de Séries Temporais pela Inferência Bayesiana. Ele tomou como base os seus artigos que tinham acabado se ser publicados com George Tiao. A eles foram acrescentados capítulos iniciais que justificavam e davam forma para uma possível implementação do ponto de vista Bayesiano. A partir desse livro, pode-se perceber que o caminho Bayesiano era viável para uma série de problemas importantes de Estatística, descritos no livro.

Outra contribuição importante de Box, também de cunho teórico mas também com enorme impacto prático, foi um artigo escrito com Cox sobre transformações de variáveis. Esse é um daqueles textos científicos que se lê e se diz: mas isso é óbvio. Aí é que está a maior genialidade dos exponentes: expor aquilo que é simples mas que ninguém até então havia percebido ou sistematizado de forma científica. 

Box teve contribuições importantes para várias outras áreas da Estatística, como Fundamentos e Planejamento de Experimentos. Ele trabalhou tanto no campo Bayesiano como no campo frequentista em um momento onde havia uma forte polarização entre essas 2 vertentes. Isso não parece tê-lo incomodado, possivelmente por essa visão de fazer Ciência com vista a aplicação em análise de dados.  Em um importante artigo que ele publicou nos anos 80, ele chega a propor formas de fazer inferência onde as 2 abordagens se misturam e já não fica mais tão claro se o que está sendo proposto é frequentista ou Bayesiano!  Reflexo dessa postura aplicada é uma frase célebre dele: "todos os modelos são errados mas alguns são úteis". 

Um comentário:

  1. Muito bom: "todos os modelos são errados mas alguns são úteis". Abraços!!!

    ResponderExcluir