
Já ouviram falar do "intervalo de confiança" de uma sondagem?
Quem estiver mais familiarizado com a estatística e a econometria está farto seguramente de o ouvir e provavelmente sabe também que estas margens de confiança calculam-se com a famosa função t de Student. O mais bizarro, no entanto, é que esta função matemática nasceu na fábrica de cerveja Guinness.
A história da função t
No final do século XIX, a fábrica de Saint James's Gate, em Dublin, era a maior cervejeira do mundo. A Guinness não só era consumida na Irlanda e Grã Bretanha, como começava a exportar para todo o mundo.
Como líder mundial, a preocupação com a qualidade do produto era enorme e foram pioneiros nos rigorosos controlos de qualidade.
No auge desta campanha, decidem contratar, em 1899, William Sealy Gosset, um reputado estatístico inglês que se muda para Dublin a fim de melhorar tanto o processo de fermentação como a selecção de matérias-primas.
Gosset tinha como objectivo analisar amostras para optimizar ambos os processos. O seu problema, matematicamente falando, era obter resultados estatisticamente significativos a partir de um número comparativamente reduzido de amostras.
Com a ajuda do matemático Karl Pearson, Gosset obteve resultados a que em princípio não deu muita importância, mas que acabariam por ser a chave da estatística moderna.
Havia um pequeno problema: a Guinness proibia a publicação das investigações realizadas pela empresa, já que as considerava como um segredo industrial. Gosset decidiu então utilizar o pseudónimo “Student” e publicá-las na mesma, com a esperança de não ser descoberto.
O trabalho de Gosset passou inicialmente despercebido. Enviou as suas tabelas ao pai da bioestatística, Ronald Fisher, dizendo-lhe que achava ser ele o único a utilizá-las.
Fisher compreendeu o grande alcance do trabalho de Gosset e aplicou-o nas suas próprias investigações, completando-o e melhorando-o. A função t de Student tornou-se famosa, de facto, graças a Fisher.
Acontece que, aparentemente, Fisher e Pearson tinham uma grande rivalidade pessoal, o que não deixava de ser irónico, dado que o sucesso de Fisher baseava-se precisamente nas fórmulas que Pearson tinha elaborado, apesar de desprezar a sua importância.
Gosset, no entanto, era um homem modesto e em certa ocasião respondeu a um admirador do seu trabalho que “Fisher o teria descoberto mais cedo ou mais tarde, de qualquer maneira”.
A importância da função t
A função t de Student está relacionada com o estudo de populações muito grandes a partir de uma amostra comparativamente muito pequena.
A função surge ao querer calcular a média de uma determinada variável de uma certa população, que se supõe normalmente distribuída, mas da qual se desconhece a variação, isto é, a tendência das amostras para se desviarem do valor médio.
Pois bem, este é precisamente o caso das pesquisas realizadas sobre a população de um território. Por exemplo, o objectivo de uma sondagem eleitoral é calcular a média de intenção de voto de cada partido, contando com muito poucas amostras aleatórias da população total.
Para avaliar a "qualidade" da estimativa, é necessário recorrer à função t de Student, da qual obtemos um intervalo de confiança.
É habitual nas pesquisas publicar os resultados com um intervalo de confiança de 95%.
Se na ficha técnica de uma sondagem eleitoral, por exemplo, se diz que a margem de erro é de 2% e o intervalo de confiança é 95%, o que quer dizer é que segundo a função t de Student, a possibilidade da intenção de voto real da população estudada estar fora das margens de erro é de 5%.
Distribuição t de Student
Matematicamente, a função de distribuição t é da forma Z / √(v/V), onde Z é uma distribuição normal (também chamada gaussiana) e V é uma distribuição de tipo χ², com v graus de liberdade.
A forma desta distribuição de probabilidade é mostrada pela linha vermelho da imagem. É similar à distribuição normal (a famosa "curva de Gauss", em azul) mesmo que os flancos sejam algo mais "pesados", isto é, a possibilidade de obter valores muito desviados da média é maior.
Seguramente o bom do Gosset nunca imaginaria que os seus trabalhos na Guinness atingiriam esta repercussão.