R. A. Fisher foi um dos fundadores da Estatística moderna.
Em um de seus famosos experimentos, ele testou a capacidade de uma senhora em distinguir se a xícara estava servida com o leite colocado antes ou depois do chá.
Como planejar um experimento para testar a capacidade da pessoa distinguir se o chá foi preparado com leite primeiro ou por último?
\binom{12}{6}=924
\binom{6}{6}\binom{6}{0}=1
\binom{6}{5}\binom{6}{1}=36
\binom{6}{4}\binom{6}{2}=225
\binom{6}{3}\binom{6}{3}=400
\binom{6}{2}\binom{6}{4}=225
\binom{6}{1}\binom{6}{5}=36
\binom{6}{0}\binom{6}{6}=1
Queremos calcular a probabilidade de que este grupo de n elementos contenha x elementos com a característica A.
Elemento escolhido | Característica A | Característica B | Total |
---|---|---|---|
sim | x | n-x | n |
não | N-n | ||
Total | r | N-r | N |
Seja X a v.a. que representa o número de elementos com a característica A dentre os n escolhidos ao acaso.
Então dizemos que X segue uma distribuição Hipergeométrica com parâmetros N,n,r, ou seja, X \sim Hip(N,n,r).
A probabilidade de se observar x é dada por: P(X=x)=\frac{\binom{r}{x}\binom{N-r}{n-x}}{\binom{N}{n}}\,,\quad\quad0\leq x \leq min\{r,n\}
Queremos calcular a probabilidade de que dentre as 6 xícaras escolhidas x tenham de fato o chá colocado primeiro.
Seja X a v.a. que representa o número de xícaras com chá primeiro dentre as 6 selecionadas.
Então dizemos que X segue uma distribuição Hipergeométrica com parâmetros N,n,r, ou seja, X \sim Hip(N=12,n=6,r=6).
A probabilidade de se observar x é dada por: P(X=x)=\frac{\binom{6}{x}\binom{6}{n-x}}{\binom{12}{6}}, \qquad 0\leq x \leq 6
H_0: A senhora não consegue distinguir entre chá ou leite primeiro e escolhe ao acaso durante o experimento.
Estatística do teste: Total de acertos (X)
Distribuição de probabilidade da estatística do teste, quando H_0 é verdadeira.
P(X=x)=\frac{\binom{6}{x}\binom{6}{6-x}}{\binom{12}{6}}, \qquad 0\leq x \leq 6
Distribuição da Estatística do Teste sob H_0
Como decidir se rejeitamos ou não H_0 de acordo com a estatística do teste observada?
Como decidir se rejeitamos a hipótese de que a senhora não consegue distinguir os chás, sendo que ela acertou, por exemplo, 4? Se ela tivesse acertado todas as 6 xícaras? Seria por pura sorte? Ou ela tem algum conhecimento?
Calculamos a probabilidade, sob H_0, de um valor igual ou mais extremo ao da estatística do teste observada (valor-de-p). Mais extremo: mais evidência contra H_0.
Se o valor-de-p obtido é bem pequeno, por exemplo, 0.05, isto quer dizer que se H_0 é verdadeira, então seria incomum obter uma amostra com os resultados como o observado.
Um valor-de-p muito baixo traz fortes evidências contra H_0.
Se a senhora acertou 5 xícaras:
P(X=5) = \frac{\binom{6}{5}\binom{6}{1}}{\binom{12}{6}}=3/77
Calculamos a probabilidade de um valor igual ou mais extremo ao da estatística do teste observada (valor-de-p). Mais extremo: mais evidência contra H_0.
Se a senhora tivesse acertado 6, seria ainda mais evidência contra H_0, de forma que o valor de p é calculado como:
P(X=5)+P(X=6)=3/77 + 1/924 = 37/924
Se este valor for considerado baixo, temos evidências, baseando-se no experimento realizado, para rejeitar H_0.
Nível de significância \alpha também conhecido como probabilidade de Erro do Tipo I:
P(\mbox{Rejeito }H_0\mid H_0\mbox{ é verdadeira}) Em um teste de hipóteses, definimos um \alpha, que é o erro que estamos dispostos a cometer rejeitando a H_0 quando ela é verdadeira.
Desta forma, quando meu p-valor é menor do que \alpha, encontramos evidências para rejeitar H_0.
David Salsburg - Uma senhora toma chá: Como a estatística revolucionou a ciência no século XX
Slides produzidos por: