R. A. Fisher foi um dos fundadores da Estatística moderna.
Em um de seus famosos experimentos, ele testou a capacidade de uma senhora em distinguir se a xícara estava servida com o leite colocado antes ou depois do chá.
Como planejar um experimento para testar a capacidade da pessoa distinguir se o chá foi preparado com leite primeiro ou por último?
\[\binom{12}{6}=924\]
\[\binom{6}{6}\binom{6}{0}=1\]
\[\binom{6}{5}\binom{6}{1}=36\]
\[\binom{6}{4}\binom{6}{2}=225\]
\[\binom{6}{3}\binom{6}{3}=400\]
\[\binom{6}{2}\binom{6}{4}=225\]
\[\binom{6}{1}\binom{6}{5}=36\]
\[\binom{6}{0}\binom{6}{6}=1\]
Queremos calcular a probabilidade de que este grupo de \(n\) elementos contenha \(x\) elementos com a característica A.
Elemento escolhido | Característica \(A\) | Característica \(B\) | Total |
---|---|---|---|
sim | \(x\) | \(n-x\) | \(n\) |
não | \(N-n\) | ||
Total | \(r\) | \(N-r\) | \(N\) |
Seja \(X\) a v.a. que representa o número de elementos com a característica A dentre os \(n\) escolhidos ao acaso.
Então dizemos que \(X\) segue uma distribuição Hipergeométrica com parâmetros \(N,n,r\), ou seja, \(X \sim Hip(N,n,r)\).
A probabilidade de se observar \(x\) é dada por: \[P(X=x)=\frac{\binom{r}{x}\binom{N-r}{n-x}}{\binom{N}{n}}\,,\quad\quad0\leq x \leq min\{r,n\}\]
Queremos calcular a probabilidade de que dentre as 6 xícaras escolhidas \(x\) tenham de fato o chá colocado primeiro.
Seja \(X\) a v.a. que representa o número de xícaras com chá primeiro dentre as 6 selecionadas.
Então dizemos que \(X\) segue uma distribuição Hipergeométrica com parâmetros \(N,n,r\), ou seja, \(X \sim Hip(N=12,n=6,r=6)\).
A probabilidade de se observar \(x\) é dada por: \[P(X=x)=\frac{\binom{6}{x}\binom{6}{n-x}}{\binom{12}{6}}, \qquad 0\leq x \leq 6\]
\(H_0\): A senhora não consegue distinguir entre chá ou leite primeiro e escolhe ao acaso durante o experimento.
Estatística do teste: Total de acertos (\(X\))
Distribuição de probabilidade da estatística do teste, quando \(H_0\) é verdadeira.
\[P(X=x)=\frac{\binom{6}{x}\binom{6}{6-x}}{\binom{12}{6}}, \qquad 0\leq x \leq 6\]
Distribuição da Estatística do Teste sob \(H_0\)
Como decidir se rejeitamos ou não \(H_0\) de acordo com a estatística do teste observada?
Como decidir se rejeitamos a hipótese de que a senhora não consegue distinguir os chás, sendo que ela acertou, por exemplo, 4? Se ela tivesse acertado todas as 6 xícaras? Seria por pura sorte? Ou ela tem algum conhecimento?
Calculamos a probabilidade, sob \(H_0\), de um valor igual ou mais extremo ao da estatística do teste observada (valor-de-p). Mais extremo: mais evidência contra \(H_0\).
Se o valor-de-p obtido é bem pequeno, por exemplo, 0.05, isto quer dizer que se \(H_0\) é verdadeira, então seria incomum obter uma amostra com os resultados como o observado.
Um valor-de-p muito baixo traz fortes evidências contra \(H_0\).
Se a senhora acertou 5 xícaras:
\[P(X=5) = \frac{\binom{6}{5}\binom{6}{1}}{\binom{12}{6}}=3/77 \]
Calculamos a probabilidade de um valor igual ou mais extremo ao da estatística do teste observada (valor-de-p). Mais extremo: mais evidência contra \(H_0\).
Se a senhora tivesse acertado 6, seria ainda mais evidência contra \(H_0\), de forma que o valor de p é calculado como:
\[P(X=5)+P(X=6)=3/77 + 1/924 = 37/924\]
Se este valor for considerado baixo, temos evidências, baseando-se no experimento realizado, para rejeitar \(H_0\).
Nível de significância \(\alpha\) também conhecido como probabilidade de Erro do Tipo I:
\[P(\mbox{Rejeito }H_0\mid H_0\mbox{ é verdadeira})\] Em um teste de hipóteses, definimos um \(\alpha\), que é o erro que estamos dispostos a cometer rejeitando a \(H_0\) quando ela é verdadeira.
Desta forma, quando meu p-valor é menor do que \(\alpha\), encontramos evidências para rejeitar \(H_0\).
David Salsburg - Uma senhora toma chá: Como a estatística revolucionou a ciência no século XX
Slides produzidos por: