Introdução

Testes de permutação/aleatorização podem ser utilizados para avaliar hipóteses sobre efeitos de tratamentos, quando as unidades experimentais são alocadas aleatoriamente para cada tratamento.

Exemplo: Um grupo de pesquisadores quer avaliar se dois tratamentos, \(A\) e \(B\) apresentam diferença com relação a uma certa resposta de interesse.

Os pesquisadores têm à disposição 10 pessoas.

Exemplo

As 10 pessoas são alocadas, aleatoriamente, a um dos tratamentos:

Exemplo

Após aplicar o tratamento, coletamos a variável resposta de interesse em cada pessoa.

Exemplo - Dados observados

ID Tratamento Resposta
1 B 33
2 A 10
3 B 24
4 A 16
5 A 13
6 A 18
7 B 19
8 B 29
9 B 29
10 A 16

Exemplo

  • \(\bar{x}_A = 14.6\)

  • \(\bar{x}_B = 26.8\)

  • Diferença entre \(A\) e \(B\) é -12.2.

  • Esta diferença indica que \(A\) tem média inferior à \(B\) (pensando populacionalmente, não apenas na nossa amostra)?

  • Seria possível, mesmo que não houvesse diferença entre os tratamentos, observar uma diferença de -12.2? Isto é, a diferença observada foi devido ao acaso? Ou foi devido ao fato de realmente existir uma diferença entre os tratamentos?

Exemplo

  • \(H_0\): não há diferença entre os tratamentos
  • \(\mu_A\) a verdadeira média das respostas do Tratamento \(A\)
  • \(\mu_B\) a verdadeira média das respostas do Tratamento \(B\)
  • \(H_0\): \(\mu_A=\mu_B\).
  • Como avaliar?

Exemplo

Sob \(H_0\), não existe diferença entre os tratamentos.

Se \(H_0\) é verdadeira, então a resposta de cada pessoa não tem ligação com o tratamento que ela recebeu.

Exemplo

Se \(H_0\) é verdadeira, a diferença observada de -12.2, foi apenas consequência de uma alocação aleatória em dois grupos \(A\) e \(B\).

Iremos, desta forma, repetir o argumento da \(H_0\): avaliar todas as alocações aleatórias possíveis de 10 pessoas entre os Tratamentos \(A\) e \(B\) e calcular a diferença entre as médias.

Exemplo

Quantas maneiras temos de escolher ao acaso 5 pessoas, de um grupo de 10?

\[\binom{10}{5}=252\]

Temos 252 maneiras de alocar 5 pessoas para o tratamento \(A\) e as restantes para o tratamento \(B\).

Alguns ex das 252 combinações possíveis

id Trat A id Trat A id Trat A id Trat A id Trat A Média do Trat A Média do Trat B Diferença entre A e B
8 1 2 3 5 7 19.8 21.6 -1.8

Alguns ex das 252 combinações possíveis

id Trat A id Trat A id Trat A id Trat A id Trat A Média do Trat A Média do Trat B Diferença entre A e B
2 1 2 3 4 6 20.2 21.2 -1

Alguns ex das 252 combinações possíveis

id Trat A id Trat A id Trat A id Trat A id Trat A Média do Trat A Média do Trat B Diferença entre A e B
1 2 3 4 5 19.2 22.2 -3.0
1 2 3 4 6 20.2 21.2 -1.0
1 2 3 4 7 20.4 21.0 -0.6
1 2 3 4 8 22.4 19.0 3.4
1 2 3 4 9 22.4 19.0 3.4
1 2 3 4 10 19.8 21.6 -1.8
1 2 3 5 6 19.6 21.8 -2.2
1 2 3 5 7 19.8 21.6 -1.8
1 2 3 5 8 21.8 19.6 2.2
1 2 3 5 9 21.8 19.6 2.2

Alguns ex das 252 combinações possíveis

id Trat A id Trat A id Trat A id Trat A id Trat A Média do Trat A Média do Trat B Diferença entre A e B
11 1 2 3 5 10 19.2 22.2 -3.0
12 1 2 3 6 7 20.8 20.6 0.2
13 1 2 3 6 8 22.8 18.6 4.2
14 1 2 3 6 9 22.8 18.6 4.2
15 1 2 3 6 10 20.2 21.2 -1.0
16 1 2 3 7 8 23.0 18.4 4.6
17 1 2 3 7 9 23.0 18.4 4.6
18 1 2 3 7 10 20.4 21.0 -0.6
19 1 2 3 8 9 25.0 16.4 8.6
20 1 2 3 8 10 22.4 19.0 3.4

Exemplo

Todas as diferenças obtidas através de alocação ao acaso nos tratamentos:

Exemplo

Todas as diferenças obtidas através de alocação ao acaso nos tratamentos:

Exemplo

A diferença observada foi de -12.2.

Sob \(H_0\), obteríamos uma diferença de \(|-12.2|\) ou ainda maior, em valor absoluto, 2 vezes.

Como temos 252 combinações possíveis e apenas 2 com valores iguais ou mais extremos ao valor de diferença observada no experimento, temos que o p-valor é:

\[ \frac{2}{252}=0.0079365 \]

Desta maneira, uma valor de diferença como o observado ou ainda mais extremo pode ocorrer ao acaso com probabilidade 0.0079365. Se considerarmos um nível de significância \(\alpha=0.05\), concluímos que os dados trazem evidências para rejeitar a hipótese de que não há diferença entre os tratamentos.

Exemplo

Se utilizarmos o teste t-student para duas amostras (variâncias iguais):

## 
##  Two Sample t-test
## 
## data:  Resposta by Tratamento
## t = -4.3683, df = 8, p-value = 0.002386
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -18.640319  -5.759681
## sample estimates:
## mean in group A mean in group B 
##            14.6            26.8

Exemplo

Se utilizarmos o teste t-student para duas amostras (variâncias diferentes):

## 
##  Welch Two Sample t-test
## 
## data:  Resposta by Tratamento
## t = -4.3683, df = 6.4131, p-value = 0.004039
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -18.928547  -5.471453
## sample estimates:
## mean in group A mean in group B 
##            14.6            26.8

Exemplo 2

Um grupo de pesquisadores quer avaliar se dois tratamentos, \(A\) e \(B\) apresentam diferença com relação a uma certa resposta de interesse.

Os pesquisadores têm à disposição 20 pessoas.

As 20 pessoas são alocadas, aleatoriamente, a um dos tratamentos.

Após aplicar o tratamento, coletamos a variável resposta de interesse em cada pessoa.

Exemplo 2

Exemplo 2

Dados observados:

  • \(\bar{x}_A = 17.1\)

  • \(\bar{x}_B = 21.5\)

  • Diferença entre \(A\) e \(B\) é -4.4.

  • Esta diferença indica que \(A\) tem média inferior à \(B\) (pensando populacionalmente, não apenas na nossa amostra)?

  • Seria possível, mesmo que não houvesse diferença entre os tratamentos, observar uma diferença de -4.4? Isto é, a diferença observada foi devido ao acaso? Ou foi devido ao fato de realmente existir uma diferença entre os tratamentos?

Exemplo 2

Quantas maneiras temos de escolher ao acaso 10 pessoas, de um grupo de 20?

\[\binom{20}{10}=1.84756\times 10^{5}\]

Temos \(1.84756\times 10^{5}\) maneiras de alocar 10 pessoas para o tratamento \(A\) e as restantes para o tratamento \(B\).

Exemplo 2

Todas as diferenças obtidas através de alocação ao acaso nos tratamentos:

Exemplo 2

P-valor: diferenças iguais ou maiores, em valor absoluto, do que o valor absoluto da diferença observada, \(|-4.4|\).

P-valor: \(0.1253978\)

Exemplo 2

Se utilizarmos o teste t-student para duas amostras (variâncias iguais):

## 
##  Two Sample t-test
## 
## data:  Resposta by Tratamento
## t = -1.6586, df = 18, p-value = 0.1145
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -9.973496  1.173496
## sample estimates:
## mean in group A mean in group B 
##            17.1            21.5

Exemplo 2

Se utilizarmos o teste t-student para duas amostras (variâncias diferentes):

## 
##  Welch Two Sample t-test
## 
## data:  Resposta by Tratamento
## t = -1.6586, df = 15.479, p-value = 0.1173
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.03927   1.23927
## sample estimates:
## mean in group A mean in group B 
##            17.1            21.5

Passo-a-passo

  • \(H_0\): \(\mu_A=\mu_B\)

  • Aloque as pessoas em um dos dois tratamentos, aleatoriamente: \(m\) alocados ao Tratamento A e \(n\) alocados ao Tratamento \(B\)

  • Calcule a média para cada tratamento: \(\bar{x}_A\) e \(\bar{x}_B\)

  • Calcule a diferença entre as médias: \(D_{obs}=\bar{x}_A-\bar{x}_B\)

  • Permute as \(m+n\) observações entre os dois tratamentos, obtenha uma lista com todas as permutações possíveis:

\[\binom{m+n}{m}=\frac{(m+n)!}{m!n!}\]

Passo-a-passo

  • Para cada permutação, calcule \(D\), a diferença entre as médias dos tratamentos.

  • Encontre o p-valor:

    • \(H_a\): \(\mu_A>\mu_B\)

      \[\mbox{p-valor}=\frac{\# \{D \geq D_{obs}\}}{\binom{m+n}{m}}\]

    • \(H_a\): \(\mu_A<\mu_B\)

      \[\mbox{p-valor}=\frac{\#\{ D \leq D_{obs}\}}{\binom{m+n}{m}}\]

    • \(H_a\): \(\mu_A\neq\mu_B\)

      \[\mbox{p-valor}=\frac{\#\{ |D| \geq |D_{obs}|\}}{\binom{m+n}{m}}\]