15  Testes de acompanhamento (post-hoc)

15.1 Teste de Tukey (HSD - Honest Significant Difference)

Criado por John Tukey (1915–2000), o teste de Tukey é um dos testes post-hoc (ou de comparações múltiplas) mais utilizados após uma ANOVA significativa. Ele realiza todas as comparações par a par possíveis entre as médias populacionais dos tratamentos, controlando o nível de significância do conjunto de todas as comparações (a “taxa de erro para a família de comparações”).

Em vez de usar um valor crítico do teste t padrão para cada comparação, o teste de Tukey utiliza um valor crítico próprio (baseado na distribuição “Studentized Range”), que leva em conta o número de médias sendo comparadas e o número de observações, mantendo o nível de significância global desejado (geralmente \(\alpha = 0.05\)).

As hipóteses testadas para cada par de médias \(i\) e \(j\) são:

  • \(H_0: \mu_i = \mu_j\) (As médias das populações \(i\) e \(j\) são iguais)

  • \(H_1: \mu_i \neq \mu_j\) (As médias das populações \(i\) e \(j\) são diferentes)

Existem muitos outros testes de comparações múltiplas similares ao de Tukey. Se você for capaz de interpretar os resultados deste teste, entenderá facilmente os de muitos outros.

Exemplo 15.1 (Teste de Tukey - Cobertura do Solo e Infiltração) Voltando ao Exemplo 14.1, onde a ANOVA indicou um efeito significativo do tipo de manejo da cobertura do solo sobre a taxa de infiltração de água (\(p < 0,001\)). Agora, queremos saber quais tipos de manejo diferem entre si:

  1. O Solo Descoberto (SD) difere da Gramínea Nativa (GN)?
  2. O Solo Descoberto (SD) difere da Leguminosa Consorciada (LC)?
  3. A Leguminosa Consorciada (LC) difere da Gramínea Nativa (GN)?

Para inicar, vamos refazer a Análise de Variância:

cobertura <- readr::read_csv("cobertura.csv") # importar os dados
aov_cobertura <- lm(infiltracao ~ manejo, data = cobertura)
anova(aov_cobertura)
Df Sum Sq Mean Sq F value Pr(>F)
manejo 2 708,8696 354,4348 106,6325 1,00e-11
Residuals 21 69,8017 3,3239 - -

Utilizaremos o pacote emmeans para calcular o teste de Tukey e o pacote multcomp para obter a apresentação com letras (Compact Letter Display - CLD).

# Carregar pacotes se ainda não estiverem carregados
pacman::p_load("emmeans", "multcomp", "multcompView")


# Calcular as médias marginais estimadas e aplicar o teste de Tukey
tk_manejo <- emmeans::emmeans(aov_cobertura, ~manejo, contr = "tukey")


# Ver os contrastes (comparações par a par)
tk_manejo$contrasts
 contrast estimate    SE df t.ratio p.value
 GN - LC     -3.16 0.912 21  -3.469  0.0062
 GN - SD      9.62 0.912 21  10.550  <.0001
 LC - SD     12.78 0.912 21  14.020  <.0001

P value adjustment: tukey method for comparing a family of 3 estimates 
# Ver os intervalos de confiança para as diferenças
tk_manejo$contrasts |> confint()
 contrast estimate    SE df lower.CL upper.CL
 GN - LC     -3.16 0.912 21    -5.46   -0.865
 GN - SD      9.62 0.912 21     7.32   11.915
 LC - SD     12.78 0.912 21    10.48   15.078

Confidence level used: 0.95 
Conf-level adjustment: tukey method for comparing a family of 3 estimates 
# Obter as letras para o Compact Letter Display (CLD)
# Ajustar 'Letters = letters' ou 'Letters = LETTERS' para minúsculas ou maiúsculas
tk_manejo$emmeans |> multcomp::cld(Letters = letters, decreasing = TRUE)
 manejo emmean    SE df lower.CL upper.CL .group
 LC      17.82 0.645 21     16.5    19.16  a    
 GN      14.66 0.645 21     13.3    16.00   b   
 SD       5.04 0.645 21      3.7     6.38    c  

Confidence level used: 0.95 
P value adjustment: tukey method for comparing a family of 3 estimates 
significance level used: alpha = 0.05 
NOTE: If two or more means share the same grouping symbol,
      then we cannot show them to be different.
      But we also did not show them to be the same. 
# Gerar o gráfico das médias com intervalos de confiança
tk_manejo$emmeans |> plot(comparisons = TRUE, CIs = TRUE)

Apresentação e Interpretação dos Resultados:

Os resultados do teste de Tukey podem ser resumidos em uma tabela, usando as letras do CLD para indicar quais médias diferem significativamente.

Tabela X. Taxa média de infiltração de água (mm/hora) sob diferentes manejos de cobertura do solo.

Manejo Taxa de infiltração
LC 17,82 a
GN 14,66 b
SD 5,04 c

Médias seguidas pela mesma letra na coluna não diferem significativamente entre si pelo teste de Tukey (p < 0,05).

Conclusão:

Com base nos resultados do teste de Tukey (p < 0,05):

  • A Leguminosa Consorciada (LC) apresentou a maior taxa média de infiltração (17,82 mm/hora), sendo significativamente superior tanto à Gramínea Nativa (GN) quanto ao Solo Descoberto (SD).
  • A Gramínea Nativa (GN) teve uma taxa média de infiltração (14,66 mm/hora) significativamente maior que o Solo Descoberto (SD).
  • O Solo Descoberto (SD) apresentou a menor taxa média de infiltração (5,04 mm/hora), diferindo significativamente dos manejos com cobertura vegetal.

Portanto, todos os três tipos de manejo da cobertura do solo resultaram em taxas médias de infiltração de água estatisticamente diferentes entre si, com a ordem de eficácia (da maior para a menor infiltração) sendo: Leguminosa Consorciada > Gramínea Nativa > Solo Descoberto.