Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
---|---|---|---|---|---|
manejo | 2 | 708,8696 | 354,4348 | 106,6325 | 1,00e-11 |
Residuals | 21 | 69,8017 | 3,3239 | - | - |
15 Testes de acompanhamento (post-hoc)
15.1 Teste de Tukey (HSD - Honest Significant Difference)
Criado por John Tukey (1915–2000), o teste de Tukey é um dos testes post-hoc (ou de comparações múltiplas) mais utilizados após uma ANOVA significativa. Ele realiza todas as comparações par a par possíveis entre as médias populacionais dos tratamentos, controlando o nível de significância do conjunto de todas as comparações (a “taxa de erro para a família de comparações”).
Em vez de usar um valor crítico do teste t padrão para cada comparação, o teste de Tukey utiliza um valor crítico próprio (baseado na distribuição “Studentized Range”), que leva em conta o número de médias sendo comparadas e o número de observações, mantendo o nível de significância global desejado (geralmente \(\alpha = 0.05\)).
As hipóteses testadas para cada par de médias \(i\) e \(j\) são:
\(H_0: \mu_i = \mu_j\) (As médias das populações \(i\) e \(j\) são iguais)
\(H_1: \mu_i \neq \mu_j\) (As médias das populações \(i\) e \(j\) são diferentes)
Existem muitos outros testes de comparações múltiplas similares ao de Tukey. Se você for capaz de interpretar os resultados deste teste, entenderá facilmente os de muitos outros.
Exemplo 15.1 (Teste de Tukey - Cobertura do Solo e Infiltração) Voltando ao Exemplo 14.1, onde a ANOVA indicou um efeito significativo do tipo de manejo da cobertura do solo sobre a taxa de infiltração de água (\(p < 0,001\)). Agora, queremos saber quais tipos de manejo diferem entre si:
- O Solo Descoberto (SD) difere da Gramínea Nativa (GN)?
- O Solo Descoberto (SD) difere da Leguminosa Consorciada (LC)?
- A Leguminosa Consorciada (LC) difere da Gramínea Nativa (GN)?
Para inicar, vamos refazer a Análise de Variância:
<- readr::read_csv("cobertura.csv") # importar os dados
cobertura <- lm(infiltracao ~ manejo, data = cobertura)
aov_cobertura anova(aov_cobertura)
Utilizaremos o pacote emmeans
para calcular o teste de Tukey e o pacote multcomp
para obter a apresentação com letras (Compact Letter Display - CLD).
# Carregar pacotes se ainda não estiverem carregados
::p_load("emmeans", "multcomp", "multcompView")
pacman
# Calcular as médias marginais estimadas e aplicar o teste de Tukey
<- emmeans::emmeans(aov_cobertura, ~manejo, contr = "tukey")
tk_manejo
# Ver os contrastes (comparações par a par)
$contrasts tk_manejo
contrast estimate SE df t.ratio p.value
GN - LC -3.16 0.912 21 -3.469 0.0062
GN - SD 9.62 0.912 21 10.550 <.0001
LC - SD 12.78 0.912 21 14.020 <.0001
P value adjustment: tukey method for comparing a family of 3 estimates
# Ver os intervalos de confiança para as diferenças
$contrasts |> confint() tk_manejo
contrast estimate SE df lower.CL upper.CL
GN - LC -3.16 0.912 21 -5.46 -0.865
GN - SD 9.62 0.912 21 7.32 11.915
LC - SD 12.78 0.912 21 10.48 15.078
Confidence level used: 0.95
Conf-level adjustment: tukey method for comparing a family of 3 estimates
# Obter as letras para o Compact Letter Display (CLD)
# Ajustar 'Letters = letters' ou 'Letters = LETTERS' para minúsculas ou maiúsculas
$emmeans |> multcomp::cld(Letters = letters, decreasing = TRUE) tk_manejo
manejo emmean SE df lower.CL upper.CL .group
LC 17.82 0.645 21 16.5 19.16 a
GN 14.66 0.645 21 13.3 16.00 b
SD 5.04 0.645 21 3.7 6.38 c
Confidence level used: 0.95
P value adjustment: tukey method for comparing a family of 3 estimates
significance level used: alpha = 0.05
NOTE: If two or more means share the same grouping symbol,
then we cannot show them to be different.
But we also did not show them to be the same.
# Gerar o gráfico das médias com intervalos de confiança
$emmeans |> plot(comparisons = TRUE, CIs = TRUE) tk_manejo
Apresentação e Interpretação dos Resultados:
Os resultados do teste de Tukey podem ser resumidos em uma tabela, usando as letras do CLD para indicar quais médias diferem significativamente.
Tabela X. Taxa média de infiltração de água (mm/hora) sob diferentes manejos de cobertura do solo.
Manejo | Taxa de infiltração | |
---|---|---|
LC | 17,82 | a |
GN | 14,66 | b |
SD | 5,04 | c |
Médias seguidas pela mesma letra na coluna não diferem significativamente entre si pelo teste de Tukey (p < 0,05).
Conclusão:
Com base nos resultados do teste de Tukey (p < 0,05):
- A Leguminosa Consorciada (LC) apresentou a maior taxa média de infiltração (17,82 mm/hora), sendo significativamente superior tanto à Gramínea Nativa (GN) quanto ao Solo Descoberto (SD).
- A Gramínea Nativa (GN) teve uma taxa média de infiltração (14,66 mm/hora) significativamente maior que o Solo Descoberto (SD).
- O Solo Descoberto (SD) apresentou a menor taxa média de infiltração (5,04 mm/hora), diferindo significativamente dos manejos com cobertura vegetal.
Portanto, todos os três tipos de manejo da cobertura do solo resultaram em taxas médias de infiltração de água estatisticamente diferentes entre si, com a ordem de eficácia (da maior para a menor infiltração) sendo: Leguminosa Consorciada > Gramínea Nativa > Solo Descoberto.