15Análise de Variância para blocos (ANOVA for RCBD)
Em muitos experimentos de campo ou laboratório, existe uma fonte de variação conhecida ou suspeita entre as unidades experimentais que não é o foco principal do estudo, mas que pode influenciar a variável resposta. Se essa variação não for controlada, ela infla o erro experimental, tornando mais difícil detectar diferenças reais entre os tratamentos.
O delineamento em blocos casualizados (RCBD) é uma estratégia para lidar com uma única fonte de variação externa (o “fator de bloqueio”). A ideia é agrupar as unidades experimentais em “blocos” homogêneos, onde cada bloco contém todos os tratamentos que estão sendo comparados. A variação entre os blocos é então removida da estimativa do erro experimental, tornando o teste para os efeitos dos tratamentos mais sensível e preciso.
Exemplo 15.1 (Anova com bloco) Pesquisadores investigaram o efeito de cinco novas formulações de substrato (S1 a S5) em comparação com um substrato padrão (SP) na produtividade de cogumelos Shiitake (kg/saca). Sabendo que diferentes lotes de inóculo (micélio) poderiam introduzir variabilidade, o experimento foi delineado em blocos completos casualizados, utilizando quatro lotes de inóculo distintos como blocos. Cada um dos seis substratos foi testado uma vez dentro de cada lote. Os dados estão disponíveis no arquivo shiitake.csv.
Análise Exploratória Inicial:
Começamos explorando os dados para ter uma ideia das distribuições e das médias de cada grupo.
shiitake <- readr::read_csv("shiitake.csv") # importar os dados
# A tibble: 4 × 5
bloco n media desvpad var
<chr> <int> <dbl> <dbl> <dbl>
1 _I 6 33.4 7.88 62.0
2 _II 6 33.6 8.50 72.3
3 _III 6 36.5 7.73 59.8
4 _IV 6 20.0 7.39 54.6
Boxplot comparativo entre os bloco:
shiitake |>ggplot(aes(x = bloco, y = prod)) +geom_boxplot() +labs(x ="Substratos",y ="Produção de shiitake" ) +theme_classic()
A análise exploratória inicial mostra que alguns substratos apresentaram maior produtividade média, como o S3 e S5. Quanto aos blocos (lotes de inóculo), o lote d apresentou uma produtividade consideravelmente inferior.
Executando a Análise de Variância (ANOVA):
Procedemos com o teste F da ANOVA:
aov_shiitake <-lm(prod ~ subs + bloco, data = shiitake)anova(aov_shiitake)
term
df
sumsq
meansq
statistic
p.value
subs
5
1,131.19
226.24
30.27
<0.001 *
bloco
3
981.05
327.02
43.75
<0.001 *
Residuals
15
112.11
7.47
*Estatisticamente significativo (nível de 5%)
Conclusão da ANOVA:
O p-valor (Pr(>F)) obtido na tabela da ANOVA é p<0,001. Sendo o p-valor extremamente baixo (muito menor que um nível de significância usual como 0,05), rejeita-se a hipótese nula de que não há diferença entre as médias de produtividade dos diferentes substratos. Portanto, conclui-se que há evidência estatística significativa de que pelo menos um dos substratos tem um efeito diferente na produtividade de cogumelos Shiitake. .
15.1 Condições para a ANOVA em blocos
Assim como para os outros modelos de ANOVA, agora vamos verificar os pressupostos de Normalidade e homogeneidade de variâncias analisando os resíduos do modelo ajustado.
Exemplo 15.2 Continuando com o Exemplo 15.1, vamos avaliar os resíduos, que representam a parte da variabilidade da produtividade não explicada pelos diferentes substratos.
Análise gráfica para Normalidade: Avaliando o gráfico Q-Q Normal, observa-se que os pontos azuis, que representam os resíduos, seguem de perto a linha de referência vermelha tracejada. Não são visíveis desvios sistemáticos ou acentuados dos pontos em relação à linha, seja no centro da distribuição ou nas caudas. A forma do histograma, juntamente com a curva de densidade sobreposta, aproxima-se de uma forma de sino, que é característica de uma distribuição normal. Esta análise sugere que a distribuição dos resíduos é consistente com uma distribuição normal
Índices Descritivos para Normalidade: Um valor de assimetria (-0,20) tão próximo de 0 indica um alto grau de simetria na distribuição dos resíduos. O valor de curtose de 2,03 está próximo de 3, sugerindo que o “achatamento” ou “pico” da distribuição dos resíduos é similar ao de uma distribuição normal.
Testes Formais para Normalidade: O teste de Shapiro-Wilk resultou em 0,332. Como o p-valor é maior que o nível de significância comum de 0,05, não há evidências estatísticas para rejeitar a hipótese nula de Normalidade dos resíduos.
Conclusão: Com base na análise conjunta do gráfico Q-Q, do histograma dos resíduos, dos valores de assimetria e curtose, e do resultado do teste de Shapiro-Wilk, pode-se concluir que o pressuposto de normalidade dos resíduos é satisfeito para este modelo de ANOVA. Não há indicações significativas de desvio da normalidade que possam comprometer a validade das inferências realizadas a partir da ANOVA.
Verificação da Homogeneidade das Variâncias (Homoscedasticidade)
Análise Gráfica dos Resíduos: O gráfico de resíduos versus valores ajustados não revelou padrões sistemáticos, como forma de funil, sugerindo que a dispersão dos resíduos é relativamente constante ao longo dos valores preditos. Os boxplots dos resíduos apresentaram alturas (indicativas da dispersão) comparáveis entre os grupos, sem evidências de discrepâncias acentuadas na variabilidade.
Regra Prática dos Desvios-Padrão Amostrais: A razão entre o maior e o menor desvio-padrão é de 1,74, indicando grande similaridade entre desvio-padrão.
Testes Formais para Homoscedasticidade:
O teste de Levene resultou em um p-valor de 0,483 maior que o nível de significância usual (0,05). Não há evidência estatística para rejeitar a hipótese nula de que as variâncias dos resíduos são homogêneas entre os diferentes substratos.
Conclusão: Com base na inspeção dos gráficos de diagnóstico dos resíduos e no resultado não significativo do Teste de Levene, o pressuposto de homogeneidade das variâncias (homoscedasticidade) é considerado satisfeito para o modelo ANOVA analisado. Não foram identificadas violações graves que comprometam a validade das inferências do teste F da ANOVA.
Todas as análises apresentadas aqui podem ser executadas usando o script anova_bloco.Rmd