2011-10-21 42 views
5

Si tengo algunos datos y hago un ANOVA y pruebas post-hoc, ¿cómo hago un diagrama de caja que agrega la clasificación post-hoc automáticamente, en lugar de tener que editar la figura fuera de R ?Posthoc labels en anova boxplot en R

Por ejemplo, he aquí algunos datos para comenzar:

install.packages("reshape", dependencies=T) 
library(reshape) 

x <- rnorm(30) 
y <- rnorm(30)+1 
z <- rnorm(30)+0.5 

data.1 <- data.frame(x, y, z) 
data.2 <- melt(data.1) 

Aquí está el código para ejecutar un simple ANOVA manera y todas las pruebas post-hoc COMPARACIÓN no planificados:

linear.model <- lm(value~variable, data=data.2) 
anova(linear.model) 

# Analysis of Variance Table 
# Response: value 
#   Df Sum Sq Mean Sq F value Pr(>F) 
# variable 2 10.942 5.4710 5.8628 0.004087 ** 
# Residuals 87 81.185 0.9332  

TukeyHSD(aov(linear.model)) 

# Tukey multiple comparisons of means 
# 95% family-wise confidence level 
# Fit: aov(formula = linear.model) 
# $variable 
      # diff  lwr  upr  p adj 
# y-x 0.8344105 0.2396705 1.42915051 0.0034468 
# z-x 0.2593612 -0.3353788 0.85410126 0.5539050 
# z-y -0.5750493 -1.1697893 0.01969078 0.0602975 

En este punto, quiero clasificar x en el grupo "a", y en el grupo "b" yz en el grupo "a, b". Puedo hacer un diagrama de caja, pero ¿cómo anotarlo con las letras?

boxplot(value~variable, data=data.2) 

Respuesta

6

Si no les importa usar el paquete ggplot2, así es como me gustaría hacer la figura:

En primer lugar, añadir una columna a la trama de datos (datos.2) con las etiquetas de texto:

data.2$posthoc[data.2$variable == "x"] <- "a" 
data.2$posthoc[data.2$variable == "y"] <- "b" 
data.2$posthoc[data.2$variable == "z"] <- "a,b" 

Instalar y cargar el paquete ggplot2:

install.packages("ggplot2", dependencies=T) 
library(ggplot2) 

para entender el código de la figura, voy a construir en el paso s. En primer lugar simplemente trazar los medios para cada uno de los tres grupos:

qplot(data=data.2, 
    x = variable, 
    y = value, 
    stat = "summary", 
    fun.y = "mean", 
    geom = c("point") 
    ) 

A continuación, añadir las etiquetas de texto:

qplot(data=data.2, 
    x = variable, 
    y = value, 
    stat = "summary", 
    fun.y = "mean", 
    label = posthoc, 
    vjust = -12, 
    geom = c("point", "text") 
    ) 

Por último, añadir el geom diagrama de caja y limpiarlo un poco:

qplot(data=data.2, 
    x = variable, 
    y = value, 
    stat = "summary", 
    fun.y = "mean", 
    label = posthoc, 
    vjust = -12, 
    ylim = c(-1, 3.5), 
    geom = c("point", "text"), 
    main="ggplot2 ANOVA boxplot" 
    ) + 
    geom_boxplot(aes(fill=posthoc)) + 
    theme_bw() 

R anova boxplot with labels

+0

Eso funciona! ¿Hay alguna forma de hacer la misma anotación en gráficos base R? – user1006644

+1

Sí, por ejemplo, 'text (x = 1: 3, y = 3, c (" a "," b "," b, c "))' después de la función 'boxplot'. – rcs

+0

¡Gracias James y RCS! – user1006644

2

Esto sería más simple

library(reshape) 

x <- rnorm(30) 
y <- rnorm(30)+1 
z <- rnorm(30)+0.5 

data.1 <- data.frame(x, y, z) 
data.2 <- melt(data.1) 
data.2$newgroup = factor(data.2$variable,labels=c("a","b","ab")) # only line added 
boxplot(value~newgroup, data=data.2) 
+0

Gracias Dieter, ¡esto es útil! – user1006644

Cuestiones relacionadas