2012-05-16 40 views
10

¿Cómo puedo ajustar mi eje Y para ignorar valores atípicos, como en this post, pero en un caso más desafiante donde tengo 4 boxplots y un diseño de "faceting libre" ?Ignorar valores atípicos en gplplot2 boxplot + faceting + opciones "gratuitas"

p < - ggplot (molten.DF, aes (x = clase, y = SOC, llenar = clase)) + geom_boxplot() + facet_grid (capa ~, escalas = "libre", el espacio. = "libre")

Como puede ver en mi figura, considerar valores atípicos en el rango del eje Y hace que las cajas sean más difíciles de leer. No importa si todavía hay algunos valores atípicos visibles en el resultado, ¡pero me gustaría centrarme realmente en las cajas!

boxplot with free scale, all outliers are (unfortuately) visibles

+4

Si publica un ejemplo reproducible para que trabajemos, nos será mucho más fácil ayudarle. –

Respuesta

2

Obviamente, depende de lo que se considera un valor atípico. Si es posible que lo calcule, puede configurar su ylim en este valor y dejar esos puntos fuera del cuadro.

Por ejemplo, si se asume que los límites superior e inferior son Q3 + 1,5 IQR y Q1 - 1,5 IQR, y esta es la forma en diagramas de caja por lo general han calculado su límite de valores atípicos, que tendría:

upper.fence <- quantile(x)[4] + 1.5*IQR(x) 
lower.fence <- quantile(x)[2] - 1.5*IQR(x) 

continuación, puede utilizar estos límites como el rango de valores y:

my.ggplot + coord_cartesian(ylim=c(lower.fence, upper.fence)) 

el procedimiento que se utiliza para obtener sus límites superior e inferior se pueden cambiar, pero el uso de los límites es el mismo.

+1

Creo que es seguro asumir que OP quiere valores atípicos según lo definido por ggplot: http://docs.ggplot2.org/current/geom_boxplot.html (sección de Detalles). Además, el enfoque 'ylim' solo funciona para un solo diagrama de caja, ya que los valores atípicos de algunos gráficos de caja estarán dentro de la valla de los demás. –

Cuestiones relacionadas