2012-06-28 14 views
18

Me ocupo un poco de los datos textuales en varias variables de agrupación. Estoy pensando en crear un método para hacer trazados facetados de wordcloud usando el paquete wordcloud de Ian Fellows. Me gusta la forma en que ggplot2 facetas variables sociales. Estoy decidiendo cómo abordar este problema (diagrama facetado wordcloud).geom_wordcloud: es un sueño imposible

¿Es posible usar el trabajo de Fellows como geom (nunca he hecho un geom pero puede aprender si esto es factible) o no se jugará bien porque uno es de cuadrícula y uno es de base (y wordcloud también usa C alguna codificación) o algún otro problema? ¿Qué tan difícil es esto (sé que esto depende de mis habilidades, pero me gustaría alguna respuesta al parque de béisbol)? Indique si el uso de gráficos básicos puede ser el enfoque más sensato para este problema. Preveo que esto se puede abordar usando panes del paquete plotrix para darle la sensación estética que da la facetación de ggplot.

Tal vez este es un concepto tonto teniendo en cuenta el tamaño de las nubes de palabras y la forma en que las facetas limitan rápidamente el espacio disponible.

+0

Puede resultar útil: http://stackoverflow.com/questions/7029906/extendiendo-ggplot2-correctamente –

+3

Puede modificar la función 'wordcloud' a (invisiblemente) devolver la posición, orientación, tamaño y color de las palabras y luego usar eso con' geom_text'. Para obtener una solución más limpia, es probable que deba envolver la llamada a 'wordcloud' en una función' stat_wordcloud'. –

+3

Excepto que ggplot2 usa una grilla para trazar y los tamaños de palabra se calculan usando gráficos base. –

Respuesta

6

Esto puede ser una quimera, y ciertamente no es fácil volver a utilizar el código wordcloud:

  1. como Ian Fellows señala en un comentario, el código wordcloud calcula tamaños de palabra y posiciones en gráficos base
  2. Una modificación consciente del código debe tener en cuenta las facetas.

En términos de hacer que funcione, un marco para diseñar una solución podría ser:

  1. reescritura wordcloud para calcular los tamaños de texto en los gráficos de la red, en lugar de gráficos de base
  2. Escribir los resultados de palabra tamaño y la posición de una trama de datos
  3. envolver los cálculos en una función llamada stat_wordcloud
  4. Modificar geom_text a un nuevo geom_wordcloud

lo tanto, es una quimera, pero estaría dispuesto a usar una vez has llegado ;-)

+1

Todavía hay noticias, ¿alguien realmente hizo esto? :-) Estoy muy interesado – rdatasculptor

Cuestiones relacionadas