Me gustaría graficar datos de modo que en el eje y haya una probabilidad (en el rango [0,1]) y en el eje x tenga los valores de los datos. Los datos son contiguos (también en el rango [0,1]), por lo tanto, me gustaría usar alguna función de estimación de la densidad del kernel y normalizarla de modo que el valor y en algún punto x signifique la probabilidad de ver el valor x en la entrada datos.Probabilidad de trazado con ggplot2 (no densidad)
lo tanto, me gustaría preguntar:
a) ¿Es razonable en absoluto? Entiendo que no puedo tener la probabilidad de ver valores que no tengo en los datos, pero me gustaría interpolar entre los puntos que tengo usando una función de estimación de la densidad del kernel y luego normalizarla.
b) ¿Hay alguna opción incorporada en ggplot que pueda usar, que anularía el comportamiento predeterminado de geom_density() por ejemplo para hacer esto?
Gracias de antemano,
Timo
EDIT: cuando dije "normalizar" antes, yo en realidad quería decir "escala". Pero obtuve la respuesta, así que gracias chicos por aclarar mi opinión sobre esto.
No estoy seguro de lo que quiere decir trazando la probabilidad, pero "no densidad", sin embargo, menciona que desea kernel suavizar los datos. Lo que hace el kernel es convertir una distribución empírica (es decir, el histograma) en una función de densidad suavizada (es decir, el PDF). Creo que tienes que dejar de lado el requisito más suave del kernel o el deseo de no graficar la densidad. Aunque puede estar abordando esto cuando dice "normalizarlo después". –
Gracias por aclarar mi mente. Creo que usar un histograma es más apropiado en este caso. Si traté de trazar la probabilidad con el suavizado, creo que confundiría a cualquiera que intente interpretar las tramas. – Timo