Existen varios métodos estadísticos para reducir un conjunto de datos grande a un conjunto de datos más pequeño y más fácil de visualizar. No está claro a partir de su pregunta qué resumen estadístico desea. Acabo de suponer que desea ver cómo cambia la tasa de cambio en función del tiempo, pero tal vez esté interesado en la frecuencia con la que la tasa de cambio supera un cierto valor o alguna otra estadística que no estoy considerando.
Resumiendo una tendencia en el tiempo
Aquí hay un ejemplo usando el método lowess en R (de la documentación sobre scatter plot smoothing): controles f
> library(graphics)
# print out the first 10 rows of the cars dataset
> cars[1:10,]
speed dist
1 4 2
2 4 10
3 7 4
4 7 22
5 8 16
6 9 10
7 10 18
8 10 26
9 10 34
10 11 17
# plot the original data
> plot(cars, main = "lowess(cars)")
# fit a loess-smoothed line to the points
> lines(lowess(cars), col = 2)
# plot a finger-grained loess-smoothed line to the points
> lines(lowess(cars, f=.2), col = 3)
El parámetro la fuerza con la regresión se ajusta a tu información. Use algo de consideración con esto, ya que quiere algo que se ajuste con precisión a sus datos sin sobreajuste.En lugar de velocidad y distancia, puede trazar el tipo de cambio en función del tiempo.
También es sencillo acceder a los resultados del suavizado. Aquí está cómo hacerlo:
> data = lowess(cars$speed, cars$dist)
> data
$x
[1] 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 16 16 17 17 17 18 18 18 18 19 19
[38] 19 20 20 20 20 20 22 23 24 24 24 24 25
$y
[1] 4.965459 4.965459 13.124495 13.124495 15.858633 18.579691 21.280313 21.280313 21.280313 24.129277 24.129277
[12] 27.119549 27.119549 27.119549 27.119549 30.027276 30.027276 30.027276 30.027276 32.962506 32.962506 32.962506
[23] 32.962506 36.757728 36.757728 36.757728 40.435075 40.435075 43.463492 43.463492 43.463492 46.885479 46.885479
[34] 46.885479 46.885479 50.793152 50.793152 50.793152 56.491224 56.491224 56.491224 56.491224 56.491224 67.585824
[45] 73.079695 78.643164 78.643164 78.643164 78.643164 84.328698
El objeto de datos que vuelvas contiene entradas denominadas X e Y, que corresponden a los valores X e Y pasados a la función lowess. En este caso, xey representan la velocidad y dist.
¿Puedes aclarar "representa"? ¿Te refieres solo a la vista o para realizar cálculos? – Carl
El resultado final sería un conjunto de datos de un tipo que luego podría procesarse y graficarse – Karl
¡Suena como un trabajo para R! – Joel