2011-10-21 11 views
5

Estoy tratando de analizar algunos datos de series temporales ruidosas en R. Los datos se basan en la emisión de CO2 de los animales y muestran una especie de periodicidad cíclica que me gustaría caracterizar. Me gustaría probar las hipótesis:Prueba de periodicidad de datos biológicos ruidosos: ¿importancia del periodograma?

H0: No hay emisión cíclica de CO2 (es decir, no más que al azar).

H1: Hay un patrón de emisión de CO2 en ciclos o pulsos.

Para hacer esto he importado los datos en R, los convertí en una clase de serie de tiempo y tracé su periodograma.

t25a <- read.table("data.txt", header=TRUE, sep="\t") 
t1 <- ts(t25a$Co2) 
plot(t1) 
spec.pgram(t1, spans=4, log="no") 

Esto es lo que parece, con los datos en bruto representan en la parte superior y el periodograma debajo:

R periodogram of time series CO2 data

En la figura inferior, puedo ver cuatro o cinco picos algo-distintas que indican un componente de frecuencia en los datos. Mi pregunta es: ¿son todos igualmente "importantes"? ¿Hay alguna manera de probar si los picos observados son significativamente diferentes entre sí o de las predicciones de la hipótesis nula? Todo lo que sé hacer es encontrar la frecuencia asociada con esos picos, pero me gustaría un método más objetivo para determinar cuántos picos "significativos" realmente existen en los datos.

+0

¿Entiende cuáles son las unidades de un espectro de potencia, sí? [unidades ** 2/Hz] Puede pensar en el espectro integrado como la varianza de las series temporales originales, por lo que si un pico es más grande que otro, tiene más energía (señal) en esa frecuencia que el otro. Entonces, el "significado" no es realmente una pregunta significativa. Y realmente deberías estar usando un esquema de reducción progresiva, y trazar la frecuencia logarítmica (en este caso). –

+0

@AndyBarbour Primero, las unidades. Mi entendimiento es que el eje y en el periodograma anterior es una medida de poder y que el eje x es la frecuencia inversa. ¿De dónde viene el * 2 en sus unidades * 2/Hz? Como una medida de la importancia relativa de los diferentes componentes de la señal, ¿podría considerar la relación entre un pico integrado y el área total? –

+0

Eche un vistazo al Teorema de Parseval, o trabaje con la transformada de Fourier en una función analítica para demostrar fácilmente las unidades. Las unidades en el gráfico son probablemente, para y, en dB en relación con 1 unidad ** 2/Hz, y para x, 0 en la frecuencia de Nyquist. Depende de qué pregunta quiera responder, pero los picos probablemente sean ciclos reales en los datos (solo mediante la inspección de sus series de tiempo). –

Respuesta

1

Una opción sería simular conjuntos de datos bajo su hipótesis nula (no tiene la periodicidad que está buscando, pero todavía tiene las otras características de series temporales). Si tiene una estadística de prueba numérica (número de picos, o alguna otra medida), puede calcular esto para cada uno de muchos conjuntos de datos simulados y esto le dará la distribución de muestreo, simplemente compare la estadística de prueba para sus datos reales con el muestreo distribución. Si usted no tiene una prueba estadística numérica recta hacia adelante entonces usted podría considerar hacer una prueba visual, ver:

Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, 
D.F and Wickham, H. (2009) Statistical Inference for exploratory 
data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 
367, 4361-4383 doi: 10.1098/rsta.2009.0120 

La función vis.testTeachingDemos en el paquete de ayuda de I con la aplicación de esta prueba (pero también hay otras formas).

+0

¡Hola, Greg, gracias por indicarme esa referencia! He pensado en usar la cantidad de picos como estadística de prueba, pero me encuentro con un pequeño problema. Quiero evitar contar picos "a ojo", por lo que suavizo los datos (usando splines cúbicos) y luego redondeo un poco de código R para contar los picos en los datos suavizados. Pero esos resultados dependen de la cantidad de suavizado que aplico, que es intrínsecamente algo subjetiva. Aún no he leído ese artículo, pero tal vez aborde estas preocupaciones. –

+0

El artículo habla sobre una prueba visual que aún requiere que observe la trama a simple vista, contar picos reales puede ser opcional. Pero hace una prueba intuitiva al mirar los resultados. –

Cuestiones relacionadas