2012-06-20 58 views
9

Tengo conjuntos de datos con dos conjuntos de datos igualmente largos, o puedo hacer una matriz de entradas de dos elementos, y me gustaría calcular la correlación y la significación estadística representada por los datos (que pueden estar estrechamente correlacionados, o puede no tener una correlación estadísticamente significativa).En Python, ¿cómo puedo calcular la correlación y la significación estadística entre dos matrices de datos?

Estoy programando en Python y tengo scipy y numpy instalados. Miré y encontré Calculating Pearson correlation and significance in Python, pero parece que quiere que los datos se manipulen para que caigan dentro de un rango específico.

¿Cuál es la forma correcta de, supongo, que pregunte scipy o numpy para darme la correlación y la significación estadística de dos matrices?

+3

¿Por qué crees que 'scipy.stats.pearsonr' quiere que se manipulen los datos? por lo que cae en un rango especificado? – ecatmur

+2

El _ coeficiente de correlación_ cae entre -1 y +1. Esa es la salida, no la entrada. –

Respuesta

2

Puede utilizar el Mahalanobis distance entre estas dos matrices, lo que tiene en cuenta la correlación entre ellas.

la función es en el paquete scipy: scipy.spatial.distance.mahalanobis

Hay un buen ejemplo here

7

Si desea calcular el Coeficiente de correlación de Pearson, entonces scipy.stats.pearsonr es el camino a seguir; aunque, la importancia solo es significativa para conjuntos de datos más grandes. Esta función no requiere que los datos que se manipulen caigan en un rango especificado. El valor para la correlación cae en el intervalo [-1,1], ¿tal vez esa fue la confusión?

Si la importancia no es muy importante, puede usar numpy.corrcoef().

La distancia de Mahalanobis tiene en cuenta la correlación entre dos matrices, pero proporciona una medida de distancia, no una correlación. (Matemáticamente, la distancia de Mahalanobis no es una verdadera función de distancia, sin embargo, se puede usar como tal en ciertos contextos con gran ventaja.)

Cuestiones relacionadas