2010-06-16 18 views
9

Estoy realizando una regresión de mínimos cuadrados como la siguiente (univariante). Me gustaría expresar la importancia del resultado en términos de R^2. Numpy devuelve un valor de residual sin escalar, lo que sería una forma sensata de normalizar esto.Convertir el valor residual de Numpy Lstsq a R^2

field_clean,back_clean = rid_zeros(backscatter,field_data) 
num_vals = len(field_clean) 
x = field_clean[:,row:row+1] 
y = 10*log10(back_clean) 

A = hstack([x, ones((num_vals,1))]) 
soln = lstsq(A, y) 
m, c = soln [0] 
residues = soln [1] 

print residues 

Respuesta

17

Ver http://en.wikipedia.org/wiki/Coefficient_of_determination

Su valor R2 =

1 - residual/sum((y - y.mean())**2) 

que es equivalente a

1 - residual/(n * y.var()) 

Como un ejemplo:

import numpy as np 

# Make some data... 
n = 10 
x = np.arange(n) 
y = 3 * x + 5 + np.random.random(n) 

# Note that polyfit is an easier way to do this... 
# It would just be "model, resid = np.polyfit(x,y,1,full=True)[:2]" 
A = np.vstack((x, np.ones(n))).T 
model, resid = np.linalg.lstsq(A, y)[:2] 

r2 = 1 - resid/(y.size * y.var()) 
print r2 
+0

podemos realizar esta operación en caso de 'scipy.linalg.lstsq'!? – diffracteD

+0

y ¿cómo funciona este ejemplo 'numpy' que ha dado para datos en 3D? no poder conseguirlo ... – diffracteD

Cuestiones relacionadas