Quiero retroceder cada columna en un conjunto de datos en un vector y luego devolver la columna que tiene el valor R-cuadrado más alto. p.ej. Tengo un vector HAPPY < - (3,2,2,3,1,3,1,3) y tengo un conjunto de datos.Regrese cada columna en un marco de datos en un vector en R
HEALTH CONINC MARITAL SATJOB1 MARITAL2 HAPPY
3 441 5 1 2 3
1 1764 5 1 2 2
2 3087 5 1 2 2
3 3087 5 1 2 3
1 3969 2 1 5 1
1 3969 5 1 2 3
2 4852 5 1 2 2
3 5734 3 1 3 3
Regress "feliz" en cada una de las columnas del conjunto de datos a la izquierda, a continuación, devuelve la columna que tiene el más alto R cuadrado. Ejemplo: lm (Health ~ Happy) si Health tiene el valor R-cuadrado más alto, luego devuelve Health.
He intentado aplicar, pero parece que no se me ocurre cómo devolver la regresión con el R-cuadrado más alto. ¿Alguna sugerencia?
Utilicé esta solución el otro día con RCDK. Estaba buscando el valor más alto de r.squared en todos los descriptores moleculares en la biblioteca del kit de desarrollo químico en comparación con los resultados del análisis de mis moléculas. Gracias. – user1945827