2011-04-14 20 views
21

Duplicar posibles:
scale a series between two points in Rrango de normalización (0 a 1) en I

¿Alguno sabe de una función de R para realizar la estandarización gama en un vector? Estoy tratando de transformar las variables a una escala entre 0 y 1, conservando el orden de rango y el tamaño relativo de separación entre los valores.

Para ser claros, no estoy buscando estandarizar las variables centrando y escalando por la SD, como se hace en la escala de función().

Probé las funciones mmnorm() y rangenorm() en el paquete 'dprep', pero parece que no hacen el trabajo.

+4

Idéntica a http: // stackoverflow .com/questions/5468280/scale-a-series-between-two-points-in-r/5468527 # 5468527 – Andrie

+0

También es muy idéntico a esta pregunta en stats.stackexchange: http://stats.stackexchange.com/q/1112/442 – Henrik

+3

No lo elimine; solo ciérralo. Está vinculado a la otra pregunta, por lo que puede ser útil para las personas que usan la función de búsqueda. –

Respuesta

40
s = sort(rexp(100)) 

range01 <- function(x){(x-min(x))/(max(x)-min(x))} 

range01(s) 

    [1] 0.000000000 0.003338782 0.007572326 0.012192201 0.016055006 0.017161145 
    [7] 0.019949532 0.023839810 0.024421602 0.027197168 0.029889484 0.033039408 
[13] 0.033783376 0.038051265 0.045183382 0.049560233 0.056941611 0.057552543 
[19] 0.062674982 0.066001242 0.066420884 0.067689067 0.069247825 0.069432174 
[25] 0.070136067 0.076340460 0.078709590 0.080393512 0.085591881 0.087540132 
[31] 0.090517295 0.091026499 0.091251213 0.099218526 0.103236344 0.105724733 
[37] 0.107495340 0.113332392 0.116103438 0.124050331 0.125596034 0.126599323 
[43] 0.127154661 0.133392300 0.134258532 0.138253452 0.141933433 0.146748798 
[49] 0.147490227 0.149960293 0.153126478 0.154275371 0.167701855 0.170160948 
[55] 0.180313542 0.181834891 0.182554291 0.189188137 0.193807559 0.195903010 
[61] 0.208902645 0.211308713 0.232942314 0.236135220 0.251950116 0.260816843 
[67] 0.284090255 0.284150541 0.288498370 0.295515143 0.299408623 0.301264703 
[73] 0.306817872 0.307853369 0.324882091 0.353241217 0.366800517 0.389474449 
[79] 0.398838576 0.404266315 0.408936260 0.409198619 0.415165553 0.433960390 
[85] 0.440690262 0.458692639 0.464027428 0.474214070 0.517224262 0.538532221 
[91] 0.544911543 0.559945121 0.585390414 0.647030109 0.694095422 0.708385079 
[97] 0.736486707 0.787250428 0.870874773 1.000000000 

Adición ... le permitirá pasar a través de na.rm = T si desea omitir los valores que faltan del cálculo (que todavía estará presente en los resultados):

range01 <- function(x, ...){(x - min(x, ...))/(max(x, ...) - min(x, ...))} 
+3

Siendo realmente quisquilloso, agregaría la facilidad para eliminar 'NA's, como' función (x, na.rm = FALSE) ' –

+0

Este problema [surgió de nuevo] (http://stackoverflow.com/a/ 31926163/903061) en caso de 'NA's. Edité esta versión para hacerla más general (más o menos) como sugiere Richie. – Gregor

Cuestiones relacionadas