Tengo un archivo de datos con el formato anterior.
Lo cargué en R e intenté trazar un histograma con los valores de la columna de dist y recibí el error "x debe ser numérico". Por lo tanto, traté de cambiar el formato.Cambiar valores al convertir el tipo de columna a numérico
> head(data)
V1 V2
1 type gene_dist
2 A 64667
3 A 76486
4 A 97416
5 A 30876
6 A 88018
> summary(data)
V1 V2
A : 67 100 : 1
B :122 100906 : 1
type: 1 102349 : 1
1033 : 1
10544 : 1
10745 : 1
(Other):184
Me trataron de establecer el formato de la columna usando sapply
pero los valores se cambian:
> data[,2]<-sapply(data[,2],as.numeric)
> head(data)
V1 V2
1 type 190
2 A 146
3 A 166
4 A 189
summary(data)
V1 V2
A : 67 Min. : 1.00
B :122 1st Qu.: 48.25
type: 1 Median : 95.50
Mean : 95.50
3rd Qu.:142.75
Max. :190.00
¿Alguien sabe por qué sucede esto?
puede pegar la salida de 'dput (data)' para que podamos reproducir sus resultados. Mi sospecha es que está convirtiendo un 'factor' en' numérico' directamente, lo que está causando el problema. Intente reemplazarlo con 'function (x) as.character (as.numeric (x)) 'y ver si eso funciona – Ramnath
@ Ramnath - problema resuelto con as.numeric (as.character (x)) – agatha
Parece que R está clasificando las columnas como factores porque está leyendo el encabezado como una fila entrada. Configurando 'header = T' en su llamada' read.table() 'debería arreglar esto. –