Tengo una pregunta sobre la extracción de una parte de una cadena. Por ejemplo, tengo una cadena como esta:R extraer parte de la cadena
a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0"
necesito para extraer todo lo que entre GN=
y ;
.Así que aquí será NOC2L
.
¿Es esto posible?
Nota: Esto es INFO
columna forma VCF file format. GN es Gene Name, por lo que queremos extraer el nombre del gen de la columna INFO
.
La pregunta es un poco confusa, ya que parece que su cadena deseada no siempre va seguida de un punto y coma. – jbaums