Comparación de filas entre dos matrices

¿Existe una forma rápida de encontrar qué filas en la matriz A están presentes en la matriz B? p.Comparación de filas entre dos matrices

m1 = matrix(c(1:6), ncol=2, byrow = T); m2 = matrix(c(1:4), ncol=2, byrow=T);

y el resultado sería 1, 2.

Las matrices no tienen el mismo número de filas (número de columnas es el mismo), y que son algo grande - de 10^6 - 10^7 número de filas.

La forma más rápida de hacerlo, que yo sepa, por ahora, es:

duplicated(rbind(m1, m2))

TNX!

Fuente

2012-02-16 user680111

Su solución con 'duplicated' también volverían las filas que se repiten dentro de una matriz, incluso si aparece en sólo una de las dos matrices. De todos modos, la respuesta de @ MatthewDowle es genial. –

'data.table' podría ser más rápido porque no utiliza' do.call ("paste" 'under the hood. Si prefiere' duplicated' a 'M2 [M1]' then 'duplicated (as.data.table (rbind (m1, m2))) 'podría ser más rápido, por la misma razón. Interesado en ver sus tiempos. –

@David Oh, sí, es un buen punto sobre el enfoque' duplicado' –

Una forma rápida para ese tamaño debe ser:

require(data.table) 
M1 = setkey(data.table(m1)) 
M2 = setkey(data.table(m2)) 
na.omit(
    M2[M1,which=TRUE] 
) 
[1] 1 2

Fuente

2012-02-16 18:59:23

-1

creé esta función que devolverá el ID originales. Por ejemplo, si desea hacer coincidir la matriz x con la matriz y, devolverá la identificación de coincidencia de y.

rowiseMatch2 <- function(x,y){ 
    require(data.table) 
    keycols <- colnames(x) 
    x <- cbind(x, id=1:nrow(x)) 
    y <- cbind(y, id=1:nrow(y)) 
    m1 = data.table(x) 
    setkeyv(m1, keycols) 
    m2 = data.table(y) 
    setkeyv(m2, keycols) 
    m1id <- m1$id 
    m2id <- m2$id 

    m1$id <- NULL 
    m2$id <- NULL 

    m <- na.omit(m2[m1,which=TRUE]) 
    mo <- m2id[m][order(m1id)] 

    if(length(mo) == nrow(x)){ 
    cat("Complete match!\n") 
    }else{ 
    cat("Uncomplete match, match percentage is:", round(length(mo)/nrow(x), 4)*100, "%\n") 
    } 
    return(as.integer(mo)) 
}

Fuente

2016-03-16 02:41:11 haoeric

Comparación de filas entre dos matrices

Respuesta

Cuestiones relacionadas