2009-03-16 16 views
23

No estoy seguro de si Youtube es el único sitio web con esta tecnología, pero la identificación de contenido en YT (Content ID) es básicamente una tecnología para identificar y eliminar automáticamente las infracciones de derechos de autor. Puede leer más sobre esto aquí:¿Tecnología de identificación de contenido de Youtube?

http://www.youtube.com/t/contentid

Bueno, cuando uno de mis videos (que contiene una pista de música en particular) se llevó marcadas y removidas por infracción de derechos de autor, pensé que [la sytstem contenido-ID] era probablemente tonto. Así que hice algunos experimentos: ninguno de los cuales engañar el filtro ~

  • añadido una serie de pitidos en el medio de la canción
  • Un cambio en el terreno de juego varias veces a través de la canción
  • modifica el volumen un par de veces
  • regular la velocidad
  • añadido una superposición de audio
  • añadido algunos efectos de audio

Por otro lado, no conozco ningún material que esté falsamente emparejado como protegido por derechos de autor. Una versión de piano de una canción, por ejemplo, no desencadenaría falsamente el censor.

No estoy despotricando sobre la eliminación de mis videos. Me sorprende lo efectivo que es el censor de contenido. Me pregunto cómo el algoritmo identifica correctamente la canción como una violación de los derechos de autor, incluso después de todos mis esfuerzos para eludirlo. Cualquier intento de emparejar directamente habría sido derrotado de forma inmediata, cualquier algoritmo que involucre patrones de notas probablemente sería engañado por los pitidos y el cambio de tono.

Bueno, esto es más de mi curiosidad que una pregunta urgente ..

+0

También encuentro algo similar en imeem.com, pueden identificar "duplicados" de una canción incluso si el nombre, las etiquetas, etc. son todos diferentes. – hasen

+0

Hmm, apenas relevante porque entonces cualquier coincidencia o mezcla de las dos canciones volvería verdadera. Asumiendo que las canciones son idénticas. – Bai

+0

Utilizan una forma de [huella digital acústica] (https://en.wikipedia.org/wiki/Acoustic_fingerprint). Si bien Google ha publicado artículos sobre el tema, creo que el algoritmo que usan no es público (probablemente para dificultar que las personas encuentren la forma de solucionarlo). – Zaz

Respuesta

14

Pedro Moreno y otros en el trabajo Google/Youtube en él. Usan finite-state transducers para reconocer secuencias de unidades de teléfono de música, similares a los fonemas en reconocimiento automático de voz.

revisar este artículo:

Si cambia la velocidad o el tono a lo largo de toda la canción Me sorprende que todavía reconocen estos algoritmos la canción. Pero quizás normalicen el tono y la velocidad (usando el tiempo entre tiempos) para poder reconocer versiones cubiertas también, no solo las originales. Pero no es sorprendente que pueda ignorar los pitidos que agregó, ya que de lo contrario hay suficiente similitud en la transmisión de audio.

(En realidad, el algoritmo de estado finito sería increíble para aplicar a mi biblioteca de iTunes, etiquetar los archivos correctamente. Porque los servicios como MusicBrainz se basan en coincidencias hash más o menos exactas de su audio y la entrada de la base de datos, el método del transductor parece ser más tolerante a diferencias en el reconocimiento de los archivos.)

+0

así que todavía me pregunto cómo otras personas pueden cargar clips de película parciales y no ser bloqueados. –

Cuestiones relacionadas