5

Estoy buscando una manera de determinar si una imagen es explícita (es segura para el trabajo) o no.cómo determinar si una imagen es explícita

Actualmente estoy buscando una API que sea capaz de hacerlo, pero hasta ahora no he tenido ningún éxito.

Una de las ideas que tuve fue utilizar la API de búsqueda de Google y proporcionar una URL a una imagen, y ver si estaba o no en los resultados cuando safeSearch está habilitado, pero fallará en una imagen que se agregó antes de que el rastreador llegue a eso.

Alternativamente, estoy buscando punteros con respecto a qué buscar en una imagen para determinar cómo SFW es. ¿Alguna sugerencia sobre formas, colores o patrones?

+6

Haha :) ¡Me imagino lo divertido que sería reunir muestras de entrenamiento ... para la ciencia! – Jacob

+0

dado que mi solución "sucia" actual es simplemente calcular la proporción de beige en la imagen, una imagen de un sofá beige IKEA falla mi prueba. Y esa imagen también es una "muestra de capacitación" – iliaden

+5

@iliaden, no se olvide de la internacionalización. Necesita un umbral beige ajustable de 0.1% para Irán y 99.9% para Holanda. –

Respuesta

1

Según lo prometido, un SFW paper de Google investigadores y un patent para su estudio adquirido de este blog entry.

+0

gracias! He encontrado algunos modelos matemáticos que "funcionarán", pero tomará un tiempo implementarlos. pero gracias por el consejo – iliaden

+0

cuidado de publicar esos modelos? ¡También viendo que la mayoría de los libros de procesamiento de imágenes tienen al menos una foto de Lena, esto parece bastante tradicional! :) – AruniRC

0

Ver documentos:

detección de imágenes digitales Pornográfico Jorge A. Marcial-Basilio, Gualberto Aguilar-Torres, Gabriel Sánchez-Pérez, L. Karina Toscano- Medina, y Héctor M. Pérez-Meana

Detección Pornografía Uso de máquinas de vectores soporte Yu-Chun Lin (林 語 君) Hung-Wei Tseng (曾 宏偉) Chiou-Shann Fuh

Detección Pornografía Image-Basado Rigan Ap-apid De L una Universidad de La Salle, Manila, Filipinas

También puede tomar algunos consejos de implementaciones existentes por ejemplo:

"La pornografía Detección Palo utiliza avanzados algoritmos de análisis de imágenes que categorizan las imágenes como potencialmente dañinos mediante la identificación de los rasgos faciales, colores de tonos carne , fondos de imágenes, formas de partes del cuerpo y más ".

1

Uno de mis colegas dirigió el desarrollo de la tecnología de clasificación de la pornografía en una de las compañías más grandes de la web. Compartiré lo que me dijo sobre el desarrollo del filtro.

  1. La definición de lo que es explícito varía mucho entre jurisdicciones, por lo que lo que se considera explícito en los EE. UU. Podría no ser en otras partes del mundo y viceversa. Por lo tanto, los modelos deben tener en cuenta el origen del usuario.
  2. Un enfoque basado en imágenes puramente es casi imposible de usar de manera efectiva a escala web. El espacio de características es muy complejo en términos de cómo los humanos juzgan lo que es explícito y lo que no lo es, y el desarrollo de la tecnología apropiada de extracción de características para las imágenes resultó ser extremadamente difícil.
  3. Algunas de las características más predictivas son el texto en las páginas que enlazan a las imágenes. Estas son algunas de las características más fáciles de desarrollar también.
  4. La construcción de conjuntos de entrenamiento etiquetados es muy difícil ya que clasificar porno y otro contenido explícito durante 8 horas al día tiende a afectar negativamente a las etiquetadoras. Debido a esto, la rotación es bastante alta y casi nadie dura un año.
  5. Obtener una alta precisión de los clasificadores sigue siendo muy, muy difícil. Trabajaron en él con varios doctores y un equipo muy experimentado y aún no alcanzaron la precisión que probablemente esté buscando.

Si tiene un espacio problemático más restringido, probablemente pueda lograr una mayor precisión. Si está utilizando funciones de imagen, solo el algoritmo o modelo probablemente no se generalizará bien y tendrá una alta tasa de falsos positivos. La mejor de las suertes.

+0

Actualmente estoy implementando un escáner de imágenes basado en publicaciones que se hicieron en los últimos 2 años con respecto a la detección de piel en fotografías, y estoy tratando de clasificar "explícitamente" en función del diseño de la piel en las imágenes. El objetivo sigue siendo crear un escáner de imágenes único, no necesariamente escalable, que solo tome una imagen como entrada. Supongo que no tengo ningún enlace a la página web en la que se encontró. Peor aún, imagine que la página web es imgur.com: es casi imposible obtener datos relevantes del sitio de alojamiento. – iliaden

Cuestiones relacionadas