Detectar un objeto en una imagen de cámara en C#

Tengo una imagen, tomada de una cámara web en vivo, y quiero ser capaz de detectar un objeto específico en la imagen y extraer esa parte para hacer un procesamiento posterior.Detectar un objeto en una imagen de cámara en C#

Específicamente, la imagen sería de un tablero de juego, digamos a los fines de esta pregunta que es un tablero de Sudoku. Aquí hay un sample image.

Mi enfoque inicial fue buscar áreas contrastantes y resolverlas a partir de ahí, pero parece que terminé con muchos bordes potenciales (muchos erróneos) y sin pistas reales sobre cómo saber cuáles son los ¡los que realmente quiero!

¿Existen algoritmos, librerías, muestras de código o incluso ideas brillantes por ahí, sobre cómo encontrar y extraer la parte relevante de la imagen?

Fuente

2009-07-31 Jon Grant

utilice la biblioteca de procesamiento de imágenes AForge.Net gratuita para esto. hay un montón de cosas geniales para jugar.

Fuente

2009-07-31 10:38:20

El hecho de que alguien te dé un martillo no significa que puedas construir una casa. Tener herramientas es útil, pero debes saber qué vas a hacer con la herramienta. –

Necesita realizar operaciones de filtros y máscaras en la imagen.

Creo que no hay formas simples de para obtener un objeto de la imagen, debe usar algoritmos de detección de bordes, recorte y establecer los criterios para objetos/imágenes válidos.

También puede usar el umbral de imagen para detectar objetos. Aquí está article and algorithm de Stanford Uni.

Es posible que desee consultar la siguiente biblioteca de procesamiento de imágenes.

Filters API para C, C++, C#, Visual Basic .NET, Delphi, Python
http://www.catenary.com/
CIMG más rica que la biblioteca anterior sin embargo, está escrito en C++

Fuente

2009-07-31 10:18:56 Sun

Una de las (Supongo que muchos posibles) enfoques:

Encuentra un filtro que "obtiene/calc ula "líneas rectas (bordes, etc.) de una imagen determinada.
Ahora tiene la colección (conjunto) de todas las líneas (xStart, yStart & xEnd, yEnd). Puede calcular fácilmente todas las longitudes de línea a partir de las coordenadas.
Ahora, teniendo en cuenta que siempre se puede (!) Esperar "un cuadrado más grande/rectángulo" dentro de la imagen, sería bastante fácil encontrar y calcular la región deseada-sudoku-rectángulo y recortarla de la imagen para hacer un procesamiento adicional.

EDITAR: Solucionar/programar ese tipo de problemas es siempre desafiante PERO realmente interesante al mismo tiempo :).

Fuente

2009-07-31 10:35:26 sabiland

Puede intentar primero encontrar las intersecciones en negrita y usarlas como marcas de registro.

Este sería un buen comienzo porque:

son bastante uniformemente en forma de
Usted sabe cuántos hay
usted sabe dónde (más o menos) que deben estar en relación con los demás
variaciones de escala pueden tolerar

Así

Aplicar un filtro de borde
Escanear una máscara * de lo que el ideal + debería parecerse a través de la imagen, la grabación de todo lo que es un buen partido
Seleccione el conjunto que coincide con sus expectativas mejores, según ubicación relativa entre sí
Ahora también sabe dónde deben estar los números, para que pueda extraerlos fácilmente.

* Una solución más sofisticada sería usar una red neuronal en lugar de una máscara para reconocer las intersecciones. Esto podría valer la pena ya que es probable que vayas a usar uno para el OCR de los números.

Fuente

2009-07-31 11:12:45 pufferfish

+1 por idea, -1 por sugerir un NN –

Las imágenes son ruidosas, y las redes neuronales manejan bien los datos ruidosos. Es por eso que se usan en OCR. Dicho esto, prefiero tu sugerencia de detector Harris ... ¿tal vez como una entrada a una NN? ;-) – pufferfish

Esta es la característica de Coding4Fun blog entry que puede ser útil. Esto también significa una segunda votación para la biblioteca AForge, ya que el autor la usa en el ejemplo.

Fuente

2009-07-31 13:02:42 chsh

Puede intentar usar el Hough Transform.

Fuente

2009-07-31 14:17:12 plinth

Comenzaría usando un detector de esquina (el detector Harris funciona bien) para encontrar las intersecciones y las esquinas de la cuadrícula de sudoku.

Entonces usaría esos puntos para hacer una rectificación de imagen para transformar la imagen y hacer que la cuadrícula sea lo más rectangular posible. Ahora no debería tener problemas para encontrar cada cuadrado para hacer OCR.

La rectificación de la imagen no es simple y conlleva bastantes cálculos matemáticos.

estar preparado para hacer un poco de lectura :)

Si las imágenes de los tableros de juego son ya cerca rectangular por supuesto puede omitir la parte de rectificación y utilizar directamente los puntos de esquina para encontrar sus plazas para OCR.

Mucha gente ha sugerido utilizar redes neuronales. Estoy bastante seguro de que lanzar una red neuronal sobre este problema es totalmente innecesario. Los NN son (a veces) buenos si necesita clasificar objetos donde la definición del objeto es vaga. "Encontrar coches en la imagen" es un problema que podría tener un uso para una red neuronal ya que los automóviles pueden verse muy diferentes pero tienen algunas características iguales. Por lo tanto, con suficientes datos, puede entrenar a su NN para detectar automóviles. En este problema, tiene algo que es muy regular y siempre se ve casi igual, por lo que un NN no hará que nada sea más fácil o mejor.

Fuente

2009-08-02 07:59:57

+1 para "Prepárate para leer un poco :)" – Niki

Sin rechazar ninguna de las otras ideas, el paso 1 realmente debería ser la detección de la rotación de la imagen. Puede hacer esto determinando el gradiente local en cada punto y creando un histograma del mismo. Esto tendrá 4 componentes principales en desplazamientos de 90 grados.Idealmente, estos serían 0, 90, 180 y 270, pero si no lo son, debería rotar su imagen. P.ej. en la imagen de muestra debe comenzar con una rotación de aproximadamente 8 grados CW.

Fuente

2009-08-11 14:50:21 MSalters

Uso colorfiltering aforge

Hay muchas método de filtrado previsto C#, principalmente prefiero filtros aforge, para este fin tienen unos filtros, son

* ColorFiltering 
* ChannelFiltering 
* HSLFiltering 
* YCbCrFiltering 
* EuclideanColorFiltering

See here

Fuente

2010-12-24 14:36:57 xfill

Debe buscar en google CamShift o Blob tracking o Filtros de partículas. Todos son útiles para su problema. Y la mayoría de ellos se envían con OpenCV y su envoltorio de C# AForge.NET. Encontrarás algunas demos agradables en Youtube que muestran cómo funcionan.

Buena suerte

Fuente

2013-05-03 14:02:56 Matthias

Tome un vistazo a: https://github.com/dajuric/accord-net-extensions

La biblioteca "se une" la biblioteca libre AForge.NET y Accord.NET y suma de procesamiento de imágenes y de objetos de seguimiento de algoritmos. Muestras incluidas :)

Fuente

2014-08-06 00:22:57 dajuric

Detectar un objeto en una imagen de cámara en C#

Respuesta

Cuestiones relacionadas