Tomaría las dos imágenes y las reduciría a una resolución mucho más baja ... como una cuadrícula de 16 x 16, más o menos. Marque cada punto en la cuadrícula como encendido o apagado (dibujado o no dibujado).
Luego superpúpese unos a otros, y vea cuántos de los puntos se establecen en uno y no en otro. Si eso supera el umbral, márquelo como no coincidente.
Puede mejorar el algoritmo escalando la imagen dibujada. Busca los píxeles más altos y los más bajos dibujados en ambos, y escala la imagen dibujada para que coincida con la primera imagen. Usted podría hacer lo mismo con el ancho. De esta forma, un jugador no sería penalizado por dibujar una buena, pero más pequeña, versión de la imagen.
Otra mejora sería realizar comparaciones múltiples, desplazar la imagen dibujada de izquierda a derecha, arriba y abajo, tomando la "mejor" coincidencia. De esa forma no serás penalizado por sacar algo compensado del centro.
Todo es un poco hacky, pero creo que es probablemente más útil seguir esta ruta que intentar incorporar la lógica para analizar trazos y otros algoritmos basados en OCR o gestos.
Consulte la primera teoría de reconocimiento de patrones en http://en.wikipedia.org/wiki/Pattern_recognition – Lunik