Máster Tesis: Traductor de Lenguaje de Signos utilizando Microsoft Kinect XBOX 360
Video del resultado final de la tesis
Método
La Figura 2 muestra el diagrama de flujo para cada uno de los fotogramas que la cámara captura. Por cada fotograma, se obtienen los puntos de interés, se normalizan y finalmente se crea el descriptor. El modo de trabajo en cada momento (PROBANDO/ENTRENANDO), define a qué base de datos va a ser añadido este descriptor. Si el modo de trabajo actual es PROBANDO, y una vez se ha añadido el último fotograma del signo, el clasificador es el elemento que se encarga de comparar este signo con los signos del diccionario y dar como salida del sistema la palabra a la que pertenece este signo.
A) OBTENER LOS PUNTOS DE INTERES
El sistema usa los 6 puntos de interés que se muestran en la Figure 3. Estos puntos son las dos manos (LH,RH), los dos codos (LE,RE), el torso (T), y la cabeza (H). Los dos últimos son solamente usados para para normalizar los datos. También aquí se aplican diferentes pesos a los puntos de interés dependiendo de la importancia que tiene cada uno en la descripción del signo.
B) NORMALIZACION DE LOS DATOS
Invariante a la posición del usuario:Todos los puntos de interés se representan con respecto al torso (T) para hacer que el sistema funcione independientemente de la posición que el usuario ocupe en la habitación.
Invariante al tamaño del usuario:
Los puntos de interés son expresados usando coordenadas esféricas (Figure 4), y las distancias d son normalizadas por el factor dHT de la Figure 5 para hacer que el sistema funcione independientemente de la altura o tamaño del usuario.
C) DESCRIPTOR
Después de haber evaluado la importancia de cada uno de los parámetros d, θ, y ϕ, sólo d y ϕ parecen ser descriptivos. Es por eso que el descriptor final es un descriptor de 8 dimensiones como el de la Figure 6 y contiene los valores de d and ϕ para cada uno de los puntos de interés y cada uno de los fotogramas.
D) CLASIFICADOR

