CORPUS DE VOZ REALIZADO EN LA UNAM ES REGISTRADO A NIVEL MUNDIAL

Posted by . on jueves, 16 de abril de 2015 0

De la corresponsalía

Ciudad de México-. Un corpus para reconocimiento de voz en español, con el acento que se habla en el centro de México y desarrollado por completo en la Facultad de Ingeniería (FI), ingresó al Linguistic Data Consortium, de la Universidad de Pensilvania (UPenn), que lo distribuirá con acceso abierto a todo el mundo; la UNAM conservará los derechos de distribución.

Así lo informó Abel Herrera Camacho, uno de los titulares del proyecto, profesor de posgrado y licenciatura en Ingeniería y responsable del Laboratorio de Procesamiento de Voz, en el que durante dos años el académico, además de Carlos Hernández y 23 alumnos de licenciatura y maestría, han trabajado para desarrollar un corpus propio y aceptable internacionalmente. Gracias a un proyecto PAPIIT de esta casa de estudios se han tenido los recursos para lograrlo.

Conjunto de datos

El sistema, llamado Corpus de Investigación en Español de México del Posgrado de Ingeniería Eléctrica y Servicio Social (CIEMPIESS), es un conjunto de datos conformado por 16 mil 717 archivos de audio obtenidos de una estación de radio de la Facultad de Derecho (FD), cada uno con la grabación de la voz de una persona, sin ruido ni música de fondo.

Entre los avances de esta tecnología, logrados hasta ahora por el Laboratorio de Procesamiento de Voz de la UNAM, destacan su uso en aplicaciones domóticas como controlar luminarias, cortinas o puertas, así como su función para mover, con la voz, una prótesis de brazo mecatrónico.

"Queremos profundizar en la relación entre el ser humano y la máquina, para que mediante el reconocimiento de voz un usuario pueda controlar su habitación o máquinas de trabajo, cambiar de canal a la televisión o subir y bajar su volumen", explicó Herrera.

Especialmente útil para personas con discapacidad física, también posee un gran potencial como traductor de idiomas. "Tenemos interés en desarrollar uno de español a lenguas mexicanas; es un proyecto a futuro que busca hacer una aportación al país para mantener nuestro patrimonio cultural", adelantó.

Miniaturizar, nuevo reto

El nuevo reto de los ingenieros de esta área del conocimiento está en miniaturizar los componentes y microcircuitos que conforman el sistema.

"Es indispensable mantener el procesador central que funciona como cerebro del equipo, así como algunas memorias, interfaces y la fuente de poder para alimentar al sistema, pero necesitamos utilizar lo mínimo con la máxima eficiencia y reducir su tamaño para introducirlo en dispositivos como teléfonos inteligentes y grabadoras portátiles", reconoció.

El próximo objetivo de Herrera y sus colaboradores es lograr que el reconocimiento funcione en tiempo real y en dispositivos más pequeños que una computadora. Para ello, se empleará un microcontrolador de bajo costo, que a futuro podrá instalarse en los hogares o en dispositivos comerciales.

"Nuestro propósito es reducir el actual microcontrolador que usamos en el laboratorio a un octavo de su tamaño y un décimo de su valor económico, para que sea accesible a los usuarios en México", dijo.

El CIEMPIESS está etiquetado a nivel palabra; por cada archivo de audio hay uno de texto que revela en qué segundo inicia y termina una palabra, expuso el universitario.

El corpus fue donado al Linguistic Data Consortium para que ellos lo distribuyan en su sitio, pero también puede descargarse sin costo en la página http://www.ciempiess.org.

El sistema de reconocimiento de voz se nutrió con los boletines de la UNAM publicados en este portal entre 2010 y 2013, de los que se extrajeron 1.5 millones de palabras para generar el modelo

de lenguaje.

"Una de sus características más notables es que indica la vocal tónica de cada palabra, tanto en su archivo de transcripción como en el modelo de lenguaje. Además, el diccionario de pronunciación del sistema fue creado con herramientas automáticas desarrolladas en nuestro laboratorio", apuntó.

Actualmente, este tipo de sistemas están en boga en el mundo, y naciones como la nuestra enfrentan el reto de ser consumidores o constructores de sus propios avances tecnológicos. "Nuestro deber como profesores es aportar al país, junto con los estudiantes. En este caso la UNAM hace innovación por México", finalizó.

 

 

Tagged as:
About the Author

Write admin description here..

Get Updates

Subscribe to our e-mail newsletter to receive updates.

Share This Post

Related posts

0 comentarios:

Total de visitas

Tecnicos capacitados con alta tecnologia garantizan nuestro servicio

Tecnicos capacitados con alta tecnologia garantizan nuestro servicio
Tecnicos capacitados con alta tecnologia garantizan nuestro servicio

Laboratorio 40

Laboratorio 40
A un costado del jardín municipal de Texcoco Andador Bravo No. 100. Visitanos excelentes descuentos

Sucursal calle Còlon no.103 Centro Texcoco de Mora Edomex

Latest Tweets

Blog Archives

© 2013 REGION 11. WP Theme-junkie converted by Bloggertheme9
back to top