35 artículos y proyectos de investigación en reconocimiento de voz – Descargar

Vota este post



Reconocimiento de voz

Durante siglos, ingenieros y científicos estuvieron intrigados por la idea de crear una máquina que pudiera conversar con los humanos con fluidez en un lenguaje hablado natural. Los primeros ejemplos de esta fascinación se pueden encontrar en las películas de ciencia ficción de los años 60 y 70.

La película de Stanley Kubrick de 1968 “2001: Una odisea del espacio” y la famosa saga de Star Wars de George Lucas, por ejemplo, tenían una computadora inteligente llamada “HAL” y droides móviles como R2D2 y C3PO respectivamente, que podían moverse interactuando con personas y otros droides. en el lenguaje humano natural.

Entre los primeros intentos genuinos de reconocimiento de voz se encontraba un «reconocedor de dígitos» llamado Audrey (1952) de Bell Laboratories que solo podía reconocer números hablados, Shoebox de IBM (1962) que podía entender 16 palabras en inglés y Harpy (1976) de Carnegie Mellon. que podía comprender 1011 palabras.

En un avance significativo, el desarrollo del modelo de Markov en la década de 1980 fue capaz de determinar una palabra a partir de un sonido desconocido, sin depender de patrones de habla o plantillas fijas. Condujo a la invención de varias aplicaciones industriales y comerciales. Pero todos los sistemas de reconocimiento de voz de los años 80 tenían un gran defecto: había que tomarse un descanso entre cada palabra hablada.

El mundo tuvo que esperar hasta 1997 para echar un vistazo al primer reconocedor de voz continuo del mundo: Dragon NaturallySpeaking. Capaz de comprender 100 palabras por minuto sin ninguna pausa, todavía está en uso hoy en día.

En una interfaz de persona a máquina, una señal de voz se transforma en una forma de onda analógica y digital que la máquina puede entender. Las tecnologías del habla se utilizan mucho y tienen usos ilimitados. Estas tecnologías permiten que los dispositivos respondan de manera correcta y confiable a las voces humanas y brinden servicios útiles y valiosos.

En esta publicación, enumeramos los 35 principales trabajos y proyectos de investigación en reconocimiento de voz, publicados recientemente. Siéntase libre de descargar. Comparta sus propios trabajos de investigación con nosotros para agregarlos a esta lista.




Nuestro equipo editorial está formado por un grupo de jóvenes expertos dedicados a la investigación en robótica, inteligencia artificial y aprendizaje automático. ¿Te gustaría ser parte de este equipo? Haga clic en ‘Escribe para nosotros’ para contactarnos.