Revista de ingeniería informática y tecnología de la información

Traducción de voz a voz mediante servicios basados ​​en la nube y modelos de aprendizaje profundo

Ajit R Patil*, Kamlesh Patil y Sonal Patil

En las últimas décadas, con la llegada de Internet y las redes sociales, se ha formado una comunidad global y su aplicación directa para una comunidad subdesarrollada. El aprendizaje cognitivo es uno de los campos de investigación más buscados que busca mejorar la interacción entre humanos y computadoras. Este artículo presenta una aplicación para la traducción de voz a voz utilizando una combinación de servicios en la nube y modelos de aprendizaje automático de última generación. Para la traducción de voz a voz, se investiga una arquitectura de tres fases que contiene voz a texto basada en la nube, traducción de voz, extracción de tokens, modelo de síntesis de voz basado en redes neuronales profundas y un vocoder también basado en redes neuronales profundas. Nuestro enfoque principal en este estudio es crear un sistema robusto para la traducción de idiomas de voz a voz y la aplicación de este sistema.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.