Transcripción de Voz: Aplicación de los servicios de IA de Microsoft

Transcripción de Voz: Aplicación de los servicios de IA de Microsoft

En medio del gran crecimiento que han tenido las aplicaciones, herramientas y plataformas para el desarrollo de la ‘‘nueva’’ normalidad en los ámbitos educativos, laborales y sociales Microsoft lanzó una nueva función de Office 365 llamada Transcribir en Word. La nueva función permitirá a las personas transcribir audio en tiempo real a través de la inteligencia artificial de Azure Cognitive Service. No podemos pasar sin comentar este grandioso servicio, debido a la novedosa funcionalidad que tiene para el desarrollo actual de software.

Azure Cognitive Service es una familia integral de servicios de inteligencia artificial que permite a los desarrolladores crear aplicaciones inteligentes, agregando de manera sencilla características cognitivas en sus aplicaciones sin la necesidad de aptitudes o conocimientos profundos sobre ciencia de datos. (tomado de Azure Microsoft).

El catálogo de API (Interfaces de programación de aplicaciones por sus siglas en inglés) de Azure Cognitive Services se puede dividir en cinco pilares principales: Visión, Voz, Lenguaje, Búsqueda web y Decisión.

API de Visión: ayuda a identificar y analizar contenido en imágenes o videos

API de voz: permite integrar el procesamiento de voz en aplicaciones.

API de lenguaje: facilita la incorporación de procesamiento de lenguaje natural, análisis de texto y tecnología en el desarrollo de chatbot.

API de búsqueda web: Permite encontrar cualquier cosa que estemos buscando en la red mundial.

API de decisiones: ayuda a tomar decisiones más rápido, detectar anomalías o moderar contenido.

Estos servicios de inteligencia artificial añaden un gran potencial de capacidad para las empresas que de otro modo no podrían crear dichas herramientas, reduciendo los costos de investigación y desarrollo de aplicativos inteligentes.

Cerrando este interesante paréntesis, podemos distinguir como un claro ejemplo de aplicación de los servicios de inteligencia artificial desarrollados por Microsoft la nueva función de Word, ya mencionada.

Actualmente, la función está limitada a la plataforma en línea de Word, su objetivo a largo plazo es implementarla en otras herramientas 365. Con esta función, los usuarios podrán cargar varios archivos de audio para transcribirlos o grabar una conversación directamente en Word y transcribirla inmediatamente con la opción de reproducir y editar las grabaciones.

Esto podría cambiar las reglas del juego, porque piénselo: las empresas y sus trabajadores usarán esto como una forma de dictar correos, escribir propuestas, realizar informes e incluso crear contenido de una manera mucho más rápida.  También esto se puede convertir en una herramienta fantástica para los empleados en situación de discapacidad.

(tomado de News Center Microsoft Latinoamérica).

cerrar