Google Duplex o cómo conversar de forma natural con una máquina

Estamos ante una de las grandes sorpresas tecnológicas en lo que llevamos de año: Google Duplex podrá hacer llamadas telefónicas reales por nosotros, y puede que la otra persona al lado del teléfono ni siquiera se de cuenta que está hablando con una máquina.

Así es, Google Duplex, el sistema de inteligencia artificial aplicado a la automatización de las conversaciones telefónicas fue presentado hace unos días en la conferencia anual de Google donde fuimos testigos por primera vez de cómo la compañía logró que su asistente de voz sonara tan real mediante combinaciones de sistemas.

La demostración que Sundar Pichai, CEO de Google, hizo durante la conferencia Google I/O 2018 nos dejó a todos con la boca abiera, ciertamente la tecnología dejó patente su capacidad para hacer llamadas y mantener una conversación como lo haría una persona común y corriente.

Google Duplex

El sistema asistente de voz “Assitant” o Google Dúplex, es el resultado de varios años de trabajo. En el ejemplo que decidieron mostrar en la conferencia, pudimos apreciar como “el asistente” de la llamada del sistema hizo una reserva en un restaurante que no acabó de resolverse del todo —”no reservamos para menos de 5 personas, podéis pasaros directamente, habrá sitio”—, pero aún así el asistente consiguió lo que el usuario deseaba: no tener que hacer él la llamada y obtener esa reserva (o algo parecido a ella).

¿Cómo funciona realmente Google Duplex? 

Para que Assitant logre mantener una conversación fluida, su sistema se basa en una Red Neuronal Recurrente (RNN), que no es más que un sistema conectado entre sí para ir aprendiendo a través de la experiencia y queda fijo en el sistema, desarrollada mediante TensorFlow Extended.

Para diferenciar el contexto, el sistema hace uso de la tecnología Automatic Speech Recognitión (ASR) de Google y analiza distintos parámetros para diferenciar el contexto y entender lo que el interlocutor le está diciendo.

Por otro lado, para que su voz suene tan natural, usa el sistema de dictado a través de Tacotro y WaveNet para controlar las entonaciones.

El sistema es capaz de mantener conversaciones de forma “totalmente autónoma, sin intervención humana”, aunque también integra un sistema de monitorización que avisa a un operador humano de que cierta tarea no ha podido ser completada.

Google Duplex, de momento sólo está pensado para reservas de servicios, algo que reduce el contexto de preguntas y respuestas y que lo acota para hacer todo más manejable.

También podría gustarte

Los comentarios están cerrados.

Product added successful