Google usará Reddit para mejorar el reconocimiento de voz

Comparte:

El reconocimiento de voz se ha vuelto parte integral de la tecnología moderna. Alexa, Siri, Cortana y Google Now utilizan distintos algoritmos para desenmarañar uno de las características humanas básicas: el lenguaje. 

A través de los años, los investigadores se han dado cuenta de que muchos usuarios que tienen algún tipo de acento en su forma de hablar lo intentan modificar para que sus equipos reconozcan lo que están diciendo.

Las maquinas son “entrenadas” con distintos métodos y son capaces de distinguir varios tipos de pronunciaciones. En los años 90, un proyecto llamado “Call Home” recopilaba conversaciones de larga distancia para después ser alimentadas al algoritmo que reconoce el lenguaje, con la esperanza de que fuera capaz de distinguir entre diversos acentos.

Pronto se dieron cuenta de que la solución es recabar la mayor cantidad de datos posibles. Google lleva considerable tiempo haciendo esto y se ha apoyado en terceros como Appen para recopilar distintos samples de audio de múltiples usuarios. El siguiente video explica a detalle el proceso:

Utilizando la red social Reddit, los empleados de Appen han creado foros bajo diferentes categorías y han pedido a los usuarios utilizar un teléfono Android para grabarse diciendo distintas frases, a cambio de un pago de $35 dólares por grabar 2000 frases. Como era de esperarse, la mayoría de estas frases están dedicadas a Google y su clave para iniciar una búsqueda de voz: “OK Google”.

Las empresas han comparado este proceso a las pruebas farmacéuticas. Hasta 1993, los laboratorios utilizaban mayoritariamente hombres blancos; en la actualidad, es ilegal no incluir a mujeres y minorías en este tipo de investigación. Si personas de todo tipo usan servicios como Alexa, Google Now o Siri, lo lógico es que utilicemos todo tipo de acentos cuando alimentamos las bases de datos, explicó Marsel Gavalda, líder de reconocimiento de voz para Yik Yak, en una entrevista para The Verge.

Fuente: The Verge

 

 

Navigate