Enseñémosle a hablar a las maquinas con Common Voice de Mozilla

La Fundación Mozilla lleva varios años trabajando en una de sus mejores iniciativas de código abierto.

Common Voice, desarrollado por Mozilla

Mozilla, la fundación detrás de uno de los navegadores web más populares que existen, Firefox, es mucho más que una simple fundación con un navegador a sus espaldas. Se trata de una enorme organización formada por desarrolladores de todo el mundo, y entre todos crean y comparten herramientas basadas en tecnologías web para mejorar el mundo.

Una de sus herramientas más populares es Common Voice, una iniciativa basada en machine learning para enseñarle a las maquinas a hablar como las personas. Y cualquiera puede participar en ella.

Dando voz y apoyo

Common Voice se compone por dos sencillas mecánicas; hablar y escuchar. Desde su página web cualquiera puede colaborar poniendo su granito de arena a la iniciativa.

Por un lado la herramienta de habla consiste en recitar en el idioma escogido por el usuario varias palabra que te muestra el programa. Nada más que eso. Por otro lado la de escuchar se basa en oír palabras que han grabado otras personas y seleccionar si la palabra pronunciada se corresponde con lo que te muestra la pantalla o no.

La interfaz de Common Voice es sencilla e intuitiva
La interfaz de Common Voice es sencilla e intuitiva

Actualmente tienen registradas miles de horas de voz con todos los idiomas. En inglés, por ejemplo, tienen más de 1400 horas y 50.000 voces distintas, mientras que en español unas 220 horas y 8200 voces. En total, más de 40 idiomas en conjunto.

Toda esta información puede consultarse públicamente y con datos demográficos incluidos. Pero no hay que preocuparse, no recopilan información personal y toda la información de carácter demográfico, como la edad, el sexo, idioma o el acento, es completamente opcional. El nombre de usuario se da a escoger entre uno público o uno anónimo.

Todos los datos demográficos y estadísticas de Common Voice pueden consultarse públicamente
Todos los datos demográficos y estadísticas de Common Voice pueden consultarse públicamente

Si estás interesado en participar recomiendo mucho leer el apartado de preguntas frecuentes: https://voice.mozilla.org/es/faq

La importancia de enseñarle a hablar a las maquinas

Una iniciativa de este tipo podrá aportar mucho más que un simple software capaz de hablar como un ser humano. Por ejemplo, está ayudando mucho a Mozilla en el desarrollo de su proyecto de código abierto, DeepSpeech, que permite transcribir de voz a texto.

Otra de las posibilidades que podría aportar una iniciativa como esta es la de darle a desarrolladores la oportunidad de crear tecnologías de reconocimiento de voz mucho más avanzadas, como traductores de voz en tiempo real o asistentes controlados mediante voz.

En la actualidad este tipo de tecnologías suelen ser desarrolladas por empresas privadas como Alphabet (Google Traductor, Google Home) o Amazon (Alexa) invirtiendo grandes presupuestos y recursos en los datos necesarios para crearlas; cientos y miles de horas de voz. Por eso el hecho de que una fundación como Mozilla esté desarrollando una tecnología similar bajo el amparo del código abierto es una esperanza para todos los desarrolladores que no trabajamos en grandes corporaciones ni tenemos ingentes cantidades de dinero. Del mismo modo que cualquiera puede participar en la validación de voces, también puede descargar los datos de Common Voice y desarrollar sus propias aplicaciones.

Alexa de Amazon (izq) y Google Home de Google (der)
Alexa de Amazon (izq) y Google Home de Alphabet (der)

Esta iniciativa también es importante por el hecho de que al basarse en la libre colaboración con gente de todo el mundo, abarca tantos idiomas que nos podemos encontrar idiomas poco hablados y que por lo tanto reciben menos atención por parte de las grandes corporaciones. El catalán, por ejemplo, tiene muchas más horas de grabación que el español.

Enlace directo: Common Voice

Deja un comentario:

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *