Google lance WAXAL, une base de données vocale pour les langues africaines

Google lance WAXAL, une base de données vocale pour les langues africaines

Google logo

Google a annoncé le lancement de Waxal, une nouvelle base de données vocale conçue pour renforcer les technologies d’intelligence artificielle dans les langues africaines. Cette initiative s’inscrit dans les efforts du géant technologique pour élargir l’inclusion linguistique dans les systèmes d’IA, en mettant l’accent sur des langues souvent sous-représentées dans les technologies vocales actuelles.

L’objectif principal de Waxal est de créer une collection de données vocales de haute qualité regroupant des enregistrements, des transcriptions et des métadonnées  qui puissent être utilisées pour entraîner, tester et améliorer des modèles d’intelligence artificielle spécialisés dans la compréhension et la synthèse de la parole dans plusieurs langues africaines. En amont, ces ressources aideront à développer des applications vocales plus précises et plus naturelles pour des communautés linguistiques locales.

Cette base de données est conçue pour faciliter la création d’assistants vocaux, de systèmes de reconnaissance vocale, de traducteurs automatiques ou d’applications conversationnelles adaptées aux besoins spécifiques des populations africaines. Elle vise également à réduire le biais linguistique présent dans de nombreux modèles IA qui fonctionnent très bien dans les langues mondiales dominantes (comme l’anglais ou le français), mais beaucoup moins bien dans des langues à ressources limitées.

Waxal se concentre sur plusieurs langues africaines importantes, notamment :

  • Wolof (majoritairement parlé au Sénégal),

  • Fula / Pulaar (présent dans de nombreux pays d’Afrique de l’Ouest),

  • Hausa (parlé au Nigeria, Niger et régions voisines).

Ces langues ont été identifiées comme prioritaires du fait de leur large base de locuteurs et de la pénurie de données vocales de bonne qualité disponibles pour l’IA.

Dans les technologies vocales et l’IA conversationnelle, la qualité et la diversité des données vocales d’entraînement sont essentielles. Les modèles de reconnaissance et de synthèse de la parole dépendent de corpus vocaux riches pour apprendre à comprendre les accents, les tonalités et les particularités phonétiques propres à chaque langue.

Sans données représentatives, les applications vocales peuvent être inefficaces ou biaisées, ce qui limite leur utilité pour les locuteurs natifs de langues moins couvertes. Waxal s’attaque à ce problème en offrant une ressource structurée qui permettra à des chercheurs et à des développeurs d’IA de créer des modèles plus justes, plus précis et culturellement adaptés.

Selon Google, cette base de données sera mise à disposition de la communauté scientifique, des développeurs d’IA et des institutions qui souhaitent bâtir des technologies vocales inclusives. Bien que les modalités exactes d’accès (licence, API, conditions de réutilisation) n’aient pas été toutes détaillées publiquement, l’intention est de favoriser un écosystème ouvert et collaboratif autour de Waxal.

L’entreprise souhaite que cette initiative stimule la recherche linguistique appliquée à l’IA, tout en encourageant le développement d’outils comme des assistants vocaux locaux, des services d’accessibilité ou des applications éducatives adaptées aux populations africaines.

 

 Envie d’en savoir plus ? Voici quelques liens intéressants.

Sources 

Image de https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcTJHjrQV5pV2xgdOjlmt_TbZim4WUejB4jWtA&s 

https://www.agenceecofin.com/actualites-numerique/0402-135474-google-lance-waxal-une-base-de-donnees-vocale-pour-les-langues-africaines 

https://www.latribune.fr/article/afrique/72119028515116/ia-vocale-et-langues-africaines-google-tisse-progressivement-sa-toile-sur-le-continent 

https://blog.google/intl/en-africa/company-news/outreach-and-initiatives/introducing-waxal-a-new-open-dataset-for-african-speech-technology/ 

Author

IAredac