Le géant de la tech a intégré à son service de traduction 24 nouvelles langues, dont dix africaines, jusqu’à présent largement sous-représentées.
Après l’amharique, le haoussa ou encore le swahili, ce sont dix nouvelles langues africaines qui pourront désormais être traduites par le service Google Traduction. Aux côtés de langues asiatiques ou sud-américaines, comme le bhojpuri (Inde, Népal, Fidji), le dhiveri (Maldives) ou le quechua (Pérou), une poignée de nouveaux idiomes, parmi les quelque 2 000 utilisés sur le continent africain, sont donc mis à disposition des internautes.
Ce service gratuit proposé par Google permet de traduire instantanément des phrases et textes entiers dans 133 langues différentes. Sont désormais proposés le bambara (Mali), l’ewe (Ghana, Togo), le krio (Sierra Leone), le lingala (Afrique centrale), le luganda (Ouganda, Rwanda), l’oromo (Éthiopie), le sepedi (Afrique du Sud), le tigrinya (Érythrée, Éthiopie), le tsonga (Afrique du Sud) et le twi (Ghana). Plus de 300 millions de personnes parlent couramment ces 24 nouveaux idiomes disponibles à la traduction.
Nouvelle technologie
Google se targue ainsi d’aider à « briser les barrières linguistiques » et « connecter les communautés du monde entier », assurant soutenir les peuples dont les langues restent sous-représentées dans la plupart des technologies. « Les utilisateurs de Google Traduction n’ont jamais été aussi nombreux, mais nous avons encore du travail à faire pour le rendre universel et accessible à tous », a déclaré le 11 mai le PDG du géant de la tech, l’Indien Sundar Pichai. Il s’exprimait à l’occasion de « Google I/O », une conférence annuelle de deux jours organisée par Google au Moscone Center de San Francisco, en Californie.
Cette innovation représente une « nouvelle étape importante » dans la technologie utilisée par Google Traduction, a insisté Isaac Caswell, ingénieur de Google. « Ces langues sont les premières qui ont été ajoutées via le logiciel de traduction ‘Zero-shot’», a expliqué l’ingénieur. Ce modèle d’apprentissage permet à cette machine de traduire une langue sans s’inspirer d’un exemple existant.
Les langues représentées sont principalement européennes et négligent des régions linguistiquement très variées, comme l’Afrique
À l’origine, pour élaborer le service Google Traduction, l’entreprise s’était servie de dictionnaires bilingues. Une approche coûteuse et chronophage, qui sera remplacée par la suite par une traduction automatique statistique, basée sur une importante base de données. Pour ces 24 nouvelles langues, la machine d’intelligence artificielle permet donc de traduire des textes, même sans base de données préalable.
Cette innovation participe à « l’extension de la couverture à de nombreuses communautés qui étaient très négligées, non seulement par Google mais aussi par d’autres technologies en général », a ajouté Isaac Caswell.
Les langues africaines négligées
Google s’est également appuyé sur des personnes dont ces 24 nouveaux idiomes sont les langues maternelles. « Leur aide a été fondamentale dans notre travail », a insisté l’entreprise, qui a collaboré avec plus de 100 personnes et institutions.
« Bien que les services de traduction couvrent les langues les plus parlées dans le monde, ils n’en incluent au final qu’une centaine au total, soit 1% seulement de l’intégralité des langues existantes, a concédé Google. De plus, les langues représentées sont principalement européennes et négligent des régions linguistiquement très variées, comme l’Afrique ou les Amériques. » (Jeune Afrique)