Google veut sauver 10 langues en danger de disparition

La firme américaine lance des outils de crowdsourcing sur sa plateforme Woolaroo pour préserver les langues en voie d’extinction.

Il existe des milliers de langages dans le monde. Mais au fil du temps, une partie d’entre z-eux dépérit. Les nouvelles générations ne les utilisent plus et préfèrent employer une langue nationale plus répandue. C’est le cas des patois employés en Europe, qui se sont perdus en quelques générations, mais aussi des dialectes indigènes remplacés par des langues occidentales bien souvent issues de la colonisation. D’après Google, une langue disparait tous les 14 jours.

Pour essayer de garder une trace de ces langages, Google a mis en place le projet de plateforme Woolaroo dans le cadre de son service Art and Culture. La firme de Mountain View n’en est pas à sa première tentative de préservation des langues en danger d’extinction. Le service Traduction réunit déjà en effet environ 110 langues et Google répertorie déjà d’autres dialectes sur le côté. Mais la force de ce nouveau projet réside dans l’utilisation du crowdsourcing, la collecte du savoir grâce à la foule.

Google n’essaye donc pas de répertorier des langues tout seul, mais avec l’aide des membres de sa communauté qui parlent le dialecte en question. Ceux-ci peuvent émettre des commentaires, relever des nuances, corriger des fautes, préciser la prononciation, etc. Cela permettra aux générations futures qui ne parleront plus la langue de pouvoir se référer à la plateforme pour s’instruire sur la signification et la prononciation de certains mots. Cela est d’autant plus pertinent lorsque l’on cherche à endiguer l’oubli d’une langue dans une culture de transmission orale. C’est le cas des langues aborigènes australiennes, dont le nom Woolaroo est inspiré.

La langue aborigène Yugambeh n’est plus parlée que par une poignée d’individus (crédit : Google)

L’application fonctionne en réalité augmentée et permet de prendre une photo ou d’en soumettre une. Ensuite, Woolaroo l’analysera et traduira les éléments présents sur la photo. Il est amusant de noter que bon nombre de ces dialectes n’ont pas toujours de nom pour certains objets modernes, d’où les nuances utiles fournies par la communauté.

Les langues répertoriées actuellement sont au nombre de 10 : la langue aborigène Yugambeh, la langue juive Yiddish, la langue berbère Tamazight, la Polynésienne de l’ile de Pâques Rapa Nui, l’aztèque Nawat, la néo-zélandaise Maori, le grec de Calabre, le sicilien, le créole de Louisiane et la langue taï de Chine Yang Zhuang. Ces langues sont tout au plus parlées par quelques milliers de personnes, parfois juste une centaine. Il est prévu d’ajouter plus de dialectes dans le futur. Il est pour l’instant possible de traduire les langues en anglais, français, arabe et espagnol.