Crédit photo : Tolga Akmen/AFP

L’algospeak, un langage pour tromper les algorithmes

Les internautes inventent de nouveaux mots pour contourner les algorithmes de modération de contenu dans le cadre d’un langage surnommé “algospeak”.

La pandémie de coronavirus a attiré une vague de nouvelles personnes sur les plateformes de communication virtuelles en ligne. Alors que de plus en plus de gens ont commencé à s’exprimer en ligne, les systèmes algorithmiques de modération du contenu ont eu un impact sans précédent sur les mots choisis par les utilisateurs. Et en particulier sur TikTok.

Retour sur la naissance d’une nouvelle forme de langage sur le Web.

L’algospeak comme méthode de contournement des systèmes de modération

L’algospeak désigne les mots de code ou les tournures de phrase que les utilisateurs ont adoptés pour créer un nouveau lexique. L’objectif ? Éviter que les systèmes de modération du contenu ne déclassent ou ne suppriment leurs messages. Autrement dit, cela représente l’action de remplacer des phrases défavorisées par les algorithmes des médias sociaux par des phrases apparemment inoffensives.

À savoir que, sur les plateformes de médias sociaux, les publications peuvent être automatiquement retirées si elles contiennent du contenu toxique ou considéré comme inapproprié par les règles de modération. Pour contourner ces règles, les gens remplacent donc les mots interdits par d’autres que les algorithmes ne reconnaissent pas (encore).

L’exemple de TikTok

TikTok a été un tremplin pour le phénomène. Et ce, car sur cette plateforme, le principal moyen de diffusion du contenu est une page appelée “For You”. Le contenu de cette dernière étant sélectionné par une intelligence artificielle, cela a conduit les utilisateurs à adapter leurs vidéos en fonction de l’algorithme. Le respect des règles de modération du contenu est ainsi devenu plus crucial que jamais.

En bref, pour les créateurs de contenus, il est essentiel d’être repéré par l’algorithme de cette page pour faire exploser sa cote de popularité. Petite anecdote, selon le Washington Post, les créateurs les plus célèbres tiendraient même un Google Doc. Ce document servirait de répertoire des mots risquant d’être censurés par la plateforme.

Aux origines de l’algospeak

Déjà dans le passé, des groupes de gens ont utilisé l’adaptation du langage pour éviter des sanctions ou d’autres conséquences négatives. Par exemple, de nombreuses personnes vivant dans des régimes répressifs ont développé des noms de code pour discuter de sujets tabous.

Autre illustration, les premiers utilisateurs d’Internet utilisaient une orthographe alternative pour contourner les filtres de mots dans les forums de discussion et les jeux en ligne. Depuis, les systèmes de modération sont devenus bien plus performants, tous comme les techniques pour les tromper.

Le Voldemorting et le leet speak, les ainés de l’algospeak

Le terme “Voldemorting” existe depuis plusieurs années. Cette pratique fait référence aux personnages de la série de livres Harry Potter qui appellent Voldemort “celui dont on ne prononce pas le nom”. Il s’agit d’une pratique web qui consiste à éviter d’utiliser un nom, une marque ou un mot-clé et à le remplacer par un autre terme. À la base, l’objectif est de priver délibérément les célébrités ou les sites web d’attention ou de clics en ne les désignant pas par leur nom. Bien sûr, cela a des conséquences en termes de référencement, et c’est le but.

Autre exemple, le leet speak, dans lequel les lettres sont souvent remplacées par des chiffres ou des caractères spéciaux, est apparu dans les années 1980. Cet argot informatique du début d’Internet est donc un des prédécesseurs du Voldemorting et de l’algospeak.

Ainsi, à mesure que l’algospeak se popularise et que les mots de remplacement s’introduisent peu à peu dans le langage commun, les utilisateurs constatent qu’ils doivent faire preuve de toujours plus de créativité pour échapper aux filtres. Mais il faut bien comprendre que ces messages en “algospeak” ne sont pas toujours offensants. Parfois, les gens utilisent ces phrases inventées pour parler de sujets sensibles comme la santé mentale ou la sexualité.

Libérer la parole

L’utilisation de l’algospeak peut aider les créateurs de contenu à aborder des sujets sensibles. Et ce, sans que le système de modération du contenu ne retire ou ne supprime leurs messages.

Par exemple, dans de nombreuses vidéos en ligne, il est courant de dire “SA” plutôt que “sexual assault”, “unalive” plutôt que “dead”, “spicy eggplant” plutôt que “vibrator”, de remplacer “weed” par “ouid”, ou encore, d’utiliser “devenir non vivant” pour se confier sur ses pensées suicidaires. En effet, certaines recherches comme “anorexie” et “suicide” préfèrent renvoyer l’utilisateur vers des ressources d’assistance ou des numéros verts, plutôt que de le rediriger vers des vidéos à ce sujet. De même, les travailleurs du sexe, qui ont longtemps dû faire face à la censure des systèmes de modération, se désignent sur TikTok comme des “comptables” et utilisent l’émoji maïs pour remplacer le mot “porno”.

À suivre, un exemple un peu plus ancré dans l’actualité. Récemment, lors de discussions sur l’invasion de l’Ukraine, des internautes sur YouTube et TikTok ont utilisé l’émoji tournesol pour désigner le pays.

_
Suivez Geeko sur Facebook, Youtube et Instagram pour ne rien rater de l'actu, des tests et bons plans.