Les Captcha de CNN, E-Bay, et Wikipédia forcés !

Une université américaine a créé un logiciel capable de forcer les tests de reconnaissance humaine sur internet (appelé aussi test Turing ou Captcha). Les chercheurs en profitent aussi pour proposer des solutions. Eclairage.

C’est devenu une habitude sur le net. Montrer patte blanche. Prouver que nous sommes bien des êtres humains. Pour n’importe quoi. Commenter l’article d’un blog, poster sur un forum. Faire ses courses. Aucun internaute n’échappe au test Captcha. Ces caractères écrits de manières bizarroïdes, de telle sorte qu’un ordinateur ne saurait pas le lire !

Le but : lutter contre les messages automatiques (spams), envoyés par ordinateur. A en croire une étude de l’université de Standford, tout cela risque de faire partie du passé puisque ces fameux Captcha peuvent être facilement lus par une machine !

Une étude réalisées sur 15 modèles de contrôle de Captcha révèlent que 13 d’entre eux ont pu être forcés par un logiciel, nommé DECAPTCHA.
Ce logiciel est capable d’identifier les caractères d’un Captcha à l’aide d’un processus de segmentation du code et d’identification des caractères. Au final, le logiciel donne une réponse exacte sur 13 Captcha sur 15. Parmi les Captcha forcés : ceux de CNN, Wikipédia, et E-Bay !

Cette étude peut inquiéter car elle signifie que d’ici quelques années, les ordinateurs pourront facilement se faire passer pour des humains, si la complexité des tests n’évolue pas.

Pour éviter que nos boîtes mails, nos forums et nos blogs ne se retrouvent envahis de spams, les chercheurs de l’Université de Standford ont émis une série de conseils dans la conception des Captcha.

La recette d’un bon Captcha :

– Utiliser une ligne qui barre les caractères du Captcha. Au plus la ligne est épaisse, au plus le Captcha est sécurisé. Il empêche la segmentation du code par le logiciel et de fait l’identification des caractères.
– La ligne doit traverser quelques caractères seulement.
– L’angle d’inclinaison de la ligne doit être le plus horizontal possible
– La ligne doit être de la même couleur que les caractères
– Le placement de la ligne doit être aléatoire.

Reste à savoir si E-Bay, CNN, ou Wikipédia suivront ces précieux conseils ! En attendant le test vocal et le contrôle rétinien…

Rémi DECLERCK (st).