Rémi MOUNIER - Ergonome - 06.67.55.28.96 -

Retour sur la page d'accueil du blogPublié le Wed 07 Sep 2011

Captcha toi-même !

La plupart des sites de diffusion d’information, invitant désormais les visiteurs à poster des commentaires dans un souci d’interactivité, a dû faire face à la propagation de robots n’ayant pour seul but que de poster des liens publicitaires. Pour filtrer un visiteur réel d’un robot spammeur, le captcha a fait son apparition. Un captcha est un système assez simple, consistant à demander au visiteur postant un message de recopier une inscription présente sur une image.

Sur mon ancien blog "Le Petit Ergonome", hébergé par Overblog, j’ai été très surpris de recevoir des e-mails de lecteurs m’indiquant qu’il leur était impossible de poster un commentaire, à cause du captcha.

La première difficulté est la compréhension de la consigne. Certains captchas proposent des énigmes, des formules mathématique, de recopier un mot… Dans le cas présent, il s’agissait de recopier deux mots, séparés par une virgule. Dans la consigne, il n’était pas indiqué s’il fallait ou non recopier la virgule.

Exemples de captchasLa deuxième difficulté réside dans le déchiffrage du captcha. Le système anti-spam se heurte sur ce point à des problèmes d’accessibilité. Les personnes non-voyantes ou mal-voyantes seront forcées d’utiliser le système audio, pourvu que celui-ci soit proposé. De plus, le principe du captcha est d’ajouter à la tâche de lecture ou d’audition un trouble perceptif. Ce dernier peut être des rayures,  des ratures, un fond coloré, une déformation des lettres, de la friture sur la bande audio… Il est important de noter qu’il ne s’agit pas d’une tâche de lecture ou d’audition courante. La difficulté ajoutée par le captcha est aussi une contrainte supplémentaire pour l’utilisateur, qui n’est absolument pas liée à sa tâche initiale : poster un commentaire. Le visiteur peut donc renoncer à publier s’il considère que le captcha est une difficulté trop importante par rapport à l’intérêt de sa publication. Gageons qu’un certain nombre de commentaires ont été perdus suite à une ou deux tentatives infructueuses de résolution de captcha.

La dernière difficulté repose sur le feedback renvoyé par le système en cas d’erreur. A l’heure où j’écris cet article, je n’ai pas encore trouvé un captcha qui indique sur quelle partie de l’image le visiteur a commis une erreur. Est-ce ce « c » qui est en réalité un « e » ? Ou bien ce « u » qui ressemble étrangement à un « v » ? La tâche de correction s’en trouve considérablement complexifiée.

Pour conclure, je ne suis pas très optimiste sur l’avenir de ce genre de protection anti-spam. Déjà, des robots spammeurs plus perfectionnés arrivent à lire correctement des images de captcha. Les progrès des logiciels de reconnaissance vocale vont forcément s’accompagner de performances poussées des méchants robots sur les tests auditifs. La seule réponse des concepteurs de captchas est d’augmenter la difficulté perceptive. Or il existe un seuil où l’être humain sera moins performant que le robot sur ce genre de tâche.

Les commentaires sur l'article

Nicolas, le Wed 07 Sep à 21h11

Et si on généralisait l'usages de questions enfantines que l'ordinateur lui ne trouverait pas simple. Reconnaître un signal l'ordinateur peut le faire, mais traiter une information ça devient moins simple déjà.
"Quelle est la couleur du cheval blanc d'Henri ?"
"Quel est le contraire de beau : moche ou cloche ?"
etc.
Je suis sur qu'on peu en générer de façon automatique en plus.

Rémi Mounier, le Wed 07 Sep à 22h54

L'ordinateur peut repérer et traiter des informations chiffrées très facilement. Les premiers captchas à avoir été contournés furent les énigmes de type : 4 + 5 = "". Pour les questions basées sur des connaissances, le problème se situe davantage au niveau de la conception du captcha. En effet, il faut que la connaissance soit partagé par tous les utilisateurs. Ce n'est pas une mince affaire. Par exemple, il me serait très préjudiciable de mettre un captcha sur ce blog du type : "Qui a développé la théorie de la charge cognitive ?". D'autre part, je pense qu'il ne serait pas trop compliqué pour un robot d'aller trouver la réponse sur des sites d'informations. Rien que sur Wikipédia, il trouverait beaucoup de réponses. Il lui suffirait de rentrer une à une les réponses les plus plausibles, en boucle, jusqu'à ce que le spam passe.

Bref, pas simple tout ça...

Jérémie CaptchMe, le Sat 10 Sep à 14h33

Hello,

Pour palier à ce genre de problème nous avons mis au point des captchas publicitaires : nous affichons une publicité en clair avec une partie du slogan à recopier en lieu et place du texte habituellement déformé.
Nos publicités sont lisibles, le passage à recopier facilement identifiable, aussi nos publicaptchas sont-ils beaucoup plus faciles et agréables à saisir qu'un captcha traditionnel.
Le captcha n'est ainsi plus un frein à la participation de vos internautes !

Pour se faire, notre service se base sur des moyens de protection innovants, alors que les captchas classiques jouent sur la déformation du texte pour contrer les robots.

Autre avantage pour le webmaster : il est rémunéré à chaque saisie utilisateur, le deal devient donc d'être payé pour être protégé du SPAM!

Je vous invite à juger notre dispositif par vous-mêmes sur http://www.captchme.com

Jérémie de CaptchMe

Déposer un commentaire