Recaptcha, une idée lumineuse !
26/05/2007
Commençons par les captchas : vous avez probablement utilisé des captchas, sans forcement en connaître le nom. Ce sont ces contrôles faits par une application qui vous demande de recopier un ensemble de lettres et de chiffres aux formes complexes, sur des fonds difficiles à lire.
L’objectif d’un captcha est de s’assurer que c’est une personne qui répond et non pas un automate informatique.
Ce nom est l’acronyme de :
“Completely Automated Public Turing test to tell Computers and Humans Apart”.
Il a été choisi pour rendre hommage au professeur Turing, qui, le premier, avait imaginé un test permettant de déterminer si un ordinateur pourrait, un jour, se faire passer pour un humain.
Les premiers captchas ont été développés en 2 000 à l’Université Carnegie Mellon et utilisés pour la première fois par Yahoo.
Naissance des recaptchas
Une équipe de jeunes informaticiens de cette même Université Carnegie Mellon, aux USA, a eu l’idée lumineuse d’utiliser cette technique pour... aider à digitaliser des livres !
Luis von Ahn, l’un des responsables du projet, estime à 60 millions le nombre de captchas utilisé chaque jour. A raison de 10 secondes par opération, cela représente ... 150 000 heures de travail par jour !
C’est l’équivalent de 20 000 personnes à temps plein !
Et si l’on ne perdait pas ces heures, improductives aujourd’hui ?
Des milliers d’ordinateurs sont utilisés pour digitaliser des ouvrages anciens, écrits avant l’arrivée de l'informatique. Les logiciels de lecture, OCR (Optical Recognition Character) sont très performants, mais buttent parfois sur des mots qu’ils n’arrivent pas à déchiffrer.
L’idée de l’équipe de Carnégie Mellon est la suivante : on va utiliser les mots que ces programmes OCR ne savent pas lire pour créer des captchas.
La méthode utilisée est la suivante :
On propose un captcha composé de deux mots :
- Le premier a déjà été identifié par l’ordinateur.
- Le second est celui que l’on cherche a comprendre.
- Si vous identifiez le premier, on fait l’hypothèse que vous allez interpréter intelligemment le second. Par sécurité, ce deuxième mot sera présenté plusieurs fois, et ne sera confirmé que si trois personnes différentes ont donné la même interprétation.
Et... le tour est joué ; on fait d’une pierre, deux coups.
L’action préventive, s’assurer que c’est une personne qui répond, se double d’une action positive : un nouveau mot scanné a été identifié.
L’intelligence collective au service de la ... collectivité = Web 2.0
J’imagine assez bien ce qu’aurait pu être la solution “1.0” de ce problème :
des dizaines de personnes, devant leur écran, étant payées, mal, pour faire un travail peu passionnant.
L’équipe de Carnégie Mellon a découvert un filon de travail quasi infini, gratuit, de haute qualité, valorisant, car les internautes sauront qu’ils font œuvre utile chaque fois qu’ils résolvent un recaptcha.
Dans les semaines qui viennent, je suis persuadé que la grande majorité des sites Web, des blogs qui utilisent des captchas vont les remplacer par des recaptchas.
Sur le site du projet recaptcha, les API et autres programmes PHP nécessaires pour utiliser cette technique sont déjà disponibles.
L’investissement nécessaire, des serveurs X86 sous Linux, a été financé par Intel et Novell.
Voila encore une innovation comme je les aime, simple, efficace, à forte valeur ajoutée, qui s’appuie sur l’intelligence collective de millions de personnes.
Cette solution n’est pas parfaite ; de nombreuses études ont montré que des programmes complexes peuvent résoudre les captchas les plus classiques.
À nous de jouer !
Toutes les entreprises, qui souhaitent protéger leur site, peuvent, à partir d’aujourd’hui, participer à cet effort mondial de numérisation de la connaissance, sans dépenser un euro, en utilisant des recaptchas chaque fois qu’elles souhaitent contrôler l’accès au site
Les recaptchas sont une remarquable arme antispam. La version pour courriel est déjà disponible. Ceci demandera simplement, aux personnes avec qui vous communiquez, d’utiliser une seule fois le test recaptcha.
Dans ces deux cas, il est très probable que les personnes, qui auraient ‘râlé” parce qu’on leur imposait un test captcha, accepteront plus volontiers un recaptcha, sachant qu’elles font en même temps une bonne action.
Participer à une mission intelligente, bloquer spam et accès indésirables, ce double bénéfice fait que je suis persuadé que les recaptchas vont s’imposer très rapidement.
Bravo l’intelligence humaine ! Ce genre d’innovations redonne une bonne dose d’optimisme à ceux qui ont trop tendance à ne voir que le mauvais côté de la technologie.