reCAPTCHA: detener el spam, leer libros

Escrito Por
25 de junio del 2007

Un CAPTCHA es un programa dise�ado para distinguir si un usuario es un humano o una computadora. �Te suena poco familiar? Lo m�s seguro es que alguna vez te has topado con ellos y quiz� no sab�as el nombre t�cnico �Pero c�mo saber si te has topado con un CAPTCHA?.

CAPTCHA  - Completely Automated Public Turing test to tell Computers and Humans Apart

Te has fijado en las im�genes de letras distorsionadas en algunos sitios? Las cuales es necesario identificar en un campo de texto adicional para poder ingresar o bien para hacer uso de alguna funcionalidad: como ser�a dejar un comentario. Pues bien esas letras o caracteres distorsionados que aparecen forman un CAPTCHA. El �xito de los CAPTCHA, bien implementados, reside en que es dif�cil para un programa de computadora interpretar correctamente ese texto distorsionado. Es aprovechando esa dificultad que los CAPTCHA son usados para evitar (entre otras cosas) los abusos de Bots de Spam, programas que navegan la red en busca de p�ginas que no tengan protecciones adecuadas para dejar comentarios basura en foros, blogs, libros de visitas y en general todas aquellas p�ginas que se presten para ese fin.

Ahora que sabemos que es un CAPTCHA, les comento que en el mundo se resuelven alrededor de 60 millones de CAPTCHA al d�a por humanos, es por eso que en la School of Computer Science de la Carnegie Mellon University (los mismos que tuvieron la idea del CAPTCHA original) decidieron crear el reCAPTCHA ya que sin duda existe una mejor manera de aprovechar todos esos peque�os segundo que nos tomamos en resolver un CAPTCHA para contribuir a la digitalizaci�n de libros.

reCaptcha >> Deten el Spam,  Lee un libro

�C�mo se logra eso? les explico, la idea atr�s del reCAPTCHA es bastante sencilla: Se trata de resolver dos palabras separadas que aparecen en el mismo CAPTCHA. La primera de ellas es el la palabra distorsionada para la cual conocemos el significado y la segunda de ellas es una palabra que proviene de un libro y que un programa OCR o de reconocimiento de texto, no pudo reconocer correctamente. Al resolver CAPTCHA el sistema presupone que si resolvimos correctamente la primera palabra la segunda tambi�n debe ser correcta, sin embargo ese misma imagen de aCAPTCHA es enviada a otras sitios para que otras personas la resuelven y as� asegurarse que la segunda palabra, la que proviene del libro, es correcta tambi�n, antes de ser tomada como v�lida por el sistema de reCAPTCHA. Actualmente el proyecto de reCAPTCHA ayuda a la digitalizaci�n de libros provenientes del Internet Archive.

Si deseas implementar reCAPTCHA en tu sitio se puede hacer de varias maneras desde plugins para CMS m�s populares como: WordPress, Movable Type, Drupal, entre otros. Adem�s esta disponible como web service y como librer�a para algunos lenguajes de programaci�n. Pueden encontrar m�s informaci�n en el siguiente link sobre las opciones disponibles para implementar reCAPTCHA.