reCAPTCHA: detener el spam, leer libros

Escrito Por
25 de junio del 2007

Un CAPTCHA es un programa diseñado para distinguir si un usuario es un humano o una computadora. ¿Te suena poco familiar? Lo más seguro es que alguna vez te has topado con ellos y quizá no sabías el nombre técnico ¿Pero cómo saber si te has topado con un CAPTCHA?.

CAPTCHA  - Completely Automated Public Turing test to tell Computers and Humans Apart

Te has fijado en las imágenes de letras distorsionadas en algunos sitios? Las cuales es necesario identificar en un campo de texto adicional para poder ingresar o bien para hacer uso de alguna funcionalidad: como sería dejar un comentario. Pues bien esas letras o caracteres distorsionados que aparecen forman un CAPTCHA. El éxito de los CAPTCHA, bien implementados, reside en que es difícil para un programa de computadora interpretar correctamente ese texto distorsionado. Es aprovechando esa dificultad que los CAPTCHA son usados para evitar (entre otras cosas) los abusos de Bots de Spam, programas que navegan la red en busca de páginas que no tengan protecciones adecuadas para dejar comentarios basura en foros, blogs, libros de visitas y en general todas aquellas páginas que se presten para ese fin.

Ahora que sabemos que es un CAPTCHA, les comento que en el mundo se resuelven alrededor de 60 millones de CAPTCHA al día por humanos, es por eso que en la School of Computer Science de la Carnegie Mellon University (los mismos que tuvieron la idea del CAPTCHA original) decidieron crear el reCAPTCHA ya que sin duda existe una mejor manera de aprovechar todos esos pequeños segundo que nos tomamos en resolver un CAPTCHA para contribuir a la digitalización de libros.

reCaptcha >> Deten el Spam,  Lee un libro

¿Cómo se logra eso? les explico, la idea atrás del reCAPTCHA es bastante sencilla: Se trata de resolver dos palabras separadas que aparecen en el mismo CAPTCHA. La primera de ellas es el la palabra distorsionada para la cual conocemos el significado y la segunda de ellas es una palabra que proviene de un libro y que un programa OCR o de reconocimiento de texto, no pudo reconocer correctamente. Al resolver CAPTCHA el sistema presupone que si resolvimos correctamente la primera palabra la segunda también debe ser correcta, sin embargo ese misma imagen de aCAPTCHA es enviada a otras sitios para que otras personas la resuelven y así asegurarse que la segunda palabra, la que proviene del libro, es correcta también, antes de ser tomada como válida por el sistema de reCAPTCHA. Actualmente el proyecto de reCAPTCHA ayuda a la digitalización de libros provenientes del Internet Archive.

Si deseas implementar reCAPTCHA en tu sitio se puede hacer de varias maneras desde plugins para CMS más populares como: WordPress, Movable Type, Drupal, entre otros. Además esta disponible como web service y como librería para algunos lenguajes de programación. Pueden encontrar más información en el siguiente link sobre las opciones disponibles para implementar reCAPTCHA.