lunes, 12 de diciembre de 2016

Odio Captcha... bueno, ¡ya no!

Texto captcha y digitalización de libros antiguos



Los Captcha son un de las cosas más engorrosas que hay en Internet. Casi al mismo nivel que los pop up, robapáginas o avisos que te impiden llegar de forma rápida y efectiva a la información que estás buscando. De hecho, nunca lo implemento (o lo implementaba) en mis webs con la idea de hacerlas más usables y menos engorrosas para los usuarios.

Pero hace un par de semanas, el gran Jerzy Raczy me contó, en uno de los fantásticos cursos que organiza, el origen del Captcha, y ahora mi visión de él ha cambiado totalmente. 

¿Qué es el código Captcha?

Esta sigla, que significa Completely Automated Public Turing test to tell Computers and Humans Apart, es un sistema creado por Luis von Ahn que permite evitar spam de cualquier tipo en nuestra páginas, obligando al usuario a escribir un texto aleatorio que se muestra en formato imagen, algo que no es capaz de hacer una máquina.

Recaptcha y digitalización de libros

Bien, pues Google creo la extensión ReCaptcha con la finalidad de sacar provecho a este "tedioso" trabajo que realizamos los seres humanos cuando queremos acceder a un archivo, una web, o descargar una imagen. Y ha aprovechado para incluir entre las imágenes que debemos transcribir, fragmentos de documentos (libros, manuscritos, etc.) digitalizados como imagen y que una máquina es imposible de descifrar. 

De este modo, plataformas como Google Libros están aprovechando esta tecnología para construir una gran biblioteca mundial con la ayuda de todos los usuarios de Captcha.

¿Cómo lo hace?

Bien, pues el sistema se basa en ofrecer al usuario dos imágenes con textos que se deben transcribir. Uno de esos textos ya ha sido transcrito y validado anteriormente, y el otro es nuevo. De este modo Google interpreta que si el usuario ha introducido el primer término correctamente, hay una alta probabilidad de que el otro también lo sea.

Para terminar os dejo un estupendo vídeo que el creador de Captcha dio en una charla TED en el que explica para qué se usa. Disfrutadlo, es fantástico.




¿Ya es con otros ojos los Captcha?