Такие удивительные результаты возможны благодаря тому, что ученые Карнеги-Меллон, под руководством Луиса вон Ана с взяли широко распространённую программу по защите интернет-сайтов под названием CAPTCHA и дали ей второе назначение – преобразование книг в цифровую форму, переводя их тем самым в компьютерный век.
Когда пользователи сети в очередной раз решают один из искаженных буквенных шифров, чтобы зарегистрировать почтовый ящик или оставить комментарий в блоге, они в то же время помогают перевести печатное слово в электронный текст.
Более 100 миллионов таких шифров CAPTCHA разгадываются ежедневно и, несмотря на то, что на разгадку каждого уходит всего несколько секунд, общее время исчисляется сотнями тысяч часов человеческих усилий, которые могли быть потенциально потрачены. В течение первого года работы системы reCAPTCHA, было разгадано более 1,2 миллиардов reCAPTCHA и расшифровано более 440 миллионов слов. Это равноценно ручному переписыванию более 17600 книг.
Вон Ан заявил, что reCAPTCHA используют для оцифровки книг для интернет архивов и для оцифровки газет для New York Times. Такой перевод в цифровой формат позволяет индексировать, вести поиск, форматировать и хранить старые материалы так же, как и современные тексты в сети интернет.