Una curiosità che riguarda i re-captcha, quei fastidiosi sistemi di validazione per capire se siete umani o dei freddi robot. Dovete sapere che la parola re-captcha e non solo captcha (la parola è un acronimo inglese che in sostanza riprende il famoso test di Turing per distinguere un umano da un computer) non è usata a caso. Re, come replica, cioè ce ne sono due.
E in effetti vi sarà sicuramente capitato di dover risolvere visivamente la lettura di due parole distinte. Quello che non sapete è che solo una, la prima, serve (o meglio serviva) a discriminare se siete un robot o meno, l’altra potreste scrivere qualsiasi stramberia. Se la prima è esatta passerete alla sezione successiva.
Il motivo è che la seconda parola serve ad aiutare un processo di digitalizzazione di testi che non sono stati riconosciuti dai computer. Per essere più precisi esiste un servizio di digitalizzazione bibliotecaria il cui scopo è quello di portare in digitale testi antichi. I programmi di riconoscimento del testo non sono infallibili ed è possibile che facciano fatica a tradurre in lettere determinate parole, ed è qui che viene tirato in ballo il re-captcha. Risolvendo la seconda parola aiuterete i computer a migliorare i propri algoritmi. Per ogni parola dubbia o non riconosciuta viene immessa in questo circuito, quando almeno tre “risolutori” daranno il medesimo risultato, verrà considerata valida.
Questo progetto è stato acquistato nel 2009 da Google che ha continuato sino a non molto tempo fa, quando il sistema a due parole è stato dismesso del tutto in favore di un sistema più efficace (avrete sicuramente visto il tasto “non sono un robot”).
In questi anni quindi ogni volta che avete risolto la seconda parola di fatto avete lavorato gratis per qualcuno, poiché questo lavoro ha permesso da una parte una nobile causa, quella di poter fruire in digitale di testi di inestimabile valore non necessariamente economico, dall’altra però società private hanno potuto sviluppare sistemi informatici di riconoscimento del testo e di reti neurali proprio grazie alla manodopera inconsapevole.
Si è trattato di un risparmio a dir poco mostruoso, dato che uno degli ultimi dati noti che risalgono a prima dell’acquisto di Google, indicavano in 4 milioni di parole individuate al giorno!
Foto di copertina by Michal Jarmoluk from Pixabay
Scopri di più da Walter's blog
Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.