2009-09-16 9 views
9

Meine Lesung dieser article schlägt vor, dass ein Vorteil von ReCAPTCHA ist, dass es Menschen verifizieren kann Wörter nicht erkannt in der OCR/Digitalisierung von Büchern. Dies geschieht durch die Verwendung dieser Wörter in "Bist du ein Mensch?" Tests. So tötet ReCAPTCHA zwei Fliegen mit einer Klappe. Groß!Wie funktioniert ReCAPTCHA?

Aber ich verstehe es nicht. Wenn das Wort durch den Digitalisierungsprozess nicht erkannt werden kann, wie wird dann die Eingabe, die der vermeintliche Mensch eingegeben hat, verifiziert? Wie funktioniert das?

Antwort

23

Es zeigt zwei Wörter. Einer von ihnen kennt der Computer bereits, der andere nicht. Es setzt voraus, dass, wenn Sie das Bekannte richtig bekommen, dass Sie das andere kennen müssen.

Sie wissen nicht, welches der beiden bereits bekannt ist, also können Sie es theoretisch nicht austricksen. Darüber hinaus wird es ein Wort mit mehreren Personen wiederholen, um eine unabhängige Bestätigung zu erhalten, bevor es an die Quelle (Zeitungsunternehmen, Buchscangruppe) als gültige Antwort zurückgeschickt wird.

Aber wenn ein Computer keine solche CAPTCHA lesen können, wie das System auf das Rätsel der richtige Antwort weiß? Hier ist wie: Jedes neue Wort, das nicht korrekt gelesen werden kann durch OCR ist ein Benutzer in Verbindung mit einem anderen Wort für , die die Antwort bereits bekannt ist. Der Benutzer wird dann aufgefordert, beide Wörter zu lesen. Wenn sie das lösen, für das die Antwort bekannt ist, nimmt das System an, deren Antwort für das neue eins ist. Das System gibt dann das neue Bild an eine Reihe von anderen Personen zu ermitteln, mit höherem Vertrauen, , ob die ursprüngliche Antwort korrekt war.

http://recaptcha.net/learnmore.html

+0

Ich würde anmerken, dass ReCAPTCHA funktioniert, indem es zwei Wörter zeigt, eins, das es kennt und ein anderes es nicht. Sie müssen nur einen korrigieren. Sie reichen jedoch das eine, das sie nicht mehrmals wiederholen, erneut ein, bis sie einen hohen Prozentsatz erhalten, bevor sie es als solches absorbieren. –

+0

Guter Punkt, das System ist nicht narrensicher, obwohl es clever ist. Es erinnert mich an Googles Image Labeler-Spiel, das nach den gleichen Prinzipien arbeitet, um unbekannte Leute dazu zu bringen, Bilder zu beschriften: http://images.google.com/imagegabeler/ –

+0

Imagelabeler und ReCapcha stammen vom gleichen Typ: Luis von Ahn. Er hat wirklich den Weg gezeigt, Menschen zu benutzen, um harte Probleme zu lösen. –

2

von LEARN HOW reCAPTCHA WORKS Zitat

Aber wenn ein Computer nicht so einen CAPTCHA lesen kann, wie weiß das System die richtige Antwort auf das Rätsel? Hier ist wie: Jedes neue Wort, das nicht korrekt von OCR gelesen werden kann, wird einem Benutzer in Verbindung mit einem anderen Wort gegeben, für das die Antwort bereits bekannt ist. Der Benutzer wird dann aufgefordert, beide Wörter zu lesen. Wenn sie denjenigen lösen, für den die Antwort bekannt ist, nimmt das System an, dass ihre Antwort für die neue korrekt ist. Das System gibt dann das neue Bild einer Anzahl von anderen Leuten, um mit höherer Sicherheit zu bestimmen, ob die ursprüngliche Antwort korrekt war.