כך עזרתם ל"גוגל" לתמלל ספרים בלי ידיעתכם

מנגנון ההגנה של גוגל נגד תוכנות אוטומטיות הוא אינו תמים כפי שחשבתם, מערכת ה-reCAPTCHA מאפשרת לחברת גוגל להעביד אתכם בחינם בזיהוי מילים שאינן ברורות (ברשת)

(צילום מסך)

אם אי פעם נתקלתם במסך ההגנה הזה, כנראה שגוגל נעזרו בכם כדי להפוך ספרים לדיגיטליים, ועשיתם את זה בחינם...

בשנת 2007, פותחה באוניברסיטת 'קרנגי מלון' בפיטסבורג מערכת בשם reCAPTCHA מטרת המערכת הייתה לסייע בהמרת טקסטים מודפסים לפורמט דיגיטלי בעזרת שימוש ב-CAPTCHA (מנגון הגנה אינטרנטי מפני בוטים - תוכנות אוטומטיות).

איך זה עובד? במהלך סריקת טקסט והמרתו לטקסט דיגיטלי, ישנן מילים שהמערכת לא יודעת לזהות (דיו שנמרח, כתב שדהה וכדומה), כשהמערכת נתקלת במצב כזה, היא מכניסה את המילה למערכת ונעזרת בכם, הגולשים, על מנת לתרגם אותה.

בכל פעם בה המערכת חוששת שאתם בעצם אינכם גולשים אמיתיים אלא תוכנות מחשב מתוחכמות שמיועדות לשאוב מידע וכדומה, מופיעות 2 מילים שונות אותן תצטרכו לזהות: מילת בקרה ומילה לזיהוי.

ברגע שזיהיתם את מילת הבקרה נכון, המערכת מניחה כי תזהו נכונה גם את המילה שבמחלוקת, עליה אגב - לא משנה מה תכתבו, היא תתקבל ותאושר. מילים לא ברורות שזוהו על ידי מספר רב של אנשים באותה צורה "ממוחזרות" והופכות עם הזמן למילות בקרה.

כך בעצם מתרגמת החברה ספרים רבים, כולל את כל(!) גיליונות ה"new york times" (החל משנת 1851). מעל 100 מיליון מילים כאלו עולות מידי יום במערכת באמצעותם הפכו בגוגל מיליוני מאמרים לחומר דיגיטילי.

אל מול התופעה יש גם מתנגדים שטוענים כי מדובר ב"עבדות מודרנית" ובניצול של גוגל את הגולשים שבעצם מבצעים עבודה חינם עבור חברת הענק.

הכתבה הייתה מעניינת?

תוכן שאסור לפספס

0 תגובות

אין לשלוח תגובות הכוללות דברי הסתה, לשון הרע ותוכן החורג מגבול הטעם הטוב.

טוען תגובות...
תוכן שאסור לפספס

עכשיו בכותרות
הנקראים ביותר
המדוברים ביותר