![]() |

אתי יערי: "הקושי הוא לא מציאת מידע אלא מציאת מידע איכותי" | צלם: דודו בכר
במבט ראשון, הערך "הומו הביליס" בוויקיפדיה העברית נראה כמו מקור מידע אמין למדי על הטיפוס הטרום-אנושי הקדום. הערך מתחיל בתיאור כללי, ובהמשך מתוארים צורתו הפיסית והמבנה המשפחתי שלו. רק כשמגיעים לסעיף "עיסוק" מופיעות פתאום קביעות מוזרות לגבי חייו הכלכליים והמיניים של ההומו הביליס, שמתאימות יותר לסרטי מדע בדיוני נוסח "כוכב הקופים" מאשר לאנציקלופדיה רצינית. על פי הערך, היצורים הקופיים למחצה שחיו לפני כשני מיליון שנה החליפו עם שכניהם "נכסים יקרים כמו בנים ובנות, אחים ואחיות. כל קבוצה שאפה להשאיר מירב של אנשים בקבוצתה, משום שבני אדם היו כה יקרי ערך וניתן היה ליהנות משירותיהם הכלכליים, הרגשיים והמיניים", נקבע בנחרצות, מבלי לספק שום מקור לטענה. הפסקה מסתיימת בתיאוריה תמוהה שלפיה "הסלידה והכעס הכרוכים בגילוי עריות שיקפו את הסכנות שחברי הקבוצה נחשפים אליהן עקב התמוטטות החליפין במידה שהיתה תקלה".
זו רק דוגמה אחת, צורמת במיוחד, לתקלה בשיטת העריכה של ויקיפדיה, שבדרך כלל פועלת ביעילות ומצליחה לאתר טעויות קריטיות. בתקופה שבה ויקיפדיה היא מקור מידע מרכזי, בעיקר לתלמידים ולסטודנטים, סביר להניח שלא מעטים כבר נפלו במלכודת והסתמכו על התיאוריה הזו, שהגה כנראה גולש בעל דמיון פרוע. הבעיה היא שדווקא מכיוון שרוב הערכים בוויקיפדיה אמינים למדי, גולשים רבים נוטים לסמוך בעיניים עצומות על האנציקלופדיה החופשית. אתי יערי מהמחלקה ללימודי מידע באוניברסיטת בר אילן בדקה בעבודת הדוקטורט שלה את האפשרות להעריך באופן אוטומטי את האמינות של ערכים בוויקיפדיה, כדי לספק מדד יעיל לגולשים על איכות הערך.
לדברי יערי, מחקרים מראים שרוב משתמשי האינטרנט אינם טורחים לאמת את המידע שהם שואבים מהרשת באמצעות מקורות אחרים. "הדרך הטובה ביותר לוודא את האמינות של הערכים היא שאנשים יצליבו בין כמה מקורות", היא אומרת. "אבל התברר שאנשים חושבים שזה בזבוז זמן. מעניין אותם למצוא מידע כמה שיותר מהר".
עבודתה של יערי, שנכתבה בהנחיית פרופ' שפרה ברוכסון-ארביב, תוצג בשבוע הבא בכנס של מכון נטוויז'ן לחקר האינטרנט באוניברסיטת תל אביב. לדבריה, הניסיון ליצור מנגנונים שיעריכו איכות של מידע באינטרנט מעסיק חוקרים רבים. "באוניברסיטאות בעולם מנסים לפתח מערכות אוטומטיות להערכת איכות. הופתעתי מכמות החוקרים שמתעסקים בזה", היא אומרת. "יש בתקופתנו התפוצצות של מידע, אבל הקושי הוא לא מציאת מידע אלא מציאת מידע איכותי".
הרעיון היסודי בעבודתה הוא לבסס את מנגנון הערכת האיכות על תובנות של גולשים. לצורך כך היא ריאיינה 64 משתמשים שהתבקשו לדרג את איכותם של כמה ערכים בוויקיפדיה, ולהסביר על סמך מה דירגו אותם. כך מצאה יערי כמה מאפיינים שנחשבו בעיני רבים מהמשתתפים למדד יעיל לקביעת האמינות של הערך. בין השאר, המשתמשים נעזרו במספר הקישורים החיצוניים שנוספו לערך ובאורכו, וגם בהתפתחות הערך - מספר הפעמים שהוא שונה ביחס למשך קיומו ברשת ומספר האנשים השונים שהשתתפו בכתיבתו (לפי דף הגרסאות הקודמות).
בהמשך בדקה יערי 2,224 ערכים מוויקיפדיה העברית, והעריכה אותם על סמך המדדים של משתתפי המחקר. היא מצאה שהמדדים אכן מאפשרים זיהוי יעיל של ערכים איכותיים, בהם כאלה שזכו להיכלל בקטגוריית הערכים המומלצים מטעם ויקיפדיה. "התברר שאחוזי הדיוק של הקריטריונים האלה גבוהים", היא אומרת.
כעת מנסה יערי, בשיתוף עם פרופ' יהודית בר אילן ופרופ' ברוכסון-ארביב, לבנות יישום שימושי שיבחן באופן אוטומטי ערכים בוויקיפדיה על סמך מדדי האיכות שזיהתה. "המטרה היא לבנות כלי שתוכל להשתמש בו בכל פעם שתיכנס לוויקיפדיה. תופיע לך תיבה, שבה רמז לגבי האיכות של הערך, למשל בצורה של ציון מאחת עד עשר". באחרונה קיבל צוות המחקר מענק מאיגוד האינטרנט הישראלי, כדי לפתח אמצעי כזה.
יערי מקווה שבקרוב משתמשי ויקיפדיה לא יצטרכו לסמוך על תחושותיהם בנוגע לאמינות הערך שהם קוראים בה. "אני מאוד אוהבת את ויקיפדיה, זה מקור נפלא", היא אומרת. "אבל הבעיה היא שהשימוש בו נעשה בעיניים עצומות. אנשים אומרים: מצאתי חומר, הוא עלה לי ראשון בגוגל - אז זה מספיק לי". לדבריה, "נעשו מאמצים להקנות למשתמשים כלים להתמודדות עם שפע המידע, אבל עכשיו נראה שזה לא מספיק. אם אנשים לא בודקים בעצמם, כדאי לספק להם רובוט שיבדוק את המידע בשבילם, לפחות כמה שהוא יכול".
עוד בנושא: ויקיפדיה - הגירסה המודפסת: מו"לית גרמנית תוציא לאור ספר המכיל ערכים מהאנציקלופדיה המקוונת
רוצים לקבל עידכונים מ-TheMarker IT ישירות למייל? לחצו כאן להרשמה לניוזלטר שלנו
בכל ערב TheMarker IT מגיש לכם את מדור מנה עסקIT הסוקר את העסקות, ההטמעות, החוזים, וההשקות שעשו את היום