משוב ושיתופיות במנועי חיפושמשוב ושיתופיות במנועי חיפושRelevance feedback and social Relevance feedback and social
filteringfiltering
יהודית בר אילן
לימודי מידע, אוניברסיטת בר-אילן
בי"ס לספרנות, האוניברסיטה העברית
ניסוח המידע בשפה טבעית
Index
Collections
Rank
Query
בעיית מידעחיפוש מידעחיפוש מידע
אי ודאות בתהליך האחזוראי ודאות בתהליך האחזור
מה בדיוק בעיית •המידע?
כיצד לתרגם •אותה לשאילתה
המתאימה למערכת?
איזה סוג מידע •ניתן בכלל לקבל
מהמערכת?
...... קשה לנסח שאילתות, אבלקשה לנסח שאילתות, אבל
קל יותר לזהות מידע שימושי •)רלוונטי( עבור הבעייה כאשר
המידע מוצג בפנינוכיצד נשיג מידע כזה?•
על ידי שאילתה ראשונית על הנושא–
כיצד ממשיכים הלאה?•על ידי שינוי השאילתה–תהליך זה נקרא–
•Query modification•Relevance feedback
תהליך כזה נעשה באופן טבעי ע"י תהליך כזה נעשה באופן טבעי ע"י המשתמשיםהמשתמשים
דוגמה: שאלה מהמוקדמות •2005של אליפות החיפוש
מה תפקידו הנוכחי וכתובת •מקום עבודתו של חוקר
? Andrei Broderהאינטרנט
של אחד logנעקוב אחרי ה •המתחרים
:10תוצאה מספר
Answer: IBM ResearchAnswer: IBM Research
A more successful query would have been:A more successful query would have been:
Berrypicking – Marcia BatesBerrypicking – Marcia Bates
Relevance Feedback Relevance Feedback ArchitectureArchitecture
RankingsIR
System
Documentcorpus
RankedDocuments
1. Doc1 2. Doc2 3. Doc3 . .
1. Doc1 2. Doc2 3. Doc3 . .
Feedback
Query String
Revised
Query
ReRankedDocuments
1. Doc2 2. Doc4 3. Doc5 . .
QueryReformulation
From: www.cs.utexas.edu/users/ mooney/ir-course/slides/QueryOps.ppt
Relevance FeedbackRelevance Feedback
הרעיון המרכזי הוא לשנות את השאילתה •המקורית כתוצאה משיפוטי המשתמש
מצא מונחים מרכזיים במסמכים שצוינו כטובים –והוסף אותם לשאילתה
תן משקלות חדשים למונחים המקוריים–זרוק מונחים שנמצאים רק במסמכים בלתי –
רלוונטיים
גם בשלב זה ניתן להתייעץ עם המשתמש •ולהציע לו רשימה של מונחים להוספה/השמטה
נראה מספר דוגמאות•
Cortina - http://sobel.ece.ucsb.edu/Cortina - http://sobel.ece.ucsb.edu/
Relevance feedback: two maps markedRelevance feedback: two maps marked
Direct search: Jerusalem mapDirect search: Jerusalem map
related:www.infoplease.com/ce6/world/A0811353.htmlrelated:www.infoplease.com/ce6/world/A0811353.html
סיכום בינייםסיכום בינייםמחקרים מראים ששיטות •
משוב משפרות את איכות Koennemanהאחזור )למשל & Belkin 1996)
הבעיה היא שלמשתמשים אין •סבלנות
לכן גם כלי החיפוש מזניחים •את הכיוון הזה
פתרון אפשרי: משוב ללא •מעורבות המשתמש
Pseudo Feedback Architecture
RankingsIR
System
Documentcorpus
RankedDocuments
1. Doc1 2. Doc2 3. Doc3 . .
Query String
Revised
Query
ReRankedDocuments
1. Doc1 2. Doc2 3. Doc4 . .
QueryReformulation
1. Doc1 2. Doc2 3. Doc3 . .
PseudoFeedbac
k
Collaborative/social filteringCollaborative/social filtering
שיפור האחזור באופן אוטומטי על סמך המסמכים •המוחזרים הראשונים, מניח מראש שהמסמכים
הראשונים רלוונטיים לחיפושרעיון אחר הוא לנסות למצוא אנשים בעלי טעם דומה •
לשלנוהנחה בסיסית: אני אוהב את מה שהם אוהבים–ניתן לשאול את המשתמשים על דעותיהם–ניתן להסתפק רק במעקב אחר פעילויותיהם –
Collaborative Filtering (Social Filtering)Collaborative Filtering (Social Filtering)
• If Pam liked the paper, I’ll like the paper• If you liked Star Wars, you’ll like
Independence Day• Rating based on ratings of similar people
– Ignores the text, so works on text, sound, pictures, etc.
Sally Bob Chris Lynn KarenStar Wars 7 7 3 4 7Jurassic Park 6 4 7 4 4Terminator II 3 4 7 6 3Independence Day 7 7 2 2 ?
http://www.sims.berkeley.edu/academics/courses/is202/f04/
Example:Ringo Collaborative Filtering for MusicExample:Ringo Collaborative Filtering for Musicמשתמשים במערכת מדרגים •
מוסיקה – 1 = detest – 4 = ambivalent– 7 = can’t live without
מהדירוגים הנ"ל מרכיבים פרופיל •המשתמש )דינאמי(
המערכת מחשבת דמיון בין •הפרופילים
לצורך המלצה, מתחשבת •בפרופילים הדומים בלבד
כאשר משתמש חדש מצטרף • 125למערכת הוא מתבקש לדרג
אומנים רינגו הייתה אחת המערכות •
הראשונות )מערכת ניסיונית(, Alexlit.comאינה פעילה יותר.
פועלת בשיטה דומה
Social FilteringSocial Filteringסינון חברתי מתעלמת מהתכנים, ומתבססת •
רק על משתמשים בעלי "טעם" דומהמתאים במיוחד למוסיקה, סרטים, ספרי קריאה–
ישנן מערכות המצליחות לפעול גם ללא שיפוט •פעיל באמצעות מעקב אחר פעילויות
המשתמשים במערכת
סיכוםסיכוםניתן להשתמש בשיטות •
משוב וסינון כדי לבנות מערכות פרסונליזציה
כל מידע הקשור –למשתמש ולטעמו יכול
לעזור
בכל השיטות המטרה •היא לשפר את חווית
userהשימוש -experience