Upload
dirk-lewandowski
View
208
Download
0
Embed Size (px)
DESCRIPTION
Citation preview
Real Time Suche
Prof. Dr. Dirk Lewandowski [email protected]
1 | Dirk Lewandowski
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
Agenda
2 | Dirk Lewandowski
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
Agenda
3 | Dirk Lewandowski
Der Real-Time-Hype
• Proteste im Iran 2009
• 19 Mrd. Suchanfragen/Monat in Twitter? • Google: 88 Mrd. • Yahoo: 9,4 Mrd. • Bing: 4,1 Mrd.
• Herausforderungen für Suchmaschinen • Zugriff auf die Inhalte der Real-Time-Dienste • Nutzer auf den eigenen Suchseiten halten
• Aktueller Anlass • Alle großen SM (GYM) haben in den letzten Monaten Real-Time-Lösungen
vorgestellt.
4 | Dirk Lewandowski
„Revolutionen der Geschwindigkeit“
• Jeweils eigene Indices, die im Ranking in der Universal Search zusammengefasst werden.
• Jeder Index hat seine eigenen Aktualitätsprobleme.
Web News Blogs Real Time
5 | Dirk Lewandowski
6 | Dirk Lewandowski
Beispiele für Real-Time-Informationen in Suchmaschinen
7 | Dirk Lewandowski
Definition Real-Time-Informationen
Real Time Informationen sind Informationen, die über laufende Kannäle verbreitet werden, im Moment ihrer Aktualisierung für Nutzer relevant werden und deren Informationswert zeitkritisch ist.
1. Informationen sind schon kurz nach ihrer Erstellung über laufend aktualisierte Ticker verfügbar.
2. Für Nutzer ist es bedeutend, diese Informationen sofort zur Kenntnis zu nehmen.
3. Die Informationen veralten (in der Regel) sehr schnell.
8 | Dirk Lewandowski
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
Agenda
9 | Dirk Lewandowski
Zugriff auf Real-Time-Informationen
• Direkter Abruf eines Feeds • Vollständiger Feed eines Angebots wird angezeigt • Suche beschränkt sich auf das Auffinden des geeigneten Feeds
• Abruf eines gefiltertenFeeds • Gebündelt aufgrund von Nutzerpräferenzen (explizit oder implizit)
• Suche in Real-Time-Informationen mit Hilfe einer Suchmaschine • Ad-Hoc-Recherche • Ranking
• nach allgemeinen, für alle Nutzer gültigen Kriterien • aufgrund des Nutzerprofils (bspw. Abgeleitet aus dem Kontaktnetzwerk)
10 | Dirk Lewandowski
Inhalte der Real-Time-Suche
• Statusmeldungen
• Explizite Statusmeldungen: Nutzer gibt etwas bekannt / schreibt eigenen Text
• Implizite Statusmeldungen: Meldung wird vom System aufgrund Aktivität generiert
11 | Dirk Lewandowski
Formen der Kommunikation in Real-Time-Diensten
• One-to-one • Sender möchte einen Empfänger erreichen. • Private Nachricht in Sozialen Netzwerken
• One-to-many • Sender möchte viele Nutzer erreichen. • Beschränkung des Adressatenkreises höchstens durch das System (alle Mitglieder
des gleichen Netzwerks können die Nachricht lesen)
• One-to-some • Sender möchte eine bestimmte Zielgruppe erreichen. • Beschränkt auf die Kontakte innerhalb eines Sozialen Netzwerks, i.d.R. Kontakte
ersten Grads
12 | Dirk Lewandowski
Rankingfaktoren für Real-Time-Inhalte
• Textstatistik • Abgleich Suchanfrage – Dokument • Gewichtung nach „Volltext“, Hashtag • Aufgrund der Kürze von Statusmeldungen weitergehende Analyse kaum möglich.
• Popularität • Popularität des Autors messen: Anzahl Kontakte/Follower • Links auf die in der Vergangenheit von diesem Autor verfassten Nachrichten • Für „Archivrecherchen“ auch Verlinkung
• Aktualität
• Lokalität
13 | Dirk Lewandowski
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
Agenda
14 | Dirk Lewandowski
Recherche nach Real-Time-Informationen
Arten von Real-Time-Suchmaschinen (Sullivan 2009)
1. Suchmaschinen für einen einzelnen Datenbestand • Mehrwert liegt in der Verbesserung der Suchergebnisse
2. Suchmaschinen, die einen Datenbestand auf Basis der in RT-Diensten geposteten Links aufbauen • Alternativer Datenbestand zu den konventionellen Web-Suchmaschinen
3. Websites, die selbst einen Großteil der Inhalte des RT-Web erstellen • Bsp. Facebook, Twitter • Bieten eigene Suche an
Ergänzung 4. Allgemeine Web-Suchmaschinen, die Meldungen aus dem RT-Web in ihre
Ergebnisse integrieren.
15 | Dirk Lewandowski
Recherche direkt in den einzelnen Angeboten
1. Sinnvoll, wenn Inhalte nicht (oder nicht vollständig) an die Aggregatoren weitergegeben werden.
2. Sinnvoll, wenn es um Vollständigkeit und „absolute Aktualität“ geht.
16 |
17 | Dirk Lewandowski
Recherche in Suchmaschinen, die ihren Bestand auf Basis von Links in Statusmeldungen aufbauen
• Sinnvoll, wenn man eine alternative Sicht (auf das „aktuelle Web“) bekommen möchte.
• Beispiel www.oneriot.com
18 |
19 | Dirk Lewandowski
Recherche in allgemeinen Web-Suchmaschinen
1. Sinnvoll, wenn primär Web-Inhalte gefunden werden sollen, eine Ergänzung um Meldungen aus dem Real Time Web aber erwünscht ist.
2. Sinnvoll, wenn (auch) alte Meldungen gefunden werden sollen (echte Archivsuche).
20 |
21 |
22 | Dirk Lewandowski
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
Agenda
23 | Dirk Lewandowski
Fazit
• Real-Time-Informationen sind eine gute Ergänzung • vor allem bei gerade (sehr) aktuellen Themen • zum Nachverfolgen von Diskussionen • zur Trendbeobachtung
• Real-Time-Suchmaschinen stehen noch ganz am Anfang • RT-Suche wird sich in den kommenden Monaten wesentlich verändern.
• Real-Time-Suchmaschinen decken nur einen Teil des RT-Web ab • Lösung liegt eher in der Integration der Inhalte in der Universal Search als im
Aufbau möglichst vollständiger RT-Suchmaschinen.
Vielen Dank für Ihre Aufmerksamkeit.
www.bui.haw-hamburg.de/lewandowski.html
Aktuelles Buch: Handbuch Internet-Suchmaschinen
E-Mail: [email protected]