Upload
squizpoland
View
695
Download
3
Embed Size (px)
DESCRIPTION
Konferencje Efektywna Cyfryzacja - Eksplozja Informacji, 12.09.2012 Warszawa
Citation preview
za dużo informacji i co dalej? -
systemy wyszukiwania
1
Michał Rachowski - CMS ConsultantWarszawa 12.09.2012
2
Kto?
http://www.linkedin.com/in/michalrachowski
@snihir
Michał Rachowski
CMS Consultant
od zawsze w branży reklamowej- budowa i strategia marek
czas wolny: game.. -ing -ification -oholic
Informacja Ważne pojęcia (3x) V - (nie) jak Vendetta Systemy wyszukiwania Search experience optimasation Funnelback Squiz & Funnelback “w akcji” Pytania
3
Plan
Informacja ◦ definicja: “łac. informatio – przedstawienie, wizerunek...” ◦ opis wszystkiego dookoła? ◦ opis? dane? zera i jedynki? bajty? bity?
w 60 sekund rodzi się 156 dzieci na świecie
ile jest informacji w Państwa Organizacji?
4
Informacja
”The total amount of global data is expected to grow to almost 3 zettabytes during 2012."
International Data Corporation
3 zetabytes = 3 zetabajty = dużo informacji ?
3,000,000,000,000,000,000,000 bytes
5
Informacja
informacji na świecie w 2011 było ponad ok 1,8 zetabajta
IDC Digital Universe Study
Data mining = esksploracja danych◦ drążenie, pozyskiwanie i wydobywanie
BIG data◦ BIG = dużo? ◦ ile to dużo?
Searchandisinga targetowaniebehawioralne ◦ czyli jak ważne sąpozycjonowanie i personalizacja
6
Ważne pojęcia
"Big data is data that is too big for the processing capacity of conventional systems."
Ed Dumbill ~ O’Reilly
”Big data is a relative term. Every organization will eventually reach a point where the volume, velocity and variety of their data will be something that they have to address."
Mark Troester ~ SAS
”Data mining is the process that results in the discovery of new patterns in large data sets."
Wikipedia
Volume (ilość danych)◦ Indeksy a kompresja ◦ Magazynowanie danych a WARC (Web ARChive)◦ Obsługa wielu serwerów m.in. Cloud (chmura) a usługi w modelu SaaS
Velocity (prędkość/szybkość/czas dostępu)◦ Wielowątkowość, indeksacja a natychmiastowe aktualizacje◦ Kolekcje - nowe, szybkie i skuteczne rozwiązania ◦ Data Management API - czyli dostęp poprzez interfejs
Variety (różnorodność/bogactwo informacji) ◦ Konektory do baz danych ◦ Framework a filtrowanie ◦ Niestandardowy przepływ danych a elastyczne szablony
7
(3x) V - (nie) jak Vendetta
”Big data is a relative term. Every organization will eventually reach a point where the volume, velocity and variety of their data will be something that they have to address."
Mark Troester ~ SAS
Czy potrzeba czegoś więcejniż dobra taksonomia czy mapa serwisu, a może dobra klasyfikacja dokumentów i ich kategoryzacja i odpowiednie skatalogowanie?◦ co z dynamicznym dostępem?◦ trudy kalsyfikacji dokumentów różnego typu i nazw◦ dobra taksonomia a koszt poniesiony na analizę◦ statyczna kategoryzacja a brak elastyczności◦ dziesiątki kroków w drzewie a użyteczność
8
Systemy wyszukiwania"Aż 41% respondentów uznało, że ich system wyszukiwania nie spełnia ich oczekiwań”
Econsultancy Site Search Survey Report
August 2010
effective ranking puts at the top the documents most likely to be useful, given the need most likely to lie behind the query
Słowo klucz = Wizualizacja (Visualise)
czynność: spraw (coś) widocznym dla oka
◦Wizualizacja jest mostem◦Wizualizacja generuje intuicyjne doświadczenie ◦ Zobrazowanie metod wyszukiwania zapewnia użytkownikowi doświadczenia odkrywcy
Dobre doświadczenie przekłada się na pozytywną reakcję emocjonalną użytkownika
9
Search experience optimisation
O czym należy pamiętać: ◦ Użytkownicy przeglądają, filtrują i używają słów kluczowych (keywords)◦ Użytkownicy mogą mieć wiele życzeń i potrzeb odnośnie możliwości wyszukiwania i wyszukiwarki ◦Narzędzia są złożone i wymagają upraszczania◦ Użytkownicy nie czytają instrukcji !
Gdzie należy szukać: ◦ “Click tracking” - dostarcza wiedzę o użytkowniku ◦ Logi - dają odpowiedź na pytanie o zachowaniu
10
Search experience optimisation
Co należy robić: ◦Mieszać kwerendy - tak dopasowywać zapytania, by wypełnić lukę między językiem używanym w zapytaniach a językiem używanym w dokumentach. ◦ Korzystać z funkcjonalności typu "sugerowane wyniki" (best beats) aby pomóc użytkownikowi. ◦Nikt nie zna lepiej treści serwisu i jego zawartości od Ciebie - należy wykorzystywać tą wiedzę sugerując wyniki (pomoc i podwyższenie użyteczności). ◦Należy przeprowadzać regularne testy (m.in. A/B), sprawdzać skrypty, poprawiać i ulepszać rozwiązania.
11
Search experience optimisation
12
Funnelback Projekt badawczy◦Dr. David Hawking 20 lat rozwoju Opatentowana technologia◦ Algorytm rankingu◦Nawigacja kontekstowa◦ Poziom bezpieczeństwa dokumentu Szybka instalacja i konfiguracja
13
Funnelback
14
Demo
Funnelback
15
FunnelbackLog:
<c>!<t>20120320 09:32:59</t>!<click_url>http://www.funnelback.com/news-and-events/!news</click_url>!<http_referer>https://fnb-demo01.squiz.co.uk/s/search.html?profile=_default_preview&query=funnelback&collection=demo-funnelback-com</http_referer>!<rank>4<rank>!<remote_address>83.217.109.164<remote_address>!<search_referer />!<type>CLICK</type>!</c>!
Kwerendy i budowa słowników:
%=acetoin=["Acetylmethylcarbinol" "3 hydroxy 2 butanone" "3H 2B butanone"]!%=acetoin dehydrogenase=["Diacetyl Reductase"]!
Search◦ to optymalizacja◦ to zaangażowanie
Korzyści pracy z Funnelback:◦Searchandising◦Wsparcie◦Automatyczne usuwanie duplikatów◦ Promocja wyników Best-Bet◦Polepszenie zdolności odnajdywania◦Polepszenie wydajności◦Zwiększenie doświadczenia użytkownika◦20 lat doświadczenia
16
Funnelback
UBM Search Medica◦ http://www.searchmedica.com◦ 70 milionów dokumentów◦ terabajty danych◦ UK oraz US◦ infrastruktura w oparciu o dwa serwery
Hermes◦ http://www.hermes.co.uk◦ żywotność danych◦ 100 milionów źródeł danych ◦ kompleksowa analiza
17
Squiz & Funnelback “w akcji”
Victoria and Albert Museum
Skype
18
Uni of Beadfordshire
Squiz & Funnelback “w akcji”
19
?
Pytania
20
Dziękuję za uwagę!www.funnelback.com
http://www.linkedin.com/in/michalrachowski
@snihir