20
za dużo informacji i co dalej? - systemy wyszukiwania 1 Michał Rachowski - CMS Consultant Warszawa 12.09.2012

Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Embed Size (px)

DESCRIPTION

Konferencje Efektywna Cyfryzacja - Eksplozja Informacji, 12.09.2012 Warszawa

Citation preview

Page 1: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

za dużo informacji i co dalej? -

systemy wyszukiwania

1

Michał Rachowski - CMS ConsultantWarszawa 12.09.2012

Page 2: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

2

Kto?

http://www.linkedin.com/in/michalrachowski

@snihir

[email protected]:

Michał Rachowski

CMS Consultant

od zawsze w branży reklamowej- budowa i strategia marek

czas wolny: game.. -ing -ification -oholic

Page 3: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Informacja Ważne pojęcia (3x) V - (nie) jak Vendetta Systemy wyszukiwania Search experience optimasation Funnelback Squiz & Funnelback “w akcji” Pytania

3

Plan

Page 4: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Informacja ◦ definicja: “łac. informatio – przedstawienie, wizerunek...” ◦ opis wszystkiego dookoła? ◦ opis? dane? zera i jedynki? bajty? bity?

w 60 sekund rodzi się 156 dzieci na świecie

ile jest informacji w Państwa Organizacji?

4

Informacja

”The total amount of global data is expected to grow to almost 3 zettabytes during 2012."

International Data Corporation

Page 5: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

3 zetabytes = 3 zetabajty = dużo informacji ?

3,000,000,000,000,000,000,000 bytes

5

Informacja

informacji na świecie w 2011 było ponad ok 1,8 zetabajta

IDC Digital Universe Study

Page 6: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Data mining = esksploracja danych◦ drążenie, pozyskiwanie i wydobywanie

BIG data◦ BIG = dużo? ◦ ile to dużo?

Searchandisinga targetowaniebehawioralne ◦ czyli jak ważne sąpozycjonowanie i personalizacja

6

Ważne pojęcia

"Big data is data that is too big for the processing capacity of conventional systems."

Ed Dumbill ~ O’Reilly

”Big data is a relative term. Every organization will eventually reach a point where the volume, velocity and variety of their data will be something that they have to address."

Mark Troester ~ SAS

”Data mining is the process that results in the discovery of new patterns in large data sets."

Wikipedia

Page 7: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Volume (ilość danych)◦ Indeksy a kompresja ◦ Magazynowanie danych a WARC (Web ARChive)◦ Obsługa wielu serwerów m.in. Cloud (chmura) a usługi w modelu SaaS

Velocity (prędkość/szybkość/czas dostępu)◦ Wielowątkowość, indeksacja a natychmiastowe aktualizacje◦ Kolekcje - nowe, szybkie i skuteczne rozwiązania ◦ Data Management API - czyli dostęp poprzez interfejs

Variety (różnorodność/bogactwo informacji) ◦ Konektory do baz danych ◦ Framework a filtrowanie ◦ Niestandardowy przepływ danych a elastyczne szablony

7

(3x) V - (nie) jak Vendetta

”Big data is a relative term. Every organization will eventually reach a point where the volume, velocity and variety of their data will be something that they have to address."

Mark Troester ~ SAS

Page 8: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Czy potrzeba czegoś więcejniż dobra taksonomia czy mapa serwisu, a może dobra klasyfikacja dokumentów i ich kategoryzacja i odpowiednie skatalogowanie?◦ co z dynamicznym dostępem?◦ trudy kalsyfikacji dokumentów różnego typu i nazw◦ dobra taksonomia a koszt poniesiony na analizę◦ statyczna kategoryzacja a brak elastyczności◦ dziesiątki kroków w drzewie a użyteczność

8

Systemy wyszukiwania"Aż 41% respondentów uznało, że ich system wyszukiwania nie spełnia ich oczekiwań”

Econsultancy Site Search Survey Report

August 2010

effective ranking puts at the top the documents most likely to be useful, given the need most likely to lie behind the query

Page 9: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Słowo klucz = Wizualizacja (Visualise)

czynność: spraw (coś) widocznym dla oka

◦Wizualizacja jest mostem◦Wizualizacja generuje intuicyjne doświadczenie ◦ Zobrazowanie metod wyszukiwania zapewnia użytkownikowi doświadczenia odkrywcy

Dobre doświadczenie przekłada się na pozytywną reakcję emocjonalną użytkownika

9

Search experience optimisation

Page 10: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

O czym należy pamiętać: ◦ Użytkownicy przeglądają, filtrują i używają słów kluczowych (keywords)◦ Użytkownicy mogą mieć wiele życzeń i potrzeb odnośnie możliwości wyszukiwania i wyszukiwarki ◦Narzędzia są złożone i wymagają upraszczania◦ Użytkownicy nie czytają instrukcji !

Gdzie należy szukać: ◦ “Click tracking” - dostarcza wiedzę o użytkowniku ◦ Logi - dają odpowiedź na pytanie o zachowaniu

10

Search experience optimisation

Page 11: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Co należy robić: ◦Mieszać kwerendy - tak dopasowywać zapytania, by wypełnić lukę między językiem używanym w zapytaniach a językiem używanym w dokumentach. ◦ Korzystać z funkcjonalności typu "sugerowane wyniki" (best beats) aby pomóc użytkownikowi. ◦Nikt nie zna lepiej treści serwisu i jego zawartości od Ciebie - należy wykorzystywać tą wiedzę sugerując wyniki (pomoc i podwyższenie użyteczności). ◦Należy przeprowadzać regularne testy (m.in. A/B), sprawdzać skrypty, poprawiać i ulepszać rozwiązania.

11

Search experience optimisation

Page 12: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

12

Funnelback Projekt badawczy◦Dr. David Hawking 20 lat rozwoju Opatentowana technologia◦ Algorytm rankingu◦Nawigacja kontekstowa◦ Poziom bezpieczeństwa dokumentu Szybka instalacja i konfiguracja

Page 13: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

13

Funnelback

Page 14: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

14

Demo

Funnelback

Page 15: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

15

FunnelbackLog:

<c>!<t>20120320 09:32:59</t>!<click_url>http://www.funnelback.com/news-and-events/!news</click_url>!<http_referer>https://fnb-demo01.squiz.co.uk/s/search.html?profile=_default_preview&amp;query=funnelback&amp;collection=demo-funnelback-com</http_referer>!<rank>4<rank>!<remote_address>83.217.109.164<remote_address>!<search_referer />!<type>CLICK</type>!</c>!

Kwerendy i budowa słowników:

%=acetoin=["Acetylmethylcarbinol" "3 hydroxy 2 butanone" "3H 2B butanone"]!%=acetoin dehydrogenase=["Diacetyl Reductase"]!

Search◦ to optymalizacja◦ to zaangażowanie

Page 16: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Korzyści pracy z Funnelback:◦Searchandising◦Wsparcie◦Automatyczne usuwanie duplikatów◦ Promocja wyników Best-Bet◦Polepszenie zdolności odnajdywania◦Polepszenie wydajności◦Zwiększenie doświadczenia użytkownika◦20 lat doświadczenia

16

Funnelback

Page 17: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

UBM Search Medica◦ http://www.searchmedica.com◦ 70 milionów dokumentów◦ terabajty danych◦ UK oraz US◦ infrastruktura w oparciu o dwa serwery

Hermes◦ http://www.hermes.co.uk◦ żywotność danych◦ 100 milionów źródeł danych ◦ kompleksowa analiza

17

Squiz & Funnelback “w akcji”

Page 18: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

Victoria and Albert Museum

Skype

18

Uni of Beadfordshire

Squiz & Funnelback “w akcji”

Page 19: Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 Warszawa

19

?

Pytania