30
@ piotrpietrzak (CTO, IBM PAB) Nowi bohaterowie? - duże dane i ich analiza

Nowi bohaterowie? - duże dane - IBM Forum Analityki Biznesowej 2015

Embed Size (px)

Citation preview

@piotrpietrzak (CTO, IBM PAB)

Nowi bohaterowie?- duże dane i ich analiza

Dane przyrastają ekspotencjalnie

… i co z tego?

Danestrukturalne

Treści

niestrukturalne85%

Mity na temat Big Data

• W Big Data najważniejsza jest technologia• Big Data to projekt informatyczny• Big Data wymaga matematyków i statystyków• Trzeba zbierać jak najwięcej danych• Bez Big Data nie będziesz konkurencyjny• Big Data to informacje nieustrukturyzowane• Czy więcej danych tym lepsze analizy• Dajmy ludziom więcej danych i będzie dobrze

Zastosowanie Big Data

Rozwiązywanie problemów biznesowych

Dane są podstawą wartością do budowy przewagi konkurencyjnej

Sprzedaż

Bankowość

Zasoby naturalne

Opieka zdrowotna

Analityka Big DataSzukaj, wizualizuj i zrozum dane w celu poprawy procesów decyzyjnych.

Wzbogacony obraz klienta 360o

Połącz wewnętrzne i zewnętrzne źródła informacji aby wiedzieć jak najwięcej o kliencie, real-time.

Internet rzeczyAnalizuj dane pozyskiwane z maszyn

Modernizacja hurtowni danychModernizuje hurtownię danych: in-memory, przetwarzanie ciągłe, hadoop, appliances pamiętając o zaufaniu do danych

Bezpieczeństwo

Identyfikuj w czasie rzeczywistym nadużycia i zagrożenia oraz cyber ataki

Gdzie Big Data w organizacji

CEO

CMO CFO CIO

CDO

CRO

Gdzie Big Data w organizacji

CEO

CMO

CDO

CFO CIO CRO

Gdzie Big Data w organizacji

CEO

CMO CFO

CDO

CIO CRO

Gdzie Big Data w organizacji

CEO

CMO CFO CIO CRO CDO

Kto zarządza Big Data w organizacji

Analityka treści

Analizowana treść

(i dane)

Jan skręcił kostkę na schodach...

Źródło informacjiWewnętrzne (ECM, Pliki, DBMS, etc.)

Zewnętrzne (Social, News, etc.)

Rzecz. Czasow. Rzeczownik Określenie

Osoba Krzywda Część ciała Lokalizacja

Przypadek: Uszkodzenie ciałaEkstrakcja

Analiza treści call center

Customer Service Representative – ocena

Detekcja ciszyDetekcja nakładającej się rozmowy

Monitorowanie i raportowanie jakości

Analityka treści Call Center

Analiza treści call center

Raportowanie wynikóww oparciu o danestrulturalne i niestrukturalne

Raaportowanie geomarketingowe

Głos, SMS

Gazety

Radio

Email

Social Media

TV/Smart TV

Artykuły, blogi,fora dyskusyjne

IBM

IBM Content Analytics

„Hurtownia

danychniestrukturalnych”

Zunifikowanywgląd

Kompletnośćwidoku

GEO

Źródła informacji Przykładowe zapytanie:

Pokaż wszystkie osoby, które wspomniały o bombie w rozmowie telefonicznej w ostatnim tygodniu, są aktywne w społeczności XYZ, zmieniły status w Facebook’u i przygotowują się do wyjazdu z kraju.

•Voice-To-Text•Analityka Social Media•Monitorowanie: - wiadomości - forum dyskusyjnych

Analityka treści a wykrywanie nadużyć i zagrożeń

Czas

Moc

obl

icze

niow

a

Algorytmy mające

zastosowanie

Dostępna przestrzeń obserwacji

Trend: Organizacje stają się …

Amnezja

Kontekst

Lepsze rozumienie czegoś przez branie pod uwagę dodatkowych okoliczności i zdarzeń

Akumulacja kontekstu i dopasowanie elementów

Przyrostowy proces integracji nowych i wcześniejszych obserwacji

[email protected]

VIPKlient

Twitterowyobserwator

Złodziej tożsamości Defraudacja

[Szerszy obrazek]

[email protected]

Analityka “kanałowa” (STARE)

Strefa obserwacji

Analiza danych strukturalnych

Analiza źródeł nie strukturalnych

Analiza kanałów social, media, retail

Klient(Analityk, system, sensor itd.)

Analiza akumulacyjna (NOWE PODEJŚCIE)

Strefa obserwacji Zbudowanie obrazka

Akumulacja informacjiTrafność informacji

Klient(Analityk, system, sensor itd.)

Nagroda Zespół Zadanie

Godne uwagi zdarzenia

@ 1.3% (4 elementy) “Wow, to układanka ze zdjęciem budynku i chyba napisem”

@ 4% (12 elementów) Pierwsze kawałki obrazka poskładane.

@ 37% (112 elementów) jeden element dodawany jest co 5.2 sec. Czemu?

@ 48% (144 elementów) “Cała ramka gotowa, główne części obrazka połączone ze sobą”

@ 65% (196 elementów) pierwsze elementy nie do końca poprawnie ułożone wykryte i poprawione.

@ 75% (224 elementów) “eeee to już jest łatwe.”

Wysiłek obliczeniowy maleje gdy pole obserwacji rośnie