41
VERSLO ANALITIKOS ATEITIS Aleksej Kovaliov, BDC programavimo centro direktorius 2013 05 30

Bdc future of business analytics final

Embed Size (px)

DESCRIPTION

Aleksejaus Kovaliovo, BDC programavimo paslaugų centro direktoriaus, prezentacija, kurią jis skaitė metinėje IT vadovų konferencijoje „IT Summit“ 2013 metų gegužės 30-ą dieną. Šis pranešimas konferencijos dalyvių buvo geriausiai įvertintas iš visų tą dieną skaitytų pranešimų. Pranešimas skirtas aptarti šiuo metu vis aktualesnei didžiųjų duomenų (angl. big data) temai. Per kelis pastaruosius metus apdorojamų ir saugomų duomenų apimtys eksponentiškai išaugo ir šis augimas tęsiasi toliau kosminiu greičiu. Natūraliai vyksta eilinė kompiuterinių sistemų technologijų bei architektūros evoliucija. Paradigmos pokyčio mąstą galima palyginti su perėjimu nuo universaliųjų kompiuterių (angl. mainframes) prie personalinių, toliau prie kliento-serverių ir žiniatinklio sistemų. Prezentacijoje pateikiamas įvadas į didžiųjų duomenų (angl. big data) bei duomenų mokslo (angl. data science) tematiką, apžvelgti iki šiol retai versle nagrinėjami duomenų šaltiniai, pateikti naujoviškos verslo analitikos sistemų architektūros modeliai.

Citation preview

Page 1: Bdc future of business analytics final

VERSLO ANALITIKOS ATEITIS Aleksej Kovaliov, BDC programavimo centro direktorius

2013 05 30

Page 2: Bdc future of business analytics final

© Back to the Future movie

VERSLO ANALITIKOS ATEITIS

Page 3: Bdc future of business analytics final

Kodėl?

3

2015 metai

4.4M IT darbo vietų, susijusių su BIG DATA

iš jų 1.9M x 3 = 6M JAV Peter Sondergaard, Sr VP at Gartner and global head of Research

http://www.gartner.com/newsroom/id/2207915

Jau dabar

Page 7: Bdc future of business analytics final

© Minority Report movie

ATEITIS

Page 10: Bdc future of business analytics final

90% per 2 metus

10

Labai daug duomenų

90% duomenų sugeneruota per pastaruosius 2 metus

Techninės platformos pinga

Debesų platformos tampa įprastu dalyku

http://www.sciencedaily.com/releases/2013/05/130522085217.htm

Page 11: Bdc future of business analytics final

Duomenys ateina iš visur

11

Internetas kiekvienoje kišenėje

Socialinių tinklų rinkos ir revoliucijos

E-valstybės

Protinga energetika 20/20/20

Protingi daiktai...

Page 12: Bdc future of business analytics final

Defragmentuoti dividualai

12

Tradiciniai segmentai nustoja galioti

Personalinės informacijos gausybė

E-Sociumai

1 žmogus : N personų

Page 13: Bdc future of business analytics final

Karaokė

13

Apimčių santykis

Apimties augimo greičio

santykis

NE-interneto ir NE-gigantai einam tuo pačiu keliu

Page 14: Bdc future of business analytics final

Išmetam duomenis = Išmetam pinigus

14

Prarandame duomenis, nes „netelpa“

Nebandome moksliškai tyrinėti

Nežinome savo tikrų klientų, aplinkos, istorijos

Ignoruojame „baltą triukšmą“

Page 15: Bdc future of business analytics final

15

BIG DATA OPEN DATA HADOOP NOSQL FAST DATA MPP

Page 16: Bdc future of business analytics final

BIG DATA

16

Duomenų kiekiai, kuriuos tikrai sunku apdoroti įprastomis priemonėmis (Wikipedia)

V. V. V.

Volume – 100-ai Tbytes, Pbytes ...

Velocity –„Duomenų srovė“, FAST DATA

Variety – Struktūriniai / ne / pusiau

Nuodėmė#8: ne kaupti, o juolab, trinti duomenis

Page 17: Bdc future of business analytics final

OPEN DATA

17

Duomenų viešinimas pakartotinam panaudojimui

Žali duomenys, skirti ne žmogui, o mašinai

Nemokamos licencijos

LINKED OPEN DATA: Semantinis atvirų duomenų tinklas

Strateginė ES kryptis

http://open-data.europa.eu/

http://data.gov.uk/

Lietuvoje užuomazgos

http://opendata.gov.lt/

http://data.ukmin.lt/

Page 18: Bdc future of business analytics final

OPEN & BIG, BIG & OPEN?

18

Ne tas pats

BIG Technologijos

OPEN Teisiniai klausimai, standartizacija, procesai

Tačiau

BIG DATA technologijos gali būti taikomos OPEN DATA

OPEN DATA gali išaugti iki BIG

Page 20: Bdc future of business analytics final

OPEN & BIG PAVYZDŽIAI2

20

Page 21: Bdc future of business analytics final

HADOOP

21

Paskirstyta failų sistema su replikavimu ir Java dorokliais

Palaiko milžiniškas duomenų apimtis ir failų dydžius

Daugybė atviro kodo ir komercinių versijų

Page 22: Bdc future of business analytics final

MAP-REDUCE

22

„Pasidaryk pats“ Java dorokliai failams

Kai kurie Hadoop numato SQL

Page 23: Bdc future of business analytics final

MPP - Massive Parallel Processing

23

Page 24: Bdc future of business analytics final

VERSLO ANALITIKOS ATEITIS

DABARTIS

Page 25: Bdc future of business analytics final

Įprasta verslo analitika

25

Page 26: Bdc future of business analytics final

Nauja verslo analitika

26

Page 27: Bdc future of business analytics final

Verslo analitika Duomenų mokslas

27

Page 29: Bdc future of business analytics final

Pranašystės

29

1. Esamų BI sistemų papildymas duomenų rezervuarais

2. Gamybiniai duomenų mokslininkų padaliniai

3. Verslo analitikos platformos, kaip paslauga (aaS)

4. Prognozinės analitikos plėtra operatyvinėse sistemose

5. Atvirų duomenų pajungimas į verslo analitiką

6. „Balto triukšmo“ standartizacija

Page 30: Bdc future of business analytics final

1. Duomenų rezervuarai

30

Page 32: Bdc future of business analytics final

Duomenų mokslo gamybos ciklas

32

Page 33: Bdc future of business analytics final

Praeitis

33

Idėjos ir charizma

Page 34: Bdc future of business analytics final

Ateitis

34

Faktai ir mokslas

Page 35: Bdc future of business analytics final

3. Platformos As-A-Service

35

Page 36: Bdc future of business analytics final

4. Prognozinė analitika gali būti visur

36

Modeliai, įkomponuoti į „kasdienes“ IS:

• Prekyba: Individuali prekių pasiūla

• Prekyba: Kainų optimizacija

• Telco: Abonento išėjimo rizikos eskalavimas

• Telco, Gamyba: Avarijos pavojaus aptikimas

• Gamyba: Atsargų pirkimo optimizavimas

• Gamyba: Išteklių švaistymo aptikimas

• Kiber-saugumas: Botnetų identifikavimas tinkle

• Finansai: Sukčiavimo prevencija

• Medicina: Epidemijos pavojaus eskalavimas

• . . .

Page 37: Bdc future of business analytics final

5. Atvirų duomenų pajungimas

37

http://linkeddatabook.com/editions/1.0/

2015: ^N 2013: *N 2010:

Page 38: Bdc future of business analytics final

Duomenų rezervuarai IN-OUT

38

http://linkeddatabook.com/editions/1.0/

Page 39: Bdc future of business analytics final

6. Standartizacija

39

Terminai ir klasifikavimas

„Sidabrinės kulkos“ nebus

Architektūros parinkimo faktoriai:

• Priimam ar publikuojam

• Saugom ar skaičiuojam

• Transakcionalumas

• Vėlavimas

• Srauto pastovumas

• Vizualizavimas

• Saugumas

• Privatumas

• ...

Page 40: Bdc future of business analytics final

40

0. Nauja DB technologijų ir architektūros karta

1. Esamų BI sistemų papildymas duomenų rezervuarais

2. Gamybiniai duomenų mokslininkų padaliniai

3. Verslo analitikos platformos, kaip paslauga (aaS)

4. Prognozinės analitikos plėtra operatyvinėse sistemose

5. Atvirų duomenų pajungimas į verslo analitiką

6. „Balto triukšmo“ standartizacija

Page 41: Bdc future of business analytics final

© Back to the Future movie

Po 7 metų visa tai bus JUST DATA