Upload
phunghanh
View
214
Download
0
Embed Size (px)
Citation preview
České Success Stories 2014
SAS CI Roadshow 2014
24. 9. 2014 Praha
Pavel Šiška
Reálný přínos analytiky na
praktických příkladech v českém
prostředí.
2© 2014 Deloitte Česká republika
Kdo jsmeCenter of Excellence pro střední a východní Evropu
Podstatná část - Customer Analytics (analýza klientských dat)
Finanční sektor – Retail Banking Growth Engine
Technologie – vlastní laboratoř (HW, Storage),
spolupráce se SASem
Projekty v ČR i v zahraničí
SOFTWARE!
5© 2014 Deloitte Czech Republic
Analýza nestrukturovaných dat
Proof of Concept
Fokus na internetové bankovnictví. Identifikace cca 3000 sekvencí kroků v
rámci internetového bankovnictví...
Zákazník:
Finanční sektor
Cíl:
Využití dat o chování klienta na webu pro identifikaci nabídky zajímavé pro
klienta i pro banku… Obohacení stávajících modelů založených na
transakčních datech.
6© 2014 Deloitte Czech Republic
Výsledky
Identifikovali jsme a napočítali 31 spouštěcích událostí (triggers), 294 prediktorů a 2962 sekvencí kroků v
rámci internetového bankovnictví.
Kombinace modelů přinesla výrazně lepší výsledky, než jakých by dosáhnul každý model zvlášť.
Jenom během pilotní kampaně vydělala banka o cca X mil CZK* víc, než pokud by kampaň vedla sama na
celém portfoliu (vyjádřeno v Lifetime Value).
* Částka je vypočítaná jako skutečný zisk, tedy zisk z kontraktů, které byly uzavřeny navíc oproti situaci, kdy by celou kampaň vedla banka sama.
3,60%
1,55%1,34%
2,81%
6,90%
3,17%
2,18% 2,13%
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
7,00%
8,00%
Osobní půjčka Konsolidace Kontokorent Kreditní karta
Konečné výsledky - Conversion Rate
Champion
Challenger
7© 2014 Deloitte Czech Republic
eBanking login
… …
Účty a
transakce Spoření Karty Půjčky Hypotéky Investování
Přehled
karet
Nezaúčtované
transakce
Přehled
transakcí
Doplňkové
služby
Zablokování
karty
… … …
OBCHODNÍ PRAVIDLAANALYTICKÁ PRAVIDLA
Náš přístupDeloitte obohatil existující propenzitní modely o analýzu typických sekvencí kroků v internetovém
bankovnictví, které vedou k nákupu nového produktu.
Pilotní kampaň se uskutečnila na čtyřech vybraných produktech, které byly nabídnuty klientům
prostřednictvím zprávy v internetovém bankovnictví. Kampaň proběhla jako tzv. Champion/Challenger –
Deloitte a banka si rozdělili portfolio v poměru 20:80.
Událostně řízené kampaně
Propenzitní modely
Hledali jsme typické sekvence kroků v rámci internetového
bankovnictví, které vedou k nákupu produktu.
Trigery jsou předem definované události, které když
nastanou, nárazově zvyšují pravděpodobnost, že si klient
koupí nějaký produkt.
Propenzitní modely kalkulují s jakou pravděpodobností si
klient koupí produkt, který mu banka aktivně nabízí.
Výkonnost modelu byla zvýšena vstupy z ostatních dvou
modelů.
Typické sekvence kroků
Client
information
database
8© 2014 Deloitte Czech Republic
Digitálni marketing – shrnutí
Vybrané poznatky
Vyžití dat z internetu vylepšuje výkon stávajících modelů
Nutnost mít čerstvá data. Neaktuální výrazně snižují sílu prediktivních modelů.
Nutno exekuovat kampaně hned – PtB rychle klesá už během dní (zvláště sekvence stránek zastarává
u konkrétního klienta velmi rychle)
Potenciál pro další rozvoj a zlepšení
Implemetace real-time analytiky a nabídek (nebo aspoň near-real time) – infrastrukturální projekt
(pořízení dat, scoring, exekuce kampaně)
Data z dalších kanálů jako je například mobilní bankovnictví
Sledování aktivity klienta přes cookies i neidentifikovaného na webu banky (na jiných webech je právní
problém, ale je to možné).
10© 2014 Deloitte Czech Republic
Analýza nestrukturovaných dat
Proof of Concept
Analyzovaly se poznamly v CRM…
Zákazník:
Finanční sektor
Cíl:
Prokázat reálnou využitelnost nestrukturovaných dat především v oblasti
- propenzitního modelování a
- retence
11© 2014 Deloitte Česká republika
VýsledkyPropensity to Buy
Očekávaný zisk X mil. EUR (lifetime value)
Prediktivní síla modelu:
Churn
Náklady obětované příležitosti cca X mil. EUR
Gini: 0,764
1 2 3 4 5 6 7 8 9 10
Decily
CZK m
Opportunity costs
Campaign costs
50
40
30
20
80
0
70
10
60
PTB Target GiniHodnocení
modelu
Overall 0,29 0 – 0,30
Financing 0,46 0,45 – 0,60
Investments 0,61 0,60 – 1,00
Everyday banking 0,53 0,45 – 0,60
Technical products 0,46 0,45 – 0,60
Other 0,32 0,30 – 0,45
12© 2014 Deloitte Česká republika
VýsledkyPředmět konverzace
Téma konverzace Diskutované produkty
Bez tématu
Bankovní
nabídka
Žádost klienta
Finanční plán
Stížnost
Téma
27%
31%
22%
18%
2%
3%
7%
53%
18%
7%
7%
Hypotéka
Kreditní karta
Kategorie
produktu
2%
3%
Spoření a investice
Účty a balíčky
Pojištění
Spotřebitelské půjčky
Debetní karty
Jiné
Životní styl
Has car 1,2%
Dissatisfied
Entrepreneur
Undecided
Building a house 0,3%
On welfare
11,1%
1,8%
Has a newborn baby 0,8%
Girlfriend 0,9%
Has small kid 1,1%
We 4,2%
Has grown up kid 5,6%
3,8%
Renting a flat 6,3%
0,9%
Conservative 2,3%
Loyal 7,1%
Risk averse 8,9%
Affluent 12,7%
Single 6,3%
Married 14,3%
Cost sensitive 0,4%
Interacting 0,6%
Influential 1,2%
Prestige 1,7%
Behavioral
Family
Situational
13© 2014 Deloitte Česká republika
Náš přístup
• Všechna slova byla
porovnána s českým
slovníkem a ta, která nebyla
nalezena, byla klasifikována.
• Zaznamenání speciálních
symbolů jako: !!!,???, :-), :-(
• Zaznamenání ostatních
anomálií: VŠECHNA VELKÁ
PÍSMENA …
• Překlad zkratek (zaznamenali
jsme více než 1000 zkratek)
• „Výplňová“ slova jsou slova s
omezeným významem
• Tyto slova jsou vyloučena z
analýzy, protože nemají
význam pro účel analýzy.
• „Výplňová“ slova jsou
většinou funkční slova jako
spojky, předložky atd.,
například: „ta”, „kdo”, „což”,
„tedy”, „Vám”, „na”.
• V další fázi jsou slova
převedena na základní
gramatický tvar (lemma).
• V rámci tohoto procesu jsou
také tvary v množném čísle
převedeny do jednoduchého
a všechna slova jsou
přepsána do prvního pádu.
Tokenizace Vyloučení „výplňových“ slov Lematizace
Vyloučení
„výplňových“
slov
LematizaceTerm Document
MatrixKlasifikaceTokenizace
Příprava dat Analýza
14© 2014 Deloitte Česká republika
Náš přístup
Term Document Matrix
• Frekvence každého slova v každé
poznámce je spočítána a uložena
do Term Document Matrix.
• Term Document Matrix je matice,
kde jednou dimenzí jsou různé
poznámky a druhou různá lemmata
(slova), která se v poznámkách
vyskytují.
• Tyto data slouží k trénování
klasifikačních modelů.
Klasifikace
• Klasifikace nestrukturovaného textu
představuje „big data“ problém.
Term Document Matrix byla proto
zredukována na 1300 nejčastěji se
vyskytujících lemmat (slov). I tak
matice o rozměrech 2,7 mil. x 1300
zabrala cca 28 GB RAM.
• Klasifikační modely byly původně
fitovány v R a LIBSVM, ale později
kvůli lepšímu výkonu v SASu.
Vyloučení
„výplňových“
slov
LematizaceTerm Document
MatrixKlasifikaceTokenizace
Příprava dat Analýza
15© 2014 Deloitte Česká republika
Analýza nestrukturovaných dat – shrnutí
Potenciál pro další rozvoj a zlepšení
Hledání dalších oblastí – například ochota klientů sdělovat informace o konkurenci a produktech, které
využívají jinde
Využití pro analýzu cenové elasticity – jaká sleva je třeba (nebo není sleva potřeba)
Vyžít data i z dalších datových zdrojů
Jít do většího detailu například u uvěrových produktů
Vybrané poznatky
Nestrukturovaná data vylepšují existující analytické modely a pomáhají odhalit další důležité skutečnosti
Vytěžení nestrukturovaných dat není extrémně náročná úloha (finančně, časově, technologicky)
Více než technologie rozhoduje schopnost stavět modely pro danou industrii a konkrétní úkol
17© 2014 Deloitte Česká republika
Kontakty
FLAVIO PALACIPartner | Applied Analytics Deloitte Advisory s.r.o.
Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic
Tel/Direct: +420 246 042 543 | Mobile: +420 730 595 648
[email protected] | www.deloitte.cz
FILIP TROJANManager | Applied Analytics Deloitte Advisory s.r.o.
Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic
Tel/Direct: +420 246 042 797 | Mobile: +420 733 598 521
[email protected] | www.deloitte.cz
PAVEL ŠIŠKAPartner | ConsultingDeloitte Advisory s.r.o.
Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic
Tel/Direct: +420 246 042 300 | Mobile: +420 737 264 273
[email protected] | www.deloitte.cz
Deloitte označuje jednu či více společností Deloitte Touche Tohmatsu Limited, britské privátní společnosti s ručením omezeným zárukou („DTTL“), jejích
členských firem a jejich spřízněných subjektů. Společnost DTTL a každá z jejích členských firem představuje samostatný a nezávislý právní subjekt.
Společnost DTTL (rovněž označovaná jako „Deloitte Global“) služby klientům neposkytuje. Podrobný popis právní struktury společnosti Deloitte Touche
Tohmatsu Limited a jejích členských firem je uveden na adrese www.deloitte.com/cz/onas.
Společnost Deloitte poskytuje služby v oblasti auditu, daní, poradenství a finančního a právního poradenství klientům v celé řadě odvětví veřejného
a soukromého sektoru. Díky globálně propojené síti členských firem ve více než 150 zemích a teritoriích má společnost Deloitte světové možnosti a poskytuje
svým klientům vysoce kvalitní služby v oblastech, ve kterých klienti řeší své nejkomplexnější podnikatelské výzvy. Přibližně 200 000 odborníků usiluje o to,
aby se společnost Deloitte stala standardem nejvyšší kvality.
Společnost Deloitte ve střední Evropě je regionální organizací subjektů sdružených ve společnosti Deloitte Central Europe Holdings Limited, která je členskou
firmou sdružení Deloitte Touche Tohmatsu Limited ve střední Evropě. Odborné služby poskytují dceřiné a přidružené podniky společnosti Deloitte Central
Europe Holdings Limited, které jsou samostatnými a nezávislými právními subjekty. Dceřiné a přidružené podniky společnosti De loitte Central Europe
Holdings Limited patří ve středoevropském regionu k předním firmám poskytujícím služby prostřednictvím více než 3 900 zaměstnanců ze 34 pracovišť
v 17 zemích.
© 2014 Deloitte Česká republika