Upload
jari-jussila
View
419
Download
2
Embed Size (px)
Citation preview
Analytiikka toiminnan
kehittämisessä
Jari Jussila
Novi tutkimuskeskus
Data-analytiikka PK-yritysten toiminnan kehittämisessä
4.12.2014
Johdanto
• Big Datan ja analytiikkamaailman
käsitteiden läpikäyminen
• Toiminnan kehittämisen eri ulottuvuudet,
mihin kaikkeen data ja analytiikka taipuvat
• Analytiikka web-sivujen seurannassa,
hakukoneoptimointi, sosiaalisen median
hyödyntäminen toiminnan kehittämisessä
ja asiakasanalyysissa
8.12.2014 2
Big datan ja
analytiikkamaailman
käsitteet
8.12.2014 3
Päätöksenteon tukijärjestelmät
ja johdon tietojärjestelmät
”1970-1990”
8.12.2014 4
vrt. erilaiset johdon työpöydät, kuten markkinoinnin työpöytä
Vierailut
Toiminnot sivustolla
Liidit
Mahdollisuudet
Voitot
Metriikka Tavoitteen
saavuttaminen
64 %
51 %
70 %
29 %
35 %
Myyntisuppilo
Lähde: erilaisia esimerkkejä nähtävillä esim. Klipfolion sivuilla (ks. Dashboards);
ks. myös Visualisointi ja tiedon jakamisen käytännöt (Aho 2014)
Kuutioiden mallinnus - OLAP
(online analytical processing)
8.12.2014 5
Tuote
Aika
Markkinat
image Athanasios Kastanidis
”1980-1990”
OLAP-kuutioiden perusidea
• OLAP-tekniikka poikkeaa perinteisestä
tilastoinnista ja raportoinnista siten, että käyttäjä
voi vaihtaa näkökulmaa tiedontarpeensa mukaan.
• Esimerkiksi analyytikko voi lähteä 1)
tarkastelemaan tuoteryhmien myyntiä maittain, 2)
filtteröidä aineisto tiettyihin maihin 3) joista löytää
jotain esimerkiksi myyntitavoitteista poikkeavaa.
Tämän jälkeen 4) porautua esimerkiksi myyntiin
tietyissä kaupungeissa. 5) Vaihtaa näkökulmaa
liikevoittoon tuoteryhmittäin, jne.
8.12.2014 6
”1980-1990”
Liiketoimintatiedon
hallinnan ulottuvuudet
8.12.2014 7
Organisaation
sisäinen Organisaation
ulkoinen TIEDON
KOHDE
Määrällinen
Laadullinen
TIEDON
TYYPPI
Organisaation
sisäinen
Organisaation
ulkoinen
TIEDON
LÄHDE
Lähde: [Hannula 2005]; image Athanasios Kastanidis
”1989-2005”
Tiedon arvoketju
liiketoimintatiedon hallinnan
näkökulmasta
8.12.2014 8
Lähde: [Myllärniemi 2012]
Minkälaista tietoa tarvitaan?
Tieto, joka on pystytty
hankkimaan
Tieto, joka todella
tarvitaan
Tieto, joka määritellään tarpeelliseksi
8.12.2014 9
Lähde: [Hannula 2005]
Liiketoimintatiedon hallinnan
prosessimalli ja keskeiset tehtävät
8.12.2014 10
Lähde: Tietojohtaminen [Laihonen et al. 2013]
Tiedonlouhinta, data mining,
knowledge discovery in
databases (KDD) ”1990-2007”
8.12.2014 11
10-20 % 20-30 % 50-70 % 10-20 % 10-20 % 5-10 %
1. Liiketoiminnan
ymmärtäminen
2. Datan
ymmärtäminen
3. Datan
valmistelu
3. Mallinnus,
tiedonlouhinta
5. Arviointi
6. Tulosten
julkaisu
Lähde: The CRISP-DM Model [Shearer 2000], [Aho 2014]
CRISP-DM referenssimalli
CRISP-DM referenssimallin tehtävät
Liiketoiminnan
ymmärtäminen
Datan
ymmärtäminen
Datan
valmistelu
Mallinnus,
tiedonlouhinta
Arviointi Tulosten
julkaisu
Määritä
liiketoiminnan
tavoitteet
Tee tilannearvio
Määritä
tiedonlouhinnan
tavoitteet
Laadi
projektisuunnitelma
Kerää alustava
data
Kuvaa data
Tutki dataa
Varmista datan
laatu
Datasetin
kuvaus
Datan valinta
Datan siivous
Datan
rakentaminen
Datan
integrointi
Datan
formatointi
Valitse mallinnus
menetelmä
Suunnittele koe
Rakenna malli
Arvioi mallia
Arvioi tuloksia
Arvioi ja
varmista
tiedonlouhinta
prosessin laatu
Määrittele
seuraavat
stepit
Suunnittele
mallin julkaisu
(esim.
verkkosivuna)
asiakkaalle
Suunnittele
mallin ylläpito
Laadi
loppuraportti
Arvioi projekti
8.12.2014 12
Lähde: The CRISP-DM Model [Shearer 2000]
Analytiikka ”2005-2010”
• Deskriptiivinen analytiikka: tekniikoita joiden avulla voidaan
ymmärtää dataa ja analysoida liiketoiminnan suoriutumiskykyä
• Diagnostiivinen analytiikka: tekniikoita joiden avulla voidaan
ymmärtää mitä on tapahtunut ja miksi
• Prediktiivinen analytiikka: tekniikoita joiden avulla voidaan
analysoida nyky- ja historiatietoa jotta voidaan päätellä mitä
todennäköisesti tapahtuu tai ei tapahdu
• Preskriptiivinen analytiikka: tekniikoita joiden avulla voidaan
laskennallisesti kehittää ja analysoida vaihtoehtoja organisaation
toiminnalle
• Päätöksentekoa tukeva analytiikka: tekniikoita joiden avulla voidaan
visualisoida informaatiota päätöksen teon tueksi
8.12.2014 13
Lähde: Big Data and Analytics [Kaisler et al. 2014]
Analytiikkasykli
1. Määrittele liiketoimintaongelma tai kysymys johon haluat vastauksen
2. Tunnista, kerää, siivoa ja valmistele data kysymyksen vastausta varten
3. Deskriptiivinen analytiikka
– Perehdy dataan (descriptives, correlations, factor analysis, cluster
analysis, ym.)
– Luo mahdollisia hypoteeseja (data mining ym.)
4. Prediktiivinen analytiikka
– Muodosta hypoteesit
– Tunnista soveltuvimmat analytiikkamenetelmät
– Kehitä analyyttiset mallit (multivariate regression, logistic regression,
forecasting, non-linear models, decision trees, ym.)
– Aja mallit ja luo ennusteet
5. Preskriptiivinen analytiikka
– Kehitä päätös- ja optimointimallit
– Hyödynnä koneoppimista päätöksien ohjelmointiin
6. Kirjoita johtopäätökset ja suositukset
8.12.2014 14
Lähde: Introduction to Big Data [Kaisler et al. 2014]
Big Data ”2010-”
8.12.2014 15
Volyymi Vauhti Variaatio Varmuus
Data at Rest Data in Motion Data in Many Forms Data in Doubt
Terabittejä olemassa
olevaa dataa
prosessoitavaksi
Striimattua dataa, nopea
vasteaika millisekunneista
sekunteihin
Strukturoitua, ei-
strukturoitua, ja
semistrukturoitua dataa
Epävarmuutta liittyen
datan epätäydellisyyteen,
puutteellisuuteen, tai
virheellisyyteen
Lähde: [Breuker 2014; Laney, Meta Group 2001 (3V:tä)]
Big Data transaktioista
interaktioihin
8.12.2014 16
WEB
BIG DATA
Lähde: mukaillen [Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013]
ERP
CRM
ostotiedot
maksutiedot
segmentointi
tarjoustiedot
asiakaskohtaamiset
tukikontaktit
weblogit
tarjoushistoria A/B testaaminen
Dynaaminen
hinnoittelu
Hakukonemarkkinointi
ja optimointi
Mainosverkostot
Käyttäytymispohjainen
kohdentaminen
Dynaamiset
funnellit
Sentimentti
Ulkopuolinen demografia
Kuvat ja videot
Puheen muuttaminen tekstiksi
Feedit
Anturi/sensoridata
Tuote / palvelu logit
SMS/MMS
Sosiaaliset verkostot
Sosiaalinen media
Käyttäjien luoma sisältö
Mobiilidata
Klikkivirran analyysi
Sijaintidata
Datan lajeja
Datan laji Muoto Volyymi Kuvaus Esimerkkejä
Master Data Strukturoitu Matala Yritystason dataa jolla on
strategista arvoa organisaatiolle
Asiakas, tuote,
toimittaja
Transaktiodata Struktoroitu & semi-
strukturoitu
Keskinkertainen -
korkea
Transaktiot joita syntyy
liiketoiminta-prosesseissa
Tilaukset, ostot,
maksut
Referenssidata Struktoroitu & semi-
strukturoitu
Matala – keskin-
kertainen
Faktoja jotka tukevat
organisaation kykyä tehokkaasti
prosessoida transaktioita, hallita
masterdataa ja tukea päätöksiä
Demografiset kentät
Metadata Strukturoitu Matala ”Dataa datasta” Datan nimi, datan
dimensiot tai yksiköt,
ym.
Analytiikkadata Strukturoitu Keskinkertainen -
korkea
Liiketoimintaoperaatiosta tai
transaktioista jalostettua tietoa
raportoinnin ja analytiikan
tarpeisiin
Data joka sijaitsee
tietovarastoissa ja
päätöksenteon
tukijärjestelmissä
Big Data Struktoroitu, semi-
strukturoitu ja ei
strukturoitu
Korkea Isoja data settejä, joita on
haastava tallentaa, etsiä, jakaa,
visualisoida ja analysoida
Ihmisten ja koneiden
luomaa dataa
sosiaalisesta
mediasta, webistä,
mobiililaitteista,
sensoreista, ym.
8.12.2014 17
Lähde: Big Data and Analytics [Kaisler et al. 2014]
Master data
• organisaation ydintieto on usein kaikkein
tärkeintä liiketoiminnalle ja siinä menestymiselle
sekä data-lähtöiselle päätöksenteolle
• ydintietoa käytetään useissa yrityksen
prosesseissa ja tietojärjestelmissä, joten
ydintietojen muotojen standardointi ja arvojen
synkronointi on kriittistä järjestelmien
onnistuneelle integroinnille
• ydintiedoksi mielletään usein esimerkiksi
asiakastiedot ja tuotetiedot
8.12.2014 18
Lähde: [Vilminko-Heikkinen & Pekkola 2013]
Datan käyttöön ja analysointiin
liittyvää terminologiaa
Termi Ajanjakso Kuvaus
Päätöksenteon tuki
[Decision Support]
1970-1985 Hyödynnetään data analyysiä
tukemaan päätöksentekoa
Johdon tukijärjestelmät
[Executive Support Systems]
1980-1990 Fokus data analyysissä
ylemmän johdon tueksi
Kuutioiden mallinnus
[Online Analytical Processing
OLAP]
1990-2000 Ohjelmistoja
multidimensionaalisten data
taulujen analysointiin
Liiketoimintatiedon hallinta
[Business Intelligence]
1989-2005 Työkaluja tukemaan
datalähtöistä päätöksentekoa,
painopiste raportoinnissa
Analytiikka
[Analytics]
2005-2010 Fokus tilastollisessa ja
matemaattisessa analyysissä
päätöksenteon tueksi
Massadata
[Big Data]
2010- Fokus erittäin isossa,
monimuotoisessa ja nopeasti
liikkuvassa datassa
8.12.2014 19
Lähde: Big Data at Work [Davenport, 2014]
Kuinka liiketoimintatiedon
hallinta on muuttunut
massadatan myötä?
Massadata Business analytiikka Liiketoimintatiedon
hallinta
Vanhaa • Relaatiotietokannat
• SQL
• Tietovarastot
• Tiedonlouhinta
• Kvantitatiivinen
analyysi
• Tilastotiede
• Operaatiotutkimus
• Päätöksenteon
tukijärjestelmät
• Johdon
tietojärjestelmät
• OLAP
Uutta • 4V:tä
• Monimuotoista dataa
• Vähemmän struktuuria
• Big Data teknologiat
(MapReduce, Hadoop,
NoSQL, ym.)
• Ei strukturoitua dataa
• Dataa monesta
lähteestä
• Monimuotoista dataa
• Data liikkeessä
• Tekstianalytiikka
• Visuaalinen analytiikka
• Sosiaalisen median
analytiikka
• Helppokäyttöisyys
• Visuaalisuus
• Dynaamisuus
• Kattaa organisaation
prosessit
• Koneoppiminen
• RTAP
8.12.2014 20
Lähde: mukailtu Introduction to Big Data [Kaisler et al. 2014]
Big Data, data-analytiikka ja
lähikäsitteet
• Big Data can be defined as the amount of data just beyond
technology’s capability to store, manage and process efficiently.
(Kaisler et al. 2014)
• Data analytics is the science of examining raw data with the purpose
of drawing conclusions about that information. (Rouse 2008)
• Business analytics is the scientific process of transforming data into
insight for making better decisions (INFORMS)
• Tiedonlouhinta (engl. data mining) on kokoelma menetelmiä, jotka
valikoivat, kuvailevat ja mallintavat suuria tietomääriä tavoitteenaan
löytää tiedon omistajalle uusia ja hyödyllisiä säännönmukaisuuksia
ymmärrettävässä muodossa (Hand et al. 2001)
• Business Intelligence refers to the technologies, applications, and
processes for gathering, storing, accessing, and analyzing data to
help its users make better decisions (Wixom and Watson, Teradata
University Network 2012)
8.12.2014 21
Ymmärrys
Tiedon tasot
8.12.2014 22
Data
Informaatio
Tietämys
Lähde: [Laihonen et al. 2013; Tuomi 1999; Thierauf 1999; Ackoff 1989]
Tiedon tasot esimerkein
avattuna
8.12.2014 23
Informaatio Data Tietämys Ymmärrys
A X1 X2
1 1 300
2 0 159
… … …
100 1 501
A X1 X2
1 1 300
2 0 159
… … …
100 1 501
A = asiakasnumero
X1 = sukupuoli
(0=nainen, 1=mies)
X2 = kk-ostot
• ”Meillä on
tietokannassamme
100 asiakkuutta”
• ”85%
asiakkaistamme on
naisia”
• ”Keskimääräiset
kk-ostot ovat 250€”
• ”Suurin osa
asiakkaistamme on
naisia, vaikka
tuotteemme ovat
suunnattu
pääasiassa
miehille -?!@%!”
Lähde: [Väisänen 2011]
Tiedonhallinnan tasot
8.12.2014 24
Innovoiva
Erottuva
Arkistoiva
Mallinnus
Visualisointi
Ennustaminen
Optimointi
Raportointi
”Löytyisikö
täältä jotain?”
”Tiedän mitä
tarvitsen mutta
haluan tehdä
sen kilpailijoita
paremmin"
”Tätä tarvitaan
mutta tällä ei
erotuta"
Lähde: Informaatiosta kilpailuetua teollisuusyrityksiin [Valli & Ahlgren 2013]
tieto, joka on tallennettava esimerkiksi
määräysten perusteella
tieto, jonka avulla voidaan edistää ja
parantaa nykyistä liiketoimintaa
tieto, jonka avulla voidaan innovoida uutta
liiketoimintaa
Lähteitä
• Breuker, D. 2014. Towards Model-Driven Engineering for Big Data Analytics – An Exploratory Analysis of Domain-
Specific Languages for Machine Learning. 47th Hawaii International Conference on System Sciences.
• Davenport, T. H., Patil, D. J. 2012. Data Scientist. The Sexiest Job of the 21st Century. Harvard Business Review.
October 2012.
• Davenport, T. H. 2014. Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business
Review.
• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Introduction to Big Data. Presented at HICSS-47, January
6, 2014, Waikoloa, Hawai’i.
• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Big Data and Analytics. Presented at HICSS-47, January
6, 2014, Waikoloa, Hawai’i.
• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Advanced Analytics – Issues and Challenges in the Global
Environment. 47th Hawaii International Conference on System Sciences.
• Hannula, M. 2005. Tieto- ja liiketoiminta. Tekniset välineet ja sovellukset. Luento 23.10.2005.
• Laihonen, H., Hannula, M; Helander, N; Ilvonen, I; Jussila, J; Kukko, M; Kärkkäinen, H; Lönnqvist, A; Myllärniemi,
J; Pekkola, S; Virtanen, P; Vuori, V; Yliniemi, T. 2013. Tietojohtaminen. Laitosraportti. Tampereen teknillinen
yliopisto.
• Laney, D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. Retrieved 6 February
2001.
• Loukides, M. 2010. What is Data Science? O’ Reilly, Cambridge. http://www.kiwidatascience.it/wp-
content/uploads/2013/05/What_Is_Data_Science_.pdf
• Yli-Pietilä & Backman 2013. Management by analytics. Commercial and technical applications in the Big Data era.
Teradata
• Valli, K., Alhgren 2013. Informaatiosta kilpailuetua teollisuusyrityksiin. Teknologiateollisuus.
http://www.teknologiateollisuus.fi/file/16270/Informaatiostakilpailuetua.pdf.html
• Vilminko-Heikkinen, R., Pekkola, S. 2013. Establishing an Organization’s Master Data Management Function: A
Step-wise Approach. 46th Hawaii International Conference on System Sciences.
• Väisänen, J. 2011. Tiedonlouhinta. Luentomateriaali.
8.12.2014 25
Toiminnan kehittämisen eri
ulottuvuudet, mihin kaikkeen
data ja analytiikka taipuvat
8.12.2014 26
Raportoinnista operationaaliseen
data-analytiikkaan
8.12.2014 27
Raportit
RAPORTOIDAAN
MITÄ
tapahtui?
ANALYSOIDAAN
MIKSI
se tapahtui?
Ad hoc
BI työkalut
ENNUSTETAAN
MITÄ TULEE
tapahtumaan?
Ennustavat
mallit
OPERATIONALISOIDAAN
MITÄ ON
tapahtumassa nyt?
Linkki operatiivisiin
järjestelmiin
AKTIVOIDAAN
PISTETÄÄN
tapahtumaan
Automaattiset
linkitykset
STRATEGINEN ÄLYKKYYS
OPERATIONAALINEN ÄLYKKYYS
Lähde: mukaillen [Yli-Pietilä & Backman 2013]
Tiedonlouhinnan menetelmiä
8.12.2014 28
Suunnattu
Ei-suunnattu
Ad Hoc Strateginen
suunnittelu
Ennustaminen Segmentointi
Klusterointi
Visualisointi
OLAP
Neuroverkot
Regressio
Lähde: [Kudyba & Hoptroff, 2001; Väisänen, 2011]
Klusterointi
• Kuvailevaa tiedonlouhintaa / deskriptiivistä analytiikkaa
• Tavoitteena klusteroida (luokitella) datamatriisin
havainnot siten, että jokaisen klusterin sisällä olevat
havainnot ovat mahdollisimman homogeenisia, ja
jokainen klusteri mahdollisimman heterogeeninen
muiden klusterien kanssa
• Yleisiä käyttötarkoituksia
– asiakkaiden segmentointi
– myymälöiden ryhmittely menestyksen mukaan esimerkiksi
kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin
[Niemijärvi 2013]
8.12.2014 29
Esimerkki hierarkkisesta
klusteroinnista
8.12.2014 30
Klusterien
lukumäärä
Klusterit
5 (1) (2) (3) (4) (5)
4 (1,2) (3) (4) (5)
3 (1,2) (3,4) (5)
2 (1,2) (3,4,5)
1 (1,2,3,4,5)
1 2 3 4 5
Lähde: [Väisänen, 2011]
Assosiaatiosäännöt
• Tarkoituksena löytää havaintoja, jotka esiintyvät yhdessä
useammin kuin muut
• Usein käytettyjä sovelluksia
– Ostoskorianalyysi, engl. market basket analysis (MBA), ks. Esim.
[Niemijärvi 2014]; [Ollikainen 2013]
– Klikkivirran analyysi, engl. web clickstream analysis (WCA)
[Paananen 2006]
• Normaaleista tietokannoista poiketen
assosiaatiosääntöjä tarkastellaan transaktio- ei
asiakaspohjaisesti
– MBA:ssa yksi datamatriisin rivi vastaa yhtä kassalla käyntiä
– WCA:ssa yksi datamatriisin rivi vastaa yhtä vierailua
verkkosivuille
8.12.2014 31
Assosiaatiosäännöt
• Assosiaatiosääntö on todennäköisyyteen perustuva
lausuma tiettyjen tapahtumien samanaikaisesta
tapahtumisesta:
• JOS A=1 ja B=1, NIIN (tietyllä todennäköisyydellä p) C=1
• Todennäköisyys, että ostetaan tavara X, kun tavara Y on ostettu: X → Y
• Esim. (Maito & Tee) → Keksejä (assosioaatiosääntö)
• Säännön oikealla puolella yleensä vain yksi tekijä
• Säännön vasemmalla puolella harvoin kolmea tekijää enempää (3. asteen sääntö)
• Todennäköisyydet tavaroiden ostamiselle saadaan jakamalla ostotapahtumien esiintymistiheys kaikkien ostotapahtumien lukumäärällä
8.12.2014 32
Lähde: [Väisänen, 2011]
• Tuki (”Support”) {A → B} = P(A ja B)
– Todennäköisyys, että tuotteet A ja B löytyvät satunnaisesta ostoskorista. Jos 40%
ostoksista sisältää sekä maitoa että leipää, tuki {maitoa→ leipää} = 0.4
• Symmetrinen, eli tuki {leipää → juustoa} = tuki {juustoa → leipää}
• Jos tuki kovin alhainen, ei säännöllä välttämättä ole kovin suurta käytännön
merkitystä
• Luottamus (”Confidence”) {A → B} = tuki {A → B} / tuki {A}
– Todennäköisyys, että satunnaisesta ostoskorista löytyy tuote B, jos siellä on tuote A
– Jos 80 % ostoksista sisältää leipää, mutta vain 40 % sisältää sekä leipää että maitoa,
luottamus {leipää → maitoa} = 0.4 / 0.8 = 0.5
– Luku ei välttämättä ole symmetrinen
• Noste (”Lift”) {A → B} = luottamus {A → B} / tuki {B}
– Normalisoitu luku, joka ilmaisee, kuinka paljon tuotteen A ostaminen vaikuttaa tuotteen
B ostamiseen
– Jos luottamus {leipää → maitoa} = 0.5 ja 40 % ostoksista sisältää maitoa, noste
{leipää → maitoa} = 0.5 / 0.4 = 1.25
– Eli henkilöt, jotka ostelevat leipää, ostelevat 1.25-kertaisesti maitoa verrattuna koko
porukkaan
8.12.2014 33
Assosiaatiosäännöt
Lähde: [Väisänen, 2011]
Regressio
• Lineaarinen regressio auttaa ennustamaan
toisen muuttujan arvoja toisen muuttujan
arvoilla
• Logistisen regression avulla voidaan
selittää/ennustaa binääristä muuttujaa
• Kuinka mallinnuksen avulla ennustetaan
asiakkaan ostotodennäköisyys? [Ollikainen
2014]
8.12.2014 34
Puumallit
• Yhdistetään regressio ja klusterointi
– Jaetaan havaintoja osajoukkoihin (klusterointi) tietyn
ennustettavan muuttujan mukaan (regressio)
• Käytetään usein asiakkaiden luokitteluun, kun tiedetään,
minkä ominaisuuden mukaan halutaan luokitella
– Puhelinoperaattorilla tiedossa, että 70 % asiakkaista maksaa
laskunsa myöhässä, ja nyt halutaan tietää, keitä nämä ihmiset
oikein ovat, ja miten voidaan ennustaa, maksaako uusi asiakas
mahdollisesti laskunsa ajoissa
– Asiakastiedoista valitaan ne muuttujat, joiden arvellaan olevan
keskeisessä roolissa. Oletetaan, että seuraavat muuttujat
voisivat vaikuttaa siihen, maksaako asiakas laskunsa ajoissa (0=
ei maksa ajoissa, 1= maksaa ajoissa)
1. Keskimääräinen puhelimen käyttöaste (min/kk)
2. Ikä (1 = alle, 30v. 2 = yli 30v.)
3. Siviilisääty (1 = naimaton, 2 = naimisissa)
8.12.2014 35
Lähde: [Väisänen, 2011]
8.12.2014 36
• Puhelinoperaattoriesimerkki jatkuu… – Alussa meillä on kaikki havainnot (10 000) yhdessä, joista
siis 3 000 maksaa laskunsa ajoissa
– Puumalli jaottelee kaikki 10 000 havaintoa parhaiten
kohdemuuttujaa (laskun ajoissa maksu) luokittelevalla
muuttujalla
1: 30% 3000
0: 70% 7000
Yht. 100% 10000
1: 30% 3000
0: 70% 7000
Yht. 100% 10000
1: 11.7% 460
0: 88.3% 3480
Yht. 100% 3940
1: 41.9% 2540
0: 58.1% 3520
Yht. 100% 6060
Ikä
2 1
Ikä (1 = alle, 30v. 2 = yli 30v.)
Puumallit
Lähde: [Väisänen, 2011]
8.12.2014 37
1: 30% 3000
0: 70% 7000
Yht. 100% 10000
1: 11.7% 460
0: 88.3% 3480
Yht. 100% 3940
1: 41.9% 2540
0: 58.1% 3520
Yht. 100% 6060 2 1
1: 67.1% 490
0: 32.9% 240
Yht. 100% 730
1: 38.5% 2050
0: 61.5% 3280
Yht. 100% 5330
1: 9.3% 310
0: 90.7% 3030
Yht. 100% 3340
1: 25.0% 150
0: 75.0% 450
Yht. 100% 600
Puh.
käyttö
Ikä
Siviili-
sääty 1 2 1 2
• Puhelinoperaattoriesimerkki jatkuu…
• Lopullinen malli voi näyttää tältä
Siviilisääty (1 = naimaton, 2 = naimisissa)
Ikä (1 = alle, 30v. 2 = yli 30v.)
Keskimääräinen puhelimen käyttöaste (1 = <300, 2 = >300 )
Puumallit
Lähde: [Väisänen, 2011]
Puumallit
• Mitä saatiin selville?
– 91 % alle kolmekymppisistä naimattomista ei
maksa laskuaan ajoissa
– Ainoa ryhmä, joka maksaa laskunsa
ennemmin ajoissa kuin myöhässä on yli
kolmekymppiset alle 300min/kk puhujat
– Ikä on silti tärkein kriteeri
8.12.2014 38
Lähde: [Väisänen, 2011]
Ennakoiva analytiikka
• Millä ohjelmistoilla ennakoiva analytiikka onnistuu ja millä ei?
– Onnistuu: RapidMiner, SAS, SPSS, MS analysis services, R, AnyLogic..
– Ei onnistu: IBM Cognos, Qlikview, Business Objects, MS reporting services,
Tableau, Oracle OBIEE…
• Vinkki: Jos myyntimies vakuuttaa, että heidän softa tekee
ennakoivaa analytiikkaa, niin kysy mm. seuraavien
ennustemenetelmien sisältymisestä ohjelmistoon:
– Luokittelumuuttujille - naive bayes, neuroverkko, logistinen regressio,
päätöspuut..
– Jatkuville muuttujille - erilaiset regressioanalyysit, neuroverkot..
• Jos ei löydy, niin kyseessä lienee raportointiohjelmisto.
• Milloin kannattaisi investoida ennakoivaan analytiikkaan?
– Silloin kun sinulla on edellytyksiä hyödyntää tuloksia, esim.
• Voit toteuttaa ennakoivan huollon ennen laitteen vikaantumista
• Voit torjua asiakaspoistumaa tai ostoskorin hylkäämistä aktiivisilla toimenpiteillä
• Kykenet kohdistettuun myyntiin ja markkinointiin..
8.12.2014 39
Muokattu lähteestä: [Laukkanen]
Analytiikka web-sivujen seurannassa,
hakukoneoptimointi, sosiaalisen median
hyödyntäminen toiminnan
kehittämisessä ja asiakasanalyysissa
8.12.2014 40
Hakukoneoptimointi
• Esimerkkejä analytiikkatyökaluista
hakukoneoptimointiin
– Google Analytics
– Google Webmaster Tools
– ClickHeat
– ks. esim. Konsepton blogi (Paltamaa 2010)
8.12.2014 41
Sosiaalisen median analytiikka esimerkki
8.12.2014 42
Impressions
-number of times users saw the Tweet on
Engagements
-number of times users have interacted with a
Tweet, e.g. clicks, retweets, replies…
Myynti ja web-analytiikka
8.12.2014 43
Prospektit Suspektit
Liidit
Liidit
Liidit
Awareness Interest Desire Action
Impressions Bounce rate Engagements Shopping area
traction Shopping cart
actions Payments Repeat visits
Asiakkaat
Satisfaction
Recommendations
Starbucks hinnoittelun korjaaminen
twiittien perusteella
8.12.2014 44
Lähde: [Kaisler 2014] Introduction to Big Data
• Huoli siitä kuinka asiakkaat
pitävät uuden kahvituotteen
mausta
• Seurattiin sosiaalista mediaa
• Maku oli hyvä, mutta hinta oli
liian suuri
• Hinta laskettiin saman päivän
aikana
Linkkejä lisätietoon
8.12.2014 45
Twitter: @Noviresearch ja @tietojohtaminen
Novi tutkimuskeskuksen kotisivut:
https://www.tut.fi/novi/
Slideshare: http://www.slideshare.net/Noviresearch
YouTube: http://youtube.com/noviresearch