Strojove Uceni V Marketingu

Preview:

DESCRIPTION

Lehky uvod do pouziti metod strojoveho uceni v marketingu.

Citation preview

Strojové Učení v MarketinguDavid Filip

Obsah Prezentace

Přiblížení pojmu strojového učeníOblasti použitíPříklady:

analýza registracíoptimalizace landing pagehledání skupin zákazníků

Implementace metod strojového učeníTypické problémy

Strojové UčeníMetodologie pro získávání skrytých informací z dat Mezní obor mezi umělou inteligencí a statistikou

KlasifikaceSeskupováníVyhledáváníDoporučováníHledání vzorů chování

A další, pro nás teď nezajímavé oblasti

Typické Použití

Cílený marketingCross sellingOdchod zákazníkůFraud detectionCredit riskSpam filteringRecommendation enginesFarmacie

a další

Příklady

Analýza Registrací (1/3)

Provozujeme aplikaci a máme zájem zjistit, které faktory ovlivňují registrace

Referrer Lokalita Četl FAQ Page Views Registrace

Google USA Ne 18 None

Seznam CR Ano 25 FreeGoogle India Ne 2 None

(Direct) USA Ne 14 Free

Google USA Ano 25 Premium

...

Zjištěné údaje (analytics, logy apod).

Rozhodovací Stromy

V praxi nejpoužívanější metodaJednoduchá na interpretaci

Jako vstupní data možno použít:číselné údajelogické hodnotytextové popisky kategorií

Funguje i s chybějící informací

Analýza Registrací (2/3)

Analýza Registrací (3/3)

Problémy:Výsledek je příliš vázán na dataStrom může být příliš rozsáhlý

Řešením je prořezání stromu: odstranění částí, které podstatně neovlivňují výsledek. Prořezávání se dle potřeby děje automaticky či manuálně.

Optimalizace Landing Page

Využití předchozího přístupu "on the fly":

1. Vygenerujeme a prořežeme strom2. Zaznamenáme chování uživatele3. ????*4. Profit

* = dle klasifikace nabízíme speciální nabídku

Clustering (1/2)

Hledání skupin podobných objektů v datech.

Objektem může být:Výsledky průzkumů a anketInformace o chování zákazníkůSeznam kupovaných výrobků

Problém velkých datasetů

Clustering (2/2)

Omezeně můžeme využít obyčejné SQL

Pro hledání složitějších závislostí existují lepší postupy:

hierarchické členění k-means clustering: pro hledání k skupindensity based clustering

Implementační detaily

Implementace postupů

Používání standardních algoritmůPrakticky nulová invence implementátoraKnihovny pro ML pro téměř každý jazykSamostatné nástroje:

Free: Weka, R, Orange, ...Placené: SPSS, SAS, Matlab, ...

Typické problémy

Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem". Validnost modelu:

jsou výsledky správné?"bias" problémblack-box metody

Problémy s intuicí:

část problémů je navíc neintuitivních

Úvod pro programátory

Česky: Dobývání znalostí z databází

Dotazy?