29
Big Data na zakupach Artur Senk, OKE Poland Tech.3camp.pl 01.10.2014

Artur Senk, OKE Poland, Big Data na zakupach

  • Upload
    3camp

  • View
    268

  • Download
    1

Embed Size (px)

DESCRIPTION

Nasze wieloTORowe doświadczenia w technologicznym safari: Python, Anaconda, RabbitMQ i pożerające wszystko Celery… Czyli Big Data i social commerce na przykładzie aplikacji MioSpot.

Citation preview

Page 1: Artur Senk, OKE Poland, Big Data na zakupach

Big Data na zakupach

Artur Senk, OKE Poland

Tech.3camp.pl01.10.2014

Page 2: Artur Senk, OKE Poland, Big Data na zakupach

Rok założenia: 1996 r.

Zatrudnienie: 50 osób

Siedziba: Gdańsk

Page 3: Artur Senk, OKE Poland, Big Data na zakupach

Technologie telewizyjne (.NET)

oraz…

Page 4: Artur Senk, OKE Poland, Big Data na zakupach

- start: kwiecień 2013

Net - Trends

Przewidywanie trendówna podstawie danych zebranych

z Internetu i danych statystycznych

Page 5: Artur Senk, OKE Poland, Big Data na zakupach

NET-TRENDS: CIAŁO

Big Data

Data Mining

Trendy

Crawlery

Scrapery

Net-Trends

Page 6: Artur Senk, OKE Poland, Big Data na zakupach

MIOSPOT: GŁOWA

Zakupy

Alerty

Aplikacje mobilne

Celebryci

Social Network

Page 7: Artur Senk, OKE Poland, Big Data na zakupach

Big Data Shopping

Czy robienie zakupów może być jeszcze

bardziej, bardziej, wiele bardziejprzyjemne?

Page 8: Artur Senk, OKE Poland, Big Data na zakupach

TARGET USERSCZEGO PRAGNĄ…?

… NAPRAWDĘ CHCECIE WIEDZIEĆ?

Page 9: Artur Senk, OKE Poland, Big Data na zakupach

MioSpotBridges the gap between Retailers and People. Active system that brings buyers and sellers together.

© istockphoto.com

Page 10: Artur Senk, OKE Poland, Big Data na zakupach

MioSpotSocial Commerce

Bringing Celebs,Friends and Fans together.miospot.com

Page 11: Artur Senk, OKE Poland, Big Data na zakupach

PRODUKTY, CELEBRYCI I ZNAJOMI

Page 12: Artur Senk, OKE Poland, Big Data na zakupach

ODKRYWAJ PRODUKTY

Page 13: Artur Senk, OKE Poland, Big Data na zakupach

OBSERWUJ INNYCH

Page 14: Artur Senk, OKE Poland, Big Data na zakupach

- wiele bibliotek do przetwarzania danych

- czytelność kodu (readability)

- szybkość tworzenia nowych funkcjonalności

Środowisko: Python (3.3)

Page 15: Artur Senk, OKE Poland, Big Data na zakupach

- Django – framework Pythona

- Gunicorn – Python WSGI HTTP Server

- nginx – HTTP (static) oraz (genialne!) proxy

- PostgreSQL (9.3) – znana i dopracowana baza

- Solr – full-text search server napisany w Javie

Środowisko: główne elementy

Page 16: Artur Senk, OKE Poland, Big Data na zakupach

- Git (własny serwer z GitLab), git-flow, tagi

- Jenkins + Selenium – CI, after-commit jobs

- Fabric – szybki deploy

- Anaconda – kompletna dystrybucja Pythona

Środowisko: dodatki

Page 17: Artur Senk, OKE Poland, Big Data na zakupach

RSS Feeds artykuły

zdjęcia

ŹRÓDŁA DANYCH

Net-Trends

Page 18: Artur Senk, OKE Poland, Big Data na zakupach

- TOR – wirtualny routing na poziomie TCP, ukrywanie IP serwerów pobierających

- Celery –kolejki zadań – rozproszone i skalowalne

Pobieranie danych #1

Page 19: Artur Senk, OKE Poland, Big Data na zakupach

- ElasticSearch - search engine, ELK stack:ElasticSearch + Logstash + Kibana

- Redis – zaawansowany key-valuecache/store, wyniki tasków

Pobieranie danych #2

Page 20: Artur Senk, OKE Poland, Big Data na zakupach
Page 21: Artur Senk, OKE Poland, Big Data na zakupach
Page 22: Artur Senk, OKE Poland, Big Data na zakupach
Page 23: Artur Senk, OKE Poland, Big Data na zakupach
Page 24: Artur Senk, OKE Poland, Big Data na zakupach
Page 25: Artur Senk, OKE Poland, Big Data na zakupach
Page 26: Artur Senk, OKE Poland, Big Data na zakupach

- prawie 10TB danych (spakowanych!)

- bazy danych po kilkaset GB

- 1 000 000 000 rekordów w tabeli

Trochę statystyk

Page 27: Artur Senk, OKE Poland, Big Data na zakupach

TAR + XZ -> 40-krotna kompresja

Big Data + Big Dev = Data

Page 28: Artur Senk, OKE Poland, Big Data na zakupach
Page 29: Artur Senk, OKE Poland, Big Data na zakupach

Dziękuję za uwagę.

Dzięki!