35
A Brain-Friendly Guide BigData Head First OREILLY Don’na “Hang=Dan” Da with Pandaneco Rojinka Cloud Social User Logging Google Apps Amazon EC2 Open Cloud Facebook Twitter Social Graph Social Bookmark Access Log POS GPS Machine Learning Recommendation Enterprise Search

A Brain-Friendly Guide

  • Upload
    keona

  • View
    47

  • Download
    0

Embed Size (px)

DESCRIPTION

A Brain-Friendly Guide. Head First. Social. BigData. Facebook Twitter Social Graph Social Bookmark. User Logging. Access Log POS GPS. Machine Learning Recommendation Enterprise Search. Cloud. Google Apps Amazon EC2 Open Cloud. Don’na “Hang=Dan” Dar with Pandaneco Rojinkai. - PowerPoint PPT Presentation

Citation preview

Page 1: A Brain-Friendly Guide

A Brain-Friendly Guide

BigDataHead First

ORE’ILLY Don’na “Hang=Dan” Darwith Pandaneco Rojinkai

Cloud

Social

User Logging

Google AppsAmazon EC2Open Cloud

FacebookTwitterSocial GraphSocial Bookmark Access Log

POSGPS

Machine LearningRecommendationEnterprise Search

Page 2: A Brain-Friendly Guide

こんにちは

ビッグデータ!

ここに、これまでは SQL で扱って来たデータがあるじゃろ?

( ^ ω ^ ) ⊃ 普通のデータ ⊂

Page 3: A Brain-Friendly Guide

こんにちは

ビッグデータ!

これを NoSQL に入れ直して…

( ^ ω ^ ) ≡⊃⊂≡

Page 4: A Brain-Friendly Guide

こんにちは

ビッグデータ!

出来上がりじゃ♪

( ^ ω ^ ) ⊃ ビッグデータ⊂

Page 5: A Brain-Friendly Guide
Page 6: A Brain-Friendly Guide

Big Data って ?

そもそもの話

Page 7: A Brain-Friendly Guide

http://www.bigdatalandscape.com/

Page 8: A Brain-Friendly Guide

http://www.bigdatalandscape.com/

データ分析フレームワーク

大規模データ保持・加工・処理

Page 9: A Brain-Friendly Guide

Big Data の Data Base

扱う全データ量が大きい

一度に扱うデータ量が大きい

分散ストレージ

分散処理系

サーバ一台に収まらないデータを扱う

Page 10: A Brain-Friendly Guide

スケールアップは高価 / 頭打ち

Spec

Cost

RDBMS の高性能化限界

Page 11: A Brain-Friendly Guide

の出現

歴史のお勉強: BigData 時代の始まり

Page 12: A Brain-Friendly Guide

無限のスケールアウト性能

Spec

Cost

台数に比例した性能が得られる

Page 13: A Brain-Friendly Guide

簡単につかえて

無限にスケールアウトする

分散処理系兼

分散ファイルシステム

Page 14: A Brain-Friendly Guide

Hadoopやってます競争

の時代

Page 15: A Brain-Friendly Guide

はたと気がつく

バッチ処理はできるけどクエリとかの応答性能は出せないんだよね… … 

なんと RDBMS が おきあがりなかまに なりたそうに こちらをみている!

Page 16: A Brain-Friendly Guide

No!SQL はい いいえ

Page 17: A Brain-Friendly Guide

RDBMS ではできないことをやってるぞ!

まだ RDBMS 代替を主張しないといけない時代

Page 18: A Brain-Friendly Guide

http://www.bigdatalandscape.com/

Big Data Landscape をよく見てみよう

ところで

Page 19: A Brain-Friendly Guide

http://www.bigdatalandscape.com/

Page 20: A Brain-Friendly Guide

http://www.bigdatalandscape.com/

ファッ!???

Page 21: A Brain-Friendly Guide

トランザクションとかビジネス要件とか言われると

辛いんだよね… … 

さいど RDBMS が おきあがりなかまに なりたそうに こちらをみている!

基幹システムを張れると主張しないといけない時代

Page 22: A Brain-Friendly Guide

Not only SQL

Page 23: A Brain-Friendly Guide

DATABASERDBMS

SQL NoSQL

Page 24: A Brain-Friendly Guide

RDBMS

NoSQLand more…

Page 25: A Brain-Friendly Guide

まとめみんな Google が大好きなので、 Google のパチもんの Hadoop も最高に Coooool !!!!でした

RDBMS はしばしばデータ基盤として用いられていたので、うまく Hadoop で置き換えれば数十倍の処理性能が出ました。

例えば 大量に、全件を、まとめて処理するバッチそれはそうでしょう。それは RDBMS でやるべきものではなかったのですから。

RDBMS の数十倍! が初期のウリだったので、 RDBMS は意地でも使うわけにはいかなくなりました。そこで現れたのが  NoSQL です。

今ではそうでもなくなりました。 RDBMS との融和の時代です。

Page 26: A Brain-Friendly Guide

勧誘の時間

そもそもの疑問なぜ RDBMS では実現できないのか

データベースに求められる機能とは何なのか

そもそもどうやってデータベースを実現してきたのか

Page 27: A Brain-Friendly Guide

データベースをきちんと知らないと答えられない疑問

勧誘の時間

Page 28: A Brain-Friendly Guide

データベースをきちんと知らないと答えられない疑問

じゃあ

いつ学ぶのか

勧誘の時間

Page 29: A Brain-Friendly Guide
Page 30: A Brain-Friendly Guide

勧誘の時間

もう一度データベース (Not only SQL)

を学ぼう!

Page 31: A Brain-Friendly Guide
Page 32: A Brain-Friendly Guide
Page 33: A Brain-Friendly Guide
Page 34: A Brain-Friendly Guide

方針

• 7つのデータベース 7つの世界 から

• いくつかのソフトウェアを実際に触る• 環境はとりあえず太田が用意する• 足りなくなったら検討

• その後は個々気に入ったソフトウェアを集中的に

目標:データベース製品の特徴を理解し、用途に合わせて選んで採用できる

Page 35: A Brain-Friendly Guide

初期スケジュール

1. 7 つの DB 7 つの世界• リレーショナル代数について (東)• PostgreSQL (小林)• HBase (太田)• Neo4j (東)

2. 7 つの DB 7 つの世界• Riak (太田)• MongoDB ()• CouchDB ()• Redis (やまひろ)

3. 7 つの DB 7 つの世界 予備日• 7 つの DB 7 つの世界 残り部分• 各 DB 比較 - NoSQL プログラミング実践活用技法

4. その後• 各製品 Deep Dive