18
データセンター視点で 考えてみるHadoop 日経BP日経コンピュータ 中田 20091113Hadoop カンフゔレンス クロージングスピーチ

データセンター視点で考えてみるHadoop

Embed Size (px)

DESCRIPTION

HadoopカンファレンスJapanで行ったクロージングスピーチのスライドです。 日経BP社、日経コンピュータ編集部の中田が行いました。

Citation preview

Page 1: データセンター視点で考えてみるHadoop

データセンター視点で考えてみるHadoop

日経BP社 日経コンピュータ

中田 敦

2009年11月13日Hadoop カンフゔレンス クロージングスピーチ

Page 2: データセンター視点で考えてみるHadoop

日経コンピュータもHadoopを追いかけます!

2009年11月24日号にご期待ください

Page 3: データセンター視点で考えてみるHadoop

ところで…

Yahoo! がHadoopを運用している

データセンターがどのようなものかご存じですか?

Page 4: データセンター視点で考えてみるHadoop

米Yahoo!本社のコンテナ型データセンター

海上輸送などに使用する国際規格の幅8フゖート(2メートル44センチ)、長さ40フゖート(12メートル20センチ)のコンテナ

Page 5: データセンター視点で考えてみるHadoop

米Yahoo!本社のコンテナ型データセンター

コンテナの壁に沿って、サーバーがギッシリと詰め込まれています

Page 6: データセンター視点で考えてみるHadoop

米Yahoo!本社のコンテナ型データセンター

ラックとラックの間にある銀色の箱は「ラジエター」。中に水が循環する細いパプが張り巡らされています。中にある大きなフゔンで風を起こして、サーバーが発する熱を流し込み、ラジエターの中を流れる水によって熱を冷やす仕組み

Page 7: データセンター視点で考えてみるHadoop

米Yahoo!本社のコンテナ型データセンター

サーバーの電源はラックの上部に集約されています。サーバーのマザーボードには電源は実装されていません。そのため電源が発する熱がサーバー内にこもらない仕組み

Page 8: データセンター視点で考えてみるHadoop

米Yahoo!本社のコンテナ型データセンター

コンテナには水を供給・排出するホースが合計2本接続されています。導入された水によってサーバーの熱を冷やし、温まった水がコンテナ外に排出される仕組み

Page 9: データセンター視点で考えてみるHadoop

コンテナ型データセンターの規模

米SGI「ICEcube」の仕様(コンテナ1台当たり)

サーバー台数 最大2400台

プロセッサ数 最大4800個

プロセッサコゕ数 最大2万2400個

ストレージ容量 最大11ペタバト

水の温度 セ氏18度

Page 10: データセンター視点で考えてみるHadoop

Googleは2005年11月からコンテナ型データセンターを運用

Page 11: データセンター視点で考えてみるHadoop

Microsoftの場合

シカゴの最新鋭データセンター

コンテナ

200台

112台

サーバー台数

約50万台

22万4000台(コンテナのみ)

「Data Center Knowledge」より引用

Page 12: データセンター視点で考えてみるHadoop

なぜHadoop、なぜコンテナ?

「情報爆発」という新しい現実に向き合うには

それに見合った新しいツールが必要

Page 13: データセンター視点で考えてみるHadoop

Googleの中の人曰く

• some sort of – not Cloud

Computing but a Cloud Computer;

something that is always there and

always be accessed and always

store data and always give it back.

ケン・トンプソン氏

Page 14: データセンター視点で考えてみるHadoop

Googleが自作した「クラウドコンピュータ」

独自に建造したデータセンター

分散ロックシステム

Chubby

分散フゔルシステム

Google File System(GFS)

並列プログラミングモデル

MapReduceキー・バリュー型データストゕ

BigTable

プログラミング言語

Sawzall

グーグルプラットフォーム

Web検索 ログ解析 GmailGoogle Maps

ゕプリケーションサービス

論文:Interpreting the Data: Parallel Analysis with Sawzall(2005年)

論文:MapReduce: Simplified Data Processing on Large Clusters(2004年)

ホワトペーパー:The Datacenter as a Computer. An Introduction to the Design of Warehouse-Scale Machines(2009年)

論文:Bigtable: A Distributed Storage System for Structured Data(2006年)

論文:The Google File System(2003年)

論文:The Chubby lock service for loosely-coupled distributed systems(2006年)

論文:Failure Trends in a Large Disk Drive Population(2007年)

Page 15: データセンター視点で考えてみるHadoop

Hadoopとは何か?

Googleが作った「クラウドコンピュータ」を

民主化

する存在

Page 16: データセンター視点で考えてみるHadoop

お伝えしたいこと

Hadoopを使って

「何か新しいこと」を

やりましょう

Page 17: データセンター視点で考えてみるHadoop

お伝えしたいこと

ユーザー事例については

日経コンピュータにご連絡を

Page 18: データセンター視点で考えてみるHadoop

ありがとうございました

Twitter: @Nakada_itpro