Upload
tetsutaro-watanabe
View
1.101
Download
0
Embed Size (px)
DESCRIPTION
MongoDB World2014への参加レポートです
Citation preview
MongoDB World 2014 に行ってきた
渡部 徹太郎2014/07/17丸の内 MongoDB 勉強会
Reporting of MongoDB World
自己紹介{"ID" : "fetaro"
" 名前 " : " 渡部 徹太郎 "
" 経歴 " : " 学生時代は情報検索の研究 (@ 日本データベース学会 )"
" 仕事 " : {" 昔 ":" 証券会社のオントレシステムの Web 基盤 ",
" 今 ":" オープンソース全般 "}
" 特技 " : [" サーバ基盤 ","Linux","KVM","ruby","MongoDB"]
" エディタ " : "emacs 派 "
" 趣味 " : " 自宅サーバ "
"MongoDB 関連 " : {
- " 4年前に、友人の結婚式用のアプリを作った時に利用 "
- " 技評記事「MongoDBでゆるふわDB体験」 "
- " 日経 SYSTEMS 8 月号 「ドキュメント指向データベース」 "
- " 取材「 DBのプロに会いたい MongoDBの火付け役を目指して」"},
" 属性 " : [" ギーク "," スーツ "]
}
2
MongoDB World 2014 とは• 2014 年 6 月 (23 日 ),24 日 ,25 日に開催された MongoDB,Inc が開催した初めて
の大規模セミナー。 参加 2000 人、参加費10万円!
• 場所は NewYork マンハッタン シェラトンホテル。 1泊3万円(朝食なし)
• 公式 HP : https://world.mongodb.com/
シェラトンホテル近くにはタイムズスクエア
大ホール
受付
タイムテーブル
• 大会場でのキーノートの後は、6パラでセミナー
渡部はずっとビジネストラックを聴講
会場の様子協賛企業
MongoDB PaaS 事業者
OSS のBI 筆頭
OSS のBI
Hadoop
Redis
求人ボード
初日 (24 日 ) に聞いた主なセッション
[KeyNote] Max Schireson (MongoDB CEO)
• 過去 40 年はデータは整然としており RDB は歴史上もっとも成功したソフト
• しかし時代は変わった。o 顧客: PC → モバイルo マーケット: ADS → ソーシャルネットワークo → 価値:トランザクション ユーザ ENGAGEMENT
o → アプリ開発:年単位 月単位o → インフラ:オンプレ クラウド
• データも変わったo 90% のデータはこの2年で作られているo 80% のデータは非構造データo 非構造データは構造データの2倍のスピードで増えている
• データ処理の課題o 86% がデータの多様性に起因するものo 15% がデータ量に起因するもの
• このビックデータのゴールドラッシュで、誰が勝ち残るのか?
• それは MongoDB ユーザ ( ドヤッ )
ビデオ: http://www.mongodb.com/presentations/mongodb-world-2014-keynote-max-schireson
[KeyNote] Mike Olson (Cloudera CSO)
• MongoDB のキーノートの後 Cloudera(Haoop の会社 ) の CSO が出てきて、握手してスピーカー交替
• 内容は詳しく説明しないが、要は
• MongoDB,Inc と Cloudera(Hadoop) はとても仲が良い ということ
• 渡部的にも、 MongoDB と Hadoop は相性がよいと思うo MongoDB の集計 (aggregation) は分散しないし、 CPU の使い方もうまくない。o そこでデータのオンライン処理は MongoDB に任せて、集計は Hadoop にするのがよいという
事
シャード1 シャード2 シャード3
Mongos
オンラインアプリ
HDFS ノード 1 HDFS ノード 2 HDFS ノード 3
MapReduce フレームワーク
バッチアプリ
MongoDB,Inc
Cloudera
ビジネストラック「 Citi Bank 」• Citi 社内 Paas で MongoDB を標準に採用
• データのシフトが確実に起きているに対応する事が必要。o 従来の技術( RDB) は業務全体の99%を占めていながらも、新しい技術を取り込んでいく事に対する挑戦に取り
組んでいる。広い範囲の技術に対応する事が必要。o 大方のデータは構造型データであるが、最近急増しているのは非構造型のデータであり、クレジットカード等を含
めたデバイスが精製するデジタルデータの大方は非構造型のデータである。
• MongoDB を導入した理由o →開発期間が短い TCO が低い、 DevOps の連携、シャーディング、レプリカセット、安価なプラット
ホームでよい
• MongoDB の効果o 平均的な Inserts/sec が大幅に向上o RDB では達成出来なかったスピードでアプリ開発を達成
アプリケーションの POC 開発 ~Pre Production が4ヶ月で達成
• MongoDB の課題o アプリケーションレイヤーはまだもう少し充実させたいo スキーマのフレキシビリティはいい面と悪い面がある。o BI ツールが少ないo 標準が少ない。言語、機能セット、まだ NoSQL 業界はバラバラ
ビジネストラック「 Citi Bank 」• MongoDB が有効に働くシステムパターンが幾つか確立している
o Cache layer above other DB/Appso ODS (Data Warehouse front end)o Single Operation View o Split DB Workload
ビジネストラック「 Bosch 」
• ユースケース1:工具の管理o 在庫管理・品質管理・ワーク管理・ ERP/MES/PCS統合o 所感
製造現場での在庫管理。 昔は SQL でやっていたが、それを MongoDB でやると JSON で格納されるためレビューしやすい。 DBA がいなくてもデータをみれる
ビジネストラック「 Bosch 」
• ユースケース2o 自動車のセンサーを通して運転状況・機器の情報を収集o 故障を予測して、修理のコストを最適化する
食事朝食 昼食 おやつ
ハーゲンダッツ食べ放題
夕食空母でパーティー
2日目 (25 日 ) に聞いた主なセッション
[KeyNote] Eliott Horowitz (CTO MongoDB)
• MongoDB 2.8o ドキュメントレベルロック
DB ロックからドキュメントレベルへo ストレージエンジンの選択
今の mmapだけでなく、ヒープベース、ロックエクスペリエンス、 TOKU のストレージエンジン、 FUSION/IO が使える
• MMSo 無停止アップデートo 無停止デプロイ(レプリカセットやシャーディングのデプロイ)
o バージョン管理
ドキュメントレベルの発表の瞬間。めっちゃ盛り上がってたw
ドキュメントレベルロックによりop/s が 10 倍にw
可視化ツールは mongoscope
ビデオ: http://www.mongodb.com/presentations/mongodb-world-2014-keynote-eliot-horowitz
• Goldman Sache における DBo 社内のプライベートクラウドで、ファイルシステムと RDB の中間的な位置づけとして
MongoDB が利用されている。(使い分けが明確)o MongoDB の運用はアプリケーションサイドで対応する事が可能であるため、少人数で運
用可能
• ユースケース1:社内ソーシャルサイトo 全てのデータは MongoDB で管理o リージョン間でのデータは Replication で同期を取っているo 課題はトランザクション機能が無い事o ツイッターからのデータも引き出している
• ユースケース2:クラウド上で社内ドキュメントを管理するシステムo ファイルの属性情報を記録するのに MognoDB を採用o これによってドキュメントの迅速な検索が可能o 課題はインデックス性能とトランザクション機能の不足
• 所感o 社内でちょっとしたシステムを作る場合、日本だとパッケージ導入が盛んだが、米国では
社内 SE に技術力があり、 MongoDB などを利用してサクッと開発している。→日本と米国の大きなギャップ
ビジネストラック「 Goldman Sachs 」
ビジネストラック「 GAP 」• 社内で MongoDB による開発を積極採用
• なぜMongoDB なのか?o アジャイル開発に最も向いてる技術として評価したo 短時間でコレクションを構築し、データストアをすぐに立ち上げる事により、
アプリケーションロジックの設計に集中出来た PO システムでは2ヶ月半で開発/運用開始出来た。仕様変更にも迅速に対応できた。
o 営業と開発が一緒になって設計活動に参画出来る それは JSON が営業の人でも理解出来るデータ構造であるため
o MongoDB は魅力的であるため、開発者を活気づける→実はこれが最も重要
• 課題o MongoDB が魅力的で簡単にすぐ作れるため、研修などが置き去りになり、後
でハマるパターンがある→研修が重要
[Closing] Eliot horowitz (MongoDB CTO)
• MongoDB 3.0以降の Roadmapo Partitioned Joins
ドキュメントのジョイン(1シャードに格納されている場合に限る)o Multi-document Transactions
複数ドキュメントをトランザクション処理o Schema Validation
データのバリデーション(データハブの座を狙っている)o Multi-Master Databases
レプリカセットにおいて複数のレプリカに書き込めるo Filtered Replica Sets
データをフィルタして、セカンダリにレプリケーションできるo Storage Engines
ストレージエンジンを増やすo Adoptive Provisioning
MMS が負荷に応じて勝手にクラスタのノードなどを増やす(と思う)o Queryable Backup
今は全件ダンプしかないけど、クエリでバックアップできるo Database-as-a-Service Software
ビデオ: http://www.mongodb.com/presentations/mongodb-world-2014-roadmap-eliot-horowitz
米国に対する所感• New York マンハッタンの「世界の中心は俺だ!」感はすごい。物価も高
い。
• 米国のイベントは高い!けどいろいろ楽しませてくれる
• 米国企業の情報システム部門は MongoDB をはじめとした OSS を使いこなしている。そして社内 PaaS でサクっと開発をしてしまう 日本ではありえない光景。日本企業の情報システム部門はただの事業部の御用
聞き。
MongoDB に対する所感• MongoDB の勢いはすごい。 NOSQL のリーダであるという事を肌で感じ
た 日本でここまで浸透するにはあと3~5年ぐらい?
• MongoDB の使われるパターンが分かってきた。要は「開発しやすい」「スキーマレスデータ処理」「スケールできる」の3つで TOC削減。
• MongoDB はこれから活発にエンハンスされ、さらに完成度が高まる。これほどのソフトウェアを無料で使わせてもらっているのだから、皆さんも MongoDBコミュニティに貢献しましょう! インターネットでのノウハウ共有 日本MongoDBメーリングリストの投稿・回答 MongoDB JIRAへのバグ投稿 ソースコードへのコントリビュート 事例の提供(今回の MongoDB World で日本人の発表は0)