114
Pentaho 定型レポートハンズオン オープンソースBI 勉強会 #12 2014/11/26TwitterID:@teruu

Pentaho 定型レポート ハンズオン

Embed Size (px)

DESCRIPTION

Pentaho定型レポートのハンズオン資料です。 https://atnd.org/events/59471

Citation preview

Page 1: Pentaho 定型レポート ハンズオン

Pentaho 定型レポートハンズオン

オープンソースBI 勉強会 #12

[2014/11/26]

TwitterID:@teruu

Page 2: Pentaho 定型レポート ハンズオン

本日の内容

•勉強会について

•BIの概要

•定型レポートの概要

•ダウンロード

•起動

•レポート作成

– レポートウィザード

– 新規

1

Page 3: Pentaho 定型レポート ハンズオン

自己紹介

川崎照夫

TwitterID: teruu

所属:KSKアナリティクス

BI歴:2年

DB歴:20年

2

Page 4: Pentaho 定型レポート ハンズオン

この勉強会について

•随時、ツイートのお願い(質問など)

•セキココ登録(イベント座席表サービス) http://sekico.co/

•挙手のお願い ・勉強会参加理由 ・Pentahoについて知りたい ・定型レポートについて知りたい

3

Page 5: Pentaho 定型レポート ハンズオン

Yahooリアルタイム検索

「pentaho」定点観測中

・「日本語の資料が全然ない」というツイート

日本のPentahoユーザ

・日本語の情報が見つからない

・やりたいことがなかなかできない(簡単なことなのに...)

・フラストレーションがたまりがち

4/83

Pentahoのチュートリアル資料を充実

Page 6: Pentaho 定型レポート ハンズオン

これまでの開催

•#5 MongoDB+Pentaho ハンズオン

•#6 OLAP ハンズオン

•#7 ETL ハンズオン

•#8 定型レポート

•#9 CTools (ダッシュボード)

•#10 OLAP ハンズオン

•#11 ETL ハンズオン

•#12 定型レポート ハンズオン ※今回

Page 7: Pentaho 定型レポート ハンズオン

次回

•#13 土曜開催企画+懇親会

– 12/20(土)14:00~19:00

– 会場:銀座キレイが丘会議室 https://atnd.org/events/59575

※会場の都合で定員が限られますので、早めに参加登録を!

Page 8: Pentaho 定型レポート ハンズオン

これまでの資料

オープンソースBI勉強会メモ

•#10 OLAPハンズオン https://www.evernote.com/shard/s29/sh/be254819-1722-4d55-bb34-549ebf898c25/f85483e7059dd4c56506d7ca0a5b0578

•#11 ETLハンズオン http://www.slideshare.net/teruok/pdi-tutorial-20140121

Page 9: Pentaho 定型レポート ハンズオン

BIの概要

Page 10: Pentaho 定型レポート ハンズオン

会員制ドキュメント・ダウンロード・サービス「LiBRA」(リブラ) →提供資料の加工編集、再配布が可能 (http://libra.netcommerce.co.jp/) 以降はLiBRAの「ビジネス・インテリジェンス」から引用 (http://libra.netcommerce.co.jp/library/knowledge/841)

Page 11: Pentaho 定型レポート ハンズオン
Page 12: Pentaho 定型レポート ハンズオン
Page 13: Pentaho 定型レポート ハンズオン
Page 14: Pentaho 定型レポート ハンズオン
Page 15: Pentaho 定型レポート ハンズオン
Page 16: Pentaho 定型レポート ハンズオン
Page 17: Pentaho 定型レポート ハンズオン
Page 18: Pentaho 定型レポート ハンズオン
Page 19: Pentaho 定型レポート ハンズオン
Page 20: Pentaho 定型レポート ハンズオン
Page 21: Pentaho 定型レポート ハンズオン

Pentahoについて

•オープンソースベースのBIスイート

•以下の製品群で構成

EE CE 主な対象

ダッシュボード ダッシュボードエディタ

CDF(Community

Dashboard

Framework)

経営陣

Reporting

Reporting(定型レポート) ビジネスユーザ

メタデータ

インタラクティブレポート Adhocレポート

OLAP(多次元分析)

Analyzer JPivot/saiku/Pivot4

J

アナリスト・ ビジネスユーザ

ETL(データ統合) Data Integration 開発者、DB管理者

データマイニング Weka アナリスト、パワーユーザ

Page 22: Pentaho 定型レポート ハンズオン

21

定型レポートについて • 関連書籍

Pentaho 5.0 Reporting by Example: Beginner's Guide

Page 23: Pentaho 定型レポート ハンズオン

22

ダウンロード

•Pentahoコミュニティエディション http://community.pentaho.com/

•Pentaho配布サイト http://sourceforge.net/projects/pentaho/files/

•Pentaho配布サイト レポートデザイナー http://sourceforge.net/projects/pentaho/files/Report%20Designer/5.2/

•ダウンロード候補(Ver5.2)

prd-ce-5.2.0.0-209.zip (Windows/Linux)

prd-ce-mac-5.2.0.0-209.zip (Mac)

Page 24: Pentaho 定型レポート ハンズオン

23

インストール

•ダウンロードするだけ(Javaの環境があれば)

•DBのJDBCドライバを追加

– postgresqlのドライバは同梱されている

•SourceForgeのサイトからダウンロードし、 Windowsであれば、解凍したフォルダ中の report-designer.batをダブルクリック

•起動後、言語の設定を確認(日本語になっているか)

Page 25: Pentaho 定型レポート ハンズオン

特徴①

オープンソース(LGPLライセンス)

Java

クロスプラットフォーム(Windows/Mac/Linux)

GUIツールで設計、Webで参照

ファイル形式:PRPT

多様なデータソース

多様な出力形式(HTML、PDF、Excel、CSV、RTF)

多様なチャート形式、スパークライン

Page 26: Pentaho 定型レポート ハンズオン

特徴②

レポートウィザード

パラメータ

計算式

サブレポート

埋め込みリンク

スタイルシート

クロス集計

スケジューリング

PDIによるバースティング

Page 27: Pentaho 定型レポート ハンズオン

歴史

2002年 JFreeReportプロジェクト開始 2006年 主要な開発者Thomas MorgnerがPentahoに加入

名称をPentaho Reportingに変更 2007年 Ver1.6 2008年 Ver1.7 データソースとしてOLAPに対応 2009年 Ver3.5 2010年 Ver3.7 2011年 Ver3.8 スパークライン機能追加 2012年 Ver3.9 2013年 Ver5.0 2014年 Ver5.1

Page 28: Pentaho 定型レポート ハンズオン

レポート作成の手順

・レポートを新規作成

・データソースを作成

・クエリーを作成し、データを取得

・ワークスペース上にレイアウト

・取得したデータを使い計算式及び関数を作成

・レポートを保存

・BIサーバーにパブリッシュ

Page 29: Pentaho 定型レポート ハンズオン

レポート作成①

•レポートウィザード利用

•データソース:1テーブル

•データ:foodmartデータセット

Page 30: Pentaho 定型レポート ハンズオン

起動 Windowsの場合、report-designer.batをダブルクリックして起動

29

Page 31: Pentaho 定型レポート ハンズオン

ようこそ画面

30

レポートウィザードをクリック。

Page 32: Pentaho 定型レポート ハンズオン

ウィザード・外観

31

ここでは「Jade」を選択。

テンプレートは追加可能

Page 33: Pentaho 定型レポート ハンズオン

ウィザード・データソース

32

右上の+をクリック。

Page 34: Pentaho 定型レポート ハンズオン

データソースの種類

33

「JDBC」を選択。

Page 35: Pentaho 定型レポート ハンズオン

JDBCデータソース

34

「接続」欄の+をクリックし データベース接続を作成。

Page 36: Pentaho 定型レポート ハンズオン

データベース接続

35

パラメータを適宜入力し[Test]をクリック。

接続名:pg (任意) 接続タイプ:PostgreSQL アクセス:Native(JDBC) ホスト名:localhost データベース名:postgres ポート番号:54320 (※デフォルトと重複しない設定に)

ユーザ名:postgres パスワード:!84jJJJ# (※ハンズオンでのパスワード)

Page 37: Pentaho 定型レポート ハンズオン

JDBCデータソース

36

利用可能クエリー欄の+をクリックし、クエリーを作成。

Page 38: Pentaho 定型レポート ハンズオン

JDBCデータソース

37

クエリー名に「製品クエリー」と入力し、クエリー欄の鉛筆アイコンをクリック。

Page 39: Pentaho 定型レポート ハンズオン

SQLクエリーデザイナー

38

画面左側中段のドロップダウンメニューをクリック。

Page 40: Pentaho 定型レポート ハンズオン

スキーマ選択

39

「foodmart」スキーマを選択するとテーブル一覧が表示される。

Page 41: Pentaho 定型レポート ハンズオン

「product」表

40

「product」表をダブルクリックして追加。

Page 42: Pentaho 定型レポート ハンズオン

「product」表

41

SQLクエリーデザイナーの分割ラインをマウスでドラッグして下方に移動。 (ORDER BYの操作のため)

Page 43: Pentaho 定型レポート ハンズオン

ORDER BY追加

42

「brand_name」列と「product_name」列をそれぞれ「ORDER BY」にマウスでドラッグして追加。OKボタンをクリック。

Page 44: Pentaho 定型レポート ハンズオン

JDBCデータソース

43

クエリーを確認して「プレビュー」ボタンをクリック。

Page 45: Pentaho 定型レポート ハンズオン

プレビュー

44

プレビューの内容を確認し「Close」をクリック。前の画面に戻り「OK」をクリック。

Page 46: Pentaho 定型レポート ハンズオン

「次へ」

45

「製品クエリー」を選択して「次へ」をクリック。

Page 47: Pentaho 定型レポート ハンズオン

レイアウト

46

上の[グループ化]欄に「brand_name」、 下の[選択アイテム]欄に「product_id」「product_name」「sku」「srp」をそれぞれ追加。「次へ」をクリック。 (※Ctrlキーで複数選択も可)

Page 48: Pentaho 定型レポート ハンズオン

フォーマット (brand_name)

47

「グループヘッダラベル」を「ブランド名:」に変更。

Page 49: Pentaho 定型レポート ハンズオン

フォーマット (product_id)

48

表示名を「製品ID」に変更。データ形式に「#」を入力。(桁区切り無しの数字) 集計のドロップダウンで一番下の選択肢「Count」を選択。

Page 50: Pentaho 定型レポート ハンズオン

フォーマット (product_name)

49

表示名を「製品名」に変更。

Page 51: Pentaho 定型レポート ハンズオン

フォーマット (sku)

50

表示名を「製品番号」に変更。 整列を左寄せに変更。 データ形式に「#」を入力。 (桁区切り無しの数字に)

Page 52: Pentaho 定型レポート ハンズオン

フォーマット (メーカー希望小売価格)

51

表示名を「メーカー希望小売価格」に変更。データ形式のドロップダウンから2番目の選択肢「#,###;(#,###)」を選択。[終了]ボタンをクリックしてウィザードを終了。

Page 53: Pentaho 定型レポート ハンズオン

レポートウィザード 終了

52

緑色の実行ボタンをクリック。コンテキストメニューが表示されるので、1番上の[印刷プレビュー]を選択。

Page 54: Pentaho 定型レポート ハンズオン

印刷プレビューで 文字化け

53

→フォントを指定。 (あらかじめテンプレートを用意 することでも対応可)

Page 55: Pentaho 定型レポート ハンズオン

フォントを一括指定

54

[構造]タブの[マスターレポート]を選択。フォントを変更。

「フォント」の「family」でMeiryo UI を選択

Page 56: Pentaho 定型レポート ハンズオン

再度、印刷プレビュー

55

文字化け解消を確認。

Page 57: Pentaho 定型レポート ハンズオン

PDF文書

56

実行ボタンをクリックして「PDF文書」を選択。PDF形式のレポートが表示される。

Page 58: Pentaho 定型レポート ハンズオン

HTML文書

57

実行ボタンをクリックして「HTML文書」を選択。HTML形式のレポートが表示される。

Page 59: Pentaho 定型レポート ハンズオン

Excel文書

58

実行ボタンをクリックして「Excel文書」を選択。Excel形式のレポートが表示される。

Page 60: Pentaho 定型レポート ハンズオン

レポートウィザード 再実行

59

レポートウィザードで指定した項目を修正したい時は、[編集]-[レポートウィザード]を選択して再実行。 (レイアウト項目、フォーマット項目)

Page 61: Pentaho 定型レポート ハンズオン

保存

60

[ファイル]-[保存]を選択し、作業フォルダ「c:¥Pentaho¥pentaho_work」に移動。ファイル名に「product_list」を指定して作成したレポートを保存。(※拡張子は自動的に「prpt」が指定される)

Page 62: Pentaho 定型レポート ハンズオン

閉じる

61

×アイコンをクリックしてレポートを閉じて終了。

Page 63: Pentaho 定型レポート ハンズオン

レポート作成①

•レポートウィザード利用

•データソース:1テーブル

•データ:foodmartデータセット

Page 64: Pentaho 定型レポート ハンズオン

レポート作成②

•新規レポート作成

•データソース:2テーブル(JOIN)

Page 65: Pentaho 定型レポート ハンズオン

新規

64

[File]-[新規]を選択

Page 66: Pentaho 定型レポート ハンズオン

[データセット]

65

[データ]タブの[データセット]を右クリックし、[JDBC]を選択。

Page 67: Pentaho 定型レポート ハンズオン

クエリー追加

66

接続欄で「pg」をクリック。 利用可能クエリー欄で+をクリック。クエリー名に「製品カテゴリークエリー」と入力し、クエリー欄の鉛筆マークをクリック。

Page 68: Pentaho 定型レポート ハンズオン

SQL クエリーデザイナー

67

「product」「product_class」をダブルクリックして追加

Page 69: Pentaho 定型レポート ハンズオン

JOIN

68

Product表の「product_class_id」をドラッグしてproduct_class表の同名の列にドロップ。

Page 70: Pentaho 定型レポート ハンズオン

一旦選択解除

69

それぞれの表でテーブル名の欄を右クリックして[deselect all]を選択

Page 71: Pentaho 定型レポート ハンズオン

必要な列を追加

70

product表の「product_name」、product_class表の「product_subcategory」~「product_family」を追加。

Page 72: Pentaho 定型レポート ハンズオン

列順を変更

71

列をドラッグして列順を変更。(product_family、product_department、product_category、product_subcategoryの順) ORDER BYにも同じ順序で列を追加。

Page 73: Pentaho 定型レポート ハンズオン

[syntax]タブ

72

[syntax]タブをクリックしてSQLを確認。

Page 74: Pentaho 定型レポート ハンズオン

JDBCデータソース

73

[プレビュー]をクリック。

Page 75: Pentaho 定型レポート ハンズオン

プレビュー

74

プレビューの内容を確認し「Close」をクリック。

Page 76: Pentaho 定型レポート ハンズオン

ページ設定

75

[File]-[ページ設定]を選択。

Page 77: Pentaho 定型レポート ハンズオン

ページ設定

76

[ページサイズ]を[A4]に変更。

Page 78: Pentaho 定型レポート ハンズオン

レポート要素のサイズを変更

77

[レイアウトを変更しない]を選択。

Page 79: Pentaho 定型レポート ハンズオン

詳細エリア

78

クエリーで選択した列を[詳細]エリアにドラッグ。 (※1列ずつ配置)

Page 80: Pentaho 定型レポート ハンズオン

列幅調整

79

[構造]タブの[詳細]を表示し5列を選択。

Page 81: Pentaho 定型レポート ハンズオン

列幅調整

80

[スタイル]タブの[width]欄をデフォルトの「100.0」(ピクセル)→「20%」に変更。 ※サイズは%単位で指定可能

Page 82: Pentaho 定型レポート ハンズオン

[layout]

81

上位の[詳細]の[layout]を[row]に変更。 ※row:列を1行に配置、デフォルトは[block]モードになっている。(マスターレポートの[layout]で指定)

Page 83: Pentaho 定型レポート ハンズオン

[詳細ヘッダー]

82

[詳細ヘッダー]を選択し[属性]タブを表示。[hide-on-canvas]を[False]に変更。

Page 84: Pentaho 定型レポート ハンズオン

ラベル追加

83

[パレット]エリアの[ラベル]をクリック。ラベルが配置される。 ※他の方法でも追加可能。

Page 85: Pentaho 定型レポート ハンズオン

ラベル追加

84

[詳細ヘッダー]にラベルを5つ追加。

Page 86: Pentaho 定型レポート ハンズオン

ラベル幅調整

85

追加した5つのラベルを選択し[スタイル]タブの[width]欄をデフォルトの「100.0」→「20%」に変更。※Shiftキーで複数選択。

Page 87: Pentaho 定型レポート ハンズオン

ラベル幅調整

86

上位の[詳細ヘッダー]の[layout]を[row]に変更。

Page 88: Pentaho 定型レポート ハンズオン

ラベルの値を入力

87

[属性]タブの[値]欄にそれぞれの値を入力。 (グループ、部門、カテゴリー、サブカテゴリー、製品名)

Page 89: Pentaho 定型レポート ハンズオン

フォントを一括指定

88

[構造]タブの[マスターレポート]を選択。フォントを変更。

「フォント」の「family」でMeiryo UI を選択

Page 90: Pentaho 定型レポート ハンズオン

印刷プレビュー

89

[印刷プレビュー]を選択して内容を確認。

Page 91: Pentaho 定型レポート ハンズオン

罫線設定

90

Ctrlキーを押しながら[詳細ヘッダー]と[詳細]の各列をクリックし選択。 [Format]-[フォーマット]を選択。

Page 92: Pentaho 定型レポート ハンズオン

サイズと枠線

91

[サイズと枠線]タブを表示。

Page 93: Pentaho 定型レポート ハンズオン

サイズと枠線

92

[全て]ボタンをクリック。 スタイル:[solid]、色:[black]、幅:[1]を指定して[OK]をクリック。

Page 94: Pentaho 定型レポート ハンズオン

罫線設定

93

borderのsize設定に「0.5」を入力。 (top/left/bottom/right)

Page 95: Pentaho 定型レポート ハンズオン

heightの値を「20.0」から「100%」に変更。 高さ設定

94

Page 96: Pentaho 定型レポート ハンズオン

印刷プレビュー

95

[印刷プレビュー]を選択して内容を確認。

Page 97: Pentaho 定型レポート ハンズオン

レポート作成②

•新規レポート作成

•データソース:2テーブル(JOIN)

Page 98: Pentaho 定型レポート ハンズオン

レポート作成③(次回以降)

•チャート

•パラメータ

•計算フィールド

•サブレポート

•スパークライン

•ハイパーリンク

•クロスタブ

•スタイルシート

•エンベッド(組込)

Page 99: Pentaho 定型レポート ハンズオン

まとめ

•BIの概要

•定型レポートの概要

•ダウンロード

•起動

•レポート作成

– レポートウィザード

– 新規

Page 100: Pentaho 定型レポート ハンズオン

丌明な点

•Pentahoのフォーラムへ

– 日本語でコミュニティー・サポート

http://forums.pentaho.com/forumdisplay.php?86 (※投稿には要登録)

Page 101: Pentaho 定型レポート ハンズオン

次回

•#13 土曜開催企画+懇親会

– 12/20(土)14:00~19:00

– 会場:銀座キレイが丘会議室 https://atnd.org/events/59575

※会場の都合で定員が限られますので、早めに参加登録を!

Page 102: Pentaho 定型レポート ハンズオン

今後のテーマ(1)

•DWH

– スタースキーマ

– SCD(Slowly Changing Dimensions)

– CDC (Change Data Capture) – サロゲートキー

– MDM(マスターデータマネジメント)

•OLAP(ROLAP/MOLAP)

– キューブ設計

– MDX

101

Page 103: Pentaho 定型レポート ハンズオン

今後のテーマ(2)

Pentahoの各製品

•PDI

•OLAP

•Reporting

•ダッシュボード

•データマイニング

102

Page 104: Pentaho 定型レポート ハンズオン

今後のテーマ(3)

デザインツール

•スキーマワークベンチ

•アグリゲーションデザイナ

•メタデータエディタ

サードパーティー製品

•saiku

•Pivot4J 103

Page 105: Pentaho 定型レポート ハンズオン

今後のテーマ(4)

その他のBI製品

•Tableau

•QlikView

104

Page 106: Pentaho 定型レポート ハンズオン

今後のテーマ(5)

カラム指向DB

•HP Vertica

•Amazon Redshift

NoSQL DB

•MongoDB

•Hadoop Hive

インメモリDB 105

Page 107: Pentaho 定型レポート ハンズオン

今後のテーマ(6)

データ可視化

•CTools

•D3

•Highcharts

•GIS系

データ分析手法

Rの活用 106

Page 108: Pentaho 定型レポート ハンズオン

今後のテーマ(7)

•オープンデータの活用

•Pentaho オープンソース・コミュニティの活用

107

Page 109: Pentaho 定型レポート ハンズオン

今後のテーマ(8)

•開発手法

•プロトタイピング

•ドキュメント

108

Page 110: Pentaho 定型レポート ハンズオン

今後のテーマ(9)

•開発ツール

•SQLエディタ

•XMLエディタ

•ユーティリティ

•バージョン管理

•バグトラッキング

•テスト手法

•自動化手法 109

Page 111: Pentaho 定型レポート ハンズオン

今後のテーマ(10)

運用

•Apache

•Tomcat

•クラウド活用(AWS)

•スケジューリング、バッチ実行

110

Page 112: Pentaho 定型レポート ハンズオン

今後のテーマ(11)

ポータルサイト、CMSとの統合

•Liferay

•Alfresco

111

Page 113: Pentaho 定型レポート ハンズオン

今後のテーマ(12)

学習メディアの活用

•ドットインストール

•Slideshare

•YouTube

112

Page 114: Pentaho 定型レポート ハンズオン

今後のテーマ(13)

•プロフィットセンター/コストセンターの考え方

113