Upload
truongthu
View
296
Download
19
Embed Size (px)
Citation preview
を共有する を見つけるを組織する を構築する を統制する
アイデア
コンテンツ
ビジョン
エキスパート
答え
コネクション
チーム
プロジェクト
情報
アプリケーション
Web サイト
クラウド
コスト
リスク
時間
SHARE DISCOVERORGANIZE BUILD MANAGE
ユーザーに合わせてユーザーが探してる結果を見つけることが出来る
常に一歩先のエクスペリエンスを伴って、答えを取得し、次の行動を行うことが出来る
あらゆるスケール要件にも対応可能でスマートなアプリケーションを構築することが出来る
検索を意識させずに、ミッションクリティカルなアプリケーションに検索機能を利用することが出来る
コンポーネント (スケールする単位)サーバー ロール
外部公開 API カスタム モジュール
斜体 : 実行モジュール名
カスタムアプリケーション
クラウド
noderunner.exe
検索管理 DB クロール DB
mssearch.exe noderunner.exe noderunner.exe
検索インデックス
noderunner.exe
リンク DB 分析レポート DB
【情報リソース】
データベース
SharePointLotus Notes
ファイルサーバー
Webサイト
コンテンツ処理
クエリ処理
クローラー
【エンド ユーザー】
パーソナライズ
絞り込み
迅速なレスポンス
リッチな UI
検索A
PI
検索インデックス
「検索の解剖図」("Search Patterns", http://searchpatterns.org/) より
検索キーワード意味判断類義語展開 等
セキュリティ トリミング結果順位調整レコメンド 等
属性抽出カテゴリ分け言語処理外部システム呼出フィルタリング 等
コネクタ フレームワーク
HTML + JavaScript の表示フォーマット設定
REST+ JSON
絞り込み並び替え 等
インデックス / サーチコアコンポーネントの指標• 1,000 万アイテム / ノード• 500 GB / 1,000 万アイテムクエリ処理コンポーネントの指標• 8,000 万アイテム毎に追加
4コア / 12GB / 300GB
4コア / 12GB / 300GB
4コア / 12GB / 300GB
4コア / 12GB / 300GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
管理コンポーネント
分析処理コンポーネント
クロール コンポーネント
コンテンツ処理コンポーネント
インデックス / サーチ コア コンポーネント
クエリ処理コンポーネント
8コア / 24GB / 800GB
仮想環境
ディスクの指標 1KB Read[IOPS]
32KB Read [IOPS]
32KB Write [IOPS]
64KB Read [IOPS]
256KB Write [IOPS]
100MB Read [MB/s]
100MB Write [MB/s]
10,000 rpm 以上、RAID 5 構成、SAS インターフェースを推奨
2,000 1,800 900 - - 500 250
- - - 300 100 200 200
クラウド(Office 365, Azure 等)
ローカルまたはリモートのSharePoint サーバー
OpenSearch
検索インデックス
クロール
Exchangeパブリック フォルダ
Lotus Notes/Domino
SharePoint サーバーひとプロフィル
ファイル サーバー 社内外のWeb サイト
LOB アプリケーション(SAP, Siebel 等)
RDBMS (SQL Server,Oracle Database 等)
標準で対象のファイル形式Office ドキュメント、テキスト、HTML、XML、PDF、 ZIP 圧縮ファイル、オープンドキュメント・フォーマット、Outlook メッセージファイルなど
検索
時間差分クロールのスケジュール実施例
期待値
現実値
変更プロセス 変更プロセス 変更プロセス 変更プロセス
変更プロセス 変更プロセス
コンテンツ変更の多い時間帯
コンテンツ変更の少ない時間帯
コンテンツ変更の多い時間帯
継続的クロール実施例 時間
現実値#1
#2
#3
#4
#5
#6 #7 #9
#10
#8
クロールされていないコンテンツ数
日時
インデックス新鮮度の検証結果
Crawl Schedule
Incremental Crawl Freshness
Continuous Crawl Freshness
低い値でほぼ一定となる
変更量が多い際にクロール時間が長くなり、スケジュールされた差分クロールがスキップされる変更量が多い際にクロール時間が長くなり、スケジュールされた差分クロールがスキップされる
スキップされるスケジュール無し
コンテンツへの情報付与
言語判別ドキュメントサマリー生成
管理プロパティへのマッピング
ドキュメント解析メタデータ抽出
カスタムエンティティ抽出
発音変換ワードブレーク
コンテンツエンリッチメント
カスタム プロパティ B の値; ;
カスタム プロパティ A の値; ; ;
章タイトル プロパティの値; ; …
外部 Web サービス
外部 Web サービスから取得した情報
検索インデックス Web ブラウザ検索結果
絞り込み 「検索結果はこう分類されますよ」ひと検索 「この検索キーワードに関連した人です」クエリ候補「こんな検索キーワードはどうですか?」お気に入り「以前、これを参照しましたよ」ソーシャル「いいね!と xx 回押されていますよ」
検索結果からコンテンツのダウンロード
サムネイルおよびプレビューの確認Office Web Apps による Web ブラウザ上の参照または編集ランク付けモデルによる適切な検索結果順序検索ホバー パネルによる適切な次のアクション
コンテンツ
お気に入り
クエリ ルール
検索ボックスに入力された検索キーワード
検索インデックス
実際に実行される検索クエリー
結果の種類
ドキュメントの種類などの判断
表示テンプレート
PowerPoint アイテムの表示形式 (HTML)
ひとのアイテムの表示形式 (HTML)
表示テンプレート
表示テンプレート
Word アイテムの表示形式 (HTML)
ドキュメントの検索結果
ひとの検索結果
OSS.DOCX
共有フォルダ 1
OSS.XLSX
共有フォルダ 2
OSS.PPTX
SharePoint ポータル
Active Directoryなどの認証基盤
「OSS」を検索
「OSS」を検索
OSS.DOCX
OSS.XLSX
OSS.PPTX
OSS.DOCX
検索結果
検索結果
セキュリティ情報を持った検索インデックス
検索実行時におけるセキュリティ情報の確認
各種認証基盤の利用
分析レポート DB
アイテム間の関連グラフの計算
検索インデックスへの推奨情報の投入
イベント情報の登録
イベント情報の送信
各種イベント推奨アイテムWeb パーツや REST API
推奨アイテムの送信
推奨アイテムのリクエスト
– 利用状況レポート機能により、
分析レポート DB
アイテム間の関連グラフの計算
カスタム分析アプリケーション
イベント情報の登録
利用状況レポート
利用状況データの取得
人気のあるアイテムの利用状況データの取得
推奨アイテムWeb パーツを含むページ
イベント情報の送信
最も人気のあるアイテム、推奨アイテムの送信
ファーム管理者によるファーム レベルの検索管理
カスタム管理アプリケーション
サイト管理者によるサイト単位の検索管理
このサイトをもう一度クロールして!
この管理プロパティも検索出来るようにしよう
サイト コレクション管理者によるサイト コレクション単位の検索管理
こんな頻度で継続的クロールを実行しよう
コンテンツエンリッチメント サービス
noderunner.exe
カスタムコネクタ
リンク DB 分析レポート DB検索管理 DB クロール DB
mssearch.exe
カスタムアプリケーション
noderunner.exe
カスタム分析アプリケーション
カスタム管理アプリケーション
クラウド
カスタムセキュリティ トリマー
カスタムフィルタ
noderunner.exenoderunner.exe
カスタムワード ブレーカー
コンポーネント (スケールする単位)サーバー ロール
外部公開 API カスタム モジュール
下線 : 新機能 斜体 : 実行モジュール名
検索インデックス
を共有する を見つけるを組織する を構築する を統制する
アイデア
コンテンツ
ビジョン
エキスパート
答え
コネクション
チーム
プロジェクト
情報
アプリケーション
Web サイト
クラウド
コスト
リスク
時間
SHARE DISCOVERORGANIZE BUILD MANAGE
クエリ結果Web パーツ
(SharePoint 2010)
コンテンツ検索Web パーツ
(SharePoint 2013)
サイト コレクションを跨いだ情報表示
× 〇
コンテンツ タイプを跨いだコンテンツ表示
× 〇
結果のプレビュー × 〇
ビジネス ユーザーに、更に関連性の高く、魅力的で、アクションを起こし易い検索を
提供します
統合し易く、管理し易い、拡張性のあるプラットフォームを
提供します
単なる検索結果だけではなく、答えを見つけるための
インテリジェントな検索 UX を提供します
代替方法
検索アラートまたは SharePoint RSS を利用
検索の分析機能に変更
KQL または FQL を利用
REST または CSOM の利用を推奨
BCS コネクタ フレームワークの利用を推奨
変更前 変更後
-
個数制限なく作成できる 最大 12 個まで
パイプライン拡張コンテンツ エンリッチメント
Web サービス
おすすめコンテンツビジュアルおすすめコンテンツ
昇格した結果
Content SSA + Query SSA Search SSA
代替方法
なし (カスタムによる方法を検討中)
SharePoint コネクタを利用
BCS ベースのカスタム コネクタ
なし
標準で 55 種類のファイル種類に対応必要なファイル種類に対応した iFilter の導入
なし
なし
検索アラートまたは SharePoint RSS を利用
5 分間隔に変更する場合$ssa = Get-SPEnterpriseSearchServiceApplication$ssa.SetProperty("ContinuousCrawlInterval", 5)$ssa.Update()
Web サービスへ Web サービスから
トリガー評価
言語判別ドキュメントサマリー生成
管理プロパティへのマッピング
ドキュメント解析メタデータ抽出
カスタムエンティティ抽出
発音変換ワードブレーク
Web サービスコールアウト
補足製品リリース後に CodePlex から GUI ベースのランク モデル管理ツールを提供する予定
標準で提供されるランク付けモデル
既定の検索モデル
カタログのランク付けモデル
推薦者のランク付けモデル
ひとの専門分野の検索 (社会的距離に基づくランク付けモデル)
サイト候補のランク付けモデル
Minspan を高く設定した検索モデル
ひとの検索の社会的距離モデル
ひとの検索に適用する専門分野ランク付けモデル
ひとの名前の検索 (社会的距離に基づくランク付けモデル)
ひとの名前の検索に適用するランク付けモデル
人気のランク付けモデル
O14 既定の検索モデル
ひとの検索アプリケーションのランク付けモデル
Minspan なしの検索モデル
検索クエリを「製品」だと認識し、「Knowledge Center」サイトを推奨
「人の名前」と認識し、ひと検索の結果を表示
ビデオ検索でよく利用されている検索クエリであると認識し、ビデオ検索の結果を表示
「アイテムA
の推奨アイテム」
アイテム A アイテム B
アイテム A アイテム E
アイテム A アイテム F
アイテム A アイテム G
アイテム A アイテム C
アイテム A アイテム D
3
3
2
2
1
1
履歴情報アイテム Bアイテム Cアイテム D
エキスパート 2
エキスパート 3
エキスパート 4
エキスパート 1
履歴情報アイテム Bアイテム Eアイテム F
履歴情報アイテム Eアイテム Fアイテム G
履歴情報アイテム Bアイテム Eアイテム G
エキスパートあるアイテムにその時点で最も関わっているユーザー
アイテム A アイテム B
アイテム A アイテム F
アイテム A アイテム G
アイテム A アイテム D
3
2
2
1
バックリンク• 特定のアイテムのエキスパートが、そのアイテムを推奨していることを確認• 関係性の相互相関により、精度と関連性を担保
アイテム Bアイテム Fアイテム Gアイテム D
サイト コレクション管理者
サイト管理者
クエリ ルールおよび昇格した結果の追加および更新 ✓ ✓
結果の種類および表示テンプレートの追加および更新 ✓ ✓
検索先の追加および更新 ✓ ✓
管理プロパティの追加 ✓
サイト インデックスの再作成(次回クロール時に再インデックスさせる)
✓ ✓
サイトおよびサブ サイトを検索結果の対象外とする ✓ ✓
インデックス対象外にする列 (例 : 「いいね!」の数) ✓ ✓
構成 (クエリ ルールや検索先など) のインポートおよびエキスポート
✓ ✓