Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6
© Fujitsu Technology Solutions 2011 1/42 ページ
ホワイトペーパー
FUJITSU PRIMERGY サーバ
パフォーマンスレポート PRIMERGY RX600 S6
本書では、PRIMERGY RX600 S6 で実行したベンチマークの概要について説明します。
PRIMERGY RX600 S6 のパフォーマンスデータを、他の PRIMERGY モデルと比較して
説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク
環境の説明も掲載しています。
バージョン
1.2
2011-12-06
目次
ドキュメントの履歴 ............................... 2
製品データ.............................................. 3
SPECcpu2006 ........................................ 4
SPECjbb2005 ....................................... 11
OLTP-2 ................................................. 14
SAP SD ................................................ 19
vServCon .............................................. 22
VMmark V2 ........................................... 32
STREAM ............................................... 35
LINPACK .............................................. 38
関連資料 ............................................... 41
お問い合わせ先 .................................... 42
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
2/42 ページ © Fujitsu Technology Solutions 2011
ドキュメントの履歴
バージョン 1.0
ベンチマークを含むレポートの初版
SPECcpu2006
Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、E7-4860、
E7-4870 で測定
SPECjbb2005
Xeon E7-4870 で測定
vServCon
Xeon E7-8800 シリーズ、E7-4800 シリーズ、E7-2800 シリーズで測定
VMmark V2
Xeon E7-4870 で測定
バージョン 1.1
以下のベンチマークを追加
OLTP-2
Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、E7-4860、
E7-4870 で測定
SAP SD
認証番号 2011026
STREAM
Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-4850、E7-4860、E7-4870、E7-
8837 で測定
LINPACK
Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、
E7-4870 で測定
以下のベンチマークを更新
SPECcpu2006
Xeon E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860 で測定
バージョン 1.2
以下のベンチマークを更新
VMmark V2
Xeon E7-4870 で測定
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 3/42 ページ
製品データ
PRIMERGY RX600 S6 は、4 U の 4 ソケットラックサーバで、PRIMERGY RX600 S5 の後継製品です。
Intel 7500 チップセット、Intel Xeon プロセッサ E7-4800 シリーズまたは E7-8800 シリーズ 2 ~ 4 基また
は Intel Xeon プロセッサ E7-2800 シリーズ 2 基を搭載し、最大 1 TB の DDR3-SDRAM が搭載可能な 2 ~
8 枚のメモリボード(それぞれ 8 本の DIMM スロット)、2 基のオンボード 2 ポート 1 Gbit イーサネット
コントローラー、10 本の PCI スロット(PCI-Express 2.0 x4(3 本)、PCI-Express 2.0 x8(4 本)、PCI-
Express 2.0 x16(1 本)、および PCI-Express x4(2 本))を装備、最大 8 台の内蔵 2.5 インチドライブ
(SSD または SAS HDD)または PCle SSD を搭載可能です。
詳細な製品データについては、PRIMERGY RX600 S6 データシートを参照してください。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
4/42 ページ © Fujitsu Technology Solutions 2011
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン
チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア
プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ
リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント(デ
ィスク I/O、ネットワークなど)は、このベンチマークでは測定しません。
SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード
として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイラ
ーのバージョンやその最適化設定が、測定結果に影響を与えます。
SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ
び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006
および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法
も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化
を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ
ションです。
ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション
SPECint2006 整数 ピーク アグレッシブ 速度 単体実行
SPECint_base2006 整数 ベース 標準
SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行
SPECint_rate_base2006 整数 ベース 標準
SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行
SPECfp_base2006 浮動小数点 ベース 標準
SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行
SPECfp_rate_base2006 浮動小数点 ベース 標準
測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方
が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン
スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの
SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結
果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム
がこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します。
SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー
スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ
れたベンチマークの並行インスタンスの数です。
弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その
ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ
イルをアーカイブしているので、測定の内容に関していつでも証明できます。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 5/42 ページ
ベンチマーク結果
PRIMERGY RX600 S6 で、Xeon E7 シリーズのプロセッサを測定しました。ベンチマークプログラムは、
インテル C++/Fortran コンパイラー 12.0.1 または 12.0.4 でコンパイルし、SUSE Linux Enterprise Server
11 SP1(64 ビット)で実行しました。すべての結果は、http://www.spec.org で公開されています。
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_base2006 SPECint2006
2 チップ 4 チップ 2 チップ 4 チップ
Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 21.0 22.5
Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 23.0 24.4
Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 27.5 29.5
Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 29.5 31.6
Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 34.0 36.7
Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 29.3 31.5
Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 28.7 31.4
Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 32.4 34.7
Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 34.5 37.2
すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています。
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_rate_base2006 SPECint_rate2006
2 チップ 4 チップ 2 チップ 4 チップ
Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 219 1)
237 1)
Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 239 462 1)
253 499 1)
Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 353 685 1)
372 737 1)
Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 380 737 1)
409 794 1)
Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 383 742 1)
400 789 1)
Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 427 1)
459 1)
Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 436 849 1)
468 913 1)
Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 488 949 1)
515 1020 1)
Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 518 1030 542 1110
1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています。
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_base2006 SPECfp2006
2 チップ 4 チップ 2 チップ 4 チップ
Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 31.4 34.4
Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 38.7 41.2
Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 45.7 50.7
Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 47.0 51.9
Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 55.6 60.2
Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 43.5 47.0
Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 44.0 49.6
Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 47.7 53.8
Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 51.4 57.5
すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
6/42 ページ © Fujitsu Technology Solutions 2011
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_rate_base2006 SPECfp_rate2006
2 チップ 4 チップ 2 チップ 4 チップ
Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 178 188
Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 188 1)
373 198 1)
394
Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 265 1)
527 277 1)
551
Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 278 1)
554 291 1)
579
Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 296 1)
591 319 1)
637
Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 307 318
Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 307 1)
610 319 1)
634
Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 349 1)
692 363 1)
720
Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 363 1)
724 378 1)
752
1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています。
整数演算テストセットおよび浮動小数点演算テストセットの両方で、4 プロセッサのスループットは 2 プロ
セッサの約 2 倍です。
SPECint_rate_base2006
SPECint_rate2006
0
200
400
600
800
1000
1200
2 x XeonE7-4870
4 x XeonE7-4870
518
1030
542
1110
SPECcpu2006:整数演算性能
PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 7/42 ページ
次の 4 つのグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループッ
トを比較したものです。それぞれ最大のパフォーマンス構成になっています。
SPECfp_rate_base2006
SPECfp_rate2006
0
100
200
300
400
500
600
700
800
2 x XeonE7-4870
4 x XeonE7-4870
363
724
378
752
SPECint_base2006
SPECint2006
0
5
10
15
20
25
30
35
40
PRIMERGY RX600 S54 x Xeon X7542
PRIMERGY RX600 S54 x Xeon X7560
PRIMERGY RX600 S64 x Xeon E7-8837
28.9 28.8
34.0
31.9 32.3
36.7
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較)
SPECcpu2006:整数演算性能
PRIMERGY RX600 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
8/42 ページ © Fujitsu Technology Solutions 2011
SPECint_rate_base2006
SPECint_rate2006
0
200
400
600
800
1000
1200
PRIMERGY RX600 S54 x Xeon X7560
PRIMERGY RX600 S64 x Xeon E7-4870
714
1030766
1110
SPECfp_base2006
SPECfp2006
0
10
20
30
40
50
60
70
PRIMERGY RX600 S5
4 x Xeon X7542
PRIMERGY RX600 S5
4 x Xeon X7560
PRIMERGY RX600 S6
4 x Xeon E7-8837
36.0 35.8
55.6 38.7 39.2
60.2
SPECcpu2006:整数演算性能
PRIMERGY RX600 S6 と 旧モデルとの比較
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX600 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 9/42 ページ
SPECfp_rate_base2006
SPECfp_rate2006
0
100
200
300
400
500
600
700
800
PRIMERGY RX600 S54 x Xeon X7560
PRIMERGY RX600 S64 x Xeon E7-4870
538
724559
752
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX600 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
10/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク環境
SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY RX600 S6
CPU Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、
E7-4860、E7-4870
CPU 数
2 チップ
Xeon E7-2803、E7-4807: 12 コア(チップあたり 6 コア)
Xeon E7-4820、E7-4830、E7-8837: 16 コア(チップあたり 8 コア)
その他すべて: 20 コア(チップあたり 10 コア)
4 チップ
Xeon E7-4807: 24 コア(チップあたり 6 コア)
Xeon E7-4820、E7-4830、E7-8837: 32 コア(チップあたり 8 コア)
Xeon E7-4850、E7-4860、E7-4870: 40 コア(チップあたり 10 コア)
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ
Xeon E7-2803、E7-4807、E7-4820: 18 MB (命令 + データ) オンチップ(チップあたり)
Xeon E7-4830、E7-8837、E7-2850、
E7-4850、E7-4860: 24 MB (命令 + データ) オンチップ(チップあたり)
Xeon E7-4870: 30 MB (命令 + データ) オンチップ(チップあたり)
ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C++/Fortran コンパイラー12.0.1 および 12.0.4
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 11/42 ページ
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク
です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。
トランザクションは、多様な機能範囲に対応するために、より複雑になっています。
ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。
SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、
SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性
を得ることができます。
SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス
レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング
システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス
テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は
無関係です。
SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ
システムをエミュレートしたもので、中間層システムに重点を置いています。
クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベ
ースへの OLTP アクセスを思考時間ゼロで行います。
中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。
データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。
トランザクションのログ記録は XML ベースで実装されます。
このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフ
ォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの
SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記
述されています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で
す。
スケーリングの単位は、 約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウス
につき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C
で次の項目を前提としています。
新規オーダーエントリー
支払
オーダーステータスの照会
納入
在庫レベル監視
顧客レポート
ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク
の結果は比較できません。
SPECjbb2005 には、次の 2 つの性能指標があります。
bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション
の処理レートです。
bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。
SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。
これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。
ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ
においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(尐なくと
も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
12/42 ページ © Fujitsu Technology Solutions 2011
高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU
の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレ
ーション速度の算術平均です。
ベンチマーク結果
2011 年 4 月、4 基の Xeon E7-4870 プロセッサおよび 512 GB の PC3-8500R DDR3-SDRAM メモリの構成
で PRIMERGY RX600 S6 を測定しました。 測定には、Windows Server 2008 R2 Enterprise SP1 を使用し
ました。 Oracle から提供されている Java HotSpot(TM) Server VM バージョン 1.6.0_25(Windows 64 ビッ
ト版)の 8 つのインスタンスを JVM として使用しました。
測定結果は次のとおりです。
SPECjbb2005 bops = 2708886
SPECjbb2005 bops/JVM = 677222
PRIMERGY RX600 S6 は、すべての 4 ソケットサーバで最高の結果を得ました。1
次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較
したものです。それぞれ最大のパフォーマンス構成になっています。
1 上記の比較結果は、2011 年 5 月 4 日現在のものです。また、この比較は、4 ソケットサーバの SPECjbb2005 の結果
に基づいています。SPECjbb2005 ベンチマークの最新の結果は、http://www.spec.org/jbb2005/results を参照してくだ
さい。
SPECjbb2005 bops:
PRIMERGY RX600 S6 と旧モデルとの比較 SPECjbb2005 bops:
PRIMERGY RX600 S6 と旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 13/42 ページ
ベンチマーク環境
SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY RX600 S6
CPU Xeon E7-4870
CPU 数 4 チップ、40 コア、チップあたり 10 コア、コアあたり 2 スレッド
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり)
3 次キャッシュ 30 MB(命令 + データ)オンチップ(チップあたり)
メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise SP1
JVM バージョン Oracle Java HotSpot(TM) 64-Bit Server VM on Windows, version 1.6.0_25
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
14/42 ページ © Fujitsu Technology Solutions 2011
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン
チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-
2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)
が測定されます。
独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の
ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、デ
ータベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモリ
の構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定できる
ように設計されています。
OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ
ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする
ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値
となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を
TPC-E として利用することも許可されません。
詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。
ベンチマーク結果
PRIMERGY RX600 S6 の OLTP-2 の値は、Xeon E7-48xx、E7-28xx、および E7-8837 プロセッサシリーズ
を使用して、256 GB、512 GB、および 1024 GB のメモリ構成で測定しました。これらの結果は、オペレ
ーティングシステム Microsoft Windows Server 2008 R2 Enterprise SP1 とデータベース SQL Server 2008
R2 Enterprise x64 Edition で測定したものです。データベースのパフォーマンスは、ハードディスクとコン
トローラーを含むシステムの構成オプションによって、大幅に異なります。ここに記載されている次元のス
ループットは、通常の外部ディスクサブシステムがボトルネックでない場合に実現されます。システム構成
の詳細については、「ベンチマーク環境」を参照してください。
次の表は、PRIMERGY RX600 S6 に搭載可能な各プロセッサの仕様を示しています。
HT = ハイパースレッディング、TM = ターボモード、QPI = QuickPath インターコネクト、
GT = ギガトランスファー、TDP = 熱設計電力
メモリに関しては、16 GB モジュールの最大構成と、8 GB モジュールおよび 4 GB モジュールの別構成で
測定しました。ここでは、周波数はプロセッサタイプによってのみ変わり、使用したメモリモジュールのタ
イプおよび数には影響されません。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon E7-
8800/4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス』を参照してください。
データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ
リ容量が十分にあることが重要です。
プロセッサ コア数/
チップ HT TM プロセッサ周波数
L3 キャ
ッシュ
QPI
スピード メモリ周波数 TDP
E7-4870 10 2.4 GHz 30 MB 6.4 GT/s 1066 MHz 130 W
E7-4860 10 2.27 GHz 24 MB 6.4 GT/s 1066 MHz 130 W
E7-4850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W
E7-4830 8 2.13 GHz 24 MB 6.4 GT/s 1066 MHz 105 W
E7-4820 8 2.0 GHz 18 MB 5.86 GT/s 978 MHz 105 W
E7-4807 6 1.87 GHz 18 MB 4.8 GT/s 800 MHz 95 W
E7-8837 8 2.67GHz 24 MB 6.4 GT/s 1066 MHz 130 W
E7-2850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 15/42 ページ
次のグラフは、Intel Xeon シリーズのプロセッサ(2 基または 4 基)とさまざまなメモリ構成で得られる
PRIMERGY RX600 S6 の OLTP-2 パフォーマンスデータを示しています。
搭載可能なプロセッサの種類が多いため、PRIMERGY RX600 S6 では広範にわたるレベルのパフォーマン
スが実現されていることがわかります。同じ最大メモリ構成で、プロセッサを 4 基搭載して比較すると、パ
フォーマンスが最も低いプロセッサ(E7-4807)を使用した場合(1402 tps)に比べ、パフォーマンスが最
も高いプロセッサ(E7-4870)を使用した場合(2825 tps)は、OLTP-2 値は 2 倍になっています。
測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。
CPU あたり 10 コアのプロセッサである E7-4870、E7-4860、および E7-4850 は、パフォーマンスの最上
位にランクされます。その次にランクされるのは、8 コアプロセッサの E7-4830、E7-4820 です。最下位に
ランクされるのは、ターボモードをサポートしていない、わずか 6 コアのプロセッサである E7-4807 です。
これらのプロセッサはすべて、ハイパースレッディング機能をサポートしています。データベースアプリケ
ーションをシミュレートした OLTP-2 の負荷の下では特に、論理的なプロセッサコア数を 2 倍にするハイパ
ースレッディングのメリットを受けます。E7-8837 プロセッサは例外で、8 コアでクロック周波数は高いも
のの、ハイパースレッディング機能をサポートしていないため、E7-4820 プロセッサとほぼ同等のパフォー
マンスとなります。E7-2850 プロセッサと E7-2803 プロセッサは特殊な位置付けにあり、プロセッサ 4 基
ではなく、プロセッサ 2 基の構成専用に設計されています。
メインメモリを増設すると、すべてのプロセッサタイプでデータベースのスループットを尐しだけ向上させ
ることができました。
一方で、4 ソケットサーバでは、プロセッサを 2 基から 4 基に増やしたときに、どの程度パフォーマンスが
向上するかという疑問もあります。スケーリングが向上すれば、サーバ内のリソース共有によって通常生じ
るオーバーヘッドは減尐します。スケーリングの係数はアプリケーションによっても変わります。サーバを
データベースサーバとして使用する場合は、CPU 数を 2 基から 4 基に倍増することで、パフォーマンスを
80 %程度向上させることができます。
2CPUs-256GB
2CPUs-512GB
4CPUs-256GB
4CPUs-512GB
4CPUs-1024GB
0
500
1000
1500
2000
2500
3000
E7-487010Core
E7-486010Core
E7-485010Core
E7-48308Core
E7-48208Core
E7-48076Core
E7-88378Core
E7-285010Core
E7-28036Core
15401463
1316
11701081
759
1066
1316
689
15521484
1332
11791100
770
1087
1332
699
2710
2589
2330
2099
1941
1362
1914
2786
2662
2395
2129
1968
1381
1941
2825
2701
2425
2147
2001
1402
1977
[tps]
PRIMERGY RX600 S6 : OLTP-2
太字、斜体の数字:実測値
その他:計算値
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
16/42 ページ © Fujitsu Technology Solutions 2011
PRIMERGY RX600 S6 をその旧モデルである PRIMERGY RX600 S3、PRIMERGY RX600 S4、および
PRIMERGY RX600 S5 の最大構成と比較すると、スループットはそれぞれ 747 %(RX600 S3)、283 %
(RX600 S4)、38 %(RX600 S5)向上しています。
333.7
736.94
2041.56
2825.49
0
250
500
750
1000
1250
1500
1750
2000
2250
2500
2750
3000
PRIMERGY RX600 S3 4 × Xeon 7140M
64 GB RAM
PRIMERGY RX600 S4 4 × Xeon 7460 256 GB RAM
PRIMERGY RX600 S5 4 × Xeon X5680
512 GB RAM
PRIMERGY RX600 S6 4 × E7-4870
1024 GB RAM
OLTP-2: PRIMERGY RX600 S3 vs. RX600 S4 vs. RX600 S5 vs.RX600 S6
+746.72% +283.41%
+38.40%
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 17/42 ページ
ベンチマーク環境
一般的な測定環境を以下に示します。
データベースサーバ(B 層)
ハードウェア
システム PRIMERGY RX600 S6
プロセッサ E7-4870(10 コア、 2.4 GHz)× 4 基
E7-4860(10 コア、 2.27 GHz)× 4 基
E7-4850(10 コア、 2.0 GHz)× 4 基
E7-4830(8 コア、 2.13 GHz)× 4 基
E7-4820(8 コア、 2.0 GHz)× 4 基
E7-4807(6 コア、 1.87 GHz)× 4 基
E7-8837(8 コア、 2.67 GHz)× 4 基
E7-2850(10 コア、 2.0 GHz)× 2 基
E7-2803(6 コア、 1.73 GHz)× 2 基
メモリ 1024 GB、512 GB、および 256 GB、Registered ECC DDR3(16 GB、8 GB、および
4 GB DIMM)
設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 4 基
ディスクサブシステム RX600 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB
146 GB 15K rpm SAS ドライブ × 2 台、RAID1(OS)、
450 GB 10K rpm SAS ドライブ × 6 台、RAID10(ログ)
LSI MegaRAID SAS 9280-8e × 10 基
JX40 × 10 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ)
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise SP1
データベース SQL Server 2008 R2 Enterprise x64
アプリケーション
サーバ
A 層
B 層
ネットワーク
ネットワーク
クライアント
データベースサーバ
ストレージサブシステム
SUT(System Under Test:テスト対象システム)
ドライバ
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
18/42 ページ © Fujitsu Technology Solutions 2011
アプリケーションサーバ(A 層)
ハードウェア
システム PRIMERGY RX200 S6 × 2 台
プロセッサ Xeon E5647(4 コア、2.93 GHz)× 2 基
メモリ 12 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15K rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
クライアント
ハードウェア
システム PRIMERGY RX200 S5 × 2 台
プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基
メモリ 24 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15K rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
OLTP-2 ソフトウェア EGen バージョン 1.12.0
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 19/42 ページ
SAP SD
ベンチマークの説明
SAP アプリケーションソフトウェアは、標準的な業務プロセスを管理するためのモジュールで構成されて
います。モジュールには、受注組立(ATO)、財務会計(FI)、人事管理(HR)、在庫購買管理(MM)、
生産計画(PP)、販売管理(SD)などの ERP(企業資源計画)用のものや、SCM(サプライチェーンマ
ネジメント)、小売、銀行業務、公益事業、BI(ビジネスインテリジェンス)、CRM(顧客関係管理)、
PLM(製品ライフサイクル管理)用のものがあります。
SAP アプリケーションソフトウェアは必ずデータベースと関連しています。したがって、SAP の構成には、
ハードウェアに加え、ソフトウェアコンポーネントであるオペレーティングシステムとデータベース、およ
び SAP ソフトウェア自体も含まれます。
SAP アプリケーションシステムのパフォーマンス、安定性およびスケーラビリティを評価するために、
SAP AG は SAP 標準アプリケーションベンチマークを開発しました。中でも、最も広く使用されており最
も重要なのは、SD ベンチマークです。これらのベンチマークでは、システム全体のパフォーマンスが分析
されるため、コンポーネントの統合品質を測定できます。
ベンチマークは、2 層の構成と 3 層の構成で異なります。2 層の構成では、SAP アプリケーションとデータ
ベースを 1 台のサーバにインストールします。3 層の構成では、SAP アプリケーションの各コンポーネン
トを数台のサーバに分散でき、別のサーバでデータベースを処理します。
SAP AG(ドイツ、Walldorf)によって開発されたベンチマークの詳細な仕様は、
http://www.sap.com/benchmark を参照してください。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
20/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク結果
2011 年 7 月 15 日に Xeon E7-4870 プロセッサ 4 基を搭載した PRIMERGY RX600 S6(Windows Server
2008 R2 Datacenter で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用)で次
の結果を得たことが認証されました(認証番号 2011026)。
認証番号 2011026
Number of SAP SD benchmark users 13,285
Average dialog response time 0.97 seconds
Throughput Fully processed order line items/hour dialog steps/hour SAPS
1,453,000 4,359,000 72,650
Average database request time (dialog/update) 0.034 sec / 0.028 sec
CPU utilization of central server 99%
Operating system, central server Windows Server 2008 R2 Datacenter
RDBMS SQL Server 2008
SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0
Configuration Central server
PRIMERGY RX600 S6 4 processors / 40 cores / 80 threads Xeon E7-4870 256 GB main memory
次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較
したものです。それぞれ最大のパフォーマンス構成になっています。
10055
13285
0 2000 4000 6000 8000 10000 12000 14000
Number of Benchmark Users
PRIMERGY RX600 S6
4 x Xeon E7-4870256 GB RAM
PRIMERGY RX600 S54 x Xeon X7560512 GB RAM
SAP SD:PRIMERGY RX600 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 21/42 ページ
ベンチマーク環境
SUT(System Under Test:テスト対象システム)
ハードウェア
サーバ PRIMERGY RX600 S6
プロセッサ Xeon E7-4870 × 4 基
メモリ 4 GB PC3-10600R DDR3-SDRAM × 64 枚
ディスクサブシステム
PRIMERGY RX600 S6 × 1 台:
RAID Ctrl SAS 6G 5/6 512MB (D2616) × 2 基
RAID Contr BBU Upgrade for RAID 5/6 V70 × 2 基
HD SAS 6G 73GB 15K HOT PL 2.5" EP × 5 台
HD SAS 6G 146GB 15K HOT PL 2.5" EP × 1 台
HD SAS 6G 300GB 15K HOT PL 2.5" EP × 1 台
FC Ctrl 8Gb/s 1 Chan LPe1250 MMF LC × 2 基
FibreCAT CX4-480 Storage Unit × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Datacenter + SP1
データベース SQL Server 2008 Enterprise Edition
SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0
負荷ジェネレーター
ハードウェア
モデル PRIMERGY RX300 S4
プロセッサ Xeon X5460(3.17 GHz、12 MB L2 キャッシュ)× 2 基
メモリ 12 GB PC2-5300F DDR2-SDRAM
ソフトウェア
オペレーティングシステム Linux 2.6.32
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
テスト対象システム
2 層環境
負荷ジェネレーター
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
22/42 ページ © Fujitsu Technology Solutions 2011
vServCon
ベンチマークの説明
vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい
て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および
I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比
較も可能になります。
vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ
り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷
を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを
対象とする 3 つの実証済みのベンチマークが使用されます。
3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ
らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」
を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの
タイルを並行して開始しなければならない場合もあります。
3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザクシ
ョンレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれぞ
れのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付け
を行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対する
スコアになります。
原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を
増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた
vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達
成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と
なるように設計されており、他のリソースによる制限は発生しないように設計されています。
タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための
有益な情報となります。
さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な
場合は電力消費量も記録します。
vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。
アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ
データベース Sysbench(補正済み) 2 1.5 GB
Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB
Web サーバ WebBench 1 1.5 GB
テスト対象システム
… …
タイル n
タイル 3
タイル 2
タイル 1
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 23/42 ページ
ベンチマーク結果
PRIMERGY の 4 ソケットおよび 8 ソケット現行世代は、Intel Xeon プロセッサ E7-2800 シリーズ、
E7-4800 シリーズ、および E7-8800 シリーズをベースにしています。
次のようなさまざまなシステム構成に対応しています。
プロセッサ RX600 S6 RX900 S2 2
80
0 6 コア、HT E7-2803 最大 2
10 コア、HT、TM E7-2850 最大 2
E7
-48
00
シリーズ
6 コア、HT E7-4807 最大 4
8 コア、HT、TM E7-4820 最大 4
E7-4830 最大 4
10 コア、HT、TM
E7-4850 最大 4
E7-4860 最大 4
E7-4870 最大 4
E7
-88
00
シリーズ
8 コア TM E7-8837 最大 4 最大 8
HT、TM E7-8830 最大 8
10 コア、HT、TM
E7-8850 最大 8
E7-8860 最大 8
E7-8870 最大 8
HT = ハイパースレッディング、TM = ターボモード
PRIMERGY の 4 ソケットモデルおよび 8 ソケットモデル現行世代は、プロセッサテクノロジーの進歩によ
り、アプリケーションの仮想化に最適なシステムとなっています。10 コアプロセッサにも対応しているた
め、前世代のプロセッサをベースとするシステムと比較して、仮想化性能が約 22 %向上しています
(vServCon スコアで測定)。10 コアプロセッサを 8 基搭載したシステムで、前述の vServCon プロファイ
ルを基にして 176 のアプリケーション VM(44 のタイルに相当)を使用した場合、CPU リソースの最大活
用をほぼ実現できます。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
24/42 ページ © Fujitsu Technology Solutions 2011
次のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。ここでは、発売済みの 6 コア、
8 コア、10 コアのプロセッサを対象に幅広く測定しました。
このグラフに示されているプロセッサ間の大きな性能差は、その機能と CPU の数が影響していると考えら
れます。同数の CPU を搭載したサーバ間では、コア数、L3 キャッシュのサイズ、CPU クロック周波数に
よって値が変わります。また、プロセッサ間のデータ転送速度(「QPI スピード」)も仮想化性能に影響し
ます。
Xeon E7-8837 プロセッサのパフォーマンスが比較的低めなのは、ハイパースレッディング(HT)機能をサ
ポートしていないためです。
この測定結果により、CPU の数を 2 倍にすると、仮想化性能が約 2 倍向上することが明らかになりました。
メモリパフォーマンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon E7-8800/
4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス』を参照してください。
仮想化環境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量
が十分にあることが重要です。
各プロセッサの製品データについて再度簡潔にまとめ、次の表に示します。
2 ×
E7-2
803
2 ×
E7-4
807
2 ×
E7-8
837
2 ×
E7-4
820
2 ×
E7-4
830
2 ×
E7-2
850/E
7-4
850
2 ×
E7-8
867L
2 ×
E7-4
860
2 ×
E7-4
870
4 ×
E7-4
807
4 ×
E7-8
837
4 ×
E7-4
820
4 ×
E7-4
830
4 ×
E7-4
850
4 ×
E7-8
867L
4 ×
E7-4
860
4 ×
E7-4
870
8 ×
E7-8
837
8 ×
E7-8
830
8 ×
E7-8
850
8 ×
E7-8
860
8 ×
E7-8
870
7 8 5 10 11 12 12 12 12 15 10 19 21 24 24 24 24 18 36 44 44 44
0
4
8
12
16
20
24
28
32
36
40
44
Fin
al v
Serv
Co
n S
co
re
#Tiles
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 25/42 ページ
プロセッサ コア数/
チップ
L3 キャッ
シュ
プロセッサ
周波数
QPI
スピード HT TM TDP タイル数 スコア
28
00 6 コア、HT E7-2803(2×) 6 18 MB 1.73 GHz 4.8 GT/s 105 W 7 4.96
10 コア、HT、TM E7-2850(2×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10
E7
-48
00 シ
リー
ズ
6 コア、HT E7-4807(2×) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 8 5.46
E7-4807(4×) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 15 10.70
8 コア、HT、TM
E7-4820(2×) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 10 8.01
E7-4820(4×) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 19 15.70
E7-4830(2×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 11 8.93
E7-4830(4×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 17.50
10 コア、HT、TM
E7-4850(2×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10
E7-4850(4×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 19.80
E7-4860(2×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 12 11.10
E7-4860(4×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 21.70
E7-4870(2×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 12 12.30
E7-4870(4×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 23.90
E7
-88
00 シ
リー
ズ
8 コア
TM
E7-8837(2×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 5 7.90
E7-8837(4×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 10 15.80
E7-8837(8×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 18 30.60
HT、TM E7-8830(4×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 16.70
E7-8830(8×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 36 32.10
10 コア、HT、TM
E7-8850(4×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 18.70
E7-8850(8×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 44 35.80
E7-8860(4×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 20.60
E7-8860(8×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 44 39.40
E7-8870(4×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 22.70
E7-8870(8×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 44 43.90
QPI = QuickPath インターコネクト、GT = ギガトランスファー、HT = ハイパースレッディング、
TM = ターボモード、TDP = 熱設計電力
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
26/42 ページ © Fujitsu Technology Solutions 2011
次の 2 つのグラフは、Xeon E7-4830(8 コア)プロセッサまたは E7-4870(10 コア)プロセッサを搭載し
た PRIMERGY RX600 S6 で、VM 数の増加に伴う仮想化性能の推移を調べたものです。ホストのそれぞれ
の CPU 負荷も示されています。CPU 負荷が 90 %のときが最適なタイル数です。90 %を超えると過負荷と
なり、仮想化のパフォーマンスは停滞または低下します。
上記のように多数の VM を稼動できるのは、物理コア数の増加に加えて、Xeon E7 プロセッサ(E7-8837
を除く)がハイパースレッディング機能をサポートしているためです。ハイパースレッディング機能では、
1 つの物理プロセッサコアが結果的に 2 つの論理コアに分割されるため、ハイパーバイザーが利用できるコ
ア数は 2 倍になります。そのため、ハイパースレッディング機能は、一般的にシステムの仮想化性能を向上
させます。
ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング
曲線が明確に見られます。Xeon E7-4870 プロセッサには、40 個の物理コア、すなわち 80 個の論理コアが
あり、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、
ほぼ 10 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、こ
の範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォ
ーマンス曲線は、傾きが緩やかになっていきます。
1.9
4 3.7
7
5.7
0
7.5
8
9.1
7
10.8
12.2
13.3
13.9
14.6
15.1
15.5
16.0
16.2
16.4
16.7
17.0
17.1
17.3
17.4
17.5
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
4 x E7-4830
0
2
4
6
8
10
12
14
16
18
20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
vS
erv
Co
n s
co
re
# Tiles
Scores and CPU utilization
vServConv score (left axis) CPU Util (right axis)
2.1
2 4.1
5 6.1
8
8.2
6
10.2
12.1
13.8
15.5
16.7
18.2
19.1
19.9
20.6
20.8
21.6
21.7
21.9
22.3
22.5
22.6
23.0
23.3
23.7
23.9
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
4 x E7-4870
0
3
6
9
12
15
18
21
24
27
30
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
vS
erv
Co
n s
co
re
# Tiles
Scores and CPU utilization
vServConv score (left axis) CPU Util (right axis)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 27/42 ページ
前のグラフでは、ホストの全アプリケーション VM の総合的なパフォーマンスを測定しました。しかし、
個々のアプリケーション VM のパフォーマンスも興味深いものです。この情報は、前のグラフから読み取れ
ます。例えば、高負荷で全体最適化された状態と、低負荷の状態での、個々のアプリケーション VM の仮想
化性能を考えます。上記の Xeon E7-4870 環境では、72 のアプリケーション VM(24 タイル、アイドル状
態の VM を除く)を使用した場合が全体最適化された状態で、3 つのアプリケーション VM(1 タイル、ア
イドル状態の VM を除く)を使用した場合が低負荷の状態です。1 タイルあたりの vServCon スコアは、
vServCon の 3 つのアプリケーションシナリオを通じた平均値です。1 タイルあたりの平均パフォーマンス
は、vServCon スコアが低負荷のケース(2.12)から全体最適化された状態(0.99=23.90/24)へ変化すると、
47 %へと大幅に低下します。個々のアプリケーション VM の反応は、高負荷の状況では全く違ったものに
なります。ある特定の状況下では、仮想ホストの VM 数に関して、全体的なパフォーマンス要件と、個々の
アプリケーションのパフォーマンス要件のバランスをとる必要があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
28/42 ページ © Fujitsu Technology Solutions 2011
2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方
では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側
面における向上の割合を示します。ここでは、Xeon X7460 を 4 基搭載した PRIMERGY RX600 S4(2008
年)、Xeon X7550 を 4 基搭載した PRIMERGY RX600 S5(2010 年)、Xeon E7-4820 を 4 基搭載した
PRIMERGY RX600 S6(2011 年)、Xeon E7-4850 を 4 基搭載した PRIMERGY RX600 S6(2011 年)と
いった 4 つの構成を比較しています。
2008 年のシステムと Xeon E7-4850 プロセッサを搭載した現在のシステムを比較すると、VM の数が尐ない
ケース(1 タイル)での進歩は明らかです。プロセッサ周波数が 25 % 低いにも関わらず(2.67 GHz に対
して 2.0 GHz)、現在のシステムの vServCon スコアはわずかに高くなっています。この主な理由の 1 つが、
プロセッサの新しい機能である EPT(Extended Page Tables:拡張ページテーブル)です2。
VM でシステムを完全負荷状態にすると、Xeon E7-4820 8 コアプロセッサを搭載した現行システムの仮想
化のパフォーマンスは、プロセッサ周波数が 25 % 低いにも関わらず、約 2 倍になります。その理由の 1 つ
は、個々の VM で実現できるパフォーマンスの向上です(グラフ左側の Few VMs のスコアを参照)。もう
1 つの理由は、全体最適化された状態で実行可能な VM の数が 3 倍以上に増加していることです(ハイパー
スレッディング機能の使用やメモリ帯域幅の拡大などによる)。ただし、VM の数を増やすことで個々の
VM のパフォーマンスは低下しているため、全体としての性能向上は、VM の数が 6 タイルに対して 19 タ
イルになったことによってもたらされたものと言えます。
前世代のプロセッサをベースとするシステムとの比較においては、完全負荷状態での現在のシステムのスコ
アの向上に加えて、消費電力の削減も考慮すべきです。TDP(Thermal Design Power:熱設計電力)が、こ
の指針となります。2010 年に使用されていた Xeon X7550 プロセッサの TDP は 130 W でしたが、現行の
E7-4820 プロセッサでは、同程度の仮想化性能を持ちながら、TDP はわずか 105 W です。
2 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を高
速化します。
0
5
10
15
20
25
2008X7460
4 x 62.67 GHz
2010X7550
4 x 82.00 GHz
2011E7-4820
4 x 82.00 GHz
2011E7-4850
4 x 102.00 GHz
2008X7460
4 x 62.67 GHz
2010X7550
4 x 82.00 GHz
2011E7-4820
4 x 82.00 GHz
2011E7-4850
4 x 102.00 GHz
Score at optimum Tile countFew VMs (1 Tile)
Virtualization relevant improvements for 4-way servers
x 2.34
vS
erv
Co
n S
core
x 2.97
Year CPU
#CoresFreq.
x 1.26
6 T
ile
s
18
Tile
s
19
Tile
s
24
Tile
s
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 29/42 ページ
さらにコア数の多いプロセッサを使用することによって、仮想化性能をさらに向上させることができます。
(完全負荷状態で)8 コアプロセッサではなく 10 コアプロセッサの現在のシステムで同じ測定を行うと、
2008 年のシステムよりも明らかにパフォーマンスが向上していることがわかります。
仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてではありません。2010 年以降
の仮想化環境におけるパフォーマンス向上の大部分は、実行できる最大 VM 数が増大したことによって達成
されたものです。
8 ソケットサーバでは、プロセッサを 4 基から 8 基に増やしたときに、どの程度パフォーマンスが向上する
かという疑問もあります。パフォーマンスの向上度が増せば、サーバ内のリソース共有によるオーバーヘッ
ドは減尐します。プロセッサ追加時の性能向上度を示すスケーリング係数は、サーバの用途によって異なり
ます。サーバ統合用の仮想化プラットフォームとしてサーバを使用する場合、プロセッサの追加で性能は
1.93 倍になります。次のグラフからわかるように、PRIMERGY RX900 S2 で Xeon E7-8870 を使用する場
合、プロセッサを 4 基 から 8 基に増やすと、仮想化性能は約 2 倍になります。
また、4 基のプロセッサで完全構成した PRIMERGY RX600 S6 と比較しても、PRIMERGY RX900 S2 は非
常に優れたパフォーマンスを示しています。8 基のプロセッサを搭載した PRIMERGY RX900 S2 のパフォ
ーマンスは、4 基のプロセッサを搭載した PRIMERGY RX600 S6 と比べて 83.68 %(1.84 倍)向上してい
ます。プロセッサ 4 基で完全構成した PRIMERGY RX600 S6 は、プロセッサ 4 基を搭載した PRIMERGY
RX900 S2 よりも若干パフォーマンスが高いですが、これは PRIMERGY RX600 S6 が 4 基のプロセッサ搭
載時に最適化するよう設計されているのに対し、PRIMERGY RX900 S2 は、最大 8 基のプロセッサ搭載時
に高パフォーマンスとなるように設計されているためです。
0
5
10
15
20
25
30
35
40
45
50
RX600 S64 × E7-4870
RX900 S24 × E7-8870
RX900 S28 × E7-8870
× 1.93
vS
erv
Co
n s
co
re
× 1.84
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
30/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク環境
測定は次のような環境で行いました。
Intel Xeon プロセッサ E7-8800 シリーズ、E7-4800 シリーズ、E7-2800 シリーズのすべての vServCon スコ
アは、PRIMERGY RX600 S6 および PRIMERGY RX900 S2 を使用して測定しました。
SUT ハードウェア
モデル PRIMERGY RX600 S6
プロセッサ Xeon E7-2803 (6 コア、 1.73 GHz)× 2 基
Xeon E7-2850 (10 コア、 2.00 GHz)× 2 基
Xeon E7-4807 (6 コア、 1.87 GHz)× 2 基
Xeon E7-4820 (8 コア、 2.00 GHz)× 2 基
Xeon E7-4830 (8 コア、 2.13 GHz)× 2 基
Xeon E7-4850 (10 コア、 2.00 GHz)× 2 基
Xeon E7-4860 (10 コア、 2.27 GHz)× 2 基
Xeon E7-4870 (10 コア、 2.40 GHz)× 2 基
Xeon E7-8837 (8 コア、 2.67 GHz)× 2 基
Xeon E7-4807 (6 コア、 1.87 GHz)× 4 基
Xeon E7-4820 (8 コア、 2.00 GHz)× 4 基
Xeon E7-4830 (8 コア、 2.13 GHz)× 4 基
Xeon E7-4850 (10 コア、 2.00 GHz)× 4 基
Xeon E7-4860 (10 コア、 2.27 GHz)× 4 基
Xeon E7-4870 (10 コア、 2.40 GHz)× 4 基
Xeon E7-8837 (8 コア、 2.67 GHz)× 4 基
メモリ 2 CPU:256 GB、4 CPU:512 GB(8 GB DIMM を使用した完全構成)
ネットワーク
インターフェース
1 Gbit LAN × 1 基(制御用)
10 Gbit LAN × 1 基(負荷用)
ディスク
サブシステム
内蔵ハードディスクは使用せず、ストレージシステムETERNUS DX80 のみを使用
VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN
各 LUN は、2 つの Seagate ST3300657SS ディスク(15 krpm)で構成された RAID 0 アレイ
ストレージの接続 FC コントローラーEmulex LPe12002 を使用
SUT ソフトウェア
オペレーティング
システム
ハイパーバイザー VMware ESX Server
リリース バージョン 4.1 U1 ビルド 348481
BIOS バージョン Aptio 0.99G、デフォルト設定からの変更:Performance/Watt=Traditional
SUT:仮想化に関する詳細
ESX 設定 デフォルト
一般的な詳細 『ベンチマークの概要 vServCon』を参照
複数の
1 Gb または 10 Gb
ネットワーク
負荷ジェネレーター
サーバ ストレージシステム
SUT(System Under Test:テスト対象システム)
フレームワーク
コントローラー
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 31/42 ページ
SUT ハードウェア
モデル PRIMERGY RX900 S2
プロセッサ Xeon E7-8830(8 コア、2.13 GHz)× 4 基
Xeon E7-8837(8 コア、2.67 GHz)× 4 基
Xeon E7-8850(10 コア、2.00 GHz)× 4 基
Xeon E7-8860(10 コア、2.27 GHz)× 4 基
Xeon E7-8870(10 コア、2.40 GHz)× 4 基
Xeon E7-8830(8 コア、2.13 GHz)× 8 基
Xeon E7-8837(8 コア、2.67 GHz)× 8 基
Xeon E7-8850(10 コア、2.00 GHz)× 8 基
Xeon E7-8860(10 コア、2.27 GHz)× 8 基
Xeon E7-8870(10 コア、2.40 GHz)× 8 基
メモリ 4 CPU:512 GB、8 CPU:1024 GB(8 GB DIMM を使用した完全構成)
ネットワーク
インターフェース
1 Gbit LAN × 1 基(制御用)
10 Gbit LAN × 1 基(負荷用)
ディスク
サブシステム
内蔵ハードディスクは使用せず、ストレージシステムETERNUS DX80 のみを使用
VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN
各 LUN は、2 つの Seagate ST3300657SS ディスク(15 krpm)で構成された RAID 0 アレイ
ストレージの接続 FC コントローラーEmulex LPe12002 を使用
SUT ソフトウェア
オペレーティング
システム
ハイパーバイザー VMware ESX Server
リリース バージョン 4.1 U1 ビルド 348481
BIOS バージョン 00.17、デフォルト設定
SUT:仮想化に関する詳細
ESX 設定 デフォルト
一般的な詳細 『ベンチマークの概要 vServCon』を参照
負荷ジェネレーターのハードウェア
モデル PRIMERGY BX920 S1 サーバブレード(PRIMERGY BX900 シャーシ)× 17 台
プロセッサ それぞれ Xeon X5570(2.93 GHz)× 2 基
メモリ 12 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 3 基
オペレーティング
システム
Windows Server 2008 R2 Enterprise with Hyper-V
負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作)
プロセッサ 論理 CPU × 1 基
メモリ 512 MB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 2 基
オペレーティング
システム
Windows Server 2003 Enterprise
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
32/42 ページ © Fujitsu Technology Solutions 2011
VMmark V2
ベンチマークの説明
VMmark V2 は、ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行
うために VMware が開発したベンチマークです。ベンチマークは、負荷生成用のソフトウェアに加えて、
定義済み負荷プロファイルおよび規定されたルールで構成されます。VMmark V2 によって得られたベンチ
マーク結果は、VMware に提出しレビューを経た後に VMware のサイト上で公開されます。実績あるベンチ
マークである「VMmark V1」の使用は 2010 年 10 月に中止され、代わって後継の「VMmark V2」が使用さ
れるようになりました。VMmark V2 では、2 台以上のサーバのクラスタが必要であり、仮想マシン(VM)
のクローン作成とデプロイ、負荷分散、vMotion や Storage vMotion による VM の移動といった、データセ
ンター機能も評価できます。
VMmark V2 は、実際には新しいベンチマー
クではありません。VMmark V2 は、既存の
ベンチマークをワークロードとして統合す
るフレームワークで、これにより仮想化さ
れた統合サーバ環境の負荷をシミュレート
します。3 つの実績あるベンチマーク(それ
ぞれ、メールサーバ、Web 2.0、e コマース
のアプリケーションシナリオに対応)が、VMmark V2 に統合されています。
これらの 3 つのアプリケーションシナリオは、合計 7 つの仮想マシンに 1 つずつ割り当てられます。さら
に、スタンバイサーバという 8 番目の VM がこれらに追加されます。これらの 8 つの VM が「タイル」を
形成します。測定対象となるサーバの処理能力によっては、全体として最大のパフォーマンスを達成するた
めに複数のタイルを並列して開始する必要があります。
VMmark V2 の新機能に、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントがありま
す。これにより、VM のクローン作成やデプロイ、vMotion、Storage vMotion によるデータセンター運用の
効率性が評価されます。このとき、DRS(Distributed Resource Scheduler)によるデータセンターの負荷
分散機能も使用されます。
VMmark V2 の結果は「スコア」と呼ばれる数値であり、テスト対象システムの仮想化パフォーマンスを表
します。スコアは、サーバ集約によるメリットの最大合計値で、さまざまなハードウェアプラットフォーム
の比較基準として使用されます。
このスコアは、VM の個々の結果とインフラストラクチャーコンポーネントの結果から導かれます。5 つの
VMmark V2 アプリケーション VM またはフロントエンド VM のそれぞれが、各 VM でのアプリケーション
固有のトランザクションレートという形でベンチマーク結果を示します。スコアを正規化するために、各タ
イルのベンチマーク結果とリファレンスシステムでの結果との比率を求め、得られた値の幾何平均を算出し
ます。さらに、すべての VM について、同じ手順で求めた値を加算します。この値は、総合スコアの 80 %
を決定します。また、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントによるワー
クロードが、結果の 20 %を決定します。インフラストラクチャーコンポーネントのスコアは、1 時間あた
りのトランザクション数と、秒単位の平均持続時間で示されます。
実際にはスコアに加えて、タイル数が スコアと共に示されます。例えば「4.20@5 タイル」のように「スコ
ア@タイル数」と表します。
VMmark V2 の詳細については、『ベンチマークの概要 VMmark V2』を参照してください。
アプリケーションシナリオ 負荷ツール VM の数
メールサーバ LoadGen 1
Web 2.0 Olio クライアント 2
e コマース DVD Store 2 クライアント 4
スタンバイサーバ (IdleVMTest) 1
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 33/42 ページ
ベンチマーク結果
2011 年 11 月 29 日、富士通は、Xeon E7-4870 プロセッサを搭載した PRIMERGY RX600 S6 と VMware
ESX 4.1 U1 を使用して VMmark V2 スコアで「18.20@18 タイル」を達成しました。このときは、合計 2 ×
40 のプロセッサコアを搭載するシステム構成で、「テスト対象システム」(SUT)には同一のサーバを 2
台使用しました。これにより、富士通は 2011 年 7 月 12 日に同じハードウェア上で獲得した「17.98@18
タイル」を上回る結果を達成しました。
このスコアおよび詳細な結果と構成データについては、http://www.vmware.com/a/vmmark/ を参照してくだ
さい。
上記の結果により、PRIMERGY RX600 S6 は、VMmark V2 の観点から、80 コアサーバのカテゴリにおい
て 2 台の同一ホストによる「マッチドペア」構成で最も強力なサーバと評価されています(ベンチマーク結
果の公表日現在)。
次のグラフは、PRIMERGY RX600 S6 と競合他社の該当するシステムの測定結果を比較3したものです。同
等のハードウェアでテストした Cisco の結果と比較すると、PRIMERGY RX600 S6 の方が 1.11 %上回って
います。
使用したプロセッサでは、優れたハイパーバイザー設定によってプロセッサの機能を最適に利用できます。
そのため、これらのプロセッサの使用は、PRIMERGY RX600 S6 がこの結果を達成するための重要な前提
条件でした。プロセッサの機能には、拡張ページテーブル(EPT 4 )とハイパースレッディングが含まれま
す。これらはすべて、仮想化に対して有効に機能します。
すべての VM、それらのアプリケーションデータ、ホストオペレーティングシステム、および追加で必要な
データは、ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました。
このディスクサブシステムは、ベンチマークの特定の要件を考慮して構成することもできます。SSD
(Solid State Drive:半導体ドライブ)の使用によって、使用するハードディスクの数や応答時間が向上し
ました。
負荷ジェネレーターのネットワーク接続とホスト間のインフラストラクチャー負荷接続は、10Gb LAN ポー
トで実装しました。
使用したすべてのコンポーネントは、それぞれが最適に動作するように調整しました。
3 上記の競合他社製品との比較は、 2011 年 11 月 29 日現在のものです。 VMmark V2 の結果は、
http://www.vmware.com/a/vmmark/ を参照してください。
4 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を
高速化します。
18
.20
@1
8 tile
s
18
.00
@1
8 tile
s
17
.98
@1
8 tile
s
17
.11
@2
1 tile
s
16
.89
@1
8 tile
s
16
.89
@2
0 tile
s
16
.68
@1
8 tile
s
0
4
8
12
16
20
FujitsuPRIMERGY
RX600 S64 ×
XeonE7-4870
CiscoUCS
C460 M24 ×
XeonE7-4870
FujitsuPRIMERGY
RX600 S64 ×
XeonE7-4870
HPProLiant
DL580 G7 4 ×
XeonE7-4870
CiscoUCS
C460 M24 ×
XeonE7-4870
HPProLiant
DL580 G7 4 ×
XeonE7-4870
CiscoUCS
C460 M24 ×
XeonE7-4870
2 x 40 Cores
+1.11%
VM
mark
V2 S
co
re
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
34/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク環境
一般的な測定環境を次に示します。
SUT ハードウェア
サーバ数 2 台
モデル PRIMERGY RX600 S6
プロセッサ Xeon E7-4870(10 コア、2.40 GHz)× 4 基
メモリ 512 GB(8 GB DIMM × 64 枚、クアッドランク)、1066 MHz Registered ECC DDR3
ネットワーク
インターフェース
内蔵 Intel 82575EB クアッドポート 1 GbE アダプター × 1 基
富士通 D2755 デュアルポート 10 GbE アダプター × 1 基
ディスクサブシステム ストレージシステム ETERNUS DX80 × 10 台、SSD を含む合計 220 のハードディスクを
搭載(複数の RAID-0 アレイを構成)
ストレージ接続 デュアルチャネル FC コントローラー Emulex LPe12002 × 1 基
SUT ソフトウェア
オペレーティングシステム ハイパーバイザー VMware ESX Server
ESX バージョン VMware ESX v4.1 U1、ビルド 348481
BIOS バージョン Rev. R0.99I / Rev. R1.00.3141
負荷ジェネレーターのハードウェア
モデル サーバブレード PRIMERGY BX620 S4 × 19 基
プロセッサ Intel Xeon 5130(2 GHz)× 2 基(ただし、プライムクライアントでは、Intel Xeon X5470
(3.33 GHz)× 2 基を使用)
メモリ 4 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 1 基
オペレーティングシステム Microsoft Windows Server 2003 R2 Enterprise、SP2 および KB955839 を適用
詳細
公開 URL http://vmware.com/a/assets/vmmark/pdf/2011-07-12-Fujitsu-RX600S6.pdf http://vmware.com/a/assets/vmmark/pdf/2011-11-29-Fujitsu-RX600S6.pdf
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
複数の
1Gb または 10Gb
ネットワーク
プライムクライアントを
含む負荷ジェネレーターと
データセンター管理サーバ
サーバ ストレージシステム
テスト対象システム
(System Under Test:SUT)
vMotion
ネットワーク
クライアントと管理サーバ
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 35/42 ページ
STREAM
ベンチマークの説明
STREAM は、メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで、John
McCalpin 氏がデラウェア大学に教授として在職中に、氏によって開発されました。現在はバージニア大学
でサポートされており、ソースコードを Fortran または C のいずれでもダウンロードできます。STREAM
は、特に HPC(ハイパフォーマンスコンピューティング)分野で、重要な役割を担っています。例えば、
STREAM は、HPC Challenge ベンチマークスイートの一部として使用されています。
このベンチマークは、PC とサーバシステムの両方で使用できるように設計されています。測定単位は、
[GB/s] であり、1 秒あたりにリード/ライト可能なギガバイト数です。
STREAM では、シーケンシャルアクセスでのメモリスループットを測定します。メモリ上のシーケンシャ
ルアクセスは、CPU キャッシュが使用されるため、一般にランダムアクセスより高速です。
ベンチマーク実行前に、測定環境に合わせて、STREAM のソースコードを調整します。また、CPU キャッ
シュによる測定結果への影響ができるだけ尐なくなるよう、データ領域のサイズは、全 CPU キャッシュの
総容量の 4 倍以上にする必要があります。ベンチマーク中にプログラムの一部を並列実行するために、
OpenMP プログラムライブラリを使用します。これにより、利用可能なプロセッサコアに対して最適な負
荷分散が行われます。
STREAM ベンチマークでは、8 バイトの要素で構成されるデータ領域が、 4 つの演算タイプに連続的にコ
ピーされます。COPY 以外の演算タイプでは、算術演算も行われます。
演算タイプ 演算 ステップあたりのバイト数 ステップあたりの浮動小数点演算
COPY a(i) = b(i) 16 0
SCALE a(i) = q × b(i) 16 1
SUM a(i) = b(i) + c(i) 24 1
TRIAD a(i) = b(i) + q × c(i) 24 2
スループットは、演算タイプ別に GB/s で表されます。しかし最近のシステムでは、通常、演算タイプによ
る値の差はほんのわずかです。そのため、一般的に、性能比較には TRIAD の測定値だけが使用されます。
測定結果は、主にメモリモジュールのクロック周波数によって変わります。また、算術演算は、CPU によ
って影響を受けます。結果の精度は約 5 %です。
本章では、スループットを 10 のべき乗で表しています。(1 GB/s = 109 Byte/s)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
36/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク結果
PRIMERGY RX600 S6 の STREAM の値は、Xeon E7 シリーズのプロセッサを使用して測定しました。ベ
ンチマークプログラムは、インテル C コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server
11 SP1(64 ビット)で実行しました。
データ領域は 12,000 万個の要素で構成されます。これは約 900 MB に相当します。
プロセッサ コア GHz L3 キャッシュ QPI
スピード TDP
TRIAD [GB/s]
2 チップ 4 チップ
Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 32.6
Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 46.2
Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 65.0
Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 80.8
Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 86.9
Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 105 W 88.2
Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 94.6
Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 101
Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 102
次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを、最
大パフォーマンス構成で比較したものです。
STREAM TRIAD
0
20
40
60
80
100
120
PRIMERGY RX600 S54 × Xeon X7560
PRIMERGY RX600 S64 × Xeon E7-8837
70.3
102
GB/s
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 37/42 ページ
ベンチマーク環境
STREAM の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました。
ハードウェア
モデル PRIMERGY RX600 S6
CPU Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、
E7-4870
コア数
2 チップ
Xeon E7-2803: 12 コア
Xeon E7-2850: 20 コア
4 チップ
Xeon E7-4807: 24 コア
Xeon E7-4820、E7-4830、E7-8837: 32 コア
その他すべて: 40 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ
Xeon E7-2803、E7-4807、E7-4820: 18 MB(命令 + データ)オンチップ(チップあたり)
Xeon E7-4870: 30 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 24 MB(命令 + データ)オンチップ(チップあたり)
メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚
ソフトウェア
オペレーティング
システム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C コンパイラー 12.0
ベンチマーク Stream.c バージョン 5.9
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
38/42 ページ © Fujitsu Technology Solutions 2011
LINPACK
ベンチマークの説明
LINPACK は、1970 年代に Jack Dongarra 氏他数名によって、スーパーコンピュータの性能を評価するため
に開発されました。このベンチマークは、線形方程式系の解析および求解用のライブラリ関数を集めたもの
です。詳細は次のドキュメントで参照できます。
http://www.netlib.org/utk/people/JackDongarra/PAPERS/hplpaper.pdf
LINPACK では、N 次元の線形方程式系を解く速度を測定します。結果は、GFlops(Giga Floating Point
Operations per Second:10 億浮動小数点演算/秒)で示されます。これは浮動小数点演算を 1 秒間に 10
億回実行することを示す単位です。求解に必要な浮動小数点演算の回数は次の式によって決定されます。
2/3 × N
3 + 2 × N
2
LINPACK の演算では、メインメモリに N × N サイズの行列データを配置する必要があります(値 N は求解
する方程式の数です)。使用可能なメインメモリを十分に利用できるような最大値を N に設定した場合に、
最大の性能が達成されます。しかし、このような最大値の決定には非常に時間がかかるうえ、期待される結
果の向上はごくわずかです。また、システムのメモリ帯域幅は結果にほとんど影響しません。これは、ベン
チマークの実行中は主に浮動小数点演算が実行され、データ交換は並列プロセス間でほとんど起こらないた
めです。そのため、ベンチマーク結果は、最大値より若干低い N の値から求められます。
LINPACK は、HPC(High Performance Computing:高性能計算)の分野で代表的なベンチマークの 1 つで
す。また、LINPACK は、HPC チャレンジベンチマーク(HPC 環境における他の性能的側面を考慮に入れ
たベンチマーク)を構成する 7 つのベンチマークの 1 つです。
PRIMERGY サーバの測定では、インテルが最適化した、個別システム用の LINPACK バージョンを 使用し
ました。これはインテルコンパイラーに含まれています。また、次のアドレスから直接ダウンロードするこ
ともできます。
http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
LINPACK の結果は http://www.top500.org/ で公表される可能性があります。公開にあたっての前提条件は、
MPI(Message Passing Interface)ベースのバージョンを使用することです
(http://www.netlib.org/benchmark/hpl を参照)。
プロセッサコアの理論的な最大性能は、1 クロックサイクル内に実行される浮動小数点演算の回数から得ら
れます。例えば、クロック周波数が 2.4 GHz で 1 サイクルあたり 4 回の浮動小数点演算を実行するプロセ
ッサの最大性能は 9.6 GFlops になります。測定結果と最大値の比率は、浮動小数点演算に関するシステム
の効率を示します。演算中のメモリアクセス回数が尐ないほど、この比率は高くなります。これまでの測定
結果から、現在のプロセッサアーキテクチャーの効率は、およそ 90 %であることがわかっています。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 39/42 ページ
ベンチマーク結果
PRIMERGY RX600 S6 で、Xeon E7 シリーズのプロセッサを測定しました。ベンチマークプログラムは、
インテルコンパイラー 12.0 に付属するものを使用し、これを SUSE Linux Enterprise Server 11 SP1(64 ビ
ット)で実行しました。
測定対象のプロセッサのうち新しい SSE4.2 テクノロジーに対応したものは、1 クロックサイクルあたり 4
回の浮動小数点演算を達成します。したがって、理論的最高値は次のとおりです。
GFlopsmax = 4 × プロセッサコアの数 × CPU 周波数(GHz 単位)
使用可能なメインメモリは 512 GB なので、次元数を N = 200000 としました。
2 プロセッサ コア GHz L3 キャッシュ
[MB]
QPI スピード
TDP 理論的最高値
[GFlops] LINPACK [GFlops]
効率
[%]
Xeon E7-2803 6 1.73 18 4.80 GT/s 105 W 83.0 78.2 94.2
Xeon E7-2850 10 2.00 24 6.40 GT/s 130 W 160 156 97.5
4 プロセッサ コア GHz L3 キャッシュ
[MB]
QPI スピード
TDP 理論的最高値
[GFlops] LINPACK [GFlops]
効率
[%]
Xeon E7-4807 6 1.87 18 4.80 GT/s 95 W 179 163 91.1
Xeon E7-4820 8 2.00 18 5.86 GT/s 105 W 256 245 95.7
Xeon E7-4830 8 2.13 24 6.40 GT/s 105 W 273 264 96.7
Xeon E7-8837 8 2.67 24 6.40 GT/s 130 W 342 324 94.7
Xeon E7-4850 10 2.00 24 6.40 GT/s 105 W 320 304 95.0
Xeon E7-4860 10 2.27 24 6.40 GT/s 130 W 362 339 93.6
Xeon E7-4870 10 2.40 30 6.40 GT/s 130 W 384 359 93.5
上記の結果では、すべてのプロセッサが理論値の 90 %以上を達成しており、PRIMERGY RX600 S6 の浮動
小数点演算の性能が良好であることを示しています。
次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを、最
大パフォーマンス構成で比較したものです。
0
50
100
150
200
250
300
350
400
PRIMERGY RX600 S54 × Xeon X7560
PRIMERGY RX600 S64 × Xeon E7-4870
269
359
GFlops
LINPACK:
PRIMERGY RX600 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
40/42 ページ © Fujitsu Technology Solutions 2011
ベンチマーク環境
LINPACK の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました。
ハードウェア
モデル PRIMERGY RX600 S6
CPU Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、
E7-4870
コア数
2 チップ
Xeon E7-2803: 12 コア
Xeon E7-2850: 20 コア
4 チップ
Xeon E7-4807: 24 コア
Xeon E7-4820、E7-4830、E7-8837: 32 コア
その他すべて: 40 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ
Xeon E7-2803、E7-4807、E7-4820: 18 MB(命令 + データ)オンチップ(チップあたり)
Xeon E7-4870: 30 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 24 MB(命令 + データ)オンチップ(チップあたり)
メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚
ソフトウェア
オペレーティング
システム SUSE Linux Enterprise Server 11 SP1(64 ビット)
ベンチマーク インテルコンパイラー 12.0 に付属の xlinpack_xeon64
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
SPECcpu2006:浮動小数点演算のパフォーマンス
PRIMERGY TX200 S6 と 旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
© Fujitsu Technology Solutions 2011 41/42 ページ
関連資料
PRIMERGY システム
http://ts.fujitsu.com/primergy
PRIMERGY RX600 S6
データシート(英語)
http://docs.ts.fujitsu.com/dl.aspx?id=368e2f3f-028f-413d-9ce8-2ca13d5b1419
Xeon E7-8800/4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=e943109a-eeba-42b3-82a1-927b01ae319a
RAID コントローラーのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b
単一ディスクのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c
PRIMERGY のパフォーマンス
http://ts.fujitsu.com/products/standard_servers/primergy_bov.html
LINPACK
http://www.netlib.org/linpack/
OLTP-2
ベンチマークの概要 OLTP-2
http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a
SAP SD
http://www.sap.com/benchmark
ベンチマークの概要 SAP SD
http://docs.ts.fujitsu.com/dl.aspx?id=ab13a8c0-44d8-40ee-9415-695d372e2e7b
SPECcpu2006
http://www.spec.org/osg/cpu2006
ベンチマークの概要 SPECcpu2006
http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157
SPECjbb2005
http://www.spec.org/jbb2005
ベンチマークの概要 SPECjbb2005
http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba
STREAM
http://www.cs.virginia.edu/stream/
vServCon
ベンチマークの概要 vServCon
http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06
42/42 ページ © Fujitsu Technology Solutions 2011
VMmark V2
ベンチマークの概要 VMmark V2
http://docs.ts.fujitsu.com/dl.aspx?id=a083d947-8a41-45d1-a112-8cd295595a95
VMmark V2 http://www.vmmark.com
VMmark V2 結果
http://www.vmware.com/a/vmmark/
PC サーバ PRIMERGY(プライマジー)
http://jp.fujitsu.com/platform/server/primergy/
お問い合わせ先
富士通テクノロジー・ソリューションズ
Web サイト:http://ts.fujitsu.com
PRIMERGY のパフォーマンスとベンチマーク
mailto:[email protected]
知的所有権を含むすべての権利は弊社に帰属します。製品データは変更される場合があります。納品までの時間は在庫状況によって異なります。データ
および図の完全性、事実性、または正確性について、弊社は一切の責任を負いません。本書に記載されているハードウェアおよびソフトウェアの名称
は、それぞれのメーカーの商標等である場合があります。第三者が各自の目的でこれらを使用した場合、当該所有者の権利を侵害することがあります。
詳細については、http://ts.fujitsu.com/terms_of_use.html を参照してください。
2011-12-06 WW JA Copyright © Fujitsu Technology Solutions GmbH 2011