42
ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 © Fujitsu Technology Solutions 2011 1/42 ページ ホワイトペーパー FUJITSU PRIMERGY サーバ パフォーマンスレポート PRIMERGY RX600 S6 本書では、PRIMERGY RX600 S6 で実行したベンチマークの概要について説明します。 PRIMERGY RX600 S6 のパフォーマンスデータを、他の PRIMERGY モデルと比較して 説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク 環境の説明も掲載しています。 バージョン 1.2 2011-12-06 目次 ドキュメントの履歴 ............................... 2 製品データ.............................................. 3 SPECcpu2006 ........................................ 4 SPECjbb2005 ....................................... 11 OLTP-2 ................................................. 14 SAP SD ................................................ 19 vServCon .............................................. 22 VMmark V2 ........................................... 32 STREAM............................................... 35 LINPACK .............................................. 38 関連資料 ............................................... 41 お問い合わせ先 .................................... 42

パフォーマンスレポート PRIMERGY RX600 S6...L3 キャッシュ QPI スピード TDP SPECint_base2006 SPECint2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7-2803

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6

© Fujitsu Technology Solutions 2011 1/42 ページ

ホワイトペーパー

FUJITSU PRIMERGY サーバ

パフォーマンスレポート PRIMERGY RX600 S6

本書では、PRIMERGY RX600 S6 で実行したベンチマークの概要について説明します。

PRIMERGY RX600 S6 のパフォーマンスデータを、他の PRIMERGY モデルと比較して

説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク

環境の説明も掲載しています。

バージョン

1.2

2011-12-06

目次

ドキュメントの履歴 ............................... 2

製品データ.............................................. 3

SPECcpu2006 ........................................ 4

SPECjbb2005 ....................................... 11

OLTP-2 ................................................. 14

SAP SD ................................................ 19

vServCon .............................................. 22

VMmark V2 ........................................... 32

STREAM ............................................... 35

LINPACK .............................................. 38

関連資料 ............................................... 41

お問い合わせ先 .................................... 42

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

2/42 ページ © Fujitsu Technology Solutions 2011

ドキュメントの履歴

バージョン 1.0

ベンチマークを含むレポートの初版

SPECcpu2006

Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、E7-4860、

E7-4870 で測定

SPECjbb2005

Xeon E7-4870 で測定

vServCon

Xeon E7-8800 シリーズ、E7-4800 シリーズ、E7-2800 シリーズで測定

VMmark V2

Xeon E7-4870 で測定

バージョン 1.1

以下のベンチマークを追加

OLTP-2

Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、E7-4860、

E7-4870 で測定

SAP SD

認証番号 2011026

STREAM

Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-4850、E7-4860、E7-4870、E7-

8837 で測定

LINPACK

Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、

E7-4870 で測定

以下のベンチマークを更新

SPECcpu2006

Xeon E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860 で測定

バージョン 1.2

以下のベンチマークを更新

VMmark V2

Xeon E7-4870 で測定

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 3/42 ページ

製品データ

PRIMERGY RX600 S6 は、4 U の 4 ソケットラックサーバで、PRIMERGY RX600 S5 の後継製品です。

Intel 7500 チップセット、Intel Xeon プロセッサ E7-4800 シリーズまたは E7-8800 シリーズ 2 ~ 4 基また

は Intel Xeon プロセッサ E7-2800 シリーズ 2 基を搭載し、最大 1 TB の DDR3-SDRAM が搭載可能な 2 ~

8 枚のメモリボード(それぞれ 8 本の DIMM スロット)、2 基のオンボード 2 ポート 1 Gbit イーサネット

コントローラー、10 本の PCI スロット(PCI-Express 2.0 x4(3 本)、PCI-Express 2.0 x8(4 本)、PCI-

Express 2.0 x16(1 本)、および PCI-Express x4(2 本))を装備、最大 8 台の内蔵 2.5 インチドライブ

(SSD または SAS HDD)または PCle SSD を搭載可能です。

詳細な製品データについては、PRIMERGY RX600 S6 データシートを参照してください。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

4/42 ページ © Fujitsu Technology Solutions 2011

SPECcpu2006

ベンチマークの説明

SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン

チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア

プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ

リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント(デ

ィスク I/O、ネットワークなど)は、このベンチマークでは測定しません。

SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード

として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイラ

ーのバージョンやその最適化設定が、測定結果に影響を与えます。

SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ

び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006

および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法

も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化

を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ

ションです。

ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション

SPECint2006 整数 ピーク アグレッシブ 速度 単体実行

SPECint_base2006 整数 ベース 標準

SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行

SPECint_rate_base2006 整数 ベース 標準

SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行

SPECfp_base2006 浮動小数点 ベース 標準

SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行

SPECfp_rate_base2006 浮動小数点 ベース 標準

測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方

が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン

スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの

SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結

果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム

がこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します。

SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー

スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ

れたベンチマークの並行インスタンスの数です。

弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その

ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ

イルをアーカイブしているので、測定の内容に関していつでも証明できます。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 5/42 ページ

ベンチマーク結果

PRIMERGY RX600 S6 で、Xeon E7 シリーズのプロセッサを測定しました。ベンチマークプログラムは、

インテル C++/Fortran コンパイラー 12.0.1 または 12.0.4 でコンパイルし、SUSE Linux Enterprise Server

11 SP1(64 ビット)で実行しました。すべての結果は、http://www.spec.org で公開されています。

プロセッサ コア GHz L3

キャッシュ

QPI

スピード TDP

SPECint_base2006 SPECint2006

2 チップ 4 チップ 2 チップ 4 チップ

Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 21.0 22.5

Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 23.0 24.4

Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 27.5 29.5

Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 29.5 31.6

Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 34.0 36.7

Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 29.3 31.5

Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 28.7 31.4

Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 32.4 34.7

Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 34.5 37.2

すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています。

プロセッサ コア GHz L3

キャッシュ

QPI

スピード TDP

SPECint_rate_base2006 SPECint_rate2006

2 チップ 4 チップ 2 チップ 4 チップ

Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 219 1)

237 1)

Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 239 462 1)

253 499 1)

Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 353 685 1)

372 737 1)

Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 380 737 1)

409 794 1)

Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 383 742 1)

400 789 1)

Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 427 1)

459 1)

Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 436 849 1)

468 913 1)

Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 488 949 1)

515 1020 1)

Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 518 1030 542 1110

1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています。

プロセッサ コア GHz L3

キャッシュ

QPI

スピード TDP

SPECfp_base2006 SPECfp2006

2 チップ 4 チップ 2 チップ 4 チップ

Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 31.4 34.4

Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 38.7 41.2

Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 45.7 50.7

Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 47.0 51.9

Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 55.6 60.2

Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 43.5 47.0

Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 44.0 49.6

Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 47.7 53.8

Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 51.4 57.5

すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

6/42 ページ © Fujitsu Technology Solutions 2011

プロセッサ コア GHz L3

キャッシュ

QPI

スピード TDP

SPECfp_rate_base2006 SPECfp_rate2006

2 チップ 4 チップ 2 チップ 4 チップ

Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 178 188

Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 188 1)

373 198 1)

394

Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 265 1)

527 277 1)

551

Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 278 1)

554 291 1)

579

Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 296 1)

591 319 1)

637

Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 307 318

Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 307 1)

610 319 1)

634

Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 349 1)

692 363 1)

720

Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 363 1)

724 378 1)

752

1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています。

整数演算テストセットおよび浮動小数点演算テストセットの両方で、4 プロセッサのスループットは 2 プロ

セッサの約 2 倍です。

SPECint_rate_base2006

SPECint_rate2006

0

200

400

600

800

1000

1200

2 x XeonE7-4870

4 x XeonE7-4870

518

1030

542

1110

SPECcpu2006:整数演算性能

PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較)

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 7/42 ページ

次の 4 つのグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループッ

トを比較したものです。それぞれ最大のパフォーマンス構成になっています。

SPECfp_rate_base2006

SPECfp_rate2006

0

100

200

300

400

500

600

700

800

2 x XeonE7-4870

4 x XeonE7-4870

363

724

378

752

SPECint_base2006

SPECint2006

0

5

10

15

20

25

30

35

40

PRIMERGY RX600 S54 x Xeon X7542

PRIMERGY RX600 S54 x Xeon X7560

PRIMERGY RX600 S64 x Xeon E7-8837

28.9 28.8

34.0

31.9 32.3

36.7

SPECcpu2006:浮動小数点演算性能

PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較)

SPECcpu2006:整数演算性能

PRIMERGY RX600 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

8/42 ページ © Fujitsu Technology Solutions 2011

SPECint_rate_base2006

SPECint_rate2006

0

200

400

600

800

1000

1200

PRIMERGY RX600 S54 x Xeon X7560

PRIMERGY RX600 S64 x Xeon E7-4870

714

1030766

1110

SPECfp_base2006

SPECfp2006

0

10

20

30

40

50

60

70

PRIMERGY RX600 S5

4 x Xeon X7542

PRIMERGY RX600 S5

4 x Xeon X7560

PRIMERGY RX600 S6

4 x Xeon E7-8837

36.0 35.8

55.6 38.7 39.2

60.2

SPECcpu2006:整数演算性能

PRIMERGY RX600 S6 と 旧モデルとの比較

SPECcpu2006:浮動小数点演算性能

PRIMERGY RX600 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 9/42 ページ

SPECfp_rate_base2006

SPECfp_rate2006

0

100

200

300

400

500

600

700

800

PRIMERGY RX600 S54 x Xeon X7560

PRIMERGY RX600 S64 x Xeon E7-4870

538

724559

752

SPECcpu2006:浮動小数点演算性能

PRIMERGY RX600 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

10/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク環境

SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いまし

た。

ハードウェア

モデル PRIMERGY RX600 S6

CPU Xeon E7-2803、E7-4807、E7-4820、E7-4830、E7-8837、E7-2850、E7-4850、

E7-4860、E7-4870

CPU 数

2 チップ

Xeon E7-2803、E7-4807: 12 コア(チップあたり 6 コア)

Xeon E7-4820、E7-4830、E7-8837: 16 コア(チップあたり 8 コア)

その他すべて: 20 コア(チップあたり 10 コア)

4 チップ

Xeon E7-4807: 24 コア(チップあたり 6 コア)

Xeon E7-4820、E7-4830、E7-8837: 32 コア(チップあたり 8 コア)

Xeon E7-4850、E7-4860、E7-4870: 40 コア(チップあたり 10 コア)

1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)

2 次キャッシュ 256 KB オンチップ(コアあたり)

その他のキャッシュ

Xeon E7-2803、E7-4807、E7-4820: 18 MB (命令 + データ) オンチップ(チップあたり)

Xeon E7-4830、E7-8837、E7-2850、

E7-4850、E7-4860: 24 MB (命令 + データ) オンチップ(チップあたり)

Xeon E7-4870: 30 MB (命令 + データ) オンチップ(チップあたり)

ソフトウェア

オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット)

コンパイラー インテル C++/Fortran コンパイラー12.0.1 および 12.0.4

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 11/42 ページ

SPECjbb2005

ベンチマークの説明

SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク

です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。

トランザクションは、多様な機能範囲に対応するために、より複雑になっています。

ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。

SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、

SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性

を得ることができます。

SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス

レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング

システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス

テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は

無関係です。

SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ

システムをエミュレートしたもので、中間層システムに重点を置いています。

クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベ

ースへの OLTP アクセスを思考時間ゼロで行います。

中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。

データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。

トランザクションのログ記録は XML ベースで実装されます。

このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフ

ォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの

SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記

述されています。

SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で

す。

スケーリングの単位は、 約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウス

につき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C

で次の項目を前提としています。

新規オーダーエントリー

支払

オーダーステータスの照会

納入

在庫レベル監視

顧客レポート

ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク

の結果は比較できません。

SPECjbb2005 には、次の 2 つの性能指標があります。

bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション

の処理レートです。

bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。

SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。

これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。

ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ

においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(尐なくと

も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

12/42 ページ © Fujitsu Technology Solutions 2011

高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU

の数と同じ値が設定されます。

性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレ

ーション速度の算術平均です。

ベンチマーク結果

2011 年 4 月、4 基の Xeon E7-4870 プロセッサおよび 512 GB の PC3-8500R DDR3-SDRAM メモリの構成

で PRIMERGY RX600 S6 を測定しました。 測定には、Windows Server 2008 R2 Enterprise SP1 を使用し

ました。 Oracle から提供されている Java HotSpot(TM) Server VM バージョン 1.6.0_25(Windows 64 ビッ

ト版)の 8 つのインスタンスを JVM として使用しました。

測定結果は次のとおりです。

SPECjbb2005 bops = 2708886

SPECjbb2005 bops/JVM = 677222

PRIMERGY RX600 S6 は、すべての 4 ソケットサーバで最高の結果を得ました。1

次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較

したものです。それぞれ最大のパフォーマンス構成になっています。

1 上記の比較結果は、2011 年 5 月 4 日現在のものです。また、この比較は、4 ソケットサーバの SPECjbb2005 の結果

に基づいています。SPECjbb2005 ベンチマークの最新の結果は、http://www.spec.org/jbb2005/results を参照してくだ

さい。

SPECjbb2005 bops:

PRIMERGY RX600 S6 と旧モデルとの比較 SPECjbb2005 bops:

PRIMERGY RX600 S6 と旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 13/42 ページ

ベンチマーク環境

SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いまし

た。

ハードウェア

モデル PRIMERGY RX600 S6

CPU Xeon E7-4870

CPU 数 4 チップ、40 コア、チップあたり 10 コア、コアあたり 2 スレッド

1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)

2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり)

3 次キャッシュ 30 MB(命令 + データ)オンチップ(チップあたり)

メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Enterprise SP1

JVM バージョン Oracle Java HotSpot(TM) 64-Bit Server VM on Windows, version 1.6.0_25

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

14/42 ページ © Fujitsu Technology Solutions 2011

OLTP-2

ベンチマークの説明

OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン

チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-

2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)

が測定されます。

独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の

ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、デ

ータベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモリ

の構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定できる

ように設計されています。

OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ

ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする

ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値

となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を

TPC-E として利用することも許可されません。

詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。

ベンチマーク結果

PRIMERGY RX600 S6 の OLTP-2 の値は、Xeon E7-48xx、E7-28xx、および E7-8837 プロセッサシリーズ

を使用して、256 GB、512 GB、および 1024 GB のメモリ構成で測定しました。これらの結果は、オペレ

ーティングシステム Microsoft Windows Server 2008 R2 Enterprise SP1 とデータベース SQL Server 2008

R2 Enterprise x64 Edition で測定したものです。データベースのパフォーマンスは、ハードディスクとコン

トローラーを含むシステムの構成オプションによって、大幅に異なります。ここに記載されている次元のス

ループットは、通常の外部ディスクサブシステムがボトルネックでない場合に実現されます。システム構成

の詳細については、「ベンチマーク環境」を参照してください。

次の表は、PRIMERGY RX600 S6 に搭載可能な各プロセッサの仕様を示しています。

HT = ハイパースレッディング、TM = ターボモード、QPI = QuickPath インターコネクト、

GT = ギガトランスファー、TDP = 熱設計電力

メモリに関しては、16 GB モジュールの最大構成と、8 GB モジュールおよび 4 GB モジュールの別構成で

測定しました。ここでは、周波数はプロセッサタイプによってのみ変わり、使用したメモリモジュールのタ

イプおよび数には影響されません。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon E7-

8800/4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス』を参照してください。

データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ

リ容量が十分にあることが重要です。

プロセッサ コア数/

チップ HT TM プロセッサ周波数

L3 キャ

ッシュ

QPI

スピード メモリ周波数 TDP

E7-4870 10 2.4 GHz 30 MB 6.4 GT/s 1066 MHz 130 W

E7-4860 10 2.27 GHz 24 MB 6.4 GT/s 1066 MHz 130 W

E7-4850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W

E7-4830 8 2.13 GHz 24 MB 6.4 GT/s 1066 MHz 105 W

E7-4820 8 2.0 GHz 18 MB 5.86 GT/s 978 MHz 105 W

E7-4807 6 1.87 GHz 18 MB 4.8 GT/s 800 MHz 95 W

E7-8837 8 2.67GHz 24 MB 6.4 GT/s 1066 MHz 130 W

E7-2850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 15/42 ページ

次のグラフは、Intel Xeon シリーズのプロセッサ(2 基または 4 基)とさまざまなメモリ構成で得られる

PRIMERGY RX600 S6 の OLTP-2 パフォーマンスデータを示しています。

搭載可能なプロセッサの種類が多いため、PRIMERGY RX600 S6 では広範にわたるレベルのパフォーマン

スが実現されていることがわかります。同じ最大メモリ構成で、プロセッサを 4 基搭載して比較すると、パ

フォーマンスが最も低いプロセッサ(E7-4807)を使用した場合(1402 tps)に比べ、パフォーマンスが最

も高いプロセッサ(E7-4870)を使用した場合(2825 tps)は、OLTP-2 値は 2 倍になっています。

測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。

CPU あたり 10 コアのプロセッサである E7-4870、E7-4860、および E7-4850 は、パフォーマンスの最上

位にランクされます。その次にランクされるのは、8 コアプロセッサの E7-4830、E7-4820 です。最下位に

ランクされるのは、ターボモードをサポートしていない、わずか 6 コアのプロセッサである E7-4807 です。

これらのプロセッサはすべて、ハイパースレッディング機能をサポートしています。データベースアプリケ

ーションをシミュレートした OLTP-2 の負荷の下では特に、論理的なプロセッサコア数を 2 倍にするハイパ

ースレッディングのメリットを受けます。E7-8837 プロセッサは例外で、8 コアでクロック周波数は高いも

のの、ハイパースレッディング機能をサポートしていないため、E7-4820 プロセッサとほぼ同等のパフォー

マンスとなります。E7-2850 プロセッサと E7-2803 プロセッサは特殊な位置付けにあり、プロセッサ 4 基

ではなく、プロセッサ 2 基の構成専用に設計されています。

メインメモリを増設すると、すべてのプロセッサタイプでデータベースのスループットを尐しだけ向上させ

ることができました。

一方で、4 ソケットサーバでは、プロセッサを 2 基から 4 基に増やしたときに、どの程度パフォーマンスが

向上するかという疑問もあります。スケーリングが向上すれば、サーバ内のリソース共有によって通常生じ

るオーバーヘッドは減尐します。スケーリングの係数はアプリケーションによっても変わります。サーバを

データベースサーバとして使用する場合は、CPU 数を 2 基から 4 基に倍増することで、パフォーマンスを

80 %程度向上させることができます。

2CPUs-256GB

2CPUs-512GB

4CPUs-256GB

4CPUs-512GB

4CPUs-1024GB

0

500

1000

1500

2000

2500

3000

E7-487010Core

E7-486010Core

E7-485010Core

E7-48308Core

E7-48208Core

E7-48076Core

E7-88378Core

E7-285010Core

E7-28036Core

15401463

1316

11701081

759

1066

1316

689

15521484

1332

11791100

770

1087

1332

699

2710

2589

2330

2099

1941

1362

1914

2786

2662

2395

2129

1968

1381

1941

2825

2701

2425

2147

2001

1402

1977

[tps]

PRIMERGY RX600 S6 : OLTP-2

太字、斜体の数字:実測値

その他:計算値

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

16/42 ページ © Fujitsu Technology Solutions 2011

PRIMERGY RX600 S6 をその旧モデルである PRIMERGY RX600 S3、PRIMERGY RX600 S4、および

PRIMERGY RX600 S5 の最大構成と比較すると、スループットはそれぞれ 747 %(RX600 S3)、283 %

(RX600 S4)、38 %(RX600 S5)向上しています。

333.7

736.94

2041.56

2825.49

0

250

500

750

1000

1250

1500

1750

2000

2250

2500

2750

3000

PRIMERGY RX600 S3 4 × Xeon 7140M

64 GB RAM

PRIMERGY RX600 S4 4 × Xeon 7460 256 GB RAM

PRIMERGY RX600 S5 4 × Xeon X5680

512 GB RAM

PRIMERGY RX600 S6 4 × E7-4870

1024 GB RAM

OLTP-2: PRIMERGY RX600 S3 vs. RX600 S4 vs. RX600 S5 vs.RX600 S6

+746.72% +283.41%

+38.40%

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 17/42 ページ

ベンチマーク環境

一般的な測定環境を以下に示します。

データベースサーバ(B 層)

ハードウェア

システム PRIMERGY RX600 S6

プロセッサ E7-4870(10 コア、 2.4 GHz)× 4 基

E7-4860(10 コア、 2.27 GHz)× 4 基

E7-4850(10 コア、 2.0 GHz)× 4 基

E7-4830(8 コア、 2.13 GHz)× 4 基

E7-4820(8 コア、 2.0 GHz)× 4 基

E7-4807(6 コア、 1.87 GHz)× 4 基

E7-8837(8 コア、 2.67 GHz)× 4 基

E7-2850(10 コア、 2.0 GHz)× 2 基

E7-2803(6 コア、 1.73 GHz)× 2 基

メモリ 1024 GB、512 GB、および 256 GB、Registered ECC DDR3(16 GB、8 GB、および

4 GB DIMM)

設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効

ネットワーク

インターフェース

オンボード LAN 1 Gbps × 4 基

ディスクサブシステム RX600 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB

146 GB 15K rpm SAS ドライブ × 2 台、RAID1(OS)、

450 GB 10K rpm SAS ドライブ × 6 台、RAID10(ログ)

LSI MegaRAID SAS 9280-8e × 10 基

JX40 × 10 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ)

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Enterprise SP1

データベース SQL Server 2008 R2 Enterprise x64

アプリケーション

サーバ

A 層

B 層

ネットワーク

ネットワーク

クライアント

データベースサーバ

ストレージサブシステム

SUT(System Under Test:テスト対象システム)

ドライバ

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

18/42 ページ © Fujitsu Technology Solutions 2011

アプリケーションサーバ(A 層)

ハードウェア

システム PRIMERGY RX200 S6 × 2 台

プロセッサ Xeon E5647(4 コア、2.93 GHz)× 2 基

メモリ 12 GB、1333 MHz Registered ECC DDR3

ネットワーク

インターフェース

オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基

ディスクサブシステム 73 GB 15K rpm SAS ドライブ × 1 台

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Standard

クライアント

ハードウェア

システム PRIMERGY RX200 S5 × 2 台

プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基

メモリ 24 GB、1333 MHz Registered ECC DDR3

ネットワーク

インターフェース

オンボード LAN 1 Gbps × 2 基

ディスクサブシステム 73 GB 15K rpm SAS ドライブ × 1 台

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Standard

OLTP-2 ソフトウェア EGen バージョン 1.12.0

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 19/42 ページ

SAP SD

ベンチマークの説明

SAP アプリケーションソフトウェアは、標準的な業務プロセスを管理するためのモジュールで構成されて

います。モジュールには、受注組立(ATO)、財務会計(FI)、人事管理(HR)、在庫購買管理(MM)、

生産計画(PP)、販売管理(SD)などの ERP(企業資源計画)用のものや、SCM(サプライチェーンマ

ネジメント)、小売、銀行業務、公益事業、BI(ビジネスインテリジェンス)、CRM(顧客関係管理)、

PLM(製品ライフサイクル管理)用のものがあります。

SAP アプリケーションソフトウェアは必ずデータベースと関連しています。したがって、SAP の構成には、

ハードウェアに加え、ソフトウェアコンポーネントであるオペレーティングシステムとデータベース、およ

び SAP ソフトウェア自体も含まれます。

SAP アプリケーションシステムのパフォーマンス、安定性およびスケーラビリティを評価するために、

SAP AG は SAP 標準アプリケーションベンチマークを開発しました。中でも、最も広く使用されており最

も重要なのは、SD ベンチマークです。これらのベンチマークでは、システム全体のパフォーマンスが分析

されるため、コンポーネントの統合品質を測定できます。

ベンチマークは、2 層の構成と 3 層の構成で異なります。2 層の構成では、SAP アプリケーションとデータ

ベースを 1 台のサーバにインストールします。3 層の構成では、SAP アプリケーションの各コンポーネン

トを数台のサーバに分散でき、別のサーバでデータベースを処理します。

SAP AG(ドイツ、Walldorf)によって開発されたベンチマークの詳細な仕様は、

http://www.sap.com/benchmark を参照してください。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

20/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク結果

2011 年 7 月 15 日に Xeon E7-4870 プロセッサ 4 基を搭載した PRIMERGY RX600 S6(Windows Server

2008 R2 Datacenter で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用)で次

の結果を得たことが認証されました(認証番号 2011026)。

認証番号 2011026

Number of SAP SD benchmark users 13,285

Average dialog response time 0.97 seconds

Throughput Fully processed order line items/hour dialog steps/hour SAPS

1,453,000 4,359,000 72,650

Average database request time (dialog/update) 0.034 sec / 0.028 sec

CPU utilization of central server 99%

Operating system, central server Windows Server 2008 R2 Datacenter

RDBMS SQL Server 2008

SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0

Configuration Central server

PRIMERGY RX600 S6 4 processors / 40 cores / 80 threads Xeon E7-4870 256 GB main memory

次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較

したものです。それぞれ最大のパフォーマンス構成になっています。

10055

13285

0 2000 4000 6000 8000 10000 12000 14000

Number of Benchmark Users

PRIMERGY RX600 S6

4 x Xeon E7-4870256 GB RAM

PRIMERGY RX600 S54 x Xeon X7560512 GB RAM

SAP SD:PRIMERGY RX600 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 21/42 ページ

ベンチマーク環境

SUT(System Under Test:テスト対象システム)

ハードウェア

サーバ PRIMERGY RX600 S6

プロセッサ Xeon E7-4870 × 4 基

メモリ 4 GB PC3-10600R DDR3-SDRAM × 64 枚

ディスクサブシステム

PRIMERGY RX600 S6 × 1 台:

RAID Ctrl SAS 6G 5/6 512MB (D2616) × 2 基

RAID Contr BBU Upgrade for RAID 5/6 V70 × 2 基

HD SAS 6G 73GB 15K HOT PL 2.5" EP × 5 台

HD SAS 6G 146GB 15K HOT PL 2.5" EP × 1 台

HD SAS 6G 300GB 15K HOT PL 2.5" EP × 1 台

FC Ctrl 8Gb/s 1 Chan LPe1250 MMF LC × 2 基

FibreCAT CX4-480 Storage Unit × 1 台

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Datacenter + SP1

データベース SQL Server 2008 Enterprise Edition

SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0

負荷ジェネレーター

ハードウェア

モデル PRIMERGY RX300 S4

プロセッサ Xeon X5460(3.17 GHz、12 MB L2 キャッシュ)× 2 基

メモリ 12 GB PC2-5300F DDR2-SDRAM

ソフトウェア

オペレーティングシステム Linux 2.6.32

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

テスト対象システム

2 層環境

負荷ジェネレーター

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

22/42 ページ © Fujitsu Technology Solutions 2011

vServCon

ベンチマークの説明

vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい

て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および

I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比

較も可能になります。

vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ

り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷

を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを

対象とする 3 つの実証済みのベンチマークが使用されます。

3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ

らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」

を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの

タイルを並行して開始しなければならない場合もあります。

3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザクシ

ョンレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれぞ

れのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付け

を行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対する

スコアになります。

原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を

増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた

vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達

成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と

なるように設計されており、他のリソースによる制限は発生しないように設計されています。

タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための

有益な情報となります。

さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な

場合は電力消費量も記録します。

vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。

アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ

データベース Sysbench(補正済み) 2 1.5 GB

Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB

Web サーバ WebBench 1 1.5 GB

テスト対象システム

… …

タイル n

タイル 3

タイル 2

タイル 1

データベース

VM Web VM

アイドル

VM Java VM

データベース

VM Web VM

アイドル

VM Java VM

データベース

VM Web VM

アイドル

VM Java VM

データベース

VM Web VM

アイドル

VM Java VM

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 23/42 ページ

ベンチマーク結果

PRIMERGY の 4 ソケットおよび 8 ソケット現行世代は、Intel Xeon プロセッサ E7-2800 シリーズ、

E7-4800 シリーズ、および E7-8800 シリーズをベースにしています。

次のようなさまざまなシステム構成に対応しています。

プロセッサ RX600 S6 RX900 S2 2

80

0 6 コア、HT E7-2803 最大 2

10 コア、HT、TM E7-2850 最大 2

E7

-48

00

シリーズ

6 コア、HT E7-4807 最大 4

8 コア、HT、TM E7-4820 最大 4

E7-4830 最大 4

10 コア、HT、TM

E7-4850 最大 4

E7-4860 最大 4

E7-4870 最大 4

E7

-88

00

シリーズ

8 コア TM E7-8837 最大 4 最大 8

HT、TM E7-8830 最大 8

10 コア、HT、TM

E7-8850 最大 8

E7-8860 最大 8

E7-8870 最大 8

HT = ハイパースレッディング、TM = ターボモード

PRIMERGY の 4 ソケットモデルおよび 8 ソケットモデル現行世代は、プロセッサテクノロジーの進歩によ

り、アプリケーションの仮想化に最適なシステムとなっています。10 コアプロセッサにも対応しているた

め、前世代のプロセッサをベースとするシステムと比較して、仮想化性能が約 22 %向上しています

(vServCon スコアで測定)。10 コアプロセッサを 8 基搭載したシステムで、前述の vServCon プロファイ

ルを基にして 176 のアプリケーション VM(44 のタイルに相当)を使用した場合、CPU リソースの最大活

用をほぼ実現できます。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

24/42 ページ © Fujitsu Technology Solutions 2011

次のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。ここでは、発売済みの 6 コア、

8 コア、10 コアのプロセッサを対象に幅広く測定しました。

このグラフに示されているプロセッサ間の大きな性能差は、その機能と CPU の数が影響していると考えら

れます。同数の CPU を搭載したサーバ間では、コア数、L3 キャッシュのサイズ、CPU クロック周波数に

よって値が変わります。また、プロセッサ間のデータ転送速度(「QPI スピード」)も仮想化性能に影響し

ます。

Xeon E7-8837 プロセッサのパフォーマンスが比較的低めなのは、ハイパースレッディング(HT)機能をサ

ポートしていないためです。

この測定結果により、CPU の数を 2 倍にすると、仮想化性能が約 2 倍向上することが明らかになりました。

メモリパフォーマンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon E7-8800/

4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス』を参照してください。

仮想化環境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量

が十分にあることが重要です。

各プロセッサの製品データについて再度簡潔にまとめ、次の表に示します。

2 ×

E7-2

803

2 ×

E7-4

807

2 ×

E7-8

837

2 ×

E7-4

820

2 ×

E7-4

830

2 ×

E7-2

850/E

7-4

850

2 ×

E7-8

867L

2 ×

E7-4

860

2 ×

E7-4

870

4 ×

E7-4

807

4 ×

E7-8

837

4 ×

E7-4

820

4 ×

E7-4

830

4 ×

E7-4

850

4 ×

E7-8

867L

4 ×

E7-4

860

4 ×

E7-4

870

8 ×

E7-8

837

8 ×

E7-8

830

8 ×

E7-8

850

8 ×

E7-8

860

8 ×

E7-8

870

7 8 5 10 11 12 12 12 12 15 10 19 21 24 24 24 24 18 36 44 44 44

0

4

8

12

16

20

24

28

32

36

40

44

Fin

al v

Serv

Co

n S

co

re

#Tiles

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 25/42 ページ

プロセッサ コア数/

チップ

L3 キャッ

シュ

プロセッサ

周波数

QPI

スピード HT TM TDP タイル数 スコア

28

00 6 コア、HT E7-2803(2×) 6 18 MB 1.73 GHz 4.8 GT/s 105 W 7 4.96

10 コア、HT、TM E7-2850(2×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10

E7

-48

00 シ

リー

6 コア、HT E7-4807(2×) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 8 5.46

E7-4807(4×) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 15 10.70

8 コア、HT、TM

E7-4820(2×) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 10 8.01

E7-4820(4×) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 19 15.70

E7-4830(2×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 11 8.93

E7-4830(4×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 17.50

10 コア、HT、TM

E7-4850(2×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10

E7-4850(4×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 19.80

E7-4860(2×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 12 11.10

E7-4860(4×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 21.70

E7-4870(2×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 12 12.30

E7-4870(4×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 23.90

E7

-88

00 シ

リー

8 コア

TM

E7-8837(2×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 5 7.90

E7-8837(4×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 10 15.80

E7-8837(8×) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 18 30.60

HT、TM E7-8830(4×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 16.70

E7-8830(8×) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 36 32.10

10 コア、HT、TM

E7-8850(4×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 18.70

E7-8850(8×) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 44 35.80

E7-8860(4×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 20.60

E7-8860(8×) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 44 39.40

E7-8870(4×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 22.70

E7-8870(8×) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 44 43.90

QPI = QuickPath インターコネクト、GT = ギガトランスファー、HT = ハイパースレッディング、

TM = ターボモード、TDP = 熱設計電力

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

26/42 ページ © Fujitsu Technology Solutions 2011

次の 2 つのグラフは、Xeon E7-4830(8 コア)プロセッサまたは E7-4870(10 コア)プロセッサを搭載し

た PRIMERGY RX600 S6 で、VM 数の増加に伴う仮想化性能の推移を調べたものです。ホストのそれぞれ

の CPU 負荷も示されています。CPU 負荷が 90 %のときが最適なタイル数です。90 %を超えると過負荷と

なり、仮想化のパフォーマンスは停滞または低下します。

上記のように多数の VM を稼動できるのは、物理コア数の増加に加えて、Xeon E7 プロセッサ(E7-8837

を除く)がハイパースレッディング機能をサポートしているためです。ハイパースレッディング機能では、

1 つの物理プロセッサコアが結果的に 2 つの論理コアに分割されるため、ハイパーバイザーが利用できるコ

ア数は 2 倍になります。そのため、ハイパースレッディング機能は、一般的にシステムの仮想化性能を向上

させます。

ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング

曲線が明確に見られます。Xeon E7-4870 プロセッサには、40 個の物理コア、すなわち 80 個の論理コアが

あり、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、

ほぼ 10 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、こ

の範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォ

ーマンス曲線は、傾きが緩やかになっていきます。

1.9

4 3.7

7

5.7

0

7.5

8

9.1

7

10.8

12.2

13.3

13.9

14.6

15.1

15.5

16.0

16.2

16.4

16.7

17.0

17.1

17.3

17.4

17.5

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

4 x E7-4830

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

vS

erv

Co

n s

co

re

# Tiles

Scores and CPU utilization

vServConv score (left axis) CPU Util (right axis)

2.1

2 4.1

5 6.1

8

8.2

6

10.2

12.1

13.8

15.5

16.7

18.2

19.1

19.9

20.6

20.8

21.6

21.7

21.9

22.3

22.5

22.6

23.0

23.3

23.7

23.9

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

4 x E7-4870

0

3

6

9

12

15

18

21

24

27

30

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

vS

erv

Co

n s

co

re

# Tiles

Scores and CPU utilization

vServConv score (left axis) CPU Util (right axis)

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 27/42 ページ

前のグラフでは、ホストの全アプリケーション VM の総合的なパフォーマンスを測定しました。しかし、

個々のアプリケーション VM のパフォーマンスも興味深いものです。この情報は、前のグラフから読み取れ

ます。例えば、高負荷で全体最適化された状態と、低負荷の状態での、個々のアプリケーション VM の仮想

化性能を考えます。上記の Xeon E7-4870 環境では、72 のアプリケーション VM(24 タイル、アイドル状

態の VM を除く)を使用した場合が全体最適化された状態で、3 つのアプリケーション VM(1 タイル、ア

イドル状態の VM を除く)を使用した場合が低負荷の状態です。1 タイルあたりの vServCon スコアは、

vServCon の 3 つのアプリケーションシナリオを通じた平均値です。1 タイルあたりの平均パフォーマンス

は、vServCon スコアが低負荷のケース(2.12)から全体最適化された状態(0.99=23.90/24)へ変化すると、

47 %へと大幅に低下します。個々のアプリケーション VM の反応は、高負荷の状況では全く違ったものに

なります。ある特定の状況下では、仮想ホストの VM 数に関して、全体的なパフォーマンス要件と、個々の

アプリケーションのパフォーマンス要件のバランスをとる必要があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

28/42 ページ © Fujitsu Technology Solutions 2011

2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方

では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側

面における向上の割合を示します。ここでは、Xeon X7460 を 4 基搭載した PRIMERGY RX600 S4(2008

年)、Xeon X7550 を 4 基搭載した PRIMERGY RX600 S5(2010 年)、Xeon E7-4820 を 4 基搭載した

PRIMERGY RX600 S6(2011 年)、Xeon E7-4850 を 4 基搭載した PRIMERGY RX600 S6(2011 年)と

いった 4 つの構成を比較しています。

2008 年のシステムと Xeon E7-4850 プロセッサを搭載した現在のシステムを比較すると、VM の数が尐ない

ケース(1 タイル)での進歩は明らかです。プロセッサ周波数が 25 % 低いにも関わらず(2.67 GHz に対

して 2.0 GHz)、現在のシステムの vServCon スコアはわずかに高くなっています。この主な理由の 1 つが、

プロセッサの新しい機能である EPT(Extended Page Tables:拡張ページテーブル)です2。

VM でシステムを完全負荷状態にすると、Xeon E7-4820 8 コアプロセッサを搭載した現行システムの仮想

化のパフォーマンスは、プロセッサ周波数が 25 % 低いにも関わらず、約 2 倍になります。その理由の 1 つ

は、個々の VM で実現できるパフォーマンスの向上です(グラフ左側の Few VMs のスコアを参照)。もう

1 つの理由は、全体最適化された状態で実行可能な VM の数が 3 倍以上に増加していることです(ハイパー

スレッディング機能の使用やメモリ帯域幅の拡大などによる)。ただし、VM の数を増やすことで個々の

VM のパフォーマンスは低下しているため、全体としての性能向上は、VM の数が 6 タイルに対して 19 タ

イルになったことによってもたらされたものと言えます。

前世代のプロセッサをベースとするシステムとの比較においては、完全負荷状態での現在のシステムのスコ

アの向上に加えて、消費電力の削減も考慮すべきです。TDP(Thermal Design Power:熱設計電力)が、こ

の指針となります。2010 年に使用されていた Xeon X7550 プロセッサの TDP は 130 W でしたが、現行の

E7-4820 プロセッサでは、同程度の仮想化性能を持ちながら、TDP はわずか 105 W です。

2 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を高

速化します。

0

5

10

15

20

25

2008X7460

4 x 62.67 GHz

2010X7550

4 x 82.00 GHz

2011E7-4820

4 x 82.00 GHz

2011E7-4850

4 x 102.00 GHz

2008X7460

4 x 62.67 GHz

2010X7550

4 x 82.00 GHz

2011E7-4820

4 x 82.00 GHz

2011E7-4850

4 x 102.00 GHz

Score at optimum Tile countFew VMs (1 Tile)

Virtualization relevant improvements for 4-way servers

x 2.34

vS

erv

Co

n S

core

x 2.97

Year CPU

#CoresFreq.

x 1.26

6 T

ile

s

18

Tile

s

19

Tile

s

24

Tile

s

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 29/42 ページ

さらにコア数の多いプロセッサを使用することによって、仮想化性能をさらに向上させることができます。

(完全負荷状態で)8 コアプロセッサではなく 10 コアプロセッサの現在のシステムで同じ測定を行うと、

2008 年のシステムよりも明らかにパフォーマンスが向上していることがわかります。

仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてではありません。2010 年以降

の仮想化環境におけるパフォーマンス向上の大部分は、実行できる最大 VM 数が増大したことによって達成

されたものです。

8 ソケットサーバでは、プロセッサを 4 基から 8 基に増やしたときに、どの程度パフォーマンスが向上する

かという疑問もあります。パフォーマンスの向上度が増せば、サーバ内のリソース共有によるオーバーヘッ

ドは減尐します。プロセッサ追加時の性能向上度を示すスケーリング係数は、サーバの用途によって異なり

ます。サーバ統合用の仮想化プラットフォームとしてサーバを使用する場合、プロセッサの追加で性能は

1.93 倍になります。次のグラフからわかるように、PRIMERGY RX900 S2 で Xeon E7-8870 を使用する場

合、プロセッサを 4 基 から 8 基に増やすと、仮想化性能は約 2 倍になります。

また、4 基のプロセッサで完全構成した PRIMERGY RX600 S6 と比較しても、PRIMERGY RX900 S2 は非

常に優れたパフォーマンスを示しています。8 基のプロセッサを搭載した PRIMERGY RX900 S2 のパフォ

ーマンスは、4 基のプロセッサを搭載した PRIMERGY RX600 S6 と比べて 83.68 %(1.84 倍)向上してい

ます。プロセッサ 4 基で完全構成した PRIMERGY RX600 S6 は、プロセッサ 4 基を搭載した PRIMERGY

RX900 S2 よりも若干パフォーマンスが高いですが、これは PRIMERGY RX600 S6 が 4 基のプロセッサ搭

載時に最適化するよう設計されているのに対し、PRIMERGY RX900 S2 は、最大 8 基のプロセッサ搭載時

に高パフォーマンスとなるように設計されているためです。

0

5

10

15

20

25

30

35

40

45

50

RX600 S64 × E7-4870

RX900 S24 × E7-8870

RX900 S28 × E7-8870

× 1.93

vS

erv

Co

n s

co

re

× 1.84

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

30/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク環境

測定は次のような環境で行いました。

Intel Xeon プロセッサ E7-8800 シリーズ、E7-4800 シリーズ、E7-2800 シリーズのすべての vServCon スコ

アは、PRIMERGY RX600 S6 および PRIMERGY RX900 S2 を使用して測定しました。

SUT ハードウェア

モデル PRIMERGY RX600 S6

プロセッサ Xeon E7-2803 (6 コア、 1.73 GHz)× 2 基

Xeon E7-2850 (10 コア、 2.00 GHz)× 2 基

Xeon E7-4807 (6 コア、 1.87 GHz)× 2 基

Xeon E7-4820 (8 コア、 2.00 GHz)× 2 基

Xeon E7-4830 (8 コア、 2.13 GHz)× 2 基

Xeon E7-4850 (10 コア、 2.00 GHz)× 2 基

Xeon E7-4860 (10 コア、 2.27 GHz)× 2 基

Xeon E7-4870 (10 コア、 2.40 GHz)× 2 基

Xeon E7-8837 (8 コア、 2.67 GHz)× 2 基

Xeon E7-4807 (6 コア、 1.87 GHz)× 4 基

Xeon E7-4820 (8 コア、 2.00 GHz)× 4 基

Xeon E7-4830 (8 コア、 2.13 GHz)× 4 基

Xeon E7-4850 (10 コア、 2.00 GHz)× 4 基

Xeon E7-4860 (10 コア、 2.27 GHz)× 4 基

Xeon E7-4870 (10 コア、 2.40 GHz)× 4 基

Xeon E7-8837 (8 コア、 2.67 GHz)× 4 基

メモリ 2 CPU:256 GB、4 CPU:512 GB(8 GB DIMM を使用した完全構成)

ネットワーク

インターフェース

1 Gbit LAN × 1 基(制御用)

10 Gbit LAN × 1 基(負荷用)

ディスク

サブシステム

内蔵ハードディスクは使用せず、ストレージシステムETERNUS DX80 のみを使用

VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN

各 LUN は、2 つの Seagate ST3300657SS ディスク(15 krpm)で構成された RAID 0 アレイ

ストレージの接続 FC コントローラーEmulex LPe12002 を使用

SUT ソフトウェア

オペレーティング

システム

ハイパーバイザー VMware ESX Server

リリース バージョン 4.1 U1 ビルド 348481

BIOS バージョン Aptio 0.99G、デフォルト設定からの変更:Performance/Watt=Traditional

SUT:仮想化に関する詳細

ESX 設定 デフォルト

一般的な詳細 『ベンチマークの概要 vServCon』を参照

複数の

1 Gb または 10 Gb

ネットワーク

負荷ジェネレーター

サーバ ストレージシステム

SUT(System Under Test:テスト対象システム)

フレームワーク

コントローラー

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 31/42 ページ

SUT ハードウェア

モデル PRIMERGY RX900 S2

プロセッサ Xeon E7-8830(8 コア、2.13 GHz)× 4 基

Xeon E7-8837(8 コア、2.67 GHz)× 4 基

Xeon E7-8850(10 コア、2.00 GHz)× 4 基

Xeon E7-8860(10 コア、2.27 GHz)× 4 基

Xeon E7-8870(10 コア、2.40 GHz)× 4 基

Xeon E7-8830(8 コア、2.13 GHz)× 8 基

Xeon E7-8837(8 コア、2.67 GHz)× 8 基

Xeon E7-8850(10 コア、2.00 GHz)× 8 基

Xeon E7-8860(10 コア、2.27 GHz)× 8 基

Xeon E7-8870(10 コア、2.40 GHz)× 8 基

メモリ 4 CPU:512 GB、8 CPU:1024 GB(8 GB DIMM を使用した完全構成)

ネットワーク

インターフェース

1 Gbit LAN × 1 基(制御用)

10 Gbit LAN × 1 基(負荷用)

ディスク

サブシステム

内蔵ハードディスクは使用せず、ストレージシステムETERNUS DX80 のみを使用

VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN

各 LUN は、2 つの Seagate ST3300657SS ディスク(15 krpm)で構成された RAID 0 アレイ

ストレージの接続 FC コントローラーEmulex LPe12002 を使用

SUT ソフトウェア

オペレーティング

システム

ハイパーバイザー VMware ESX Server

リリース バージョン 4.1 U1 ビルド 348481

BIOS バージョン 00.17、デフォルト設定

SUT:仮想化に関する詳細

ESX 設定 デフォルト

一般的な詳細 『ベンチマークの概要 vServCon』を参照

負荷ジェネレーターのハードウェア

モデル PRIMERGY BX920 S1 サーバブレード(PRIMERGY BX900 シャーシ)× 17 台

プロセッサ それぞれ Xeon X5570(2.93 GHz)× 2 基

メモリ 12 GB

ネットワーク

インターフェース

それぞれ 1 Gbit LAN × 3 基

オペレーティング

システム

Windows Server 2008 R2 Enterprise with Hyper-V

負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作)

プロセッサ 論理 CPU × 1 基

メモリ 512 MB

ネットワーク

インターフェース

それぞれ 1 Gbit LAN × 2 基

オペレーティング

システム

Windows Server 2003 Enterprise

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

32/42 ページ © Fujitsu Technology Solutions 2011

VMmark V2

ベンチマークの説明

VMmark V2 は、ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行

うために VMware が開発したベンチマークです。ベンチマークは、負荷生成用のソフトウェアに加えて、

定義済み負荷プロファイルおよび規定されたルールで構成されます。VMmark V2 によって得られたベンチ

マーク結果は、VMware に提出しレビューを経た後に VMware のサイト上で公開されます。実績あるベンチ

マークである「VMmark V1」の使用は 2010 年 10 月に中止され、代わって後継の「VMmark V2」が使用さ

れるようになりました。VMmark V2 では、2 台以上のサーバのクラスタが必要であり、仮想マシン(VM)

のクローン作成とデプロイ、負荷分散、vMotion や Storage vMotion による VM の移動といった、データセ

ンター機能も評価できます。

VMmark V2 は、実際には新しいベンチマー

クではありません。VMmark V2 は、既存の

ベンチマークをワークロードとして統合す

るフレームワークで、これにより仮想化さ

れた統合サーバ環境の負荷をシミュレート

します。3 つの実績あるベンチマーク(それ

ぞれ、メールサーバ、Web 2.0、e コマース

のアプリケーションシナリオに対応)が、VMmark V2 に統合されています。

これらの 3 つのアプリケーションシナリオは、合計 7 つの仮想マシンに 1 つずつ割り当てられます。さら

に、スタンバイサーバという 8 番目の VM がこれらに追加されます。これらの 8 つの VM が「タイル」を

形成します。測定対象となるサーバの処理能力によっては、全体として最大のパフォーマンスを達成するた

めに複数のタイルを並列して開始する必要があります。

VMmark V2 の新機能に、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントがありま

す。これにより、VM のクローン作成やデプロイ、vMotion、Storage vMotion によるデータセンター運用の

効率性が評価されます。このとき、DRS(Distributed Resource Scheduler)によるデータセンターの負荷

分散機能も使用されます。

VMmark V2 の結果は「スコア」と呼ばれる数値であり、テスト対象システムの仮想化パフォーマンスを表

します。スコアは、サーバ集約によるメリットの最大合計値で、さまざまなハードウェアプラットフォーム

の比較基準として使用されます。

このスコアは、VM の個々の結果とインフラストラクチャーコンポーネントの結果から導かれます。5 つの

VMmark V2 アプリケーション VM またはフロントエンド VM のそれぞれが、各 VM でのアプリケーション

固有のトランザクションレートという形でベンチマーク結果を示します。スコアを正規化するために、各タ

イルのベンチマーク結果とリファレンスシステムでの結果との比率を求め、得られた値の幾何平均を算出し

ます。さらに、すべての VM について、同じ手順で求めた値を加算します。この値は、総合スコアの 80 %

を決定します。また、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントによるワー

クロードが、結果の 20 %を決定します。インフラストラクチャーコンポーネントのスコアは、1 時間あた

りのトランザクション数と、秒単位の平均持続時間で示されます。

実際にはスコアに加えて、タイル数が スコアと共に示されます。例えば「4.20@5 タイル」のように「スコ

ア@タイル数」と表します。

VMmark V2 の詳細については、『ベンチマークの概要 VMmark V2』を参照してください。

アプリケーションシナリオ 負荷ツール VM の数

メールサーバ LoadGen 1

Web 2.0 Olio クライアント 2

e コマース DVD Store 2 クライアント 4

スタンバイサーバ (IdleVMTest) 1

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 33/42 ページ

ベンチマーク結果

2011 年 11 月 29 日、富士通は、Xeon E7-4870 プロセッサを搭載した PRIMERGY RX600 S6 と VMware

ESX 4.1 U1 を使用して VMmark V2 スコアで「18.20@18 タイル」を達成しました。このときは、合計 2 ×

40 のプロセッサコアを搭載するシステム構成で、「テスト対象システム」(SUT)には同一のサーバを 2

台使用しました。これにより、富士通は 2011 年 7 月 12 日に同じハードウェア上で獲得した「17.98@18

タイル」を上回る結果を達成しました。

このスコアおよび詳細な結果と構成データについては、http://www.vmware.com/a/vmmark/ を参照してくだ

さい。

上記の結果により、PRIMERGY RX600 S6 は、VMmark V2 の観点から、80 コアサーバのカテゴリにおい

て 2 台の同一ホストによる「マッチドペア」構成で最も強力なサーバと評価されています(ベンチマーク結

果の公表日現在)。

次のグラフは、PRIMERGY RX600 S6 と競合他社の該当するシステムの測定結果を比較3したものです。同

等のハードウェアでテストした Cisco の結果と比較すると、PRIMERGY RX600 S6 の方が 1.11 %上回って

います。

使用したプロセッサでは、優れたハイパーバイザー設定によってプロセッサの機能を最適に利用できます。

そのため、これらのプロセッサの使用は、PRIMERGY RX600 S6 がこの結果を達成するための重要な前提

条件でした。プロセッサの機能には、拡張ページテーブル(EPT 4 )とハイパースレッディングが含まれま

す。これらはすべて、仮想化に対して有効に機能します。

すべての VM、それらのアプリケーションデータ、ホストオペレーティングシステム、および追加で必要な

データは、ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました。

このディスクサブシステムは、ベンチマークの特定の要件を考慮して構成することもできます。SSD

(Solid State Drive:半導体ドライブ)の使用によって、使用するハードディスクの数や応答時間が向上し

ました。

負荷ジェネレーターのネットワーク接続とホスト間のインフラストラクチャー負荷接続は、10Gb LAN ポー

トで実装しました。

使用したすべてのコンポーネントは、それぞれが最適に動作するように調整しました。

3 上記の競合他社製品との比較は、 2011 年 11 月 29 日現在のものです。 VMmark V2 の結果は、

http://www.vmware.com/a/vmmark/ を参照してください。

4 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を

高速化します。

18

.20

@1

8 tile

s

18

.00

@1

8 tile

s

17

.98

@1

8 tile

s

17

.11

@2

1 tile

s

16

.89

@1

8 tile

s

16

.89

@2

0 tile

s

16

.68

@1

8 tile

s

0

4

8

12

16

20

FujitsuPRIMERGY

RX600 S64 ×

XeonE7-4870

CiscoUCS

C460 M24 ×

XeonE7-4870

FujitsuPRIMERGY

RX600 S64 ×

XeonE7-4870

HPProLiant

DL580 G7 4 ×

XeonE7-4870

CiscoUCS

C460 M24 ×

XeonE7-4870

HPProLiant

DL580 G7 4 ×

XeonE7-4870

CiscoUCS

C460 M24 ×

XeonE7-4870

2 x 40 Cores

+1.11%

VM

mark

V2 S

co

re

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

34/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク環境

一般的な測定環境を次に示します。

SUT ハードウェア

サーバ数 2 台

モデル PRIMERGY RX600 S6

プロセッサ Xeon E7-4870(10 コア、2.40 GHz)× 4 基

メモリ 512 GB(8 GB DIMM × 64 枚、クアッドランク)、1066 MHz Registered ECC DDR3

ネットワーク

インターフェース

内蔵 Intel 82575EB クアッドポート 1 GbE アダプター × 1 基

富士通 D2755 デュアルポート 10 GbE アダプター × 1 基

ディスクサブシステム ストレージシステム ETERNUS DX80 × 10 台、SSD を含む合計 220 のハードディスクを

搭載(複数の RAID-0 アレイを構成)

ストレージ接続 デュアルチャネル FC コントローラー Emulex LPe12002 × 1 基

SUT ソフトウェア

オペレーティングシステム ハイパーバイザー VMware ESX Server

ESX バージョン VMware ESX v4.1 U1、ビルド 348481

BIOS バージョン Rev. R0.99I / Rev. R1.00.3141

負荷ジェネレーターのハードウェア

モデル サーバブレード PRIMERGY BX620 S4 × 19 基

プロセッサ Intel Xeon 5130(2 GHz)× 2 基(ただし、プライムクライアントでは、Intel Xeon X5470

(3.33 GHz)× 2 基を使用)

メモリ 4 GB

ネットワーク

インターフェース

それぞれ 1 Gbit LAN × 1 基

オペレーティングシステム Microsoft Windows Server 2003 R2 Enterprise、SP2 および KB955839 を適用

詳細

公開 URL http://vmware.com/a/assets/vmmark/pdf/2011-07-12-Fujitsu-RX600S6.pdf http://vmware.com/a/assets/vmmark/pdf/2011-11-29-Fujitsu-RX600S6.pdf

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

複数の

1Gb または 10Gb

ネットワーク

プライムクライアントを

含む負荷ジェネレーターと

データセンター管理サーバ

サーバ ストレージシステム

テスト対象システム

(System Under Test:SUT)

vMotion

ネットワーク

クライアントと管理サーバ

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 35/42 ページ

STREAM

ベンチマークの説明

STREAM は、メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで、John

McCalpin 氏がデラウェア大学に教授として在職中に、氏によって開発されました。現在はバージニア大学

でサポートされており、ソースコードを Fortran または C のいずれでもダウンロードできます。STREAM

は、特に HPC(ハイパフォーマンスコンピューティング)分野で、重要な役割を担っています。例えば、

STREAM は、HPC Challenge ベンチマークスイートの一部として使用されています。

このベンチマークは、PC とサーバシステムの両方で使用できるように設計されています。測定単位は、

[GB/s] であり、1 秒あたりにリード/ライト可能なギガバイト数です。

STREAM では、シーケンシャルアクセスでのメモリスループットを測定します。メモリ上のシーケンシャ

ルアクセスは、CPU キャッシュが使用されるため、一般にランダムアクセスより高速です。

ベンチマーク実行前に、測定環境に合わせて、STREAM のソースコードを調整します。また、CPU キャッ

シュによる測定結果への影響ができるだけ尐なくなるよう、データ領域のサイズは、全 CPU キャッシュの

総容量の 4 倍以上にする必要があります。ベンチマーク中にプログラムの一部を並列実行するために、

OpenMP プログラムライブラリを使用します。これにより、利用可能なプロセッサコアに対して最適な負

荷分散が行われます。

STREAM ベンチマークでは、8 バイトの要素で構成されるデータ領域が、 4 つの演算タイプに連続的にコ

ピーされます。COPY 以外の演算タイプでは、算術演算も行われます。

演算タイプ 演算 ステップあたりのバイト数 ステップあたりの浮動小数点演算

COPY a(i) = b(i) 16 0

SCALE a(i) = q × b(i) 16 1

SUM a(i) = b(i) + c(i) 24 1

TRIAD a(i) = b(i) + q × c(i) 24 2

スループットは、演算タイプ別に GB/s で表されます。しかし最近のシステムでは、通常、演算タイプによ

る値の差はほんのわずかです。そのため、一般的に、性能比較には TRIAD の測定値だけが使用されます。

測定結果は、主にメモリモジュールのクロック周波数によって変わります。また、算術演算は、CPU によ

って影響を受けます。結果の精度は約 5 %です。

本章では、スループットを 10 のべき乗で表しています。(1 GB/s = 109 Byte/s)

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

36/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク結果

PRIMERGY RX600 S6 の STREAM の値は、Xeon E7 シリーズのプロセッサを使用して測定しました。ベ

ンチマークプログラムは、インテル C コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server

11 SP1(64 ビット)で実行しました。

データ領域は 12,000 万個の要素で構成されます。これは約 900 MB に相当します。

プロセッサ コア GHz L3 キャッシュ QPI

スピード TDP

TRIAD [GB/s]

2 チップ 4 チップ

Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 32.6

Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 46.2

Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 65.0

Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 80.8

Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 86.9

Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 105 W 88.2

Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 94.6

Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 101

Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 102

次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを、最

大パフォーマンス構成で比較したものです。

STREAM TRIAD

0

20

40

60

80

100

120

PRIMERGY RX600 S54 × Xeon X7560

PRIMERGY RX600 S64 × Xeon E7-8837

70.3

102

GB/s

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 37/42 ページ

ベンチマーク環境

STREAM の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました。

ハードウェア

モデル PRIMERGY RX600 S6

CPU Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、

E7-4870

コア数

2 チップ

Xeon E7-2803: 12 コア

Xeon E7-2850: 20 コア

4 チップ

Xeon E7-4807: 24 コア

Xeon E7-4820、E7-4830、E7-8837: 32 コア

その他すべて: 40 コア

1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)

2 次キャッシュ 256 KB オンチップ(コアあたり)

その他のキャッシュ

Xeon E7-2803、E7-4807、E7-4820: 18 MB(命令 + データ)オンチップ(チップあたり)

Xeon E7-4870: 30 MB(命令 + データ)オンチップ(チップあたり)

その他すべて: 24 MB(命令 + データ)オンチップ(チップあたり)

メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚

ソフトウェア

オペレーティング

システム SUSE Linux Enterprise Server 11 SP1(64 ビット)

コンパイラー インテル C コンパイラー 12.0

ベンチマーク Stream.c バージョン 5.9

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

38/42 ページ © Fujitsu Technology Solutions 2011

LINPACK

ベンチマークの説明

LINPACK は、1970 年代に Jack Dongarra 氏他数名によって、スーパーコンピュータの性能を評価するため

に開発されました。このベンチマークは、線形方程式系の解析および求解用のライブラリ関数を集めたもの

です。詳細は次のドキュメントで参照できます。

http://www.netlib.org/utk/people/JackDongarra/PAPERS/hplpaper.pdf

LINPACK では、N 次元の線形方程式系を解く速度を測定します。結果は、GFlops(Giga Floating Point

Operations per Second:10 億浮動小数点演算/秒)で示されます。これは浮動小数点演算を 1 秒間に 10

億回実行することを示す単位です。求解に必要な浮動小数点演算の回数は次の式によって決定されます。

2/3 × N

3 + 2 × N

2

LINPACK の演算では、メインメモリに N × N サイズの行列データを配置する必要があります(値 N は求解

する方程式の数です)。使用可能なメインメモリを十分に利用できるような最大値を N に設定した場合に、

最大の性能が達成されます。しかし、このような最大値の決定には非常に時間がかかるうえ、期待される結

果の向上はごくわずかです。また、システムのメモリ帯域幅は結果にほとんど影響しません。これは、ベン

チマークの実行中は主に浮動小数点演算が実行され、データ交換は並列プロセス間でほとんど起こらないた

めです。そのため、ベンチマーク結果は、最大値より若干低い N の値から求められます。

LINPACK は、HPC(High Performance Computing:高性能計算)の分野で代表的なベンチマークの 1 つで

す。また、LINPACK は、HPC チャレンジベンチマーク(HPC 環境における他の性能的側面を考慮に入れ

たベンチマーク)を構成する 7 つのベンチマークの 1 つです。

PRIMERGY サーバの測定では、インテルが最適化した、個別システム用の LINPACK バージョンを 使用し

ました。これはインテルコンパイラーに含まれています。また、次のアドレスから直接ダウンロードするこ

ともできます。

http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/

LINPACK の結果は http://www.top500.org/ で公表される可能性があります。公開にあたっての前提条件は、

MPI(Message Passing Interface)ベースのバージョンを使用することです

(http://www.netlib.org/benchmark/hpl を参照)。

プロセッサコアの理論的な最大性能は、1 クロックサイクル内に実行される浮動小数点演算の回数から得ら

れます。例えば、クロック周波数が 2.4 GHz で 1 サイクルあたり 4 回の浮動小数点演算を実行するプロセ

ッサの最大性能は 9.6 GFlops になります。測定結果と最大値の比率は、浮動小数点演算に関するシステム

の効率を示します。演算中のメモリアクセス回数が尐ないほど、この比率は高くなります。これまでの測定

結果から、現在のプロセッサアーキテクチャーの効率は、およそ 90 %であることがわかっています。

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 39/42 ページ

ベンチマーク結果

PRIMERGY RX600 S6 で、Xeon E7 シリーズのプロセッサを測定しました。ベンチマークプログラムは、

インテルコンパイラー 12.0 に付属するものを使用し、これを SUSE Linux Enterprise Server 11 SP1(64 ビ

ット)で実行しました。

測定対象のプロセッサのうち新しい SSE4.2 テクノロジーに対応したものは、1 クロックサイクルあたり 4

回の浮動小数点演算を達成します。したがって、理論的最高値は次のとおりです。

GFlopsmax = 4 × プロセッサコアの数 × CPU 周波数(GHz 単位)

使用可能なメインメモリは 512 GB なので、次元数を N = 200000 としました。

2 プロセッサ コア GHz L3 キャッシュ

[MB]

QPI スピード

TDP 理論的最高値

[GFlops] LINPACK [GFlops]

効率

[%]

Xeon E7-2803 6 1.73 18 4.80 GT/s 105 W 83.0 78.2 94.2

Xeon E7-2850 10 2.00 24 6.40 GT/s 130 W 160 156 97.5

4 プロセッサ コア GHz L3 キャッシュ

[MB]

QPI スピード

TDP 理論的最高値

[GFlops] LINPACK [GFlops]

効率

[%]

Xeon E7-4807 6 1.87 18 4.80 GT/s 95 W 179 163 91.1

Xeon E7-4820 8 2.00 18 5.86 GT/s 105 W 256 245 95.7

Xeon E7-4830 8 2.13 24 6.40 GT/s 105 W 273 264 96.7

Xeon E7-8837 8 2.67 24 6.40 GT/s 130 W 342 324 94.7

Xeon E7-4850 10 2.00 24 6.40 GT/s 105 W 320 304 95.0

Xeon E7-4860 10 2.27 24 6.40 GT/s 130 W 362 339 93.6

Xeon E7-4870 10 2.40 30 6.40 GT/s 130 W 384 359 93.5

上記の結果では、すべてのプロセッサが理論値の 90 %以上を達成しており、PRIMERGY RX600 S6 の浮動

小数点演算の性能が良好であることを示しています。

次のグラフは、PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを、最

大パフォーマンス構成で比較したものです。

0

50

100

150

200

250

300

350

400

PRIMERGY RX600 S54 × Xeon X7560

PRIMERGY RX600 S64 × Xeon E7-4870

269

359

GFlops

LINPACK:

PRIMERGY RX600 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

40/42 ページ © Fujitsu Technology Solutions 2011

ベンチマーク環境

LINPACK の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました。

ハードウェア

モデル PRIMERGY RX600 S6

CPU Xeon E7-2803、E7-2850、E7-4807、E7-4820、E7-4830、E7-8837、E7-4850、E7-4860、

E7-4870

コア数

2 チップ

Xeon E7-2803: 12 コア

Xeon E7-2850: 20 コア

4 チップ

Xeon E7-4807: 24 コア

Xeon E7-4820、E7-4830、E7-8837: 32 コア

その他すべて: 40 コア

1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)

2 次キャッシュ 256 KB オンチップ(コアあたり)

その他のキャッシュ

Xeon E7-2803、E7-4807、E7-4820: 18 MB(命令 + データ)オンチップ(チップあたり)

Xeon E7-4870: 30 MB(命令 + データ)オンチップ(チップあたり)

その他すべて: 24 MB(命令 + データ)オンチップ(チップあたり)

メモリ 8 GB PC3-8500R DDR3-SDRAM × 64 枚

ソフトウェア

オペレーティング

システム SUSE Linux Enterprise Server 11 SP1(64 ビット)

ベンチマーク インテルコンパイラー 12.0 に付属の xlinpack_xeon64

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

SPECcpu2006:浮動小数点演算のパフォーマンス

PRIMERGY TX200 S6 と 旧モデルとの比較

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

© Fujitsu Technology Solutions 2011 41/42 ページ

関連資料

PRIMERGY システム

http://ts.fujitsu.com/primergy

PRIMERGY RX600 S6

データシート(英語)

http://docs.ts.fujitsu.com/dl.aspx?id=368e2f3f-028f-413d-9ce8-2ca13d5b1419

Xeon E7-8800/4800/2800(WESTMERE-EX)搭載システムのメモリパフォーマンス

http://docs.ts.fujitsu.com/dl.aspx?id=e943109a-eeba-42b3-82a1-927b01ae319a

RAID コントローラーのパフォーマンス

http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b

単一ディスクのパフォーマンス

http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c

PRIMERGY のパフォーマンス

http://ts.fujitsu.com/products/standard_servers/primergy_bov.html

LINPACK

http://www.netlib.org/linpack/

OLTP-2

ベンチマークの概要 OLTP-2

http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a

SAP SD

http://www.sap.com/benchmark

ベンチマークの概要 SAP SD

http://docs.ts.fujitsu.com/dl.aspx?id=ab13a8c0-44d8-40ee-9415-695d372e2e7b

SPECcpu2006

http://www.spec.org/osg/cpu2006

ベンチマークの概要 SPECcpu2006

http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157

SPECjbb2005

http://www.spec.org/jbb2005

ベンチマークの概要 SPECjbb2005

http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba

STREAM

http://www.cs.virginia.edu/stream/

vServCon

ベンチマークの概要 vServCon

http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 バージョン: 1.2 2011-12-06

42/42 ページ © Fujitsu Technology Solutions 2011

VMmark V2

ベンチマークの概要 VMmark V2

http://docs.ts.fujitsu.com/dl.aspx?id=a083d947-8a41-45d1-a112-8cd295595a95

VMmark V2 http://www.vmmark.com

VMmark V2 結果

http://www.vmware.com/a/vmmark/

PC サーバ PRIMERGY(プライマジー)

http://jp.fujitsu.com/platform/server/primergy/

お問い合わせ先

富士通テクノロジー・ソリューションズ

Web サイト:http://ts.fujitsu.com

PRIMERGY のパフォーマンスとベンチマーク

mailto:[email protected]

知的所有権を含むすべての権利は弊社に帰属します。製品データは変更される場合があります。納品までの時間は在庫状況によって異なります。データ

および図の完全性、事実性、または正確性について、弊社は一切の責任を負いません。本書に記載されているハードウェアおよびソフトウェアの名称

は、それぞれのメーカーの商標等である場合があります。第三者が各自の目的でこれらを使用した場合、当該所有者の権利を侵害することがあります。

詳細については、http://ts.fujitsu.com/terms_of_use.html を参照してください。

2011-12-06 WW JA Copyright © Fujitsu Technology Solutions GmbH 2011