20
同同同同同 同同同 同同 同同 同同 同同 同同 同同 同同 PC 同同同同同同同同同

各種 PC クラスタの性能評価

Embed Size (px)

DESCRIPTION

各種 PC クラスタの性能評価. 同志社大学 工学部. 廣安 知之 三木 光範 谷村 勇輔. DSO/V パラダイス Magnate SDX. 81,800 円. パソコン工房 AMPHIS-1700M4R. 89,800 円. Pentium 4 1.6GHz Memory 256MB HDD 40GB. Pentium 4 1.7GHz Memory 256MB HDD 40GB. TWO-TOP ViP 84N-SP1500. 90,800 円. Pentium 4 1.5GHz Memory 256MB HDD 20GB. - PowerPoint PPT Presentation

Citation preview

同志社大学 工学部

廣安 知之三木 光範谷村 勇輔

各種 PC クラスタの性能評価

日給 \5,000 だったら1 ヶ月も働くと... DSO/V パラダイス Magn

ate SDX   81,800 円

Pentium 4 1.6GHzMemory 256MB HDD 40GB

Pentium 4 1.7GHzMemory 256MB HDD 40GB

89,800 円 パソコン工房AMPHIS-1700M4R

TWO-TOP

ViP 84N-SP1500   90,800 円

Pentium 4 1.5GHzMemory 256MB HDD 20GB

コモディティハードウエア

性能の向上価格の急激な下落

CPUハードウエアネットワーク

COTS (Commodity-off-the-Shelf)-based scalableparallel systems

PC クラスタHardware

CPUmemorymotherboardhard disccasenetwork cardcablehub

Super Computer TOP 500

http://www.top500.org

Name Rmax(Gflops)7226

4059

3052

2379

2144

# Proc

8192

3024

3228

9632

5808

ASCI White

AlphaServer SC ES45/1 GHz2

ASCI Blue-Pacific5

ASCI Red4

Power3 375 MHz 16 way3

1

Ranking

Super Computer TOP 500(self made)

http://www.top500.org

Name Rmax(Gflops)

706.70

618.30

331.70

221.60

184.40

# Proc

1369

1024

256

530

320

CPlant/Ross Cluster

SCore IIIe/PIII 933 MHz40

Netfinity Cluster PIII 1 GHz184

CLIC PIII 800 MHz137

Presto III Athlon 1.2 GHz86

30

Ranking

同志社大学 クラスタシステム

知能情報センターCambria システム Cambria システム

複数のアプリケーションによるPC クラスタ特性の比較

Cambria システム仕様

CPU PentiumIII 800MHz 256CPU

Memory 256MB (計 65.536GB )

Network Fast Ethernet

OS Debian/GNU Linux

Compiler gcc

Communication Lam-6.6b1

Gregor システム仕様

CPU PentiumIII 1GHz 128CPU( 64 Nodes dual processor )

Memory 512MB (計 32.768GB )

Network Myrinet2000

OS Kondara HPC ( Red Hat 系)

Compiler gcc  , g77

Communication MPICH1.2/GM1.3

Peak 性能 128GFlops

Myrinet

Myricom 社が開発

PC クラスタコンピューティングのデファクト・スタンダードとして期待

最大転送速度が 2Gbps の高速通信

ー Ethernet より優れた性能,    コストパフォーマンスを発揮

Linpack   BenchmarkTop 500などをはじめ広く使用密行列の線形代数問題 ガウスの消去法

問題のサイズなどはユーザが指定HPL を利用の際には ATLAS を使用する 高速な CPU

多ノード膨大なメモリ高速なネットワーク適切な放熱,電源処理コンパイラに依存しない

並列計算機の総合的な評価に向いている

Myrinet2000 と Ethernet の比較

Linpack Benchmark はネットワークに依存する

Linpack  結果

78.62GFlops ( 84.58GFlops )

公式記録

Cambria 67.03/204.8 Gflops (N=80000)

Gregor 69.94/128.0 Gflops (N=40000)

カットオフのある粒子シミュレーション

カットオフ半径内に収まる粒子との相互作用を考える

領域をどう分割するか?

比較的,通信量が大きくなるプログラム

結 果順位 プログラマ ( )実行結果 秒 マシン名 ノード数 ピーク性能

(GFLOPS)所属

1 工藤誠 5.98HITACHISR8000/ MPP 16 (128) 230.4

東京大学大学院情報理工学系研究科コンピュータ科学専攻

2丸山直也 16.69 Gregor 64 (128) 128 同志社大学工学部

3丸山直也 21.09 Hitachi SR8000 32 (256) 256産業技術総合研究所先端情報計算センター

4丸山直也 54.70 Fujitsu VPP800 40 320京都大学大型計算機センター研究開発部

5丸山直也 67.73

CompaqAlphaServerDS20E× 6 11 15約 京都大学大学院情報学研究科

6丸山直也 69.79

CompaqAlphaServerES40×2 8 10約 京都大学大学院情報学研究科

7丸山直也 87.05 ETL- Wiz 32 21.312産業技術総合研究所情報処理研究部門

8丸山直也 97.70 Presto Cluster 32 16 東京工業大学 学術国際情報セ

ンター

9丸山直也 100.13FujitsuGP7000/ 900 14 16.8京都大学大型計算機センター

10丸山直也 253.56 Cambria 10 8 同志社大学工学部

11丸山直也 496.90RCCP HyadesAlpha- Cluster 8 9.6

筑波大学計算物理学研究センター

最適化における並列化

感度の並列化など GA の並列化など

Distributed Genetic Algorithms(Island GAs)

subpopulation

migration

DGA Benchmark

乱数発生の繰り返し

DGA による処理速度の向上

PC クラスタの性能–CPU–メモリ–ネットワーク–放熱問題

最適化問題–感度の並列–分散遺伝的アルゴリズム

まとめ