51
1.1 Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved. Komputer Paralel Chapter 1

Komputer Paralel

Embed Size (px)

DESCRIPTION

Chapter 1. Komputer Paralel. Tuntutan Terhadap Kecepatan Komputasi. Tuntutan yang terus mendesak agar sistem komputer menunjukkan kecepatan komputasi yang lebih besar dari saat ini. - PowerPoint PPT Presentation

Citation preview

Page 1: Komputer Paralel

1.1Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Komputer Paralel

Chapter 1

Page 2: Komputer Paralel

1.2Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Tuntutan Terhadap Kecepatan Komputasi

• Tuntutan yang terus mendesak agar sistem komputer menunjukkan kecepatan komputasi yang lebih besar dari saat ini.

• Bidang yang membutuhkan kecepatan komputasi yang tinggi mencakup pemodelan numerik dan simulasi masalah ilmiah dan teknik.

• Komputasi harus diselesaikan dalam waktu yang “masuk akal”.

Page 3: Komputer Paralel

1.3Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Masalah yang Merupakan Tantangan Besar

… adalah masalah yang tidak dapat diselesaikan dalam waktu yang masuk akal dengan kecepatan komputer yang sekarang … → berkisar sekitar 10 tahun waktu eksekusi.

Contoh

• Pemodelan struktur DNA yang besar• Peramalan cuaca global• Pemodelan gerakan benda luar angkasa.

Page 4: Komputer Paralel

1.4Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Peramalan Cuaca

• Atmosfir dimodelkan dengan membaginya menjadi sel-sel 3-dimensi.

• Perhitungan setiap sel diulang-ulang to memodelkan perjalanan waktu.

Page 5: Komputer Paralel

1.5Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Contoh Peramalan Cuaca Global

• Misalkan keseluruhan atmosfir global dibagi menjadi sel sebesar 1 mile 1 mile 1 mile dengan ketinggian 10 miles (tinggi 10 sel) - sekitar 5 108 sel.

• Misalkan setiap perhitungan membutuhkan 200 operasi floating point. Dalam satu tahap, diperlukan 1011 operasi floating point.

• Untuk meramalkan cuaca 7 hari dengan interval 1 menit, komputer dengan kecepatan 1Gflops (109 operasi floating point / detik) membutuhkan waktu 106 detik atau lebih dari 10 hari.

• Untuk melakukan perhitungan tersebut dalam waktu 5 menit dibutuhkan komputer yang beroperasi dengan kecepatan 3.4 Tflops (3.4 1012 operasi floating point / detik).

Page 6: Komputer Paralel

1.6Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Pemodelan Gerakan Benda Luar Angkasa

• Setiap benda saling menarik dengan gaya gravitasi. Gerakan setiap benda diprediksi dengan menghitung gaya total pada setiap benda.

• Jika ada N benda, diperlukan perhitungan N - 1 gaya

untuk setiap benda, atau sekitar N2 perhitungan. (N log2 N untuk algoritma aproksimasi yang efisien.)

• Setelah menentukan posisi baru untuk setiap benda, perhitungan diulang kembali.

Page 7: Komputer Paralel

1.7Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

• Satu galaksi bisa memiliki sekitar 1011 bintang.

• Bahkan jika satu perhitungan dilakukan dalam waktu 1 ms (angka yang sangat optimistik), diperlukan 109 tahun untuk satu iterasi dengan menggunakan algoritma N2 algorithm dan hampir satu tahun untuk satu iterasi dengan menggunakan algoritma aproksimasi N log2 N yang efisien.

Page 8: Komputer Paralel

1.8Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Simulasi Astrofisika N-benda oleh Scott Linssen (mahasiswa undergraduate UNC-Charlotte).

Page 9: Komputer Paralel

1.9Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Komputasi Paralel

• Menggunakan lebih dari 1 komputer, atau komputer dengan lebih dari 1 prosesor, untuk menyelesaikan masalah.

Motif• Biasanya komputasi yang lebih cepat – ide yang sangat

sederhana – bahwa n komputer yang beroperasi secara simultan dapat memberikan hasil n kali lebih cepat – walaupun tidak akan mencapai n kali lebih cepat dengan berbagai alasan.

• Motif lain mencakup: toleransi kesalahan, kapasitas memori yang tersedia lebih besar, ...

Page 10: Komputer Paralel

1.10Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Latar Belakang

• Komputer paralel – komputer dengan lebih dari satu prosesor – dan pemrogramannya – pemrograman paralel – telah ada selama

lebih dari 40 tahun.

Page 11: Komputer Paralel

1.11Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Gill menulis pada tahun 1958:

“... Dengan demikian tidak ada hal baru dalam gagasan pemrograman paralel, selain penerapannya pada komputer. Penulis tidak menganggap akan ada kesulitan besar dalam perluasannya pada komputer. Tidak diharapkan bahwa teknik pemrograman yang diperlukan akan ditemukan dalam semalam. Banyak eksperimen yang masih harus dilakukan. Bagaimanapun, teknik yang biasanya digunakan dalam pemrograman saat ini didapat dengan usaha keras beberapa tahun yang lalu. Pada kenyataannya, munculnya pemrograman paralel bisa berperan dalam menghidupkan kembali semangat perintis dalam pemrograman yang tampaknya menjadi membosankan dan hanya rutin saja ...”

Gill, S. (1958), “Parallel Programming,” The Computer Journal, vol. 1, April, pp. 2-10.

Page 12: Komputer Paralel

1.12Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Faktor Speedup

dengan ts adalah waktu eksekusi pada prosesor tunggal dan tp adalah waktu eksekusi pada multiprosesor.

S(p) menunjukkan bertambahnya kecepatan dengan menggunakan multiprosesor.

Gunakan algoritma sekuensial terbaik dengan sistem prosesor tunggal. Algoritma yang mendasari untuk implementasi paralel bisa (dan biasanya) berbeda.

S(p) = Waktu eksekusi dengan 1 prosesor (algoritma sekuensial terbaik)

Waktu eksekusi multiprosesor dengan p prosesor

ts

tp

Page 13: Komputer Paralel

1.13Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Faktor speedup juga bisa dinyatakan dalam langkah komputasi:

Kompleksitas waktu juga dapat diperluas dengan komputasi paralel.

S(p) = Jumlah langkah komputasi dengan satu prosesor

Jumlah langkah komputasi paralel dengan p prosesor

Page 14: Komputer Paralel

1.14Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Speedup Maksimum

Speedup maksimum biasanya p dengan p prosesor (linear speedup).

Dapat dicapai superlinear speedup (lebih besar dari p) tetapi biasanya dengan kondisi tertentu seperti:

• Memori ekstra pada sistem multiprosesor• Algoritma nondeterministik

Page 15: Komputer Paralel

1.15Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Speedup Maksimum Hukum Amdahl

Bagian serial Bagian yang dapat diparalelisasi

(a) Satu prosesor

(b) Multipleprosesor

fts (1 - f)ts

ts

(1 - f)ts /ptp

p prosesor

Page 16: Komputer Paralel

1.16Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Faktor speedup dinyatakan dengan:

Persamaan ini dikenal sebagai hukum Amdahl

S(p) ts p

fts (1 f )ts /p 1 (p 1)f

Page 17: Komputer Paralel

1.17Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Speedup terhadap jumlah prosesor

4

8

12

16

20

4 8 12 16 20

f = 20%

f = 10%

f = 5%

f = 0%

Jumlah prosesor , p

Page 18: Komputer Paralel

1.18Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Bahkan dengan jumlah prosesor tak terbatas, speedup maksimum tetap terbatas sampai 1/f.

ContohDengan hanya 5% komputasi yang serial, speedup maksimum adalah 20, berapapun jumlah prosesor.

Page 19: Komputer Paralel

1.19Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Contoh Superlinear Speedup - Searching

(a) Searching setiap sub-space secara sekuensial

tsts/p

Start Waktu

t

Solusi ditemukanxts/p

Sub-spacesearch

x indeterminate

Page 20: Komputer Paralel

1.20Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

(b) Searching setiap sub-space secara paralel

Solusi ditemukan

t

Page 21: Komputer Paralel

1.21Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Dengan demikian, Speedup dinyatakan dengan

S(p)xtsp

t+

t=

Page 22: Komputer Paralel

1.22Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Worst case untuk search sekuensial dengan solusi ditemukan di sub-space terakhir. Pada kasus ini, versi paralel memberikan keuntungan terbesar, yaitu

S(p)

p 1–p

ts t+

t=

  as t tends to zero

Page 23: Komputer Paralel

1.23Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Keuntungan terkecil versi paralel ialah jika solusi ditemukan pada sub-space pertama dari search sekuensial, yaitu

Speed-up yang sebenarnya bergantung pada subspace yang mana yang menyimpan solusi, tetapi mungkin banyak sekali.

S(p) = tt

= 1

Page 24: Komputer Paralel

1.24Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Tipe Komputer Paralel

Dua tipe utama:

• Shared memory multiprocessor

• Distributed memory multicomputer

Page 25: Komputer Paralel

1.25Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Shared Memory Multiprocessor

Page 26: Komputer Paralel

1.26Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Komputer KonvensionalTerdiri dari satu prosesor yang mengeksekusi program yang tersimpan pada memori (utama):

Setiap lokasi memori utama ditentukan oleh alamatnya. Alamat dimulai dari 0 sampai 2b - 1 jika ada b bit (digit biner) alamat.

Memori Utama

Prosesor

Instruksi(ke prosesor)Data (ke atau dari prosesor)

Page 27: Komputer Paralel

1.27Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Shared Memory Multiprocessor SystemCara natural untuk mengembangkan model prosesor tunggal - multiple processor dihubungkan ke multiple memory modules, sedemikian sehingga setiap prosesor dapat mengakses memory module yang manapun:

Processors

Interconnectionnetwork

Memory moduleOneaddressspace

Page 28: Komputer Paralel

1.28Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Ilustrasi shared memory multiprocessor kecil yang disederhanakan

Contoh:• Dual Pentium• Quad Pentium

Processors Shared memory

Bus

Page 29: Komputer Paralel

1.29Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Quad Pentium Shared Memory MultiprocessorProcessor

L2 Cache

Bus interface

L1 cache

Processor

L2 Cache

Bus interface

L1 cache

Processor

L2 Cache

Bus interface

L1 cache

Processor

L2 Cache

Bus interface

L1 cache

Memory controller

Memory

I/O interface

I/O bus

Processor/memorybus

Shared memory

Page 30: Komputer Paralel

1.30Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Pemrograman Shared Memory Multiprocessors

• Threads - programmer membagi program menjadi urutan paralel individu (threads), masing-masing dapat mengakses variabel yang dideklarasikan di luar thread.

Contoh: Pthreads

• Bahasa pemrograman sekuensial dengan preprocessor compiler directives untuk mendeklarasikan variabel yang dipakai bersama (shared variables) dan menspesifikasi paralelisme.

Contoh: OpenMP – standard industri – membutuhkan compiler OpenMP

Page 31: Komputer Paralel

1.31Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

• Bahasa pemrograman sekuensial dengan syntax tambahan untuk mendeklarasikan variabel yang dipakai bersama dan menspesifikasi paralelisme.

Contoh: UPC (Unified Parallel C) – membutuhkan compiler compiler.

• Bahasa pemrograman paralel dengan syntax untuk menyatakan paralelisme - compiler membuat executable code untuk setiap prosesor (sekarang tidak umum)

• Bahasa pemrograman sekuensial dan meminta parallelizing compiler untuk mengubahnya menjadi parallel executable code. - sekarang tidak umum

Page 32: Komputer Paralel

1.32Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Message-Passing Multicomputer

Komputer lengkap dihubungkan melalui interconnection network:

Processor

Interconnectionnetwork

Local

Computers

Messages

memory

Page 33: Komputer Paralel

1.33Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Interconnection Networks

• Interkoneksi yang terbatas dan lengkap• Mesh 2- dan 3-dimensi• Hypercube (sekarang tidak umum)• Menggunakan switch:

– Crossbar– Tree– Multistage interconnection network

Page 34: Komputer Paralel

1.34Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Array dua-dimensi (mesh)

Juga tiga-dimensi – digunakan pada beberapa sistem dengan kinerja tinggi.

LinksComputer/processor

Page 35: Komputer Paralel

1.35Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Hypercube Tiga Dimensi

000 001

010 011

100

110

101

111

Page 36: Komputer Paralel

1.36Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Hypercube Empat Dimensi

Hypercube yang populer pada tahun 1980-an – sekarang tidak

0000 0001

0010 0011

0100

0110

0101

0111

1000 1001

1010 1011

1100

1110

1101

1111

Page 37: Komputer Paralel

1.37Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Crossbar switch

SwitchesProcessors

Memories

Page 38: Komputer Paralel

1.38Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Tree

Switchelement

Root

Links

Processors

Page 39: Komputer Paralel

1.39Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Multistage Interconnection NetworkExample: Omega network

000

001

010

011

100

101

110

111

000

001

010

011

100

101

110

111

Inputs Outputs

2 ´ 2 switch elements(straight-through or

crossover connections)

Page 40: Komputer Paralel

1.40Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Distributed Shared Memory Membuat main memory dari kelompok interconnected computers seakan-akan seperti satu memory dengan satu address space. Selanjutnya dapat digunakan teknik pemrograman shared memory.

Processor

Interconnectionnetwork

Shared

Computers

Messages

memory

Page 41: Komputer Paralel

1.41Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Klasifikasi Flynn

Flynn (1966) membuat klasifikasi komputer berdasarkan aliran instruksi dan aliran data:

– Single instruction stream-single data stream (SISD) computer

Komputer prosesor tunggal – dibuat satu aliran instruksi dari program. Instruksi beroperasi pada satu aliran data.

Page 42: Komputer Paralel

1.42Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Multiple Instruction Stream-Multiple Data Stream (MIMD) Computer

Sistem multiprosesor general-purpose – setiap prosesor memiliki program sendiri dan dibuat satu aliran instruksi dari setiap program untuk setiap prosesor. Setiap instruksi beroperasi pada data yang berbeda.

Multiprosesor shared memory dan message-passing yang telah dibahas sebelum ini termasuk dalam klasifikasi MIMD.

Page 43: Komputer Paralel

1.43Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Single Instruction Stream-Multiple Data Stream (SIMD) Computer

• Komputer yang dirancang khusus – datu aliran instruksi dari satu program, tetapi terdapat banyak aliran data. Instruksi dari program di-broadcast ke lebih dari satu prosesor. Setiap prosesor mengeksekusi instruksi yang sama secara sinkron, tetapi menggunakan data yang berbeda.

• Dikembangkan karena banyak aplikasi penting yang beroperasi pada banyak data.

Page 44: Komputer Paralel

1.44Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Struktur Multiple Program Multiple Data (MPMD)

Termasuk klasifikasi MIMD, setiap prosesor memiliki program sendiri untuk dieksekusi:

Program

Processor

Data

Program

Processor

Data

InstructionsInstructions

Page 45: Komputer Paralel

1.45Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Struktur Single Program Multiple Data (SPMD)

Terdapat satu source program yang copy-nya dieksekusi oleh setiap prosesor secara independen dan tidak sinkron.

Source program dapat dibuat sedemikian rupa sehingga bagian-bagiannya dieksekusi oleh komputer-komputer tertentu bergantung pada identitas komputer tersebut.

Page 46: Komputer Paralel

1.46Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Networked Computers sebagai Computing Platform

• Jaringan komputer menjadi alternatif yang sangat menarik bagi superkomputer dan sistem komputer paralel yang mahal untuk melakukan for high-performance computing di awal tahun 1990-an.

• Beberapa proyek awal:

– Berkeley NOW (network of workstations) project. – NASA Beowulf project.

Page 47: Komputer Paralel

1.47Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Keuntungan utama:

• Workstation dan PC berkinerja tinggi tersedia dengan harga murah.

• Prosesor terbaru dapat digabungkan dengan sistem jika telah tersedia.

• Software yang sudah ada dapat dipakai atau dimodifikasi.

Page 48: Komputer Paralel

1.48Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Software Tools for Clusters

• Berdasarkan pada Message Passing Parallel Programming:

• Parallel Virtual Machine (PVM) – dikembangkan pada akhir 1980-an. Menjadi sangat populer.

• Message-Passing Interface (MPI) – standardnya didefinisikan pada tahun 1990-an.

• Keduanya menyediakan satu set user-level library untuk message passing. Digunakan dengan bahasa pemrograman umum (C, C++, ...).

Page 49: Komputer Paralel

1.49Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Beowulf Clusters*

• Sekelompok interconnected “commodity” computers yang dapat mencapai kinerja tinggi dengan harga murah.

• Biasanya menggunakan commodity interconnects - high speed Ethernet, dan Linux OS.

* Beowulf merupakan nama yang diberikan oleh NASA Goddard Space Flight Center cluster project.

Page 50: Komputer Paralel

1.50Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Cluster Interconnects

• Awalnya merupakan fast Ethernet on low cost clusters• Gigabit Ethernet - easy upgrade path

More Specialized/Higher Performance• Myrinet - 2.4 Gbits/sec - disadvantage: single vendor• cLan• SCI (Scalable Coherent Interface)• QNet• Infiniband - may be important as infininband interfaces

may be integrated on next generation PCs

Page 51: Komputer Paralel

1.51Slides for Parallel Programming Techniques & Applications Using Networked Workstations & Parallel Computers 2nd Edition, by B. Wilkinson & M. Allen, © 2004 Pearson Education Inc. All rights reserved.

Dedicated cluster with a master node

Dedicated Cluster User

Switch

Master node

Compute nodes

Up link

2nd Ethernetinterface

External network