OpenMP 并行编程

OpenMP

[email protected]

OpenMP OPenMPOpenMPOpenMPOpenMP **

PVP UMA SMPCrossbarSWITCH UMAMPP NORMA

**

DSMSMP NUMACluster(Now,Cow)EthernetMyrinetQuadricsInfinibandSwitch SMP DSM NORMA

**

OpenMP**

OpenMP OpenMP SMPANSI X3H5 FortranC/C++APIRun-Time routines DECIntelIBMHPSunSGILinuxUNIXNThttp://www.openmp.org/ **

OpenMPOpenMPOpenMPFork-JoinOpenMPMaster Thread(Parallel Region) Fork: Join:**

OpenMPMasterthread**

Hello, worldOpenMP /* OpenMP/CHello World */ #include int main(int argc, char *argv[]) { int nthreads,tid; int nprocs; char buf[32]; /* Fork a team of threads */ #pragma omp parallel private(nthreads,tid) { /* Obtain and print thread id */ tid = omp_get_thread_num(); printf("Hello, world from OpenMP thread %d\n", tid); /*Only master thread does this */ if (tid == 0) { nthreads = omp_get_num_threads(); printf(" Number of threads %d\n",nthreads); } } return 0; }**

efc -openmp o HelloWorld HelloWorld.c ./HelloWorld Hello World from OpenMP thread 2 Hello World from OpenMP thread 0 Number of threads 4 Hello World from OpenMP thread 3 Hello World from OpenMP thread 1**

OpenMPFortranOpenMP PROGRAM PROG_NAME INTEGER VAR1, VAR2 ,VAR3 . !$OMP PARALLEL PRIVATE(VAR1, VAR2) SHARED(VAR3) . !$OMP END PARALLEL END**

C/C++OpenMP #include main(){ int var1, var2, var3; .. #pragma omp parallel private(var1, var2) shared(var 3) { . } } **

OpenMP**

OpenMPC/C++Fortran**

!$OMP #pragma omp parallelDO/forsection privated ,shared,reduction,copyin [Cluase]

**

sentinelsOpenMP :Fortran: !$OMP (or C$OMP or *$OMP)C/C++: #pragma omp

**

Fortran $OMP PARALLEL [clauses] BLOCK $OMP END PARALLELC/C++ #pragma omp parallel [clauses] { BLOCK } **

barrierclauseFortran C/C++

**

ThreadsThreadsMaster threadMaster threadbarrierbarrierMaster thread**

shared privated;Fortran SHARED(list) PRIVATE(list) DEFAULT(SHARED|PRIVATE|NONE)C/C++ shared(list) private(list) default(shared|private|none)**

$OMP PARALLEL DEFAULT(NONE, PRIVATEI, MYID), $OMP & SHARED(a, n) myid=omp_get_thread_num()+1 do i=1, n a(i, myid)=1.0 end do$OMP END PARALLEL

**

reduction+,*,maxminOpenMPreductionFortranREDUCTION(op:list)C/C++: reduction(op:list) sum=0; $OMP PARALLEL REDUCTION(+: sum), PRIVATE(I, MYID) myid=omp_get_thread_num()+1 do i= 1, n sum=sum+a(i, myid) end do $OMP END PARALLELreductionsumsum;Reductionop**

Pi/* Seriel Code */static long num_steps = 100000; double step; void main () { int i; double x, pi, sum = 0.0, start_time,end_time; step = 1.0/(double) num_steps; start_time=clock(); for (i=1;i

SPMDinclude static long num_steps = 100000; double step; #define NUM_THREADS 4 void main () {int i ; double pi, sum[NUM_THREADS] , start_time, end_time ; step = 1.0/(double) num_steps; omp_set_num_threads(NUM_THREADS) start_time=omp_get_wtime(); #pragma omp parallel { int id; double x; id = omp_get_thraead_num(); for (i=id, sum[id]=0.0;i< num_steps; i=i+NUM_THREADS){ x = (i+0.5)*step; sum[id] += 4.0/(1.0+x*x); } } for(i=0, pi=0.0;i

OpenMP DO/forSECTIONSSINGLEMASTER**

DO/forDO/forFortran$OMP DO[clauses] DO $OMP END DO

C/C++#pragma omp for [clauses] for

DO/forPRIVATEFIRSTPRIVARE **

DO/forFortran $OMP PARALLEL [clauses] $OMP DO[clauses] $OMP END DO $OMP END PARALLEL $OMP PARALLEL DO[clauses] $OMP END PARALLEL DOC/C++ #pragma omp parallel for [clauses] { }**

DO/forSCHEDULEFortran: SCHEDULEkind[, chunksize]C/C++ schedule (kind[, chunksize]

kindSTATIC, DYNAMICRUNTIME chunksize$ OMP DO SCHEDULE DYNAMIC4 $ OMP DO

**

schedule (STATIC [, chunksize] : chunksize chunksizechunksize 4 schudule(static) T0 T1 T2 T3 1 40 schudule(static, 4) T0 T1 T2 T3 T0 T1 T2 T3 T0 T1 1 40 **

DO/forSCHEDULEschedule (DYNAMIC [, chunksize] :chunksizechunksize1schedule (GUIDED [, chunksize] DYNAMIC

NSkkRkchunksizechunksize1schedule (RUNTIMEOMP_SCHEDULE export OMP_SCHEDULE=DYNAMIC, 4 RUNTIMEchunksize **

forpi#include #define NUM_THREADS 4static long num_steps = 100000; double step; void main () {int iid; double x, pi, sum[NUM_THREADS]; step = 1.0/(double) num_steps; omp_set_num_threads(NUM_THREADS) #pragma omp parallel private(x, id) { id = omp_get_thread_num(); sum[id] = 0; #pragma omp for for (i=id;i< num_steps; i++){ x = (i+0.5)*step; sum[id] += 4.0/(1.0+x*x); } }for(i=0, pi=0.0;i

SCHEDULE**

#pragma omp parallel for for(k=0;k

SECTIONS(work-sharing sections)OpenMPblockFortran: $OMP SECTIONS[clauses] [$OMP SECTION] block [$OMP SECTION block ] $OMP END SECTIONSC/C++: $pragma sections[clauses] { [ $pragma section] block [ $pragma section block ] .. } **

sectionsPRIVATE FIRSTPRIVATEsectionSECTIONSFortran: $OMP PARALLEL SECTIONS[clauses] . $OMP END PARALLEL SECTIONS

C/C++: $pragma parallel sections[clauses] . $pragma end parallel sections

**

SECTIONS:$OMP PARALLEL $OMP DO $OMP END DO $OMP SECTIONS $OMP SECTION call init(x) $OMP SECTION call init(y) $OMP SECTION call init(z) $OMP END SECTIONS$OMP END PARALLEL4**

SINGLESINGLEFortran: !OMP SINGLE [clauses] block !OMP END SINGLE

C/C++:#pragma omp single [clauses] { structure block} #pragma omp parallel{ setup(x); #pragma omp single { input(y); } work(x,y); }

**

SINGLE#pragma omp parallel{ setup(x); #pragma omp single { input(y); } work(x,y); } **

MASTERMASTERFortran: !OMP MASTER [clauses] block !OMP END MASTER

C/C++:#pragma omp master [clauses] structure block I/O

**

BARRIERBARRIEROpenMPFortran:!$ OMP BARRIER

C/C++#pragma omp barrierbarrierDO/FORSECTIONSSINGLEbarrier barrierbarrier

**

! $OMP PARALLEL PRIVATE(i, myid, neighb) myid=omp_get_thread_num() neighb=myid-1 if (myid .eq. 0) neighb=omp_get_num_threads()-1 a(myid)=a(myid)*3.5 ! $ OMP BARRIER b(myid)=a(neighb)+c ! $ OMP END PARALLEL**

reductionfor#include #define NUM_THREADS 4static long num_steps = 100000; double step; void main () {int iid; double x, pi, sum, start_time, end_time; step = 1.0/(double) num_steps; omp_set_num_threads(NUM_THREADS) ; start_time=omp_get_wtime(); #pragma omp parallel private(x, id) { id = omp_get_thread_num(); sum[id] = 0; #pragma omp for private(x) shared(sum) reductuion(+:sum) for (i=id;i< num_steps; i++){ x = (i+0.5)*step; sum += 4.0/(1.0+x*x); } } start_time=omp_get_wtime(); pi=sum*step; printf(Pi=%f\n Running time \n,end_time-start_time);}

**

NOWAIT NowaitSECTIONSFortranOMP DO do loop OMP END DO NOWAIT

C/C++#pragma omp for nowait for loop SECTIONSSINGLE NOWAITbug**

NOWAITBARRIERS

$OMP PARALLEL $ OMP do do j=1, n . ! $ OMP END DO NOWAIT $ OMP do do j=1, n . ! $ OMP END DO NOWAITOMP END PARALLEL

**

CRITICALCRITICALFortran!$OMP CRITICAL [(name)] block!$OMP END CRITICAL [(name)]

C/C++:#pragma omp critical [(name)] structure blockCritical

**

CriticalFortrannamename,nullname#pragma omp critical{ if(max

privatecritical pi#include static long num_steps = 100000; double step; #define NUM_THREADS 4 void main () {int i; double x, sum, pi=0.0,start_time, end_time; step = 1.0/(double) num_steps; omp_set_num_threads(NUM_THREADS) start_time=omp_get_wtime(); #pragma omp parallel private (x, sum) { id = omp_get_thread_num(); for (i=id,sum=0.0;i< num_steps;i=i+NUM_THREADS){ x = (i+0.5)*step; sum += 4.0/(1.0+x*x); } #pragma omp critical pi += sum; } end_time=omp_get_wtime(); printf(Pi=%f\n Running time \n, pi, end_time-start_time);}

**

ATOMICATOMICFortran:! $OMP ATOMIC statementC/C++#pragma omp atomic statementfortranstatement x=x op expr x=expr op x x=intr(x, expr)x=intr(exprx) op+- * / .and. .or. .eqv. .neqv. intrMAX min IAND IORIEOR **

C/C++statement x binop=expr x++ x-- ++x --xx binop+- * / & ^ >ATOMIC atomic**

LOCK Fortran:Subroutine OMP_INIT_LOCK(VAR)Subroutine OMP_SET_LOCK(VAR)LOGICAL FUNCTION OMP_TEST_LOCK(VAR)Subroutine OMP_UNSET_LOCK(VAR)Subroutine OMP_DESTROY_LOCK(VAR)**

C/C++#includevoid omp_init_lock(omp_lock_t *lock);void omp_set_lock(omp_lock_t *lock);int omp_test_lock(omp_lock_t *lock);void omp_unset_lock(omp_lock_t *lock);void omp_detroy_lock(omp_lock_t *lock);

**

call omp_init_lock(ilock) !$OMP PARALLEL SHARED(ilock) ... do while ( .not. omp_test_lock(ilock)) call do_something_else() end do call work() call omp_unset_lock(ilock) ... !$OMP END PARALLEL **

FLUSHFLUSH/Fortran:!$OPM FLUSH[(list)]C/C++:#prgma omp flush [(list)]

**

Run-Time routines**

OpenMPFortran: interger function OMP_GET_NUM_THREADS ()C/C++:#include int omp_get_num_threads() **

Fortran:Interger function OMP_GET_THREAD_NUM ()C/C++:#include int omp_get_thread_num()

**

Fortran: routine OMP_SET_NUM_THREADS ( ) C/C++: #include omp_set_num_threads() OMP_NUM_THREADS OMP_NUM_THREADS **

return current wall clock time (relative to arbitrary origin) Fortran: DOUBLE PRECISION FUNCTION OMP_GET_WTIME()C/C++: double omp_get_wtime(void); return clock precision Fortran: DOUBLE PRECISION FUNCTION OMP_GET_WTICK()C/C++: double omp_get_wtick(void);

**

OpenMP**

OpenMP4 1. OMP_NUM_THREADS setenv OMP_NUM_THREADS 4 2. OMP_SCHEDULEDO/for setevn OMP_SCHEDULE DYNAMIC4 **

3. OMP_DYNAMICFALSETRUE setevn OMP_DYNAMIC TRUE

4.OMP_NESTED: setenv OMP_NESTED TURE**

NUM_THREADS OpenMP 2.0 (Fortran C/C++) NUM_THREADS !$OMP PARALLEL DO NUM_THREADS(4) DO J = 1,N A(I,J) = B(I,J) !$OMP END DO : NUM_THREADSOMP_NUM_THREADS ( omp_set_num_threads() )**

OpenMPDO/forOpenMPIntel VtuneTMIntel

**

11() #include #include #include int main() { long long max=10000000; long long i,count=0; double x,y,z,bulk,start_time,end_time; time_t t; start_time=clock(); // srand((unsigned) time(&t)); for(i=0;i

OpenMP Parallel for with a reduction #include #include #include #include int main() { long long max=10000000; long long i,count=0; double x,y,z,bulk,start_time,end_time; time_t t; start_time=omp_get_wtime(); // srand((unsigned) time(&t)); #pragma omp parallel for private(x,y,z) reduction(+:count) for(i=0;i

1. do i=2,n a(i)=2*a(i-1) end do ix = base do i=1,n a(ix) = a(ix)*b(i) ix = ix + stride end do do i=1,n b(i)= (a(i)-a(i-1))*0.5 end do

**2.piOpenMP3.- OpenMP4.criticalatomiclockflush

:num_threadsnum_threads #include"omp.h" #include"stdio.h main() { omp_set_num_threads(4); #pragma omp parallel num_threads(2) printf(my thead number is %d\n",omp_get_thread_num()); }num_threadsomp_set_num_threadsNMP_NUM_THREADS

firstprivatemaster firstprivate()x[0]=10for(i=0;i

lastprivateDO/formaster

#pragma ompparallel for private(j) lastprivate(x)for(i=0;i

for(i=1;i

#include"omp.h" #include"stdio.h" #define n 20 main() { int a[m][n], i,j; for(i=1;i

,.: for(i=2;i

#include"omp.h" #include"stdio.h" #define n 20 main() { int a[n], i; for(i=0;i

ifif if() sum=0.0; #pragma omp for private(x) shared(sum) reductuion(+:sum) for (i=0;i< n; i++){ x = (i+0.5)/n; sum += 4.0/(1.0+x*x); } pi=sum/n; sum=0.0; #pragma omp for private(x) shared(sum) reductuion(+:sum) if(n>5000) for (i=id;i< num_steps; i++){ x = (i+0.5)/n; sum += 4.0/(1.0+x*x); } pi=sum/n;

5 possion.cpossion_omp.c

**

********************************************************************

Documents

OpenMP 并行编程