Главная / Информатика / Введение в параллельное программирование

Презентация на тему: Введение в параллельное программирование

Получить код Наши баннеры

Формальный подход к определению параллельной программы Формальный подход к определению параллельной программы Меры качества параллельных программ Предел ускорения вычислений при распараллеливании Реализация параллельных программ в модели общей памят…

Задача: a = b*c+d*e; Задача: a = b*c+d*e; Последовательная программа: Load r1,b Load r2, c Mul r1, r1, r2 Load r2, d Load r3, d Mul r2, r2, r3 Sum r1, r1, r2 Store a, r1

Представление алгоритма A – это набор Представление алгоритма A – это набор S = (X, F, C, M), где X – конечное множество переменных F – конечное множество операций С – управление (множество ограничений на порядок операций) = потоковое управление + п…

– это выполнение операций в некотором порядке, не противоречащим управлению C Представление корректно, если любая реализация вычисляет функцию F, т.е. С содержит потоковое управление.

Если множество реализаций алгоритма A, представленного в форме S содержит более одной реализации, то представление S называется параллельным. Если множество реализаций алгоритма A, представленного в форме S содержит более одной реализации, то предст…

Ускорение параллельной реализации относительно последовательной: Ускорение параллельной реализации относительно последовательной: S = Ts/Tp, где Ts – время выполнения последовательной программы, Tp – параллельной Эффективность использования N процес…

Если P – это доля вычислений, которые могут быть выполнены параллельно, а 1-P – доля последовательной части, то максимальное ускорение, которое можно получить на N процессорах равно Если P – это доля вычислений, которые могут быть выполнены параллел…

Изображение из Википедии Изображение из Википедии

Микропроцессоры Микропроцессоры SMP-узлы: объединения микропроцессоров над общим полем памяти Мультикомпьютеры: SMP-узлы, связанные выделенной сетью передачи данных Grid: объединение произвольных ресурсов

#include <omp.h> #include <omp.h> <…> int main() { <…> #pragma omp parallel shared(a, b, c) private(i) { #pragma omp for for (i = 0; i < N; i++) a[i] = b[i] + c[i]; } <…> }

$#include <mpi.h> #include <mpi.h> #include <iostream> #include <unistd.h> int main(int argc, char** argv) { int rank, size; char hostname[50]; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm…$

$if(size!=2){ if(size!=2){ std::cerr << "2 processes required\n"; MPI_Finalize(); return 1; } int intBuff = 1234; MPI_Status st; if(rank==0){ MPI_Send(&rank, 1, MPI_INT, 1, 0, MPI_COMM_WORLD); std::cerr << "Rank " …$

$intBuff = 1234; intBuff = 1234; std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n"; MPI_Sendrecv(&rank, 1, MPI_INT, !rank, 0, &intBuff, 1, MPI_INT, !…$

$int intBuff = rank; int intBuff = rank; std::cerr << "Rank = " << rank << ", intBuff = " << intBuff << "\n"; MPI_Bcast(&intBuff, 1, MPI_INT, 0, MPI_COMM_WORLD); std::cerr << "…$

$int intBuff = 0; int intBuff = 0; std::cerr << "Rank = " << rank << ", intBuff = " << intBuff << "\n"; MPI_Reduce(&rank, &intBuff, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD); std::cerr…$

$int intBuff = rank; int intBuff = rank; MPI_Request rq; MPI_Isend(&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &rq); for(int i = 0; i<100; i++) std::cout << "working\n"; int flag = 0; MPI_Status st; MPI_Wait(&rq, &a…$

Сбор распределенных векторов: MPI_Gather, MPI_Allgather Сбор распределенных векторов: MPI_Gather, MPI_Allgather Распределение вектора: MPI_Scatter и т.д.

Point-to-point communication Point-to-point communication Datatypes Collective operations Process groups Communication contexts Process topologies Environmental Management and inquiry The info object Process creation and management One-sided communi…

Двумерное уравнение: Двумерное уравнение: d2u/dx2+d2u/dy2-a*u=f Дискретизация: (u(i+1)j-2uij+u(i-1)j)/h2+ (ui(j+1)-2uij+ui(j-1))/h2-a*uij = fij Итеративный метод: un+1ij = 0.25(un(i+1)j+un(i-1)j+uni(j+1)+uni(j-1)-h2fij)

Как организовать коммуникации на разрезе? Как организовать коммуникации на разрезе?

Создается 2 массива в каждом процессе: для значений предыдущей итерации и новой. Создается 2 массива в каждом процессе: для значений предыдущей итерации и новой. Когда значения на границах посчитаны на предыдущей итерации, производится обмен, при эт…

32 двойных блейд-серверов HP BL2x220c, в каждом узле два 4-х ядерных процессора Intel Xeon Е5450 (Intel(R) Xeon(R) CPU E5450 @ 3.00GHz) 32 двойных блейд-серверов HP BL2x220c, в каждом узле два 4-х ядерных процессора Intel Xeon Е5450 (Intel(R) Xeon(R…

1 Вход с помощью программы putty.exe: 1 Вход с помощью программы putty.exe: 1.1Имя сервера: nks-30t.sscc.ru 1.2 Логин: 1.3 Пароль: 2. Панельный файловый менеджер: mc 3. Создать в домашней директории папку для своей работы 4. Скопировать себе примеры…

#!/bin/bash #!/bin/bash #PBS -V #PBS -r n #PBS -l nodes=<количество узлов>:ppn=<количество процессов на узле>,cput=00:10:00,walltime=15:00 #PBS -k oe #PBS -N name_of_the_job #PBS -j oe date cd $PBS_O_WORKDIR pwd mpirun -r ssh -genv I_MPI…

MPI: http://www.mpi-forum.org/ MPI: http://www.mpi-forum.org/

1 из 31

Презентация на тему: Введение в параллельное программирование

Скачать эту презентацию

№ слайда 1

Описание слайда:

№ слайда 2 Формальный подход к определению параллельной программы Формальный подход к опред

Описание слайда:

Формальный подход к определению параллельной программы Формальный подход к определению параллельной программы Меры качества параллельных программ Предел ускорения вычислений при распараллеливании Реализация параллельных программ в модели общей памяти и в модели распределенной памяти Программирование в распределенной памяти: MPI Пример задачи: численное решение уравнения Пуассона Работа на вычислительных системах Сибирского суперкомпьютерного центра По ходу лекции: комментарии об ошибках, характерных для параллельного программирования (дедлоки, несогласованный доступ к данным)

№ слайда 3 Задача: a = b*c+d*e; Задача: a = b*c+d*e; Последовательная программа: Load r1,b

Описание слайда:

Задача: a = b*c+d*e; Задача: a = b*c+d*e; Последовательная программа: Load r1,b Load r2, c Mul r1, r1, r2 Load r2, d Load r3, d Mul r2, r2, r3 Sum r1, r1, r2 Store a, r1

№ слайда 4 Представление алгоритма A – это набор Представление алгоритма A – это набор S =

Описание слайда:

Представление алгоритма A – это набор Представление алгоритма A – это набор S = (X, F, C, M), где X – конечное множество переменных F – конечное множество операций С – управление (множество ограничений на порядок операций) = потоковое управление + прямое управление М – функция, задающая отображение множеств X и F в физические устройства параллельной вычислительной машины

№ слайда 5 – это выполнение операций в некотором порядке, не противоречащим управлению C Пр

Описание слайда:

– это выполнение операций в некотором порядке, не противоречащим управлению C Представление корректно, если любая реализация вычисляет функцию F, т.е. С содержит потоковое управление.

№ слайда 6 Если множество реализаций алгоритма A, представленного в форме S содержит более

Описание слайда:

Если множество реализаций алгоритма A, представленного в форме S содержит более одной реализации, то представление S называется параллельным. Если множество реализаций алгоритма A, представленного в форме S содержит более одной реализации, то представление S называется параллельным. Если это множество одноэлементно, то представление S назвается последовательным.

№ слайда 7 Ускорение параллельной реализации относительно последовательной: Ускорение парал

Описание слайда:

Ускорение параллельной реализации относительно последовательной: Ускорение параллельной реализации относительно последовательной: S = Ts/Tp, где Ts – время выполнения последовательной программы, Tp – параллельной Эффективность использования N процессоров относительно одного E = Ts/(N*TN), где TN – время выполнения параллельной программы на N процессорах

№ слайда 8 Если P – это доля вычислений, которые могут быть выполнены параллельно, а 1-P –

Описание слайда:

Если P – это доля вычислений, которые могут быть выполнены параллельно, а 1-P – доля последовательной части, то максимальное ускорение, которое можно получить на N процессорах равно Если P – это доля вычислений, которые могут быть выполнены параллельно, а 1-P – доля последовательной части, то максимальное ускорение, которое можно получить на N процессорах равно 1 ((1-P)+(P/N))

№ слайда 9 Изображение из Википедии Изображение из Википедии

Описание слайда:

Изображение из Википедии Изображение из Википедии

№ слайда 10 Микропроцессоры Микропроцессоры SMP-узлы: объединения микропроцессоров над общим

Описание слайда:

Микропроцессоры Микропроцессоры SMP-узлы: объединения микропроцессоров над общим полем памяти Мультикомпьютеры: SMP-узлы, связанные выделенной сетью передачи данных Grid: объединение произвольных ресурсов

№ слайда 11

Описание слайда:

№ слайда 12

Описание слайда:

№ слайда 13

Описание слайда:

№ слайда 14 #include <omp.h> #include <omp.h> <…> int main() { <…> #

Описание слайда:

#include <omp.h> #include <omp.h> <…> int main() { <…> #pragma omp parallel shared(a, b, c) private(i) { #pragma omp for for (i = 0; i < N; i++) a[i] = b[i] + c[i]; } <…> }

№ слайда 15

Описание слайда:

№ слайда 16 #include <mpi.h> #include <mpi.h> #include <iostream> #include

Описание слайда:

#include <mpi.h> #include <mpi.h> #include <iostream> #include <unistd.h> int main(int argc, char** argv) { int rank, size; char hostname[50]; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); gethostname(hostname, 50); std::cerr << "Rank = " << rank << ", hostname = " << hostname << ", size = " << size << "\n"; MPI_Finalize(); return 0; } Пример команды запуска программы: mpirun –np 4 first_example.exe Запускается 4 копии программы – 4 процесса, каждый получает свой идентификатор rank: 0, 1, 2, 3

№ слайда 17 $if(size!=2){ if(size!=2){ std::cerr << "2 processes required\n";$

Описание слайда:

if(size!=2){ if(size!=2){ std::cerr << "2 processes required\n"; MPI_Finalize(); return 1; } int intBuff = 1234; MPI_Status st; if(rank==0){ MPI_Send(&rank, 1, MPI_INT, 1, 0, MPI_COMM_WORLD); std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n"; MPI_Recv(&intBuff, 1, MPI_INT, 1, 0, MPI_COMM_WORLD, &st); std::cerr << "Rank " << rank << ": received from Rank 1 intBuff = " << intBuff << "\n"; } else if(rank==1) { std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n"; MPI_Recv(&intBuff, 1, MPI_INT, 0, 0, MPI_COMM_WORLD, &st); std::cerr << "Rank " << rank << ": received from Rank 0 intBuff = " << intBuff << "\n"; MPI_Send(&rank, 1, MPI_INT, 0, 0, MPI_COMM_WORLD); }

№ слайда 18 intBuff = 1234; intBuff = 1234; std::cerr << "Rank " << ra

Описание слайда:

intBuff = 1234; intBuff = 1234; std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n"; MPI_Sendrecv(&rank, 1, MPI_INT, !rank, 0, &intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &st); std::cerr << "Rank " << rank << ": received from Rank " << (!rank) << " intBuff = " << intBuff << "\n";

№ слайда 19 int intBuff = rank; int intBuff = rank; std::cerr << "Rank = " &

Описание слайда:

int intBuff = rank; int intBuff = rank; std::cerr << "Rank = " << rank << ", intBuff = " << intBuff << "\n"; MPI_Bcast(&intBuff, 1, MPI_INT, 0, MPI_COMM_WORLD); std::cerr << "Rank = " << rank << ", after Bcast intBuff = " << intBuff << "\n"; //example of another scenario MPI_Barrier(MPI_COMM_WORLD); if(rank==0) std::cerr << "---- Another scenario ----\n"; MPI_Barrier(MPI_COMM_WORLD); intBuff = rank; std::cerr << "Rank = " << rank << ", again intBuff = rank = " << intBuff << "\n"; if(rank==0) MPI_Bcast(&rank, 1, MPI_INT, 0, MPI_COMM_WORLD); else MPI_Bcast(&intBuff, 1, MPI_INT, 0, MPI_COMM_WORLD); std::cerr << "Rank = " << rank << ", after second Bcast intBuff = " << intBuff << "\n";

№ слайда 20 int intBuff = 0; int intBuff = 0; std::cerr << "Rank = " <&lt

Описание слайда:

int intBuff = 0; int intBuff = 0; std::cerr << "Rank = " << rank << ", intBuff = " << intBuff << "\n"; MPI_Reduce(&rank, &intBuff, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD); std::cerr << "Rank = " << rank << ", after Reduce intBuff = " << intBuff << "\n"; intBuff = 0; MPI_Allreduce(&rank, &intBuff, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD); std::cerr << "Rank = " << rank << ", after Allreduce intBuff = " << intBuff << "\n";

№ слайда 21 int intBuff = rank; int intBuff = rank; MPI_Request rq; MPI_Isend(&intBuff,

Описание слайда:

int intBuff = rank; int intBuff = rank; MPI_Request rq; MPI_Isend(&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &rq); for(int i = 0; i<100; i++) std::cout << "working\n"; int flag = 0; MPI_Status st; MPI_Wait(&rq, &st); //we can write to intBuff again: receiving into intBuff now. //we can use rq again. MPI_Irecv(&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &rq); for(int i = 0; i<100; i++) std::cout << "working again\n"; MPI_Wait(&rq, &st); //now intBuff contains a message received from a peer std::cerr << "Rank " << rank << ": intBuff = " << intBuff << "\n";

№ слайда 22 Сбор распределенных векторов: MPI_Gather, MPI_Allgather Сбор распределенных вект

Описание слайда:

Сбор распределенных векторов: MPI_Gather, MPI_Allgather Сбор распределенных векторов: MPI_Gather, MPI_Allgather Распределение вектора: MPI_Scatter и т.д.

№ слайда 23 Point-to-point communication Point-to-point communication Datatypes Collective o

Описание слайда:

Point-to-point communication Point-to-point communication Datatypes Collective operations Process groups Communication contexts Process topologies Environmental Management and inquiry The info object Process creation and management One-sided communication External interfaces Parallel file I/O Language Bindings for Fortran, C and C++ Profiling interface

№ слайда 24 Двумерное уравнение: Двумерное уравнение: d2u/dx2+d2u/dy2-a*u=f Дискретизация: (

Описание слайда:

Двумерное уравнение: Двумерное уравнение: d2u/dx2+d2u/dy2-a*u=f Дискретизация: (u(i+1)j-2uij+u(i-1)j)/h2+ (ui(j+1)-2uij+ui(j-1))/h2-a*uij = fij Итеративный метод: un+1ij = 0.25(un(i+1)j+un(i-1)j+uni(j+1)+uni(j-1)-h2fij)

№ слайда 25 Как организовать коммуникации на разрезе? Как организовать коммуникации на разре

Описание слайда:

Как организовать коммуникации на разрезе? Как организовать коммуникации на разрезе?

№ слайда 26 Создается 2 массива в каждом процессе: для значений предыдущей итерации и новой.

Описание слайда:

Создается 2 массива в каждом процессе: для значений предыдущей итерации и новой. Создается 2 массива в каждом процессе: для значений предыдущей итерации и новой. Когда значения на границах посчитаны на предыдущей итерации, производится обмен, при этом значения от соседа помещаются в дополнительный слой того же массива. Вычисляются значения на новой итерации с использованием массива предыдущей итерации.

№ слайда 27 32 двойных блейд-серверов HP BL2x220c, в каждом узле два 4-х ядерных процессора

Описание слайда:

32 двойных блейд-серверов HP BL2x220c, в каждом узле два 4-х ядерных процессора Intel Xeon Е5450 (Intel(R) Xeon(R) CPU E5450 @ 3.00GHz) 32 двойных блейд-серверов HP BL2x220c, в каждом узле два 4-х ядерных процессора Intel Xeon Е5450 (Intel(R) Xeon(R) CPU E5450 @ 3.00GHz) = 512 ядер Пиковая производительнось: ~6 ТФлопс. Операционная система: RedHat Linux (RHEL 5u2) Очередь заданий / система пакетной обработки: PBS Pro 10.0 Компиляторы: Intel C/C++ и Fortran 11.0.081 Professional Edition, включают в себя Intel MKL, Intel IPP ... Intel MPI 3.2.0.011 и Intel TraceAnalyzer&Collector 7.2.0.011

№ слайда 28 1 Вход с помощью программы putty.exe: 1 Вход с помощью программы putty.exe: 1.1И

Описание слайда:

1 Вход с помощью программы putty.exe: 1 Вход с помощью программы putty.exe: 1.1Имя сервера: nks-30t.sscc.ru 1.2 Логин: 1.3 Пароль: 2. Панельный файловый менеджер: mc 3. Создать в домашней директории папку для своей работы 4. Скопировать себе примеры (содержимое папки ~/examples) 5. Запустить пример: qsub run.sh 6. Смотреть очередь: qstat 7. Удалить задачу из очереди: qdel <jobID> 8. Компиляция программы mpiexample.cpp: mpiicpc –o mpiexample.exe mpiexample.cpp 9. Компиляция программы mpiexample.c: mpiicc –o mpiexample.exe mpiexample.c

№ слайда 29

Описание слайда:

№ слайда 30 #!/bin/bash #!/bin/bash #PBS -V #PBS -r n #PBS -l nodes=<количество узлов>

Описание слайда:

#!/bin/bash #!/bin/bash #PBS -V #PBS -r n #PBS -l nodes=<количество узлов>:ppn=<количество процессов на узле>,cput=00:10:00,walltime=15:00 #PBS -k oe #PBS -N name_of_the_job #PBS -j oe date cd $PBS_O_WORKDIR pwd mpirun -r ssh -genv I_MPI_DEVICE rdma -genv I_MPI_RDMA_TRANSLATION_CACHE disable -n <количество процессов MPI> <путь к исполняемому файлу> date

№ слайда 31 MPI: http://www.mpi-forum.org/ MPI: http://www.mpi-forum.org/

Описание слайда:

MPI: http://www.mpi-forum.org/ MPI: http://www.mpi-forum.org/

Скачать эту презентацию

Презентации по предмету

Введение в параллельное программирование 2

Введение в Visual Basic

Последовательное и параллельное соединения проводников

Объектно-ориентированное программирование С++

Введение в астрономию

Введение в предмет

Программирование. Паскаль.

Введение в теорию графов

Введение. Что изучает наука биология

Основы логики Введение

Введение в информатику

Введение в программирование

Презентация на тему: Введение в параллельное программирование

Алгоритмы с ветвящейся структурой. Программирование ветвлений на QBasic

Многопоточное программирование в OpenMP

Параметрическое линейное программирование

Диаграммы

Программирование II

Иерархия памяти CUDA

Алгоритмы с ветвящейся структурой. Программирование ветвлений на QBasic

Многопоточное программирование в OpenMP

Параметрическое линейное программирование

Диаграммы

Программирование II

Иерархия памяти CUDA

Параллельное программирование с использованием технологии MPI

Программирование

Переменные, операции, выражения

Очевидное – невероятное (Sphinx tips-n-tricks)

Элементы для Flash-приложений на языке haXe. Библиотека Sparkle

Основы программирования под Windows