# Python MPI介绍

### 问题：
● 并行计算是什么?

● 不同的并行计算方法有哪些?

● 不同的方法有哪些优点和缺点?

### 目标：
● 解释并行计算的基础知识。

# 定义

### 程序
驻留在磁盘上的可执行文件。

### 进程
一个或多个程序的执行实例。进程有单独的地址空间。

### 任务
在MPI中，进程有时称为任务，但它们是可互换的。我们总是使用“进程”而不是“任务”。

### 线程（或轻量进程）
一个进程内的一个或多个控制线程。线程共享相同的地址空间。


![image.png](attachment:image.png)

# 并行计算是什么？
传统上，软件是为串行计算而编写的:

● 一个问题被分解成一系列离散的指令。

● 指令按顺序执行。

● 在单处理器上执行。

● 只有一条指令可以在任何时刻执行。

![image.png](attachment:image.png)

简单的说，并行计算是同时使用多个计算资源来解决一个计算问题:

● 一个问题被分解成可以同时解决的离散部分。

● 每一部分都被进一步细分为一系列的指令。

● 每个部分的指令在不同的处理器上同时执行。

● 采用整体控制/协调机制。

![image.png](attachment:image.png)

# 我们为什么需要并行编程?
需要解决更大的问题，需要更多的内存计算，需要大量的大量数据。

并行编程提供了：

● 更多的CPU资源

● 更多的内存资源

● 用串行程序解决不了的问题

● 能够更快地解决问题

# 两种基本的方法

# 共享内存计算机 
● 所使用的大多数笔记本电脑/ PCs

● 多核(CPUs)

● 共享一个全局内存空间

● 核心可以有效地交换/共享数据

![image.png](attachment:image.png)

# 分布式内存(ex. Compute集群)
● 具有多个核的节点集合

● 每个节点都使用自己的本地内存

● 一起解决一个问题

● 通过消息在节点和核心之间进行通信

● 节点网络在一起

![image.png](attachment:image.png)

# 并行程序模型
基于指令的并行编程语言

● OpenMP(最广泛使用)

● 高性能Fortran (HPF)

● 指令告诉处理器如何在处理器之间分配数据和工作

● 指令在串行代码中作为注释出现

● 在共享内存结构上运行

消息传递

● MPI(最广泛使用)

● 在进程之间传递消息以发送/接收数据

● 每个进程都有自己的局部变量

● 可以在共享内存或分布式内存结构上使用

# 优缺点
OpenMP的优点

● 比MPI更容易编程和调试

● 指令可以渐进的增加——渐进的并行化

● 仍然可以将程序作为串行代码运行

● 串行代码语句通常不需要修改

● 代码更容易理解，也更容易维护

OpenMP的缺点

● 只能在共享内存计算机中运行

● 需要一个支持OpenMP的编译器

● 主要用于循环并行化

MPI的优点

● 运行在共享内存或分布式内存结构上

● 可以用于比OpenMP更广泛的问题

● 每个进程都有自己的局部变量

● 分布式内存计算机比大型共享内存计算机便宜

MPI的缺点

● 从串行到并行需要更多的编程更改

● 更难调试

● 性能受节点之间的通讯网络的限制

# 并行编程问题
目标是减少执行时间

● 计算时间

● 空闲时间——等待来自其他处理器的数据

● 通信时间——处理器用来发送和接收消息的时间

负载平衡

● 将工作平均分配给可用的处理器

减少通信

● 减少传递的消息数量

● 减少在消息中传递的数据量

在可能的情况下——重叠通信和计算

许多问题只适用于数量有限的处理器

# Amdahl定律
![image.png](attachment:image.png)

在这里

● 加速是整个程序执行的理论加速

● n是并行线程/进程的数量

● P是可以并行计算的算法的一部分

基本上这是说加速程序的数量将会看到通过使用n核心是基于有多少的程序是串行的(只能在一个CPU内核上运行)又有多少的程序是平行的(可以在多个CPU内核之间拆分)。

![image.png](attachment:image.png)

# 编程方法
两种主要的方法：

SPMD——单程序，多数据流

● 每个处理器在不同的数据上执行相同的程序

● 一个并行执行假定多个协作进程执行程序的程序

● 最常见的并行编程风格和被MPI使用

MPMD——多个程序，多个数据流

● 多个处理器执行至少两个独立的程序

● 经理/员工的策略适合这种

● Web浏览器和Web服务器是一个例子

# MPI是什么?
MPI代表消息传递接口

● 函数库(C/ c++)或子例程(Fortran)

历史

● 上世纪80年代，早期的消息通过了Argonne的P4和Oak Ridge PVM

● MPI-1在1994年完成(1.1 - 1995,1.2 - ?，1.3 - 2008)

● MPI-2在1998年完成(2.1 - 2008,2.2 - 2009)

● MPI-3在2012年完成(3.1 - 2015)

● MPI-3功能逐渐被添加到MPI中实现

# 版本的差异
不同实现的例子 

● MPICH -由Argonne Nationa Labs开发(免费软件)

● MPI/LAM -由印第安纳州，OSC, Notre Dame开发(免费软件)

● MPI/Pro-付费软件

● Apple’s X Grid

● 兼容，线程安全的OpenMPI - MPI-2

各种实现的相似处

● 源代码兼容性(并行I/O除外)

● 程序应该按原样编译和运行

● 支持异构并行结构

各种实现的差异

● 编译和链接的命令

● 如何启动一个MPI程序

● 并行I/O(从MPI-2)

● 调试以排除故障

# ！关键点
● 并行计算用于解决用传统方法过于庞大的问题

● 并行计算有各种各样的方法

● 不同的问题可能需要不同的方法

● Amdahl定律定义了并行计算性能改进的极限