MPI

Message Passing Interface

[http://www.mpi-forum.org/ MPI Forum]
[http://accc.riken.jp/HPC/training/text.html 並列プログラミング入門　ＭＰＩ版] (青山幸也) . 「虎の巻」．理研で定期的に講習会が開かれているが，そのテキスト．
[http://www.cs.usfca.edu/mpi/ Parallel Programming with MPI] (Peter Pacheco) . MPIの解説書だが，並列プログラミングの教科書としてもよい．翻訳されている．

並列プログラミング用のメッセージ通信ライブラリの標準規格．

MPI-1 (1994)
MPI-1.1 (1995)
MPI-2.0/MPI-1.2 (1997)
MPI-1.3 (2008)
[http://www.mpi-forum.org/mpi2_1/index.htm MPI-2.1] (2008)

1990 年初頭，各ベンダは独自の並列通信ライブラリを提供していたため，ユーザプログラムのポータビリティ問題が深刻化していた．そこで，アメリカの国立研究所，並列計算機ベンダが中心となり，仕様が策定された（この時点では国内メーカも割と積極的にかかわっていたのでは？）．MPI-1で重要だったポイントは、仕様と同時にMPICHというリファレンス実装が提供されたこと。これにより普及が進んだ。現在，基本仕様である MPI-1 とその拡張仕様である MPI-2 が定められている．MPI-2はリファレンス実装が提供されなかったことから、なかなか普及が進まなかった（し、仕様が複雑になり、あいまいな点も多い）。2000年代後半になってきて、実装がMPICH2とOpenMPI系にほぼ集約された。そして、特にフォールトトレランス系のMPI研究者が中心となって、MPI-3策定の動きが出てきた。そして、2008年になり、MPI-1.3、MPI-2.1がリリースされた。MPI-2.1はいままで分かれていたMPI-1.xとMPI-2.0のドキュメントをマージし、エラッタを反映したものである。

MPI-2.1に続くMPI-2.2では、仕様／実装に大きな変更を伴わない変更が議論されている。

MPI-3.0に向けて議論されているのは、ABIの共通化（商用アプリのベンダからの要求が高いが、ライブラリ実装者は乗り気ではなく、実現の目処は疑問視）、ノンブロッキングコレクティブ（などP2Pにはあるけどcollectiveにない機能を実現する）、フォールトトレランス機能など。多くのワーキンググループが走っている。仕様の肥大化が懸念され、サブセット定義の動きも。

[http://www.nccs.gov/2007/12/04/forum-to-upgrade-mpi-standard/ Forum to Upgrade MPI Standard] (NCCS)
[http://meetings.mpi-forum.org/MPI_3.0_main_page.php MPI 3.0 Standardization Effort]

MPI は，実行モデルとして SPMD (Single Program Multiple Data) を想定した通信ライブラリである．

つまり，同一のプログラムを複数の計算ホスト(プロセス)で実行する．それぞれの計算ホストはそれぞれ独自のデータを持つ．通信ライブラリでデータ交換，同期を行う．
- より具体的にいうとリモートシェル(SSH，rsh)によって各計算ホスト上でプロセスを実行し，ソケット(共有メモリ，etc)により通信する．
MPI-1 は，コミュニケータと呼ばれるコンテキストによる通信，アプリケーション記述を容易にする集合通信機能(collective communication: バリア同期，スキャッタ/ギャザ，全交換，リダクション)を提供する．MPI-2 は，MPI-1 の機能に加えて，リモートメモリアクセス(One-sided Communication)，動的プロセス生成，並列I/O (>> MPI-IO)を提供する．
- mpirunは仕様に定められていなかったので、独自拡張がいろいろなされたりしたが、MPI-2でmpiexecが提案された。
コミュニケータは，通信に必要なコンテキスト，プロセスグループ，仮想トポロジ，属性(名前と値の組)を保持する．全プロセスは MPI_COMM_WORLD に所属する．
- 各プロセスはコミュニケータ内での識別子として rank を持つ．
- メッセージの Send/Receive には相手の rank を指定する．Receive はMPI_ANY_SOURCE (ワイルドカード)を指定することによって送信元を特定せずに受信することも可能．
Point-to-Point通信．
- non-blocking 通信にはデータ通信の並列度を上げる，デッドロックを防ぐという利点がある．
- blocking は bsend/brecv, ssend/srecv, rsend/rrecv で，non-blocking は isend/irecv．non-blocking 関数では，MPI_Request ハンドラを引数に渡す必要がある．MPI_Wait*/Test* で完了を待つ．
- 呼出し側で処理が完結する関数を local(send だと bsend とか)，完結しないものを non-local と呼ぶ．
データは<アドレス，カウント，データ型>によって記述される．C/FORTRAN の基本型(MPI_INT，MPI_FLOAT，etc)の他に構造体のようなユーザ定義の派生型も利用できる．
- MPIはあくまでライブラリでコンパイラと連動しているわけじゃないので，派生型を使って通信する場合には，その型情報をライブラリに教える仕組みが必要である．
- Send/Receive 時に型を示すタグを指定して，メッセージを送受信する．MPI_ANY_TAG を指定すれば，受信時の型チェックはしない．
- MPI_ANY_SOURCE/MPI_ANY_TAG でメッセージを受信しても status を見れば，送信元やタグを知ることができる．エラーも status の中．

オープンソース実装 . MPICH と LAM/MPI が有名．MPICH はポータビリティを重視しており，いろいろな派生実装が存在する．一般的に性能は LAM/MPI の方がよい． Linux 版は MPICH より LAM/MPI の方が安定してたらしい．RedHatLinux にも LAM/MPI が標準で含まれている．

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

MPI

Clone this wiki locally