# Python環境を設定しよう

Pythonのプログラミング環境を整えるには、いくつかの方法があり、一口にどれが正解とは言いづらい。当然ながら、最も単純な方法はPythonをインタプリタを直接OSにインストールしてしまう方法になる。この場合、Pythonの公式ページからインストーラをダウンロードしてきて、インストーラの指示に従ってインストールをすることになる。

Pythonの公式ページ (英語): <https://www.python.org/>

また、MacやLinux (UbuntuやCentOS)等を使っていれば、特に上記のウェブページからインストールをしなくても、ターミナル環境から

```{code-block} shell
python
```

と入力をすることで、Pythonのインタプリタが立ち上がるだろう。

```{admonition} コンパイラとインタプリタ
上記の説明では、突然「インタプリタ」という言葉を使ってしまった。情報科学を体系的に勉強したことがあれば、それほど戸惑わないかもしれないが、ここではインタプリタとコンパイラの違いについて、少し述べておく。

まず、コンパイラ、というのは人間が理解できるプログラムのソースコードを機械語に翻訳して、コンピュータ上で実行できるようにするためのソフトウェアを指す。例えばC言語であれば、GNU GCCやLLVM Clangなどのコンパイラを用いて、ソースコードを機械語に翻訳する。C言語以外にも、JavaやC#, Go, Rustなどの言語がコンパイラを用いる言語で、これらの言語は一度機械語に翻訳してしまえば、コンピュータが機械語の内容を読み取って次々に処理を実行していくので、一般的に言って計算速度が速い、という特徴がある。

一方で、インタプリタは、プログラムのソースコードを1行ずつ読み取って、機械語に変換する。こうすることで、ソースコードを完璧に作り込んでから実行する、という使用法に加え、プログラマがコードを入力しては結果を確認するというインタラクティブな使用が可能となり、簡単なプロトタイプのプログラムを作りたい場合などには、こちらの方が好まれることが多い。最近は、インタプリタを用いる言語 (Pythonの他、RubyやJavaScript)なども、様々な工夫によって実行速度が改善してきてはいるが、それでも、コンパイラを用いる言語と比べて、実行速度は劣る。

それぞれの特徴を理解した上で使い分けることが重要だ。
```

## 仮想開発環境とパッケージ管理

Pythonを単に使ってみたいというだけなら、OSに直接インタプリタをインストールしてしまうのが一番簡単なのだが、Python (に限らず他のプログラミング言語でも)には、いくつかのバージョンがあり、現在はPython 3.x系が一般に使われているが、バージョンによって使えるライブラリが異なることがある。

そんな時、Pythonの実行環境をOSに直接作ってしまうと、あるプロジェクトAで使うライブラリはPython 3.6で使えていたのに、別のプロジェクトBではPython 3.10でないと動かないライブラリを使いたい、というような状況が発生する。そんな時、Python 3.6が使える環境と、Python 3.10が使える環境を別々に用意することができると利便性が高い。

このようにOSの上で、複数の異なるバーションのPythonを備えた開発環境を管理する仕組みを**仮想開発環境**と呼ぶ。Python用の仮想開発環境を作るソフトウェアは複数あり、代表的な物では、
* virtualenv: <https://virtualenv.pypa.io/en/latest/>
* Anaconda (Miniconda): <https://www.anaconda.com/products/distribution>
* Pipenv: <https://pipenv.pypa.io/en/latest/>

などがある。

ただ、ここで注意しないといけないのは、上記の3つの中でvirtualenvは複数の異なるPythonのバージョンを管理するための仕組みであるのに対して、Anaconda (Miniconda)とPipenvは仮想開発環境の管理とは別に**パッケージ管理ツール**としての役割も持っている。

仮想開発環境とは関係がなく、Python向けのパッケージ管理ツールとして最も著名な物は**Pip**と呼ばれるもので、上記の3つの中ではPipenvはvirtualenvによる仮想開発環境の管理とPipによるパッケージ管理を同時に行ってくれる。

2023年現在、多くの研究プロジェクトで使われており、またPytorchやTensorFlowといった深層学習用のライブラリの導入を管理しやすいという理由から**本講義では、Anaconda (Miniconda)を用いる**。

## AnacondaとMiniconda

鋭い読者はさっきから、逐一Anaconda (Miniconda)と書いていることに違和感を覚えているに違いない。結論から先に言えば、このどちらかを使うのであれば、玄人的にはMinicondaをおすすめする。

AnacondaはPythonのインタプリタの他に、科学技術計算等に一般的に用いられるNumPyをはじめとする大量のライブラリを一緒にインストールしてくれるという点で、特に自分で必要なライブラリをチェックしなくても、大体のプロジェクトにおいて使えるという点では優れている。

その一方で、Anacondaの仮想環境を一つ用意すると、それなりにストレージ (HDDやSSDのこと)の容量を圧迫するため、自分で必要なライブラリのチェックができるようになってしまえば、Minicondaの方が使い勝手が良いと感じている。MinicondaはPython
のインタプリタさえインストールしないことも可能 (だが、そういう使い方をすることは希)で、必要なライブラリと、そのライブラリと依存関係を持つライブラリだけを最小設定でインストールするため、ストレージの無駄遣いが防げる。

特に、受講者は自分のノートPCで作業をしていることを想定すると、ストレージの容量はそれほど多くないだろうから、Minicondaの方が、その点からも好ましいと言えるだろう。

### Minicondaの導入

Minicondaを導入するには<https://docs.conda.io/en/latest/miniconda.html>にアクセスし、自分のOSにあったインストーラをダウンロードしてくれば良い。

### Minicondaによる仮想開発環境の作成

```shell
conda create -n sds-1284-ml python=3.9
```

```shell
conda env create -f environment.yaml
```

## IPythonの利用

NumPyの解説に入る前に、以下で用いるIPython環境について簡単に触れておく。IPythonとはInteractive Pythonの略でWindowsならコマンドプロンプトかPowerShell, Mac/Linuxならターミナルを開いて、

```shell
ipython
```

と打ち込むと、

```python
In [1]: 
```

のように表示されて、Pythonのコマンドを打ち込めるようになる。試しに電卓として以下のような計算を試してみよう。

```python
In [1]: 1 + 2  # Enterを押す(以下では省略する)
Out[1]: 3
```

上記の通り`1 + 2`の計算結果が正しく表示されることが分かる。また、変数に対する代入などといったPythonで普通に行える操作は使い勝手の善し悪しはあるももの、全て使用可能である。

```python
In [2]: a = 1

In [3]: b = 2

In [4]: a + b
Out[4]: 3
```

なお、以下では特別な理由がない限り`In [1]:`や`Out [1]`のような表記は省略するので注意すること。