# Python の基礎 1（データ構造と制御構文）


本章ではプログラミング言語 Python の基礎的な文法を学んでいきます。  

次章以降で登場するコードを理解するために必要な最低限の知識を習得することがゴールです。  
詳細な知識を確認したい場合には、[Python公式チュートリアル](https://docs.python.jp/3/tutorial/index.html)を参照してください。  


## 本章の構成
- Python のバージョンについて
- 必要な準備
- Google Colaboratory の基本
- Colab の基本的な使い方
- Python の特徴
- Python 基礎（データ構造）
- 制御構文

## Python のバージョンについて
Python には 2 系と 3 系といった 2 つのバージョンがあります。それぞれ基本的な機能は同じですが互換性のない部分があるので、本カリキュラムでは 3 系である **Python 3.6** 以上を前提とした解説を行っています。  

## 必要な準備

本カリキュラムで使用するコードを実行するにあたって Google Colaboratory というサービスの利用を推奨します。  

本章ではまず、 **Google Colaboratory** の利用方法を説明します。  
必要な事前準備は下記２点です。  

- Google アカウント（お持ちでない場合は[こちら](https://accounts.google.com/signup)から作成）
- [Chrome](https://www.google.com/chrome/) もしくは [Firefox](https://www.mozilla.org/ja/firefox/new/) のインストール

## Google Colaboratory の基本

Google Colaboratory（以下 Colab ）は、クラウド上で [Jupyter Notebook](https://jupyter.org/)  環境を提供する Google のウェブサービスです。Jupyter Notebook はブラウザ上で主に以下のようなことが可能なオープンソースのウェブアプリケーションであり、データ分析の現場や研究、教育などで広く用いられています。

- プログラムを実行と、その結果の確認
- Markdown と呼ばれる文章を記述するためのマークアップ言語を使った、メモや解説などの記述の追加

Colab では無料で GPU も使用することができますが、そのランタイムは**最大 12 時間**で消えてしまうため、長時間を要する処理などは別途環境を用意する必要があります。
学びはじめのうちは、数分から数時間程度で終わる処理がほとんどであるため、気にする必要はありませんが、本格的に使っていく場合は有料のクラウドサービスを利用するなどして、環境を整えるようにしましょう。

以降では、その基本的な使い方を説明します。

### Colab を開く

まずは以下の URL にアクセスして、ブラウザで Google を開き、自分のアカウントにログインしてください。

[https://www.google.com/](https://www.google.com/)

ログインが完了したら、下記に沿って、Google Drive のページに移動します。Google Drive とはファイルなどを保存することのできるオンラインストレージサービスになります。  

![Google Drive](http://drive.google.com/uc?export=view&id=1Or_pv96EGJkbuf0AGdGEydnrKGKKTgD_)

Google Drive の右上にある「新規」ボタンをクリックし、下記の手順に沿って、Google Colaboratory を使用できるようにアプリの追加を行います。  

![Google Drive2](http://drive.google.com/uc?export=view&id=12bKg9Khqyv5PpK9bFf57wrl4k_aRlqVu)

![Google Drive3](http://drive.google.com/uc?export=view&id=1pVcvg_2q_VTj0_DJqoybL3wUswCAgwe0)

![Google Drive4](http://drive.google.com/uc?export=view&id=1h4GwCJT7oARQkCAjRTcu5CVlOUlf6INW)

これで Google Drive から Colab を使用することができるようになりました。  
Google Drive 内に作業フォルダを作業して、資料をアップロードしましょう。フォルダの作成やファイルのアップロードを行うためには画面上で右クリックすると、選択肢が表示されます。  

![作業フォルダ](http://drive.google.com/uc?export=view&id=1fdx3c3nc4odWe1Qmyvyawf1sJ5VtW0sH)

![ファイルのアップロード](http://drive.google.com/uc?export=view&id=1Aw7IjHbdHPnyJ1dkEEjMI9kkx_IrD3pG)

アップロードしたファイルをクリックし、ファイルを開きます。下記の画面が表示されればプログラミングを開始することができます。  

![Jupyter Notebook にアクセス](http://drive.google.com/uc?export=view&id=1YuRzAB8jdGTR0u8bO7mcMhK_7xqKYudn)

プログラミングを開始するためには右上にある「接続」ボタンをクリックし、ノートブックをサーバーに接続します。  

もし、新規のノートブックを開く際には、下記の手順に沿ってファイルを作成します。  

![Colab 上で Jupyter Notebook を開く](http://drive.google.com/uc?export=view&id=1X0HmbQicnQRT43o2dd8pTaDpNehNijnD)

### 本資料の活用方法

Colab 上ではコードの実行、メモの記入などを行うことができます。  
本資料の活用は下記の使用方法を推奨します。  

1. `Shift + Enter` でコードの実行結果を確認しながら、それぞれのコードの意味を理解する
2. 気になった点などメモを取る
3. 練習問題で学んだ内容をプログラミングし、内容の理解を確認する

資料を読むだけではなく、実際にコードを実行し、その実行結果を確認することにより、より理解が深まります。また、項目ごとに復習のための練習問題を用意されているので、そちらで実際にプログラミングし、自身の理解度の確認に活用してください。  

## Colab の基本的な使い方

Colab 上の Jupyter Notebook を以降、単に**ノートブック**と呼びます。  

ノートブックは、複数の**セル**と呼ばれるブロックを持つことができます。
新しいノートブックを作った直後では、何も書かれていないセルが一つだけ存在している状態になっています。
セルの内側のどこかをクリックすると、そのセルを選択することができます。

セルには、**コードセル**と**テキストセル**の 2 種類があります。
**コードセル** は Python のコードを書き込み、実行するためのセルであり、**テキストセル**は、Markdown 形式で文章を書くためのセルです。

それぞれのセルタイプについてもう少し詳しく説明をします。

### コードセル

コードセルは、Python のコードを書き込み、実行することができるセルです。
実行するには、コードセルを選択した状態で、`Ctrl + Enter` または `Shift + Enter` を押します。
試しに、下のセルを選択して、`Shift + Enter` を押してみてください。

In [128]:
print('Hello world!')

Hello world!


すぐ下に、Hello world! という文字列が表示されました。
上のセルに書き込まれているのは Python のコードで、与えられた文字列を表示する関数である `print()` に、`'Hello world!'` という文字列を渡しています。
これを今実行したため、その結果が下に表示されています。

プログラミング言語の Python については、後ほどより詳しく解説します。

### テキストセル

テキストセルでは、Markdown 形式で記述された文章を扱います。
試しに、このセルをダブルクリックしてみてください。
テキストセルが編集モードになり、Markdown 形式で文章を装飾するための、先程までは表示されていなかった記号が見えるようになります。

その状態で `Shift + Enter` を押してみましょう。  

もとの文章の表示に戻ります。

### Colab から Google Drive を使う

Google Drive を Colab で開いたノートブックから利用することができます。
ノートブック中でコードを実行して作成したファイルなどを保存したり、逆に Google Drive 上に保存されているデータを読み込んだりすることができます。

Colab 上のノートブックから Google Drive を使うには、Colab 専用のツールを使って、`/content/drive` というパスに現在ログイン中の Google アカウントが持っている Google Drive のスペースをマウントします。

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


このノートブックを Colab で開いてから初めて上のコードセルを実行した場合は、以下のようなメッセージが表示されます。

![please authorize](http://drive.google.com/uc?export=view&id=1X_kMmn7DJa0PEFSdy7OPEW2Z1_pK0jmm)

指示に従って表示されているURLへアクセスしてください。
すると、「アカウントの選択」と書かれたページに飛び、すでにログイン済みの場合はログイン中の Google アカウントのアイコンやメールアドレスが表示されています。
利用したいアカウントをクリックして、次に進んで下さい。
すると次に、`Google Drive File Stream が Google アカウントへのアクセスをリクエストしています` と書かれたページに飛びます。

![access request](http://drive.google.com/uc?export=view&id=1wp9JNxdeMZRm2w5W2ASNvScVu3_btTaz)

右下に「許可」と書かれたボタンが見えます。
こちらをクリックしてください。
すると以下のように認証コードが記載されたページへ移動します。

![access code](http://drive.google.com/uc?export=view&id=16AFfON1KzRaqmTyaxJltg0tyZy74mFJM)

（この画像では認証コード部分をぼかしています）
このコードを選択してコピーするか、右側にあるアイコンをクリックしてコピーしてください。

元のノートブックへ戻り、`Enter your authorization code:` というメッセージの下にある空欄に、先程コピーした認証コードを貼り付けて、Enter キーを押してください。

**Mounted at /content/drive** と表示されたら、準備は完了です。

以下のセルを実行して、自分の Google Drive が Colab からアクセス可能になっていることを確認してください。

In [3]:
# 'My Drive'の表記が出ていればマウントがうまく行われています。
!ls 'drive/'

MyDrive  Othercomputers


上のセルで実行しているのは Python のコードではありません。
Jupyter Notebook では、コードセル中で `!` が先頭に付いている行は特別に解釈されます。`!ls` は、次に続くディレクトリの中にあるファイルまたはディレクトリの一覧を表示せよ、という意味です（注釈 1）。  

本資料では基本的に使用する CSV ファイルなどはノートブックと接続しているサーバーに直接ファイルをアップロードする方法を取りますが、ファイルを Google Drive 内に保存し、そのファイルを使用したい方はこちらの方法でファイルの操作を行ってください。  

（*注釈 1 : `ls` はシェルコマンドの 1 つです。*）

### Colab の便利なショートカット

Colab を使用中に、セルのタイプの変更やセルの複製・追加などの操作をする場合は、メニューから該当する項目を選ぶ方法以外に、キーボードショートカットを利用する方法もあります。

下記によく使う**ショートカットキー**をまとめておきます。
多くのショートカットキーは**二段階**になっており、まず `Ctrl + M` を押してから、それぞれの機能によって異なるコマンドを入力する形になっています。

| 説明                 | コマンド      |
| -------------------- | ------------- |
| Markdownモードへ変更 | Ctrl + M → M |
| Codeモードへ変更     | Ctrl + M → Y |
| セルを上に追加       | Ctrl + M → A |
| セルを下に追加       | Ctrl + M → B |
| セルのコピー         | Ctrl + M → C |
| セルの貼り付け       | Ctrl + M → V |
| セルの消去           | Ctrl + M → D |

また、重要なショートカットキーとして、下記の 2 つがあります。これらのコマンドは `Ctrl + M` を入力する必要はありません。    

- セルの実行 : `Shift + Enter`
- コメントアウト : `Ctrl + /`

コメントアウトとは、コード中で実行時に無視したい行やコメントを選択した状態で行う操作です。
Python では、`#` の後に続く文字列は全て、コメントとして無視され、実行時に評価されることはありません。

###  GPU を使用する

Colab では GPU を無料で使用することができます。
初期設定では GPU を使用しない設定となっているため、GPU を使用する場合は設定を変更する必要があります。

GPU を使用する場合は、画面上部のタブの中の 「Runtime」 (または「ランタイム」) をクリックし、「Change runtime type」 (または「ランタイムのタイプを変更」)を選択します。  

そして、下記の画像の様に 「Hardware accelerator」  (または「ハードウェアアクセラレータ」)を GPU に変更します。  

![GPUの設定](http://drive.google.com/uc?export=view&id=12j6SHcd5aw_Hw4huvfMFAzN_VHHsA0d5)

これで Colab 上で GPU を使用できるようになりました。



これで、資料の本編に入っていく準備が完了しました。次の章では、Python というプログラミング言語の基本について解説します。

## Python の特徴

プログラミング言語には、Python 以外にも C 言語や Java、Ruby、R のように様々なものがあります。それぞれの言語がすべての用途に適しているわけではなく、しばしば用途によって得手不得手があります。  

本チュートリアルでは基本的に Python というプログラミング言語を扱います。
その理由は、Python はデータ解析・機械学習のためのパッケージが充実しており、データ解析や機械学習の分野で最もよく使われている言語だからです。  
また、Web アプリケーションフレームワークの開発も活発で、データ解析だけでなく Web サービス開発まで同じ言語で統一して行える点も魅力です。  



さらには、初学者にとっても学びやすい言語です。  
初学者がプログラミングを学び始めるときにつまづきがちな難しい概念が他の言語と比べ多くなく、入門しやすい言語といえます。  

まとめると、Python には  

- データ解析や機械学習によく使われている  
- Web アプリケーションの開発などでもよく使われている  
- 初学者がはじめやすい言語  

のような魅力があります。   


### 文法とアルゴリズム

プログラミングによってある特定の処理をコンピュータで自動化したい場合、**文法**と**アルゴリズム**の 2 つを理解しておく必要があります。

プログラムでは、まずはじめにコンピュータに命令を伝えるためのルールとなる**文法**を覚える必要があります。
文法を無視した記述があるプログラムは、実行した際にエラーとなり処理が停止します。そのため、文法はしっかりと理解しておく必要があります。

ただし、文法さえ理解していれば十分かというとそうではありません。一般的に、初学者向けのプログラミングの参考書では、この文法だけを取り扱うことも多いのですが、コンピュータに処理を自動化させることが目的であれば、文法だけでなく**アルゴリズム**も理解する必要があります。アルゴリズムとは、どういう順番でどのような処理をしていくかの一連の手順をまとめたものです。

この章では、アルゴリズムを学ぶ上での基礎となる Python の文法について紹介します。  
機械学習やディープラーニングで必要となるアルゴリズムについてはこれ以降の章で紹介します。

## Python基礎（データ構造）
データ構造を理解する上で必要となる以下５つに関して説明して行きます。  

- 変数  
- 変数の型  
- 算術演算子  
- 比較演算子  
- リスト、辞書、タプル  


### 変数

**変数 (variable)** とは、様々な値を格納することができる、**名前がついた入れ物**です。
この変数に値を格納したり、更新したりすることで、計算結果を一時的に保持しておくことができます。

それでは、`a` という名前の変数に、`1` を**代入**してみましょう。

In [4]:
a = 1

代入は `=` の記号を用います。
数学的には `=` は等しいという意味を持ちますが、Python では**「左辺の変数に、右辺の値を代入する」**という意味になります。

Jupyter Notebook 上では、変数名だけ、もしくは変数名を最後の行に記述したセルを実行すると、値を確認することができます。

In [5]:
a

1

このように、変数に格納されている値を確認することができました。
また、値を確認するための他の方法として、`print()` と呼ばれる**関数 (function)** を使用することもできます。
関数について詳しくは後述しますが、`print()` のように Python には予め多くの関数が定義されています。 そのような関数を**組み込み関数 (built-in function)** といいます。

In [6]:
print(a)

1


変数名だけをセルに記入して実行する場合と`print()`を利用する場合の違いについては、後述します。

変数につける名前は、コードを書く人が自由に決めることができます。
ただし、わかりやすい名前をつけることがとても大切です。
例えば、人の名前を格納するための変数が `a` という変数名だと、それがどのような使われ方をするのかを容易に類推することができません。
`name` という名前であれば、ひと目で見て何のための変数かが分かるようになります。
これは、自分のコードを読む他人や、未来の自分にとってコードを理解するための大きな手がかりとなります。

### 変数の型

プログラミングで扱う値には種類があります。
Python では、**整数 (integer)**、**実数 (real number)**、**文字列 (string)** などが代表的な値の種類です。
それぞれの種類によって、コンピュータ内での取扱い方が異なり、この種類のことは一般に**型 (type)** と呼びます。

例えば、整数、実数、そして文字列をそれぞれ別々の変数に代入するコードは以下のとおりです。

In [7]:
a = 1

In [8]:
b = 1.2

In [9]:
c = 'Python'

コンピュータの中での取り扱い方は異なりますが、Python では**変数の型を自動的に決定する**ため、初めのうちはあまり気にする必要はありません。
ただし、違う型同士の演算では場合によってエラーが発生するなどの問題が生じるため、簡単に型の特徴は把握しておく必要があります。

まずは、上記の `a`, `b`, `c` の型を確認する方法を紹介します。
型の確認は `type()` という組み込み関数を使用します。

In [10]:
type(a)

int

In [11]:
type(b)

float

In [12]:
type(c)

str

`a` は `int` という整数の型をもつ変数であり、`b` は `float` という実数の型をもつ変数です。
この `float` という型の名前は、コンピュータ内で実数を扱うときの形式である**浮動小数点数 (floating-point number)** に由来しています。

`c` は `str` という文字列の型をもつ変数であり、値を定義するにはシングルクォーテーション `' '` もしくはダブルクォーテーション `" "` で対象の文字列をくくる必要があります。

Python では、`.` を含まない連続した数字を `int`、直前・直後も含め `.` が含まれる連続した数字を `float` だと自動的に解釈します。
例えば、`7` や `365` は `int` ですが、`2.718`、`.25`、`10.` などは `float` になります。

実数の `0` は `0.0` とも `.0` とも `0.` とも書くことができます。

In [13]:
type(0)

int

In [14]:
type(0.)

float

In [15]:
type(.0)

float

例えば、実数の `5` は以下のように書くことができます。

In [16]:
type(5.0)

float

In [17]:
type(5.)

float

一方、`.5` と書くと、これは `0.5` の略記と解釈されることに注意してください。

In [18]:
type(.5)

float

In [19]:
print(.5)

0.5


また、Python では複数の変数に対する代入を一度に行うことができ、**複数同時の代入 (multiple assignment)** と呼びます。  




複数同時の代入は後の章で頻出するため、覚えておきましょう。

In [20]:
a, b = 1, 1.2

In [21]:
a, b, c = 1, 1.2, 'Python'

print(a,b,c)

1 1.2 Python


### 算術演算子

様々な計算を意味する**演算子**と呼ばれる記号があります。
はじめに紹介するのは**算術演算子 (arithmetic operator)** と呼ばれるもので、 2 つの変数または値を取り、 1 つの演算結果を返します。

代表的な演算として**四則演算（加算・減算・乗算・除算）**があります。
四則演算に対応する演算子として、Python では以下の記号が用いられます。

| 演算 | 記号 |
|------|------|
| 加算（足し算） | `+` |
| 減算（引き算） | `-` |
| 乗算（掛け算） | `*` |
| 除算（割り算） | `/` |

具体例を見ながら使い方を説明します。

In [22]:
# 整数と整数で加算 -> 結果は整数
1+1

2

このように、演算子を使う際には、**記号の両側に値を書きます。**
このとき、演算子の両側にひとつずつ空白を空けることが多いです。
文法的な意味はありませんが、コードが読みやすくなります。
この空白は Python のコーディング規約である [PEP8](https://www.python.org/dev/peps/pep-0008/#should-a-line-break-before-or-after-a-binary-operator) でも推奨されています。

In [23]:
1 + 1

2

値が代入されている変数との演算も下記のように行うことができます。

In [24]:
a + 2

3

また、`int` と `float` は異なる型同士ですが、計算を行うことができます。
`int` と `float` の演算結果の型は `float` になります。

In [25]:
# 整数と実数で加算 -> 結果は実数
a + b

2.2

他の演算子の例を示します。

In [26]:
# 整数と整数で減算 -> 結果は整数
2 - 1

type(2-1)

int

In [27]:
# 実数と整数で減算 -> 結果は実数
3.5 - 2

type(3.5-2)

float

In [28]:
# 整数と整数で乗算 -> 結果は整数
3 * 5

type(3*5)

int

In [29]:
# 実数と整数で乗算 -> 結果は実数
2.5 * 2

type(2.5*2)

float

In [30]:
# 整数と整数で除算 -> 結果は実数
3 / 2

type(3/2)

float

In [31]:
# 整数と整数で除算 -> 結果は実数
4 / 2

type(4/2)

float

Python 3 では、 `/` 記号を用いて除算を行う場合、除数（割る数）と被除数（割られる数）が整数であっても、計算結果として実数が返ります。
計算結果として実数を返す除算のことを特に、**真の除算 (true division)** と言います。
一方、商（整数部分）を返すような除算演算子として、 `//` 記号が用意されています。 `/` 記号を 2 回、間を空けずに繰り返します。計算結果として商を返す除算のことを、 **切り捨て除算 (floor division)** と呼びます。
商を計算したい場合に便利な演算子であるため、こちらも覚えておきましょう。

※ Python 2 では、除数も被除数も整数であった場合、 `/` 記号を用いても切り捨て除算が行われるので注意してください。

In [32]:
# 整数と整数で切り捨て除算 -> 結果は整数
type(3 // 2)
print(3 // 2)

type(3 % 2)
print(3 % 2)


1
1


In [33]:
# 整数と整数で切り捨て除算 -> 結果は整数
4 // 2

2

また、ここで注意すべき点として、整数や実数と文字列の演算は基本的にエラーになります。

In [34]:
# error
# a + c

**エラーメッセージを読みましょう。**

> TypeError: unsupported operand type(s) for +: 'int' and 'str'

と言われています。「+ にとって int と str はサポートされていない被作用子（ + が作用する対象のこと。operand）です」と書かれています。「int に str を足す」ということはできないというわけです。

`int` もしくは `float` と、 `str` の間の加算、減算、除算では上記のエラーが生じます。
ただし、`str` と `int` の**乗算**は特別にサポートされており、計算を実行することができます。

In [35]:
# str と int で乗算
c * 3

'PythonPythonPython'

上のコードは、`c` という文字列を `3` 回繰り返す、という意味になります。

`str` 同士は足し算を行うことができます。

In [36]:
name1 = 'Python'
name2 = 'チュートリアル'

name1 + name2

'Pythonチュートリアル'

整数と文字列を連結したいこともあります。
例えば、`1` という整数に、 `'番目'` という文字列を足して `'1番目'` という文字列を作りたいような場合です。
その場合には、型を変換する**キャスト (cast)** という操作をする必要があります。

何かを `int` にキャストしたい場合は `int()` という組み込み関数を使い、`str` にキャストしたい場合は `str()` という組み込み関数を使います。では、`1` という整数を `str` にキャストして、 `'番目'` という文字列と足し算を行ってみましょう。

In [37]:
1

1

In [38]:
type(1)

int

In [39]:
str(1)

'1'

In [40]:
type(str(1))

str

In [41]:
str(1) + '番目'

num='番目'
for i in range(0,5):
    print(str(i)+num)

0番目
1番目
2番目
3番目
4番目


また、`+=` や `-=` もよく使います。
これは、演算と代入を合わせて行うもので、**累積代入文 (augmented assignment statement)** と呼ばれます。

下記に示すとおり、`+=` では左辺の変数に対して右辺の値を足した結果で、左辺の変数を更新します。

In [42]:
# 累積代入文を使わない場合
count = 0
count = count + 1
count

1

In [43]:
# 累積代入文を使う場合
count = 0
count += 1
count

1

四則演算の全てで累積代入文を利用することができます。
つまり、`+=`, `-=`, `*=`, `/=` がそれぞれ利用可能です。

Python には、他にも幾つかの算術演算子が用意されています。
例えば以下の演算子です。

| 演算 | 記号 |
|------|------|
| 累乗 | `**` |
|  剰余　 | `%` |

`**` を使うと、$2^3$ は以下のように記述することができます。

In [44]:
# 累乗
print(2 ** 3)


8


`%` を使って、`9` を `2` で割った余りを計算してみましょう。

In [45]:
# 剰余
9 % 2

1

### 練習問題 算術演算子

算術演算子までで学んだ内容を復習しましょう。下記の内容を次のセルに記述し、実行結果を確認してください。（必要に応じてセルの追加を行ってください。）  

下記の内容を実行し、変数 `z` の値を確認して下さい。  

- 10 を 2 で掛けた計算結果を変数 `x` に格納
- 20 を 4 で割った計算結果を変数 `y` に格納
- `x` を `y` で割った計算結果を変数 `z` に格納

In [46]:
# 変数 x の計算
x = 10 * 2

In [47]:
# 変数 x の確認
print(x)

20


In [48]:
# 変数 y の計算
y = 20 / 4

In [49]:
# 変数 y の確認
print(y)

5.0


In [50]:
# 変数 z の計算
z = x / y

In [51]:
# 変数 z の確認
print(z)

4.0


#### 模範解答

In [52]:
# 変数 x の計算
x = 10 * 2

In [53]:
# 変数 x の確認
x

20

In [54]:
# 変数 y の計算
y = 20 / 4

In [55]:
# 変数 y の確認
y

5.0

In [56]:
# 変数 z の計算
z = x / y

In [57]:
# 変数 z の確認
z

4.0

### 比較演算子

比較演算子は、2 つの値の比較を行うための演算子です。

| 演算 | 記号 |
|------|------|
| 小なり | `<` |
| 大なり | `>` |
| 以下 | `<=` |
| 以上 | `>=` |
| 等しい | `==` |
| 等しくない | `!=` |

比較演算子は、その両側に与えられた値が決められた条件を満たしているかどうか計算し、満たしている場合は `True` を、満たしていない場合は `False` を返します。
`True` や `False` は、**ブール (bool) 型**と呼ばれる型を持った値です。
ブール型の値は `True` もしくは `False` の 2 つしか存在しません。

いくつかの比較演算子の計算例を示します。

In [58]:
1 < 2

True

In [59]:
# 型の確認
type(1 < 2)

bool

In [60]:
2 == 5

False

In [61]:
1 != 2

True

In [62]:
3 >= 3

True

In [63]:
'test' == 'test'

True

等しいかどうかを判定する比較演算子 `==` を使う際は、代入演算子 `=` と間違えないように気をつけてください。

### 複合データ型

これまでは `a = 1` のように 1 つの変数に 1 つの値を代入する場合を扱ってきましたが、複数の値をまとめて取り扱いたい場面もあります。
Python では複数の変数や値をまとめて扱うのに便利な、以下の 3 つの複合データ型があります。

- リスト (list)
- タプル (tuple)
- 辞書 (dictionary)

### リスト

複数の変数を `,` （カンマ）区切りで並べ、それらの全体を `[ ]` で囲んだものを **リスト (list)** と言います。
リストに含まれる値を**要素**と呼び、整数の**インデックス** （要素番号）を使ってアクセスします。

In [64]:
# リスト型の変数を定義
numbers = [4, 5, 6, 7]

# 値の確認
print(numbers)

[4, 5, 6, 7]


In [65]:
# 型の確認
type(numbers)

list

`numbers` には 4 つの数値が入っており、**要素数** は 4 です。
リストの要素数は、リストの**長さ (length)** とも呼ばれ、組み込み関数の `len()` を用いて取得することができます。
`len()` はよく使う関数であるため、覚えておきましょう。

In [66]:
# 要素数の確認
len(numbers)

4

リストの各要素へアクセスする方法はいくつかあります。
最も簡単な方法は `[]` を使ってアクセスしたい要素番号を指定して、リストから値を取り出したり、その位置の値を書き換えたりする方法です。
ここで、注意が必要な点として、Python では先頭の要素のインデックス番号が `0` である点があります。
インデックス番号 `1` は 2 番目の要素を指します。

In [67]:
# 先頭の要素にアクセス
numbers[0]

4

In [68]:
# 先頭から3番目の要素にアクセス
numbers[2]

6

In [69]:
# 2 番目の要素を書き換え
numbers[1] = 10

In [70]:
# 値の確認
numbers

[4, 10, 6, 7]

また、インデックスに負の値を指定すると、末尾からの位置となります。
要素番号 `-1` で最後の要素を参照することができます。

In [71]:
# 末尾の要素にアクセス
numbers[-1]

7

In [72]:
# 末尾から3番目の要素にアクセス
numbers[-3]

10

次に、リストから一度に複数の要素を取り出す操作である**スライス (slice)** を紹介します。
`開始位置:終了位置` のようにコロン `:` を用いてインデックスを範囲指定し、複数の部分要素にアクセスします。
このスライスの処理は、この後の章でも多用するため、慣れておきましょう。

例えば、先頭から 2 つの要素を取り出したい場合、以下のように指定します。

In [73]:
numbers[0:2]

[4, 10]

`開始位置:終了位置` と指定することで、開始位置から**終了位置のひとつ手前**までの要素を抽出します。
終了位置に指定したインデックスの値は含まれないことに注意してください。

また、指定する開始番号が `0` である場合、以下のような略記がよく用いられます。

In [74]:
numbers[:2]

[4, 10]

このように、先頭のインデックスは省略することができます。
このような記法を使う場合は、終了位置を示す数字を**取り出したい要素の個数**と捉えて、**先頭から 2 つを取り出す**操作だと考えると分かりやすくなります。

同様に、ある位置からリストの末尾までを取り出す場合も、終了位置のインデックスを省略することができます。
例えば、2 個目の要素から最後までを取り出すには以下のようにします。

In [75]:
numbers[1:]

[10, 6, 7]

この場合は、取り出される要素の個数は `len(numbers) - 1` 個となることに注意してください。

以上から、`numbers[:2]` と `numbers[2:]` は、ちょうど 2 個目の要素を境に `numbers` の要素を 2 分割した前半部分と後半部分になっています。
ここで、2 個目の要素自体は**後半部に含まれる**ということに注意してください。

また、開始位置も終了位置も省略した場合は、すべての要素が選択されます。

In [76]:
numbers[:]

[4, 10, 6, 7]

現状では、`numbers[:]` と `numbers` の結果が同じであるため、どのように使用するか疑問に思われるかも知れません。
しかし、後の章では NumPy というライブラリを用いてリストの中にリストが入ったような**多次元配列 (multidimensional array)** を扱っていきます。
そして多次元配列を用いて行列を表す場合には、`0 列目のすべての値`を抽出するために `[:, 0]` のような記法を用いるケースが登場します。
これは Python 標準の機能ではありませんが、Python 標準のスライス表記を拡張したものになっています。

リストは数値以外に、文字列を扱うこともでき、また複数の型を同一のリスト内に混在させることもできます。

In [77]:
# 文字列を格納したリスト
array = ['hello', 'world']
array

['hello', 'world']

In [78]:
# 複数の型が混在したリスト
array = [1, 1.2, 'Python']
array

[1, 1.2, 'Python']

リストにリストを代入することもできます。
また、Python 標準のリストでは入れ子になったリスト内の要素数がばらばらでも問題ありません。

In [79]:
array = [[1, 1.2, 'Python', True], [3.2, 'Tutorial']]
array

[[1, 1.2, 'Python', True], [3.2, 'Tutorial']]

リストを使う際に頻出する操作として、**リストへの値の追加**があります。
リスト型には `append()` というメソッドが定義されており、これを用いてリストの末尾に新しい値を追加することができます。

上記の `array` に値を追加してみましょう。

In [80]:
# 末尾に 2.5 を追加
array.append(2.5)

In [81]:
# 値の確認
array

[[1, 1.2, 'Python', True], [3.2, 'Tutorial'], 2.5]

また、今後頻出する処理として、**空のリスト**を定義しておき、そこに後段の処理の中で適宜新たな要素を追加していくという使い方があります。

In [82]:
# 空のリストを定義
array = []

# 空のリストに要素を追加
array.append('Python')
array.append('チュートリアル')

array

['Python', 'チュートリアル']

### タプル

**タプル (tuple)** はリストと同様に複数の要素をまとめた型ですが、リストとは異なる点として、定義した後に**中の要素を変更できない**という性質を持ちます。

タプルの定義には `( )`を用います。

In [83]:
# タプルを定義
array = (4, 5, 6, 7)
array

(4, 5, 6, 7)

In [84]:
# 型の確認
type(array)

tuple

タプルの定義する際に `( )` を使用したため、要素へのアクセスも `( )` を使うように感じるかもしれませんが、実際にはリストと同様 `[ ]` を使用します。

In [85]:
# 先頭の要素へアクセス
array[0]

4

In [86]:
# リストと同様、スライスも使用可能
array[:3]

(4, 5, 6)

先述の通り、タプルは各要素の値を変更することができません。
この性質は、定数項などプログラムの途中で書き換わってしまうことが望ましくないものをまとめて扱うのに便利です。

実際に、タプルの要素に値の書き換えを行うとエラーが発生します。

In [87]:
# error
# array[0] = 10

`tuple` のように中身が変更できない性質のことを**イミュータブル (immutable)**であると言います。反対に、`list` のように中身が変更できる性質のことを**ミュータブル (mutable)**であると言います。

### 辞書

リストやタプルでは、複数の値をまとめて扱うことができました。
そこで、定期テストの結果をまとめることを考えてみましょう。

例えば、数学 90 点、理科 75 点、英語 80 点だったという結果を `scores = [90, 75, 80]` とリストで表してみます。
しかし、これでは**何番目がどの教科の点数に対応するか**、一見して分かりにくいと思われます。

Python の `dict` 型は、**キー (key)** とそれに対応する**値 (value)** をセットにして格納することができる型であり、このようなときに便利です。

リストやタプルでは、各要素にアクセスする際に整数のインデックスを用いていましたが、辞書ではキーでインデックス化されているため、整数や文字列など、色々なものを使って要素を指定することができます。

辞書は `{}` を用いて定義し、要素にアクセスする際には、リストやタプルと同様に `[ ]` を使用し、`[ ]` の中にキーを指定して対応する値を取り出します。

In [88]:
# 辞書を定義
scores = {'Math': 90, 'Science': 75, 'English': 80 }
scores

{'Math': 90, 'Science': 75, 'English': 80}

In [89]:
# key が Math の value にアクセス
scores['Math']

90

In [90]:
# key に日本語を使用することも可能
scores = {'数学': 90, '理科': 75, '英語': 80}
scores

{'数学': 90, '理科': 75, '英語': 80}

In [91]:
scores['数学']

90

他の人が定義した辞書に、**どのようなキーが存在するのか**を調べたいときがあります。
辞書には、そのような場合に使える便利なメソッドがいくつか存在します。

- `keys()`: キーのリストを取得。`dict_keys` というリストと性質が似た型が返る
- `values()`: 値のリストを取得。`dict_values` というリストと性質が似た型が返る
- `items()`: 各要素の `(key, value)` のタプルが並んだリストを取得。`dict_items` というリストと性質が似た型が返る

In [92]:
# キーのリスト
scores.keys()

dict_keys(['数学', '理科', '英語'])

In [93]:
# 値のリスト
scores.values()

dict_values([90, 75, 80])

In [94]:
# (キー, 値)というタプルを要素とするリスト
scores.items()

dict_items([('数学', 90), ('理科', 75), ('英語', 80)])

`dict_keys`, `dict_values`, `dict_items` と新しい型が登場しましたが、これは辞書型特有の型であり厳密には標準のリストとは異なりますが、リストと性質の似た型であるという程度の認識で問題ありません。

辞書に要素を追加する場合は、新しいキーを指定して値を代入します。

In [95]:
scores['国語'] = 85

In [96]:
scores

{'数学': 90, '理科': 75, '英語': 80, '国語': 85}

また、既に存在するキーを指定した場合には、値が上書きされます。

In [97]:
scores['数学'] = 95

In [98]:
scores

{'数学': 95, '理科': 75, '英語': 80, '国語': 85}

## 制御構文

複雑なプログラムを記述しようとすると、繰り返しの処理や、条件によって動作を変える処理が必要となります。
これらは**制御構文**を用いて記述します。

ここでは最も基本的な制御構文を 2 つ紹介します。

- 繰り返し (`for`, `while`)
- 条件分岐 (`if`)

Python の制御構文は、**ヘッダ (header)** と **ブロック (block)** と呼ばれる 2 つの部分で構成されています。
これらを合わせて **複合文 (compound statement)** と呼びます。

![ヘッダーとブロック](http://drive.google.com/uc?export=view&id=1N21zKWGVpnZl9G200DNNDjO6yukiunB-)

上図に示すように、制御構文ではヘッダ行に `for` 文や `if-else` 句を記述し、行末に `:` 記号を書きます。次に、ヘッダ行の条件で実行したい一連の処理文を、ブロックとしてその次の行以降に記述していきます。その際、 **インデント (indent)** と呼ばれる空白文字を先頭に挿入することで、ブロックを表現します。同じ数の空白でインデントされた文がブロックとみなされます。
Python では、インデントとして**スペース 4 つ**を用いることが推奨されています。

### 繰り返し（ for 文）

同じ内容のメールを宛名だけ個別に変えて、1000 人に一斉送信したい場合など、繰り返す処理を記述する制御構文である `for` を使います。

![for文](http://drive.google.com/uc?export=view&id=18MNASdFX-ttjT5rrykbEw84YuAKUAhlr)

`for` 文の文法は上図のとおりです。

**イテラブルオブジェクト (iterable object)** とは、反復可能オブジェクトのことであり、要素を一度に 1 つずつ返せるオブジェクトのことを指します。
`range()` という組み込み関数を使うと、引数に与えた整数の回数だけ順番に整数を返すイテラブルオブジェクトを作ることができます。
`range(5)` と書くと、0, 1, 2, 3, 4 という整数 5 つを順番に返すイテラブルオブジェクトになります。

後述しますが、このイテラブルオブジェクトとして、リストやタプルも指定することができます。

In [99]:
# 5回繰り返す
for i in range(5):
    print(i)

0
1
2
3
4


上記の例では、イテラブルオブジェクトが1 つずつ返す値を変数 `i` で受け取っています。
最初は `i = 0` から始まっていることに注意してください。
最後の値も、`5` ではなく `4` となっています。
このように、`range()` に 1 つの整数を与えた場合は、その整数 - 1 まで 0 から 1 つずつ増えていく整数を順番に返します。

In [100]:
# 繰り返し処理が終わった後の値の確認
i

4

Jupyter Notebook では変数名をコードセルの最後の行に書いて実行するとその変数に代入されている値を確認できましたが、for 文の中のブロックでは明示的に `print()` を使う必要があります。
`print()` を用いないと、以下のように何も表示されません。

In [101]:
# 変数の値は表示されない
for i in range(5):
    i

for 文を使って、0 から始まって 1 ずつ大きくなっていく整数順番に取得し、これをリストのインデックスに利用すれば、リストの各要素に順番にアクセスすることができます。

In [102]:
names = ['佐藤', '鈴木', '高橋']

for i in range(3):
    print(names[i])

佐藤
鈴木
高橋


少し応用して、自動的に敬称をつけて表示してみましょう。

In [103]:
for i in range(3):
    print('{}さん'.format(names[i]))

佐藤さん
鈴木さん
高橋さん


つぎに、さらに汎用性の高いプログラムを目指します。

上記のコードに関して、汎用性が低い点として、`range(3)` のように `3` という値を直接記述していることが挙げられます。
この `3` はリストの要素の数を意味していますが、リストの要素の数が変わると、このプログラムも書き換える必要があり、手間がかかったり、ミスが発生する原因となったりします。

リスト内の要素の数は、組み込み関数である `len()` を用いて取得できるため、これを使用した汎用性の高いプログラムに書き換えましょう。

In [104]:
len(names)

3

In [105]:
for i in range(len(names)):
    print('{}さん'.format(names[i]))

佐藤さん
鈴木さん
高橋さん


これでリストの要素数に依存しないプログラムにすることができました。

また、リスト自体をイテラブルオブジェクトとして指定することにより、リスト要素数の取得も `[]` でのインデックス番号の指定もせずに、より可読性の高いプログラムを書くことができます。

In [106]:
# リストをイテラブルオブジェクトに指定
for name in names:
    print('{}さん'.format(name))

佐藤さん
鈴木さん
高橋さん


最初のケースと比べていかがでしょうか。
動作としては変わりがありませんが、可読性という観点も重要です。

リストをイテラブルオブジェクトとして指定した場合、要素番号を取得できませんが、状況によっては要素番号を使用したいことがあります。

そのような場合は、`enumerate()` という組み込み関数を使います。
これにイテラブルオブジェクトを渡すと、`(要素番号, 要素)` というタプルを 1 つずつ返すイテラブルオブジェクトになります。

In [107]:
for i, name in enumerate(names):
    message = '{}番目: {}さん'.format(i, name)
    print(message)

0番目: 佐藤さん
1番目: 鈴木さん
2番目: 高橋さん


`enumerate()` と同様、`for` 文と合わせてよく使う組み込み関数に `zip()` があります。

`zip()` は、複数のイテラブルオブジェクトを受け取り、その要素のペアを順番に返すイテラブルオブジェクトを作ります。
このイテラブルオブジェクトは、渡されたイテラブルオブジェクトそれぞれの先頭の要素から順番に、タプルに束ねて返します。
このイテラブルオブジェクトの長さは、渡されたイテラブルオブジェクトのうち最も短い長さと一致します。

In [108]:
names = ['Python', 'TensorFlow']
versions = ['3.7', '2.0.0']
suffixes = ['!!', '!!', '?']

for name, version, suffix in zip(names, versions, suffixes):
    print('{} {} {}'.format(name, version, suffix))

Python 3.7 !!
TensorFlow 2.0.0 !!


`suffixes` の要素数は 3 ですが、より短いイテラブルオブジェクトと共に `zip` に渡されたため、先頭から 2 つ目までしか値が取り出されていません。

### 練習問題 制御構文（ for 文）

制御構文までで学んだ内容を復習しましょう。下記の内容を次のセルに記述し、実行結果を確認してください。（必要に応じてセルの追加を行ってください。）  

下記の内容を実行し、リスト `c` の値を確認して下さい。  

- 1、2、3 が格納されたリスト `a` を定義
- 4、5、6 が格納されたリスト `b` を定義
- `a` と `b` の値を足し合わせ 5、7、9 の値を持つリスト `c` を獲得

*ヒント*  

方法は 1 つではありません。スライスや for 文など様々な方法を試してみて下さい。

In [109]:
# リスト a の定義


In [110]:
# リスト b の定義


In [111]:
# リスト c の獲得


#### 模範解答

In [112]:
# リスト a の定義
a = [1, 2, 3]

In [113]:
# リスト b の定義
b = [4, 5, 6]

for 文を使用せず、インデックスを指定して、値を抽出し単純に足し合わせることでも値を取得することが可能です。

In [114]:
# リスト c の獲得 1
c = [a[0] + b[0], a[1] + b[1], a[2] + b[2]]
c

[5, 7, 9]

In [115]:
# リスト c の獲得 2
c = [] # 空のリスト
for _a, _b in zip(a, b): # 複数のリストを繰り返す場合は zip() を使用
    _c = _a + _b
    c.append(_c) # リスト c に値を追加

In [116]:
c

[5, 7, 9]

### 条件分岐（ if 文）

`if` は、指定した条件が `True` か `False` かによって、処理を変えるための制御構文です。

![if文](http://drive.google.com/uc?export=view&id=1ZeiVxZ8DYs5leMU7HdkVAiZ3LbsaNVyF)

`elif` と `else` は任意であり、`elif` は 1 つだけでなく複数連ねることができます。

例えば、0 より大きいことを条件とした処理を書いてみます。

In [117]:
# if の条件を満たす場合
a = 1

if a > 0:
    print('0より大きいです')
else:
    print('0以下です')

0より大きいです


In [118]:
# if の条件を満たさない場合
a = -1

if a > 0:
    print('0より大きいです')
else:
    print('0以下です')

0以下です


また、`if` に対する条件以外の条件分岐を追加する場合は、下記のように `elif` を使います。

In [119]:
a = 0

if a > 0:
    print('0より大きいです')
elif a == 0:
    print('０です')
else:
    print('0より小さいです')

０です


### 繰り返し（ while 文）

繰り返し処理は、`for` 以外にも `while` を用いて記述することもできます。
`while` 文では、以下のように**ループを継続する条件**を指定します。
指定された条件文が `True` である限り、ブロックの部分に記述された処理が繰り返し実行されます。

![while文](http://drive.google.com/uc?export=view&id=1_SNQsZEk5x9qnlJmL_5z_8wshYVya6TX)

`while` 文を使用した 3 回繰り返すプログラムは下記のとおりです。

In [120]:
count = 0

while count < 3:
    print(count)
    count += 1

0
1
2


ここで使われている `count` という変数は、ループの中身が何回実行されたかを数えるために使われています。
まず `0` で初期化し、ループ内の処理が一度行われるたびに `count` の値に 1 を足しています。
この `count` を使った条件式を `while` 文に与えることで、ループを回したい回数を指定しています。

一方、`while True` と指定すると、`True` は変数ではなく値なので、変更されることはなく、ループは無限に回り続けます。
`while` 文自体は無限ループの状態にしておき、ループの中で `if` 文を使って、ある条件が満たされた場合はループを中断する、という使い方ができます。
これには `break` 文が用いられます。

以下は、`break` 文を使って上のコードと同様に 3 回ループを回すコードです。

In [121]:
count = 0

while True:
    print(count)
    count += 1

    if count == 3:
        break

0
1
2


`count` の値が 3 と等しいかどうかが毎回チェックされ、等しくなっていれば `break` 文が実行されて `while` ループが終了します。

`while` 文を使って、指定された条件を満たして**いない**間ループを繰り返すという処理も書くことができます。`while` 文自体の使い方は同じですが、条件を反転して与えることで、与えた条件が `False` である間繰り返されるようにすることができます。

これには、ブール値を反転する `not` を用います。
`not True` は `False` を返し、`not False` は `True` を返します。

In [122]:
not True

False

In [123]:
not False

True

In [124]:
not 1 == 2

True

このように、`not` はあとに続くブール値を反転します。
これを用いて、`count` が 3 **ではない**限りループを繰り返すというコードを `while` 文を使って書いてみましょう。

In [125]:
count = 0

while not count == 3:
    print(count)
    count += 1

0
1
2


## 練習問題 本章のまとめ

本章で学んだ内容を復習しましょう。下記の内容を次のセルに記述し、実行結果を確認してください。（必要に応じてセルの追加を行ってください。）  

下記の内容のプログラムを作成・実行し、リスト `odd` と `even` の値を確認して下さい。  

- 1、2、3、4、5、6、7、8、9、10 が格納されたリスト `numbers` を定義
- `numbers` のリストから奇数を `odd` というリストに格納、偶数は `even` というリストに格納

*ヒント*  

for 文、if 文を活用しましょう。偶数か奇数かの判定には 2 で割り切れるかを用いるといいでしょう。

In [126]:
# numbers の定義


In [127]:
# odd、even の獲得
