# Python入門

この章では、 Python というプログラミング言語の基礎、およびプログラムの実行環境である Google Colaboratory の使用方法について学びます。

## Google Colaboratory の基礎

Google Colaboratory は Google 社が提供している Web サービスです。以下の URL からアクセスできます。
https://colab.research.google.com/notebooks/

早速、Google Colaboratory を開いてみましょう。（利用には Google のアカウントが必要です。）

`NEW PYTHON 3 NOTEBOOK` をクリックすると Google Colaboratory 上で Jupyter Notebook というプログラムが実行できる環境を作る事ができます。

### Google Colaboratory とは

Google Colaboratory はデータ解析などで広く使用されている Jupyter Notebook 環境を、Google が用意したサーバー（クラウド）上に立ち上げ、それを利用者が自身のコンピュータ上でブラウザから使用することができるようにしたウェブサービスです。

まずはこの Jupyter Notebook 環境の特徴を説明します。

#### Jupyter Notebook 環境の特徴

- ブラウザから利用可能なため、利用者は手元のコンピュータのメーカーやOSの違いを気にする必要がない
- コードの実行結果が確認しやすく、デバックが容易
- データの可視化も可能
- Markdown を使用してメモを記入する事ができるためコメントや解説をコードと一緒に管理することができ、コードの共有の際に便利

Jupyter Notebook には以上の様なメリットがあるため、現在データ解析の実務でも利用されることがあります。

Jupyter Notebook 環境は利用者が自身のコンピュータ上（ローカル環境といいます）で立ち上げることもできます。一方、Google Colaboratory は upyter Notebook 環境を Google 用意しているクラウドサーバー上に作成し、そこへのアクセスをブラウザを介して可能にするものです。以降のチュートリアルでは全て Google Colaboratory を使って用意した Jupyter Notebook 環境を利用します。それには以下の様な理由があります。

#### Google Colaboratory 使用のメリット

- ブラウザから書いたコードを、クラウド上で実行することができ、その際ハードウェアアクセラレータ（計算を高速化するための追加ハードウェア）として **GPU を無料で使用する事ができる**
- Google Docs などのウェブサービスと同様に、リアルタイムに複数人で使用することができる
- データ解析によく用いられるツール（ライブラリなど）が予め整備されているため、**環境構築が不要**

このような利点があるため、本チュートリアルではできる限り Google Colaboratory を使用して学習できるよう資料全体を構築しています。そのため、資料中のコードなどは Google Colaboratory 上で動作確認が行われています。

それでは、Google Colaboratory の基本的な使用方法を説明します。

### Google Colaboratory の基本的な使用方法

Google Colaboratory ではブラウザ上でコードを記述し、そのコードを実行し、さらに実行結果を確認する事まで可能です。まず、下の四角い

試しに、下の「1 + 1」と書かれたあたりをクリックして、コードセル（コードを記述し、実行することができるブロックのこと）を選択し、`Shift + Enter` を押してコードを実行してみましょう。

In [1]:
1 + 1

2

コードセルの真下に「2」と表示されました。「1 + 1」が計算され、その結果が表示されました。

#### GoogleDrive ディレクトリのマウント

GoogleDrive 内のディレクトリを認識させ、GoogleDrive 内のファイルを使用する事ができます。  
自身のデータを使用する場合などには GoogleDrive ディレクトリをマウントしてから使用すると便利です。

In [2]:
from google.colab import drive
drive.mount('/content/drive')

ModuleNotFoundError: No module named 'google.colab'

In [3]:
# 'My Drive'の表記が出ていればマウントがうまく行われています。
!ls 'drive/'

'My Drive'


### Google Colaboratoryの便利なショートカット

Google Colaboratory解析を行う上で、コード表記やMarkdown表記への変更など頻繁に行います。  

そこで下記のショートカットキーを覚えておくと便利です。  
基本的には`Ctrl`を押しながら`m`そして、それぞれの実行内容に合わせてコマンドを変更します。  

| 説明                 | コマンド      |
| -------------------- | ------------- |
| Markdownモードへ変更 | Ctrl + m → m       |
| Codeモードへ変更     | Ctrl + m → y       |
| セルの実行           | shift + enter |
| セルを上に追加       | Ctrl + m → a       |
| セルを下に追加       | Ctrl + m → b       |
| セルのコピー         | Ctrl + m → c       |
| セルの貼り付け       | Ctrl + m → v       |
| セルの消去       | Ctrl + m → d       |
| コメントアウト       | Ctrl + /       |

※macの場合は`Ctrl`の代わりに`command`を使用します。  
※コメントアウトはコード記述の中にコメントを記入する際に用いられます。Pythonでは`#`の後にコメントを記述する事ができます。

## Pythonの基礎

環境が整いましたので、データ解析に必要なプログラミング言語であるPythonについて学んでいきます。  

### 変数

In [0]:
a = 1

これは`a`という変数に`1`を代入していることになります。

変数の中身を確認したい時は`print(a)`のように`print`というコマンドを使用することを覚えておきましょう。  
`print`は非常によく使います。

In [5]:
print(a)

1


またJupyter Notebook環境では`a`と変数のみで実行しても中身を確認することもできます。

In [6]:
a

1

#### 数値の種類

コンピュータの内部的処理の話になりますが、`int型`と呼ばれる整数と`float型`と呼ばれる実数（小数を含んだ数値）を扱うための数値型の２種類があります。  

数値・変数の種類を確認するには`type()`を使用します。

In [7]:
type(a)

int

In [8]:
b = 1.5
type(b)

float

Pythonでは、整数を代入すれば`int`、実数を代入すれば`float`と自動的に判定してくれるため、  
最初はあまり気にする必要はありません。  
但し、Chainerでは、この数値型の変数の取り扱いに制約があるということを覚えておきましょう。


#### 文字の変数

文字の代入も数値と同じように`=`を使うだけです。  
但し、文字を扱う場合は、`' '`（シングルクォーテーション）もしくは `" "`（ダブルクォーテーション）のどちらかで文字を囲む必要があります。  

機能的には同じになるので、どちらを使用しても問題ありません。  
（一般的にシングルクオテーションを用います。）  

また文字列は `string`型(`str`)になります。

In [0]:
name = 'Chainer'

In [10]:
print(name)

Chainer


In [12]:
type(name)

str

文字列同士は足し算により、結合を行う事ができます。

In [0]:
name1 = 'Chainer'
name2 = 'チュートリアル'

In [15]:
print(name1 + name2)

Chainerチュートリアル


#### 四則演算

足し算は`+`、引き算は`-`、掛け算は`*`、割り算は`/`で表現します。  
べき乗は`**`です。  

In [16]:
# 足し算
1 + 1

2

In [17]:
# 引き算
2 - 1

1

In [18]:
# 掛け算
3 * 5

15

In [20]:
# 割り算
10 / 2

5.0

In [19]:
# べき乗
2 ** 3

8

### 基本構文

#### 比較演算

大小の比較は`<`（もしくは`>`）、等しい場合は`==`、等しくない場合は`!=`を使用します。

In [21]:
1 < 2

True

In [22]:
2 == 5

False

In [23]:
1 != 2

True

In [25]:
3 >= 3

True

In [24]:
'test' == 'test'

True

#### エスケープシーケンス

通常の文字列では表せない特殊な文字や機能を、規定された特別な文字の並びにより表したものです。  
  よく使用するものとして、`\n`（もしくは`¥n`）による **改行** 、`\t`（もしくは`¥t`） による**タブ**があります。

In [26]:
print('Chainerチュートリアルへ\nようこそ')

Chainerチュートリアルへ
ようこそ


In [27]:
print('Chainerチュートリアルへ\tようこそ')

Chainerチュートリアルへ	ようこそ


#### コメントアウト

コメントアウトはプログラムとしては意味を持たないものです。  
しかし他の人にプログラムの機能を伝えるためによく使用されるものです。  
コメントアウトは`ctrl + /`（もしくは`command + /`）のショートカットキーでも切り替える事が可能です。

In [0]:
# これはコメントのため、実行時に無視されます。

### 複数の変数

#### リスト

変数を`[]`で囲んで並べたものです。  
それぞれの変数のことを **要素** と呼びます。  

`type()`を実行することによって`list`形式になっている事が確認できます。

In [0]:
numbers = [4, 5, 6, 7]

In [39]:
print(numbers)

[4, 5, 6, 7]


In [40]:
type(numbers)

list

##### リストへのアクセス（スライス）

一番左側の要素にアクセスするには要素番号`0`を指定すると取得する事ができます。  
Pythonで複数の変数の中から要素を取り出す際には基本的に`[]`を使用することを覚えておくといいでしょう。  

In [41]:
# Index番号0にアクセス
numbers[0]

4

リストから部分的に取り出してみます。  
`:（コロン）`を使うことで部分的な要素を取り出すことができます。

In [42]:
numbers[0:3]

[4, 5, 6]

ここで`0`から`3`と指定するのは、  
「要素番号が0番目から3番目のひとつ手前までの要素を抜き出す」という仕様となっているためです。  

一番最初の要素である`0`は省略することができるためこの様な仕様となっています。

In [43]:
numbers[:3]

[4, 5, 6]

この様に記述すると「先頭から3つを取り出す」と、直感的に扱うことができます。  

そして「1番目から最後まで」は下記になります。  

In [44]:
numbers[1:]

[5, 6, 7]

よく使う「全て」は、次のように記述します。

In [46]:
numbers[:]

[4, 5, 6, 7]

    これだけですと`numbers`と全く変わりませんが、この記述方法は２次元以上の多次元配列となった際に効果を発揮します。  

「matrixという多次元配列の特定列(0)の全ての行」といったときには、  
`matrix[:, 0]`のように記述（こちらはNumpyの扱い方ですが）することがあります。  

リストは数値以外に、文字列も扱えます。  


In [0]:
words = ['hello', 'world']

In [49]:
print(words)

['hello', 'world']


また、**空のリスト** を定義しておき、そこに新たな要素を追加（`append`）していく処理をよく行います。

In [0]:
# 空のリストを定義
names = []

In [0]:
# 空のリストに要素を追加
names.append('Chainer')
names.append('チュートリアル')

In [52]:
print(names)

['Chainer', 'チュートリアル']


リストの豆知識として、リストの変数名には**複数形**で名前を付けるこが一般的です。  
変数名を見ただけでリストであることが把握でるためです。`for文`と相性が良い、この二つがその理由です。  

※ 詳しくは`for文`の節で説明します。  


#### タプル

リストとは異なり、定義した後には**変更ができない** 配列のことを**タプル**と呼びます。
複数の要素を一つにまとめたもので、宣言は`( )`を使用し、要素にアクセスする際には`[ ]`を使用します。


In [0]:
t = (4, 5, 6)

In [54]:
t[0]

4

##### タプルの要素を書き換え

タプルは**定数**など、書き換えられたくない値に使用してください。  
要素の抽出方法は、基本的にはリストと同じになっています。

書き換えは`[]`で要素にアクセスし、そこに新たな値を代入すると書き換えを実行する事ができます。　 
ですが、この書き換えがタプルでは実行する事ができません。

In [55]:
t[0] = 10

TypeError: ignored

#### 辞書

**キー（key）**と**値（value）**のペアを保持するリストのことです。  

APIで使用されるJSONも、この形式で変数を保存することで値に対する説明を行うことができます。

In [0]:
results = {'数学': 90, '理科': 75, '英語': 80 }

In [57]:
results['数学'] 

90

### 制御構文

#### for文：繰り返し

for文は**繰り返し**に使います。  
繰り返しの処理はプログラミングで頻繁に使用する構文になります。  

一番簡単な数値での繰り返しの方法を確認します。  

In [58]:
#0から4まで繰り返す
for i in range(5):
    print(i)

0
1
2
3
4


for文含め、Pythonの構文では、`:`の後からは処理ブロックが始まり、`スペース4つ`がそのブロック内であることを表します。  
今回は、`print(i)`という処理がfor文の中に入っており、  
これを繰り返すことがわかります。  

`range`を使用することで、特定回数の繰り返しが行われます。  
ここでの注意点は、`range(5)`と指定すると「0,1,2,3,4」のように、  
0から始まることです。  
0から始まることで、リストの要素番号へうまくアクセスすることができます。  

この`range(5)`で作成されたリストの要素一つ一つを取り出し、  
一時的な変数である`i`に格納して、処理を実行するという流れです。  

一時的な変数名は`i`でなくても大丈夫ですが、  
要素番号を指定するときには、よく `i` を使用します。  

リストの要素番号として、各要素を取り出す時は以下のように記述できます。

In [59]:
names = ['佐藤', '鈴木', '高橋']

for i in range(3):
    print( names[i] + 'さん' )

佐藤さん
鈴木さん
高橋さん


今回はリストの要素数を`range(3)`と数値で指定しましたが、  
これは汎用性の低いプログラムです。  

もう少し汎用性を高めるため、自動的に要素数を取得する方法を考えます。 

In [61]:
len(names)

3

`len`を使用することで、リストの要素数を取得できます。  
（`len`はlengthの省略と覚えやすいです。）

これを使用し汎用性を高めたfor文は、以下の通りです。


In [62]:
names = ['佐藤', '鈴木', '高橋']

for i in range(len(names)):
    print( names[i] + 'さん' )

佐藤さん
鈴木さん
高橋さん


汎用性が高いプログラムにする事ができましたが、  
Pythonではより簡潔に記述する事が可能です。  

Pythonならでは書き方としては、要素番号を指定するのではなく、  
以下のように記述します。

In [63]:
#Pythonならではのfor文
for name in names:
    print(name + 'さん')

佐藤さん
鈴木さん
高橋さん


このようなプログラムを**可読性が高い**といいます。  
可読性が高いと他の人に伝わりやすいだけでなく、バグを生み出しにくくなります。  
プログラムを書く際は動作することはもちろん、可読性という観点ももち書くことを心がけましょう。  

また、for文でよく使うのが、要素番号も取得しながら繰り返す`enumerate`と、２つのリストを同時に繰り返す`zip`です。  


#### enumerateの使用方法

`enumerate`はインデックスの番号が必要な場合に用いられます。  
`(要素番号, 要素)`と入ってくるので、そのようなケースには最適です。 

In [64]:
for (i, name) in enumerate(names):
    print(i, '番目: ', name, 'さん')

0 番目:  佐藤 さん
1 番目:  鈴木 さん
2 番目:  高橋 さん


#### zipの使用方法

`zip`では2つのリストを同時にfor文で扱いたい場合に使用します。  

In [0]:
names1 = ['佐藤', '鈴木', '高橋']
names2 = ['亮介', '俊介', '大介']

`zip`を使用しない場合はこのように記述することできます。

In [67]:
for i in range(3):
  print(names1[i], names2[i])


佐藤 亮介
鈴木 俊介
高橋 大介


`zip`を使用すると下記のように比較的見やすいコードにする事ができます。

In [68]:
for (name1, name2) in zip(names1, names2):
    print(name1, name2)

佐藤 亮介
鈴木 俊介
高橋 大介


### if文：条件分岐

これもfor文と同じく、よく使う構文です。

もう一度比較演算子を確認します。  

-    `==` ： 等しい
-    `!=` ： 等しくない
-    `<, >` ： 大きい、小さい

例えば、`val`という変数が0より大きい（正の値）か否かを判定するときは以下のように記述します。


In [69]:
val = 1
if val > 0:
    print('正の値です')
else:
    print('負の値です')

正の値です


この実行結果は`正の値です`と表示されます。  
if文もfor文と同様、`:（コロン）`でブロックを区切ります。  

`else`は**それ以外**という意味であり、`val`が0よりも大きくなければ、全てこの処理が実行されます。  

また、条件が当てはまらなくて追加する場合は、`elif`を使います。


In [70]:
val = 0
if val > 0:
    print('正の値です')
elif val == 0:
    print('０です')
else:
    print('負の値です')

０です


### 関数

#### 一番簡単な関数

関数は、複数の処理をまとめて使いたい時、再利用性を高めるために使用するものです。  

まずは一番簡単な関数を作成します。


In [0]:
def say_hello():
    print('こんにちは、田中さん')
    print('ご機嫌いかがですか')

実行には `関数名()`で実行する事ができます。

In [73]:
say_hello()

こんにちは、キカガクさん
ご機嫌いかがですか


このように関数は定義した後に実行することで、いつでも再利用できます。

#### 入力（引数）のある関数

先の関数は、常に同じ処理しかできないため、汎用性が高いとはいえません。  

そこで「田中」や「高橋」といった名前を自由に変えられるように、入力（引数）の値を変えられる関数を作成します。  

In [0]:
def say_hello2(name):
    print('こんにちは、{}さん'.format(name))
    print('ご機嫌いかがですか')

このように「こんにちは、○○さん」という入力の値によって、出力結果が変わります。  

「○○」に対応する部分を一時的に`name`という変数が入力されると仮定して、この処理を書いていくわけですが文字列の中に`{ }`があり、その後に`.format(name)`が来てこの文法はまだ紹介していません。    

これはPythonでよく使う、他の言語の`%s`のような機能で、`{ }`に対応した場所に、`.format()`で指定した変数を格納するといった意味です。  

この関数を実行してみます。  
実行時には、`name`に対応する入力の値を与える必要があります。  

In [77]:
say_hello2('高橋')

こんにちは、高橋さん
ご機嫌いかがですか


#### 出力のある関数

入力に引き続き、出力のある関数です。  
先の実行結果は、`print`で表示されるにとどまっており、  
計算した結果をあとで使い回せない状況です。  

試しに、入力しか指定しない`say_hello2`から出力された先の値を確認してみます。


In [82]:
message = say_hello2('株式会社キカガク')

# 出力の値を確認
print(message)

こんにちは、株式会社キカガクさん
ご機嫌いかがですか
None


このように、`message`という変数には何も格納されておらず、  
結果を使えない事が確認できます。

では、出力を設定を行います。
出力設定は単純に、`return`の後に出力したい変数を指定します。  

In [0]:
def say_hello3(name):
    message = 'こんにちは、{}さん'.format(name)
    return message  # 出力

実行して出力が得られているか確認します。  

In [81]:
message = say_hello3('株式会社キカガク')

# 出力の値を確認
print(message)

こんにちは、株式会社キカガクさん


出力の値が渡ったことがわかります。

また、入力、出力ともに`,(カンマ)`を使うことで複数を指定できます。

### クラス

変数や関数をひとまとまりで扱うことの出来る概念のことです。  
関数を作ることはあっても、クラスを作ることはあまりないかもしれません。  
大きなプロジェクトを作ることがなければなかなか遭遇しないのですが、Chainerなどのプログラムを読む際に必要となる可能性があるため、ここでは必要最小限の説明をします。  

クラスとして定義を行い、それを実態化させることを**インスタンス化**と呼びます。  


#### 関数を持ったクラス

Pythonでのクラスは以下のように定義します。  

In [0]:
class MyClass1:
    # 関数を定義
    def say_hello():
        print("こんにちは")

クラスは定義するだけでは実態を持たず、概念のような存在です。

#### MyClassクラスをインスタンス化

実態を持たせるために**インスタンス化**を行います。

In [84]:
# aにMyClass1インスタンスを代入
a = MyClass1
# MyClass1内のsay_hello関数を実行
a.say_hello()

こんにちは


#### クラス変数を持ったクラス

クラスには関数以外にも変数をもたせることができます。  
基本的に、変数の値はインスタンス内で保持されます。  

In [0]:
class MyClass2:
    name = "Chainer チュートリアル"

インスタンス化を実行し中身を確認します。

In [88]:
a = MyClass2
a.name # クラス変数にアクセス

'Chainer チュートリアル'

このクラス変数は簡単に代入もできます。


In [0]:
class MyClass2:
    name = "Chainer"

    def change():
        MyClass2.name = "チュートリアル"       

In [130]:
a = MyClass2        
print(a.name)

Chainer


In [0]:
a.change()

In [134]:
print(a.name)

チュートリアル


クラス変数には思わぬ落とし穴があります。  
クラス内で変数の値を保持するため、別のインスタンスを作成した際に、そのクラス変数の値が他のインスタンスへ共有されてしまうことです。  

以下は、他のインスタンスを作っても最初からnameが"チュートリアル"となっている例です。


In [133]:
b = MyClass2
print(b.name)

チュートリアル


#### インスタンス変数を持ったクラス

インスタンス変数はクラス変数とは異なり、**インスタンスごとに独立に保持される変数**です。  
クラス内の変数の状況を毎回気にする必要はなく、独自のインスタンスの状況のみ把握しておけば良いため、考え方はシンプルです。  

クラス内で変数を使用したい場合は、基本的には**インスタンス変数**を使うようにしてください。  

In [0]:
class MyClass3:
    # イニシャライザ（最初に実行される:インスタンス変数の初期化を行う）
    def __init__(self, name):
        self.name = name

In [0]:
# ↓ 一番目の引数（入力）がイニシャライザのselfの次に相当
a = MyClass3('Chainer')

インスタンス変数の確認

In [137]:
print(a.name)

Chainer


#### call関数を持ったクラス

`__call__`という事前に準備されている関数を使用することで、インスタンスを関数のように実行することができます。  

これは実際にChainerでも使用するので、覚えておきましょう。

In [0]:
class MyClass4:
    # イニシャライザ
    def __init__(self, name1, name2):
        self.name1 = name1
        self.name2 = name2

    def __call__(self):
        return '{}{}へようこそ！'.format(self.name1, self.name2)

In [0]:
a = MyClass4('Chainer', 'チュートリアル')

In [144]:
a.__call__()

'Chainerチュートリアルへようこそ！'

このように通常通り関数名を指定して呼び出す事ができます。  
ですが、この`__call__`を持った関数は下記のようにも記述する事ができます。

In [145]:
a()

'Chainerチュートリアルへようこそ！'

実際にcall関数を使用することは少ないかもしれませんが、  
Chainer含めフレームワークでは暗黙の了解として使われていることがあるため、  
ほかの人のコードを理解するためにも覚えておきましょう。  

これでPythonの基礎はしっかり抑える事ができました。  
続いてはChainerでディープラーニングを実装する前に数学的にどのような中身になっているのかをお伝えします。  