# Python チュートリアル

ここでは、Python の基本的な文法などを見ていきます。

まずは、お馴染みの。

In [1]:
print('Hello World!')

Hello World!


実はこの 1 行に Python のエッセンスが詰まっています。

C などの言語では、先程の文を出すには 3 行ほど必要なのですが、その時にいろいろな **おまじない** を書かなければいけません。
Python では、こうしたおまじないを極力書かないで済むので、自分がどういった操作をしているかが分かりやすく、学習が容易になるのです。

Python はオブジェクト指向のプログラミング言語です。
オブジェクト指向とは、その言葉通りオブジェクトを上手く使っていくことです。

Python では全てがオブジェクトです。では、オブジェクトとは何でしょうか？ 
それを説明する前に、いくつかの基本的なオブジェクトを見ていきましょう。
まずはとっつきやすいデータ型を見ていきます。

## 変数
さて、データ型を説明する前に、変数について説明しましょう。
変数には数字や文字などを格納することができます。
例えば、
```python
apple = 100
```
とすれば、 `apple` に 100 という値が格納されます。

In [2]:
apple = 100

変数の値を参照するには、変数名をタイプします。

In [3]:
apple

100

何も格納していない変数を参照した場合は、エラーが返ってきます。

In [4]:
orange

NameError: name 'orange' is not defined

### 演算
Python では四則演算、累乗は次のように行います。
```
加算: +
減算: -
乗算: *
除算: /
累乗: **
剰余: %
```

## エラー
プログラミングをしていく中で、エラーは必ず起こります。ですが、エラーが出たからといって、気落ちしないでください。
まず、エラーが起きたら、エラーの内容をよく読んでみましょう。
例えば、先の場合は、
```
NameError: name 'orange' is not defined
```
という内容です。これは、`orange` という変数はまだ定義されていませんということです。
それでは、次に
```python
orange = 150
```
と打ってみてから、`orange`を参照してみましょう。今度はエラーが出ないはずです。

In [5]:
orange = 150
orange

150

エラーの内容を読んでもよくわからなかった場合、エラーの内容をコピーして、ググりましょう。

プログラミングに関する掲示板を提供する場として、[stack overflow](https://stackoverflow.com/) が有名です。
ほとんどの場合、こちらを参照すれば同じような問題を抱えた人がいて、それに対する答えも提供されていることでしょう（基本的に英語です）。
また、 [teratail](https://teratail.com/) という日本のサイトもあります。

調べても答えが得られなかった場合は、上記の2つで質問してみるのもよいでしょう。

他にも、パッケージの使い方がいまいちわからない場合、 [Qiita](http://qiita.com/) で検索してみましょう。
そのパッケージを使用した記事があるかもしれません。

## 基本的なデータ型

### int (整数）型
整数型は値に整数を持ちます。あまり説明する必要はないかもしれません。
次の例は整数型です。

In [6]:
1

1

### float (小数点) 型
小数点型は値に小数点を持ちます。整数の後に `.` をつけることで小数点型になります。
次の例は小数点型です。

In [7]:
1.0

1.0

### str (文字列) 型
文字列型は値に文字列を持ちます。文字列の前後を シングルクォート ` かダブルクォート "  で囲みます。次の例は文字列型です。

In [8]:
'string'

'string'

文字列は足すことができます。しかし、引くことはできません。

In [9]:
'str' + 'ing'

'string'

In [10]:
'string' - 'ing'

TypeError: unsupported operand type(s) for -: 'str' and 'str'

### list (リスト) 型
リスト型は複数の値を持つことができます。リストを作るには、かぎかっこ `[]` を使います。
複数の要素を持つリストを作る場合は、各要素を `,` で分けます。

In [11]:
[1, 2, 3]

[1, 2, 3]

リストの中には、異なるデータ型を入れられます。

In [12]:
[1, 3.14, 'string']

[1, 3.14, 'string']

リストとリストは足すことができますが、引くことはできません。

In [13]:
[1, 2, 3] + [4, 5, 6]

[1, 2, 3, 4, 5, 6]

リストの各要素を参照するには、かぎかっこ `[]` を用い、かぎかっこの中に参照したい要素の番号（インデックス）を入れます。
R とは違い、 Python では、要素の番号は 0 から始まります（ R では 1 から）。
リストにない番号を参照するとエラーが返ってきます。

In [8]:
num_list = [1, 2, 3]

In [15]:
num_list[0]

1

In [16]:
num_list[4]

IndexError: list index out of range

マイナスの番号を入れると、後ろから参照します。

In [17]:
num_list[-1]

3

複数の要素を参照したい場合は、スライスを使います。 `[0:2]` とすると、0 番目から 1 番目までの要素を参照します。

In [18]:
num_list[0:2]

[1, 2]

k 番目からの要素を全て参照する場合には、`[k:]` とします。

In [2]:
num_list[1:]

[2, 3]

k - 1 番目までを参照するには、`[:k]` とします。

In [22]:
num_list[:2]

[1, 2]

ちなみに、文字列もインデックスが振られているので、文字列の一部のみを参照することができます。

In [19]:
'string'[:3]

'str'

### dict (辞書) 型 
辞書型は、キーと値をセットで使います。辞書型を作るには、なみかっこ `{}` を使います。
`{キー：値}` という順番で各要素を作成します。複数のキーと値を持つ辞書を作る場合は、各要素を `,` で分けます。

In [19]:
{'apple': 100, 'orange': 150}

{'apple': 100, 'orange': 150}

辞書の要素を参照するには、`[]` を用います。`[]` の中にキーとなる値を入れると、そのキーに対応する値が返ってきます。キー以外の値を参照しようとすると、エラーが返ってきます。

In [20]:
fruits = {'apple': 100, 'orange': 150}

In [21]:
fruits['apple']

100

In [22]:
fruits['melon']

KeyError: 'melon'

新たにキーと値を追加するには、`辞書型[キー] = 値` とします。

In [23]:
fruits['melon'] = 500
fruits['melon']

500

### tuple (タプル) 型
タプル型はリスト型と同じように複数の要素を持つことができます。また、各要素の参照もリストと同じです。
しかし、リスト型と違うのは、要素の追加、削除、編集ができないということです。
意図せず値を書き換えてしまうことを防ぎたい場合は、タプルを使うとよいでしょう。

In [24]:
car = ('taxi', 'bus')
car

('taxi', 'bus')

In [25]:
car[0]

'taxi'

In [26]:
car[0] = 'truck'

TypeError: 'tuple' object does not support item assignment

ちなみに、要素が 1 つのみのタプルを作るときには、`(i, )` とします。

### データ型の調べ方
ある変数のデータ型がよくわからない場合は、`type()` という関数を使うとよいでしょう。

In [27]:
a = 1
type(a)

int

In [28]:
b = [1, 3]
type(b)

list

## メソッド (Method)
各データ型には、固有の関数が用意されています。これをメソッドといいます。
文字列型には例えば、次のようなメソッドが用意されています。
```
lower: 文字列を小文字にする
upper: 文字列を大文字にする
split: 文字列を指定した境界にしたがって、分割し、リストを作る
```

リスト型には例えば、次のようなメソッドが用意されています。
```
append: リストに要素を追加する
extend: リストにリストを追加する
remove: 指定した値をリストから除外する
```
メソッドを使うには、`データ型.メソッド(引数)` とします。例を見てみましょう。

In [29]:
JP = 'japan'
JP.upper()

'JAPAN'

In [30]:
countries = 'japan,korea,america'
countries.split(',')

['japan', 'korea', 'america']

In [31]:
odd_num = [1, 3, 5]
odd_num.remove(5)
odd_num

[1, 3]

引数が必要でない場合も、`()` を忘れると、関数の戻り値ではなく関数が返ってきますので注意してください。

In [32]:
JP.upper

<function str.upper>

### モジュールのインポート
Python を起動したときにすでにいくつかのデータ型、関数を使うことができます（Built-in関数といいます）。
R を使ったことがある人はおなじみかも知れませんが、使えるデータ型、関数を追加することができます。
モジュールを追加するには、`import` を使います。まずは、時間に関する操作に役立つデータ型である、`datetime` を使えるようにしてみましょう。

In [33]:
import datetime

無事追加できた場合には、特になにも結果がでません。存在しないモジュールを追加しようとした場合には、エラーが返ってきます。

In [34]:
import datetime_time

ModuleNotFoundError: No module named 'datetime_time'

`datetime` モジュールには、様々なデータ関数が用意されています。モジュールから特定の関数のみを追加したい場合は、`from モジュール名 import 関数名` とします。 

In [35]:
from datetime import timedelta 

追加したモジュールの関数を使いたい場合は、`モジュール名.関数名` で使用できます。
それでは、`datetime` 型を作ってみましょう。`datetime` 型は `datetime(year,month,day,minute,second) ` のように作成します（最後の 2 つは省略可能です）。

In [36]:
today = datetime.datetime(2017, 9, 11)

追加するモジュール名が長くて、いちいち打つのが面倒な場合、 `import モジュール名 as 適当な名前` とすれば、指定した名前でモジュールを呼び出せます。 

In [37]:
import datetime as dt
dt.datetime(2017, 9, 11)

datetime.datetime(2017, 9, 11, 0, 0)

**注意!** `import モジュール名　as *` とするとモジュール名を省略できますが、他のモジュールも同じ名前の関数があった場合、名前の衝突が起こってしまい、予期せぬエラーが起こることがあります（これを名前空間が汚れると言ったりします）。
`as *` を使うのはできるだけ避け、使う場合も 1 つのモジュールに対してのみ使いましょう。

## 属性 (Attribute)
あるデータ型を作成した場合、そのデータ型の基本的な情報を属性と呼びます。
例えば、`datetime`型の属性は、`year,month,day,mitute,second`などです。
属性を呼び出すには、`データ型.属性名` とします。メソッドと違うのは、属性を呼び出す場合には引数がいらないということです。つまり、`()` をつける必要がありません。

In [38]:
today = datetime.datetime(2017, 9, 11)
today.year

2017

In [39]:
today.month

9

これまでに、いくつかの基本的なデータ型を説明してきました。
各データ型には様々な特徴があり、またそれぞれ固有の関数（メソッド）を持っています。
くぎを打つ場合には金づちを使い、木を切る場合にはのこぎりを使います。
同じように、使用目的によって、データ型を使い分けることが重要です。

## ループ文
似たような操作を繰り返したい場合、例えば、1 から 10 までの整数を順に出力したい場合などには、ループ文を使うとよいでしょう。Python では、 `for, while` がよく用いられます。1 つずつその性質を見ていきましょう。

### for 
for は、リストやタプルなどからその中の要素を逐次的に引き出す場合に使われます。
例えば、次のようにします。

In [40]:
for i in [1, 2, 3]:
    print(i)

1
2
3


`print` はその名の通り、`()` 内の値を出力したい場合に用いる関数です。
上の文では、`i` にリスト `[1,2,3]` の各要素が順に代入されていきます。
Python では、他のプログラミング言語と違い、**インデント（字下げ）** が意味を持ちます。
ループや、関数、クラスの定義の際には、直下のインデントした文がループ文、関数、クラスの定義の文になります。
詳しく見てみましょう。

In [41]:
j = 0
k = 0
for i in [1, 2, 3, 4]:
    j += i

k += i
j, k

(10, 4)

`j=+1` は、`j = j + i` と同値です。
インデントしている文はループが実行されていますが、その下のインデントがされていない文はループが実行されていません。したがって、`j` は `1+2+3+4` の値が格納されますが、`k` はループの最後に `i` がとる値、`4` のみが格納されます。

また、特に理由のないインデントは、エラーになります。

In [42]:
1
    'a'

IndentationError: unexpected indent (<ipython-input-42-830ffeb871ce>, line 2)

`for i in [1,2,3]` は `range` 関数を使って、 `for i in range(1,4)` でも実行できます。
`range` はイテレータを返す関数で、`range(b)` とした場合、`0` から `b-1` までの値を順に返します。
`range(a,b)` のときは、`a` から `b-1` までです。
イテレータとは、ループ文を使ったときに、逐次的に要素を返すオブジェクトです。

### while
`while` は指定した条件式が真の場合にループ文を実行し、条件式が偽になるとループをやめます。例えば、次のようにします。

In [43]:
i = 0
while i < 5:
    print(i)
    i += 1

0
1
2
3
4


上の文は `i` が 5 より小さい場合という条件式が真の場合にループ文を実行するということです。
また、ループ文の最後に `i` の値に 1 を足しています。`while` は終わらないループを繰り返すことにもなりかねないので、注意しましょう。ループが終わらない場合は、 ■ を押すか、`Ctrl+C` でコードの実行を中止しましょう。

## 関数
いくつかの操作をひとまとめにして、再利用したい場合には、関数を使うとよいでしょう。
関数は次のように `def` を使って定義します。

In [44]:
def return_2():
    x = 2
    return x

In [45]:
return_2()

2

ループ文の場合と同じで、関数の定義もインデントして書きます。
引数をもつ関数を定義するには引数を `()` 内で指定します。

In [46]:
def multiple_2(x):
    x2 = x * 2
    return x2

In [47]:
multiple_2(3)

6

関数によって返される戻り値は `return` で指定します。
`return` の下は実行されないので、注意してください。

In [48]:
def upper_return():
    x = 2
    print('here')
    return x

upper_return()

here


2

In [49]:
def under_return():
    x = 2
    return x
    print('here')
    
under_return()

2

引数の数を任意にすることも可能です。 引数に `*name` を入れると、指定した数以上の引数は `name` にタプルとして格納されます。
また、引数に `**name` を入れると、指定した数以上の `key=value` という引数は `name` に辞書として格納されます。

In [50]:
def multi_arg(*args):
    print(type(args))
    
multi_arg(1,2,3)

<class 'tuple'>


In [51]:
def multi_params(**params):
    return params
    
multi_params(a=1, b=2)

{'a': 1, 'b': 2}

### ローカル変数
関数の定義で重要なのは、ローカル変数という概念です。ちなみに、逆はグローバル変数といいます。
ローカル変数は、プログラムの一部分でのみ参照可能な変数です。例えば、関数内で定義した変数は関数内でのみ参照可能であり、関数の外では参照することができません。
実際に見てみましょう。

In [52]:
x = 3
def local_x():
    x = 6
    return 1

local_x()

1

In [53]:
x

3

関数の外で `x = 3` と定義した後に、関数内で `x = 6` と定義していますね。
しかし、関数を呼び出した後に、`x` を参照しても、値は変わっていません。
なぜなら、関数内の `x` はローカル変数なので、`x = 6` というのは関数内でのみ有効だからです。
実際に、関数内では `x = 6` となっているか、`print` で見てみましょう。

In [54]:
x = 3
def print_local():
    x = 6
    print(x)

print_local()

6


ちゃんと、関数内では `x = 6` となっていることが確認できました。

さて、こうしたローカル変数があると何が嬉しいのでしょうか。
一つは、関数の影響を最小限にとどめられるということです。
例えば、関数の中と外で `x` という変数を定義していて、
関数を呼び出すたびに `x` の値が書き換わっていたらどうでしょうか。
変数を定義するたびに、関数の中もチェックして、変数名が被っていないかを考えなくてはいけません。
ローカル変数はそういったことを防ぐ役割を果たすのです。

## 無名関数

`def` とは違い、簡単にかける無名関数というものあります。`lambda x: function` とすることで無名関数を作成できます。

In [55]:
lambda x: x * 2

<function __main__.<lambda>>

無名関数は `map` というリストの各要素に関数を適応する関数と組み合わせると便利です。
例えば、次の例はリストの各要素を 2 倍にします。

In [56]:
lambda_list = [1, 2, 3, 4]

In [57]:
list(map(lambda x: x * 2, lambda_list))

[2, 4, 6, 8]

`filter` は条件式を満たす要素を返します。

In [58]:
list(filter(lambda x: x > 2, lambda_list))

[3, 4]