## ループの基本

参照：http://kesin.hatenablog.com/entry/2013/05/12/004541  
参照：https://speakerdeck.com/pyconslides/transforming-code-into-beautiful-idiomatic-python-by-raymond-hettinger-1

### 整数のループ。
C言語では`for int i=0; i<6; i++`のように書きますが、Pythonでは`range`を使用するのが一般的。

In [None]:
for i in range(6):
    print(i**2)

### コレクションのループ
リストなどの要素をループ中で取得したい場合、Pythonでは以下のように書きます。（他の言語のforEachと同様の働きもします。）
なおfor文では英語の単数形と複数形を使うことで、何をループさせているのかひと目で分かりやすくさせるのがお作法になってます。

In [None]:
# 良くない書き方
colors = ['red', 'green', 'blue', 'yellow']
for i in range(len(colors)-1, -1, -1):
    print(colors[i])

# 良い書き方
colors = ['red', 'green', 'blue', 'yellow']
for color in colors:
    print(color)

### 逆順のループ

In [None]:
# 良くない書き方
colors = ['red', 'green', 'blue', 'yellow']
for i in range(len(colors)-1, -1, -1):
    print(colors[i])

# Pythonの書き方：reversedを使うことで何をしているのか分かりやすくなります。
colors = ['red', 'green', 'blue', 'yellow']
for color in reversed(colors):
    print(colors)

### コレクションのループと同時に要素番号も取得したい
わりとよくあるパターンだと思います。

In [None]:
# 良くない書き方
colors = ['red', 'green', 'blue', 'yellow']
for i in range(len(colors)):
    print(, '-->', colors[i])

#Pythonの書き方：enumerateを使うことでスッキリ書くことができます。
colors = ['red', 'green', 'blue', 'yellow']
for i, color in enumerate(colors):
    print(, '-->', color)

### 同時に二つのコレクションをループさせたい
二つのリストから同じ要素番号の要素を取ってきて、要素数が少ない方に合わせてループを終了したいというパターンです。

In [None]:
names = ['raymond', 'rachel', 'mattew']
colors = ['red', 'green', 'blue', 'yellow']
n = min(len(names), len(colors))

# 良くない書き方
for i in range(n):
    print(names[i], '-->', colors[i])

#Pythonの書き方：
# 複数のリスト(もしくはイテラブルなもの)をまとめてくれるzipを使うとスッキリ書くことができます。
for name, color in zip(names, colors):
    print(name, '-->', color)

### 複数のループ終了条件
ここからは少し複雑なループの使い方になります。
ループ中で一つも条件に合わなかった時、例外的な値を返したいという処理はよくあると思います。ついフラグを使いたくなってしまうパターンですね。

In [None]:
# 良くない書き方
# フラグ変数が入るとコードが見難くなり、何をやっているのか分かりにくくなりがちです。
# このような場合はfor文の中でelseを使うことでフラグを使わなくてもエレガントに書けます。
def find(seq, target):
    found = False
    for i, value in enumerate(seq):
        if value == tgt:
            found = True
            break
    if not found:
        return -1
    return i

# Pythonの書き方：
# elseはfor文がbreakされずに正しく終了したときに実行されるらしいです。
def find(seq, target):
    for i, value in enumerate(seq):
        if value == tgt:
            break
    else:
        return -1
    return i

## 辞書の使い方
何かとお世話になる辞書(dict)ですが、知ってるとエレガントにコードが書けるテクニックがいくつかあるそうです。

### キーでのループ
まずは基本。dictでループを回すとキーの値を取得できます。

In [None]:
d = {'matthew': 'blue', 'rachel': 'green', 'raymond': 'red'}
for k in d:
    print(k)

### キーとバリューでのループ
キーが取得できるのだから、単純に思いつくのはこのような形です。

In [None]:
# 良くない書き方
for k in d:
    print(k, '-->', d[k])

# Pythonの書き方：
# 辞書オブジェクトのitems()を使うとd[k]をする必要がなくなり、
# 変数名を自由に付けられるのでコードの見通しがよくなります。
for k, v in d.items():
    print(k, '-->', v)

# ちなみにrange, zip同様、辞書のサイズが大きいとメモリを消費してしまうので、
# そのような場合はiteritems()を使うとイテレーターで取得するのでメモリの節約になります。
for k, v in d.iteritems():
    print(k, '-->', v)

### ペアから辞書の作成
キーとバリューの候補が既にリスト等で存在する場合は、for文などを使わなくても一発で辞書に変換できます。

In [45]:
names = ['raymond', 'rachel', 'mattew']
colors = ['red', 'green', 'blue']
d = dict(zip(names, colors))
d

{'mattew': 'blue', 'rachel': 'green', 'raymond': 'red'}

### 辞書によるカウント
自然言語処理などでは、どの単語が文書に何回登場したかを数えたいことがよくあります。
辞書はお手軽なのでよく使いますが、新しい単語が登場したときに新たなキーとして登録しないとエラーになるため、少し工夫をする必要があります。

In [9]:
# 良くない書き方
colors = ['red', 'green', 'red', 'blue', 'green', 'red']
d = {}
for color in colors:
    if color not in d:
        d[color] = 0
    d[color] += 1
d

{'blue': 1, 'green': 2, 'red': 3}

In [10]:
# Pythonの書き方：
# 辞書オブジェクトのgetを使うと、キーが存在しなかった場合は引数で渡した値をバリューとしてセット
# してくれるので、上のコードのfor文内は1行で済みます。
d = {}
for color in colors:
    d[color] = d.get(color, 0) + 1
d

{'blue': 1, 'green': 2, 'red': 3}

In [24]:
# さらに便利なのがcollectionsモジュールのdefaultdictです。 
# defaultdictはキーが存在しなかったときに、自動的に作成するオブジェクトを指定できます。
# int()=0なので、defultdict(int)は登録されていないキーが呼び出された時に、自動的に{キー: 0}を登録します

from collections import defaultdict
d = defaultdict(int)
for color in colors:
    d[color] += 1
d

defaultdict(int, {'blue': 1, 'green': 2, 'red': 3})

In [28]:
int()

0

### 辞書によるグルーピング
辞書のバリューをリストにするという、よくあるケースです。
例えば、文字列の長さごとにグルーピングすると、こんな感じになると思います。

In [14]:
names = ['raymond', 'rachel', 'matthew', 'ronger', 'betty', 'melissa', 'judith', 'charlie']
d = {}
for name in names:
    key = len(name)
    if key not in d:
        d[key] = []
    d[key].append(name)
d

{5: ['betty'],
 6: ['rachel', 'ronger', 'judith'],
 7: ['raymond', 'matthew', 'melissa', 'charlie']}

カウントの初期値を0にしたのと同様に、キーが存在しなかったときに空のリストをバリューとして登録する必要があります。
これは辞書オブジェクトのsetdefaultで置き換えることができます。

In [15]:
d = {}
for name in names:
    key = len(name)
    d.setdefault(key, []).append(name)
d

{5: ['betty'],
 6: ['rachel', 'ronger', 'judith'],
 7: ['raymond', 'matthew', 'melissa', 'charlie']}

if文の処理を圧縮することができましたが、発表中ではこれですら美しくないということでdefaultdictを使うことをオススメしていました。

In [31]:
from collections import defaultdict
d = defaultdict(list)
for name in names:
    key = len(name)
    d[key].append(name)
d

defaultdict(list,
            {5: ['betty'],
             6: ['rachel', 'ronger', 'judith'],
             7: ['raymond', 'matthew', 'melissa', 'charlie']})

In [48]:
# collectionライブラリのCounterモジュールはさらに使いやすい
from collections import Counter

text = "あかねさす　むらさきのゆき　しめのゆき　のもりはみずや　きみがそでふる"
text = text.replace("　", "")

c = Counter(text)        #文字をカウントするCounterオブジェクト
print(c)                 #Counter({'き': 4, 'の': 3, 'ゆ': 2,...
print(c.most_common(1))  #[('き', 4)]　最頻出の要素を表示

Counter({'き': 4, 'の': 3, 'さ': 2, 'ゆ': 2, 'み': 2, 'あ': 1, 'か': 1, 'ね': 1, 'す': 1, 'む': 1, 'ら': 1, 'し': 1, 'め': 1, 'も': 1, 'り': 1, 'は': 1, 'ず': 1, 'や': 1, 'が': 1, 'そ': 1, 'で': 1, 'ふ': 1, 'る': 1})
[('き', 4)]


## コードの可読性をよくする

### キーワード引数
Pythonは関数への引数に '引数名=値' という書き方が可能です。タイプ量は増えますが、引数の名前が分かると関数の振る舞いに予想がつくので可読性が向上します  
キーワード引数を使うことで、関数の定義を確認しなくてもFalseやTrueが何を設定しているのかひと目で分かります。

In [None]:
twitter_search('@obama', False, 20, True)
twitter_search('@obama', retweets=False, numtweets=20, popular=True)

### 名前付きタプル

In [36]:
from collections import namedtuple
Point = namedtuple('Point3d', 'x y z')
point = Point(10,20,30)

In [39]:
# 通常のタプルの振る舞いに加えて、オブジェクトのように参照することが可能になります。
# ちょっとした構造体のようなものが欲しいときに便利です。
print(point)
print(point.x, point.y, point.z)
print(point[0], point[1], point[2])

Point3d(x=10, y=20, z=30)
10 20 30
10 20 30


### 展開して代入
有名なので解説は必要ないでしょう。0x30がユーモアですねｗ

In [44]:
p = 'Raymond', 'Hettinger', 0x30, 'python@example.com'
fname, lname, age, email = p
fname

'Raymond'

In [47]:
# 実は応用すると代入が簡単に行える以外にも便利な場面があります。
# フィボナッチ数列を求める関数を例とすると、

def fibonacci(n):
    x = 0
    y = 1
    for i in range(n):
        print(x)
        t = y
        y = x + y
        x = t

# tを一時変数として利用するプログラマーには非常にありふれた方法ですが、直感的に分かりづらいこともあります。
# このように書きなおすことで、一時変数を使用する必要はなくなります。
# x, yが同時のタイミングで代入されるため、このような書き換えが可能になっています。
def fibonacci(n):
    x, y = 0, 1
    for i in range(n):
        print(x)
        x, y = y, x+y

## その他

### DataFrameのデータ変換

In [11]:
# for文を使って同じ操作をすることが可能ですが、mapを使う方が早く終わります
from pandas import DataFrame
A = DataFrame({'code':[1,0,2], 'name':['Taro','Hanako','ichiro']})

# 変換式
transform = {0:'A', 1:'B', 2:'C'}

# 上記変換式で、DataFrame全体を更新できます。
A['detail'] = A['code'].map(transform)
A

Unnamed: 0,code,name,detail
0,1,Taro,B
1,0,Hanako,A
2,2,ichiro,C
