## 第5章 pandas の使い方（変数表）

http://pandas.pydata.org/

### 5.1 データの作成

In [None]:
import numpy as np, pandas as pd
df = pd.DataFrame(np.arange(2, 14, 2).reshape(2, 3),
    columns=['A', 'B', 'C'])
df

In [None]:
pd.DataFrame({'A': [2, 8],
              'B': [4, 10],
              'C': [6, 12]})

In [None]:
import numpy as np
np.arange(2, 14, 2)

In [None]:
pd.Series([1, 2, 3], dtype=float)

In [None]:
df['Var'] = None
df

### 5.3 ブロードキャスト

In [None]:
df = pd.DataFrame(np.arange(2, 8).reshape(2, 3))
df // 2  # 2で割った商

In [None]:
df + [2, 1, 0]

In [None]:
(df.T + [3, 0]).T

### 5.4 条件抽出

In [None]:
df = pd.DataFrame(np.arange(8).reshape(4, 2),
                 columns=['A', 'B'])
i, j = 2, 5
df[(df.A==i) | (df.B==j)]

In [None]:
df.query('A==@i or B==@j')

### 5.5 ユニバーサル関数

In [None]:
df = pd.DataFrame(np.arange(2, 8).reshape(2, 3))
df < 5

In [None]:
np.less(df, 5)

In [None]:
df.apply(lambda v: v < 5)

### 5.6 軸で演算する関数

In [None]:
df = pd.DataFrame(np.arange(2, 8).reshape(2, 3))
df.max()

In [None]:
df.max(axis=1)

In [None]:
print(df.values.argmax())  # 5
print(df.values.argmax(0))  # [1 1 1]
print(df.values.argmax(1))  # [2 2]

### 5.7 その他の関数

In [None]:
df = pd.DataFrame([[1, 3], [1, 5], [2, 7]],
                  columns=['A', 'B'])
df  # 元の表

In [None]:
for key, group in df.groupby('A'):
    print(f'{key}:\n{group}\n')

In [None]:
df.groupby('A').first()

In [None]:
df.groupby('A').mean()

In [None]:
df = pd.DataFrame({'I': [1, 1, 2, 2, 3, 3],
                   'J': [2, 3, 1, 3, 1, 2],
                   'Var': 'U V W X Y Z'.split()})
df

In [None]:
pd.merge(df, pd.DataFrame(
    {'I': df.J, 'J': df.I, 'Other': df.Var}))

In [None]:
df = pd.DataFrame(np.arange(2, 8).reshape(2, 3))
for row in df.itertuples():
    print(row)

In [None]:
df = pd.DataFrame([['Alice', 'F'], ['Bob', 'M'],
    ['Dave', 'M']], columns=['Name', 'Type'])
df

In [None]:
pd.get_dummies(df, columns=['Type'])

In [None]:
df = pd.DataFrame({
    '時限': [1, 1, 1, 2, 2, 2],
    '曜日': '月 火 水 月 火 水'.split(),
    '科目': '国 算 社 理 音 体'.split(),
})
df.pivot('時限', '曜日')

### 5.8 グラフ描画について

In [None]:
%matplotlib inline
%config InlineBackend.figure_formats = {'png', 'retina'}
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = 5, 2
plt.rcParams['font.family'] = 'AppleGothic'
df = pd.DataFrame(np.sin(np.linspace(0, np.pi)))
df.plot(title='サイン');

In [None]:
import matplotlib
matplotlib.font_manager.findSystemFonts()

In [None]:
# フォントキャッシュを更新
# matplotlib.font_manager._rebuild()

In [None]:
np.random.seed(2)
pd.DataFrame(np.random.exponential(1, 10)).boxplot();

In [None]:
np.random.seed(1)
df = pd.DataFrame(np.random.exponential(8, 20), columns=['A'])
df.hist(range=(0, 20), bins=4);

In [None]:
pd.value_counts(pd.cut(df.A, range(0, 25, 5)))