## 生徒の成績についてのデータセット

データの取得
http://archive.ics.uci.edu/ml/machine-learning-databases/00356/student.zip<br>
データの説明
https://books.google.co.jp/books?id=ksGlDwAAQBAJ&lpg=PP1&hl=ja&pg=PA76#v=onepage&q&f=false

Zipファイルの内容
- student-mat.csv
- student-merge.R
- student-por.csv
- student.txt

student-mat.csv の内容を確認
 - ; で区切られている

```
school;sex;age;address;famsize;Pstatus;Medu;Fedu;Mjob;Fjob;reason;guardian;traveltime;studytime;failures;schoolsup;famsup;paid;activities;nursery;higher;internet;romantic;famrel;freetime;goout;Dalc;Walc;health;absences;G1;G2;G3
"GP";"F";18;"U";"GT3";"A";4;4;"at_home";"teacher";"course";"mother";2;2;0;"yes";"no";"no";"no";"yes";"yes";"no";"no";4;3;4;1;1;3;6;"5";"6";6
```

In [None]:
# ファイルを読み込み pandas DataFrame 型に変換
import pandas as pd
df_math = pd.read_csv('data/student-mat.csv', sep=';')

In [None]:
# 内容を確認
# - 先頭行から列名がついている
df_math

In [None]:
# DataFrame の要約を表示
df_math.info()

In [None]:
# DataFrame の統計量をまとめて表示
df_math.describe()

## pandas の基本操作

列への操作

In [None]:
# G1 列を取り出す
# - df_math.G1 と書くこともできる
df_math['G1']

In [None]:
# 'G1'列の0行
df_math['G1'][0]

In [None]:
# G1, G2, G3 列のデータフレームを取り出す
df_math[['G1', 'G2', 'G3']]

In [None]:
# 性別が女性 sex=='F' のG3列
df_math.query("sex=='F'")['G3']

In [None]:
# 列のラベル
df_math.columns

In [None]:
# 列の削除
# - axis=1 で列を削除することを指定
# - inplace=True を指定すると、直接データフレームを処理する
#   指定しないと、もとのデータフレームはそのままで、列が削除されたデータフレームが返される
df_math.drop(labels='romantic', axis=1, inplace=True)
df_math.columns

In [None]:
# 複数の列の削除
df_math.drop(labels=['Dalc', 'Walc'], axis=1, inplace=True)
df_math.columns

In [None]:
# 列のユニークな値
df_math['sex'].unique()

In [None]:
# 全ての列のユニークな値
for row in df_math.columns:
    print(row, df_math[row].unique())

In [None]:
# 全ての列のユニークな値をソートして出力
for row in df_math.columns:
    val = df_math[row].unique()
    val.sort()
    print(row, val)

In [None]:
# 全ての列のユニークな値をdict型変数に保存
# - sort() はもとのリストを破壊的に操作
# - ソートされたリストを戻り値として欲しい場合は sorted()
row_dict = {}

for row in df_math.columns:
    val = df_math[row].unique()
    val.sort()
    row_dict[row] = val

row_dict