# 表データの取り扱い

## pandasのメリット
* Excel形式のデータを読み込める
* Excel形式に書き出せる
* 表データの中身が見やすい
* plotも手軽
* 数値データ以外も取り扱える
* データの検索・抽出・削除などデータの加工に有用


純粋な工学計算だけに使うのであれば、なくても問題ない。  
データの可視化が容易、Excelファイルの読み書きなど
工学計算のみの使用でも有用な機能を紹介する

## 準備
1. matplotlibのバックエンドはinline
2. pandasはpdという別名でインポートされうことが多い
3. numpyのインポート
4. 下記のx,y
```python
x = np.linspace(0,1.,101)
y = np.sin(2.*np.pi*x)
```

## DataFrame
データを格納する表。
第一引数に配列(x,yを列方向に結合)を渡す。
各列名をcolumusの引数にリストとして渡す。

```python
df1 = pd.DataFrame(np.c_[x,y], columns=["time","data"])
```

このDataFrameインスタンスはplotメソッドを持ち、容易にプロット可能
```python
df1.plot(x="time")
```

plotメソッドの引数にグラフの体裁を整えるオプションが使用できる
```python
df1.plot(x="time",grid=True,xlim=(0,1.),title="sin",figsize=(6,6))
```

表の中身はインスタンスを指定するとJupyterNotebookがいい感じのHTMLで表示してくれる

ただし長い。。。転置して表示するのがおおすすめ

データすべて見なくても概要だけでよい場合、インスタンスメソッドdescribeを使う

## Excelファイル形式の取り扱い
初めにDataFrameの複製を行う。
```python
df2 = df1.copy()
df2.data = df2.data +1
```

Pythonを用いてデータ処理した結果をExcel形式のファイルとして保存する。  
ExcelWriterインスタンスにデータを与え、書き込んでいる
```python
writer = pd.ExcelWriter('pandas.xlsx')
df1.to_excel(writer,sheet_name='170317')
df2.to_excel(writer,sheet_name='170318')
writer.save()
```


逆に、excelファイルから読み込む場合はread_excelメソッドを使う
```python
df3 = pd.read_excel("./pandas.xlsx",sheet_name="170318")
```

## CSVファイル形式の取り扱い
csvファイルの読み込みはDataFrameインスタンスのto_csvメソッドを使い、  
読み込みpd.read_csv関数を使う 
```python
df2.to_csv("pandas.csv")
df4 = pd.read_csv("pandas.csv",index_col=0)
df4.T
```

---

<div align="right">This Text by Katayama is licensed under <a harf="https://creativecommons.org/licenses/by/4.0/">a Creative Commons Attribution 4.0 International License. </a>   </div>
<img src="./by.png" width=100pt align="right">
