# CSV操作

[pandas](https://pandas.pydata.org/)を用いてCSVの操作ができる。

In [1]:
import pandas as pd
import json

CSVを読み込んで`DataFrame`を構築する。

In [2]:
with open("../data/fruits.csv") as f:
    df = pd.read_csv(f)
df

Unnamed: 0,フルーツ名,色,平均重量(グラム)
0,りんご,赤,200
1,バナナ,黄色,120
2,オレンジ,橙色,150
3,ぶどう,紫,5
4,キウイ,緑,90


In [3]:
[row["フルーツ名"] for _, row in df.iterrows()]

['りんご', 'バナナ', 'オレンジ', 'ぶどう', 'キウイ']

`DataFrame`からCSVテキストを得る。

In [4]:
df.to_csv(index=False)

'フルーツ名,色,平均重量(グラム)\nりんご,赤,200\nバナナ,黄色,120\nオレンジ,橙色,150\nぶどう,紫,5\nキウイ,緑,90\n'

JSONへ変換することも可能（CSV関係っつーか`DataFrame`の機能だけども）。

In [5]:
df.to_json(force_ascii=False, orient="records")

'[{"フルーツ名":"りんご","色":"赤","平均重量(グラム)":200},{"フルーツ名":"バナナ","色":"黄色","平均重量(グラム)":120},{"フルーツ名":"オレンジ","色":"橙色","平均重量(グラム)":150},{"フルーツ名":"ぶどう","色":"紫","平均重量(グラム)":5},{"フルーツ名":"キウイ","色":"緑","平均重量(グラム)":90}]'

CSVを読み込んで辞書へ変換する。一部の列はJSON文字列が書かれているので、そこも考慮する。

In [6]:
df2 = pd.read_csv("../data/chinese_cuisine.csv")
df2["主な食材"] = df2["主な食材"].apply(lambda a: json.loads(a))
df2

Unnamed: 0,料理名,主な食材,種類
0,麻婆豆腐,"[豆腐, ひき肉, ニラ]",辛い料理
1,回鍋肉,"[豚肉, ピーマン, ニンニク]",炒め物
2,酢豚,"[豚肉, パイナップル, ピーマン]",甘酢料理
3,餃子,"[豚肉, キャベツ, ニラ]",点心
4,炒飯,"[米, 卵, ネギ, ハム]",炒め物
5,エビチリ,"[エビ, ピーマン, ニンニク, 唐辛子]",辛い料理
6,油淋鶏,"[鶏肉, キュウリ, ニンニクソース]",揚げ物


In [7]:
[
    {
        "料理名": row["料理名"],
        "主な食材": row["主な食材"],
        "種類": row["種類"],
    }
    for _, row in df2.iterrows()
]

[{'料理名': '麻婆豆腐', '主な食材': ['豆腐', 'ひき肉', 'ニラ'], '種類': '辛い料理'},
 {'料理名': '回鍋肉', '主な食材': ['豚肉', 'ピーマン', 'ニンニク'], '種類': '炒め物'},
 {'料理名': '酢豚', '主な食材': ['豚肉', 'パイナップル', 'ピーマン'], '種類': '甘酢料理'},
 {'料理名': '餃子', '主な食材': ['豚肉', 'キャベツ', 'ニラ'], '種類': '点心'},
 {'料理名': '炒飯', '主な食材': ['米', '卵', 'ネギ', 'ハム'], '種類': '炒め物'},
 {'料理名': 'エビチリ', '主な食材': ['エビ', 'ピーマン', 'ニンニク', '唐辛子'], '種類': '辛い料理'},
 {'料理名': '油淋鶏', '主な食材': ['鶏肉', 'キュウリ', 'ニンニクソース'], '種類': '揚げ物'}]