# CSV 檔案操作

CSV 是什麼：
＄ CSV 是一種以「逗號分隔值」的檔案格式，並以「純文字形式」儲存資料
```
name,id,color,price
apple,1,red,10
orange,2,orange,15
grap,3,purple,20
watermelon,4,green,30
```

## reader()	csvfile	讀取 CSV 檔案 ( 串列形式 )。

In [3]:
import os
import csv


with open("./new_file.csv", mode="r", newline="", encoding="utf8") as f:
    csv_data = csv.reader(f)
    for i in csv_data:
        # print(i[1].title())
        print(i)
        

B
['a', 'b', 'c']
2
['1', '2', '3']
Y
['x', 'y', 'z']


## writer()	csvfile	寫入 CSV 檔案 ( 串列形式 )。

In [1]:
import csv

data = [
    ['a', 'b', 'c'],
    ['1', '2', '3'],
    ['x', 'y', 'z']
]

with open("./new_file.csv", mode="w", newline="", encoding="utf8") as f:
    csv_writer = csv.writer(f, delimiter=",")
    for row in data:
        csv_writer.writerow(row)

## DictReader()	csvfile	讀取 CSV 檔案 ( 字典形式 )。

csv.DictReader(csvfile) 可以用「字典」的型態，讀取 CSV 檔案，讀取後可以使用字典的操作方式，將每一行 ( row ) 印出，除了 csvfile 為必須填入的參數，還有下列幾個非預設的參數 ( 不填入則使用預設值 )。
- fieldnames	預設 None，會使用 CSV 的第一行作為字典的鍵，如果有設定則會以 fieldnames 的內容作為鍵。
- restkey	預設 None，如果有設定，某一行多出來的資料會以 restkey 設定值作為鍵。
- restval	預設 None，如果有設定，某一行缺少的資料會以 restval 作為值。

In [8]:
import os
import csv

with open("./new_file.csv", mode="r", encoding="utf8") as f:
    data = csv.DictReader(f)        # 以字典方式讀取資料
    for i in  data:
        print(i)

{'a': '1', 'b': '2', 'c': '3'}
{'a': 'x', 'b': 'y', 'c': 'z'}


如果 CSV 的第一行不是標題 ( 直接就是資料 )，可透過下方的程式碼，使用 fieldnames 加入鍵 ( 為了明顯區隔，範例裡使用 a、b、c、d )，輸出結果可以看到，字典裡所有資料的鍵，都變成 a、b、c、d。

In [9]:
import csv
keys = ['a','b','c','d']       # 手動設定字典的鍵
with open("./new_file.csv", mode="r", encoding="utf8") as f:
    data = csv.DictReader(f, fieldnames=keys)

    for i in data:
        print(i)

{'a': 'a', 'b': 'b', 'c': 'c', 'd': None}
{'a': '1', 'b': '2', 'c': '3', 'd': None}
{'a': 'x', 'b': 'y', 'c': 'z', 'd': None}


## DictWriter()	csvfile, fieldnames	寫入 CSV 檔案 ( 字典形式 )

＄ DictWriter(csvfile, fieldnames) 可以用「字典」的型態，將資料寫入 CSV 檔案，寫入的方法分成 writerow 單行寫入以及 writerows 多行寫入兩種

In [10]:
"""單行寫入"""
import os
import csv
fieldnames = ['name','id','color','price']    # 定義要寫入資料的鍵
with open("./new_file.csv", mode="a", encoding="utf8") as f:
    data = csv.DictWriter(f, fieldnames=fieldnames)  # 設定 data 為寫入資料
    data.writerow({'name':'papaya','id':5,'color':'orange','price':30})


In [11]:
"""多行寫入"""
import os
import csv
fieldnames = ['name','id','color','price']    # 定義要寫入資料的鍵
with open("./new_file.csv", mode="a", encoding="utf8") as f:
    data = csv.DictWriter(f, fieldnames=fieldnames)  # 設定 data 為寫入資料
    w = [
        {'name':'papaya','id':5,'color':'orange','price':30},
        {'name':'banana','id':6,'color':'yellow','price':20}
    ]
    data.writerows(w)

# JSON 檔案操作

## json.load(fp) 會讀取本機 JSON 檔案，並轉換為 Python 的字典 dict 型別

函數有load、loads、dump、dumps，那我實測過，覺得知道load跟dump就更用了。

In [17]:
# 读取 JSON 文件
import json

with open('./new_file.json', 'r') as f:
    data1 = json.load(f)
print(data1)


{'name': 'oxxo', 'sex': 'male', 'age': 18, 'phone': [{'type': 'home', 'number': '07 1234567'}, {'type': 'office', 'number': '07 7654321'}]}


In [20]:
# 寫入ㄋ JSON 文件
import json

data = {}
data['name'] = 'oxxo'
data['age'] = 18
data['eat'] = ['apple','orange']
with open('./new_file.json', 'w') as f:
    json.dump(data, f, indent=4) # indent縮排


# EXCEL 檔案操作

-   worksheet：工作表

＄ 先安裝 pip install openpyxl

In [None]:
# NOTE: 基本讀excel文件的方式 
from openpyxl import load_workbook

wb = load_workbook("./DataFile/Dodgers.xlsx")
result = []

ws = wb.worksheets[0] # 第一個工作表
for i in ws.iter_rows(): # 選擇行
    result.append([j.value for j in i]) # 選擇列

print(result,end="\n")

# TODO: 計算全肥打
sum = 0
for i in result[1:]:
    sum+=int(i[11])
print(f"the total homerun：{sum}")

In [None]:
# NOTE: 基本寫excel文件的方式
# 讀csv轉成excel

from openpyxl import Workbook
import csv

data_rows = []
with open("./DataFile/file.csv", mode="r", newline="", encoding="utf8") as f:
    csv_data = csv.reader(f)
    for i in csv_data:
        data_rows.append(i)

wb = Workbook()
ws = wb.active
ws.title = "my_file" # 工作表平稱
# 工作表頁籤底色
ws.sheet_properties.tabColor="1072BA"
for i in data_rows:
    ws.append(i)

wb.save("./OutputFile/my_file.xlsx")