# 有關檔案編碼的部分，請參考這個連結
[standard-encodings](https://docs.python.org/3/library/codecs.html#standard-encodings)

In [15]:
# 安裝套件
!pip install pandas openpyxl

Defaulting to user installation because normal site-packages is not writeable



[notice] A new release of pip is available: 23.3.2 -> 24.0
[notice] To update, run: python.exe -m pip install --upgrade pip


In [16]:
# 匯入套件
import pandas as pd

# 讀寫 csv 檔
- CSV: Comma-Separated Values
  - pd.read_csv(): 讀取 csv 檔
  - df.to_csv(): 寫入 csv 檔
- 請另存下載 [csv檔: 垃圾車點位路線資訊](https://data.taipei/api/frontstage/tpeod/dataset/resource.download?rid=a6e90031-7ec4-4089-afb5-361a4efe7202) 到專案目錄當中。

In [17]:
import chardet
import csv

def check_csv_encoding(file_path):
    with open(file_path, 'rb') as f:
        reader = csv.reader(f)
        # lines = [line for line in reader]

        result = chardet.detect(f.read())  
        encoding = result['encoding']

        f.close()

    print("CSV 文件編碼格式為：", encoding)

check_csv_encoding(r"./files/垃圾車點位資訊.csv")

CSV 文件編碼格式為： Big5


In [18]:
# 讀取 csv 格式檔案
'''
pd.read_csv(
    filepath_or_buffer="你的檔案路徑", 
    sep="分隔符號", 
    header=True或False, 
    index=True或False, 
    encoding=None, 
    ...
)

說明:
- 引數 filepath_or_buffer不一定要寫: 
  - df = pd.read_csv("./output.csv")
- 近年許多檔案或資料，都使用 UTF-8 進行編碼
  - 一般來說，只要是 utf-8 編碼格式儲存的檔案，讀取成 dataframe 時候，不用特別指定編碼。
  - 然而本例使用的 csv 檔，需要用 ANSI 編碼來開啟。
'''
df = pd.read_csv(filepath_or_buffer="./files/垃圾車點位資訊.csv", encoding="big5"); df

Unnamed: 0,行政區,里別,分隊,局編,車號,路線,車次,抵達時間,離開時間,地點,緯度,經度
0,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1630,1638,臺北市中山區建國北路一段69號前,121.536944,25.051111
1,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1640,1649,臺北市中山區南京東路三段176號前(遼寧街口),121.542222,25.051944
2,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1650,1658,臺北市中山區南京東路三段214號前,121.543385,25.051725
3,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1700,1709,臺北市中山區復興北路66號,121.543853,25.050820
4,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1710,1716,臺北市中山區復興北路28號前,121.543813,25.048861
...,...,...,...,...,...,...,...,...,...,...,...,...
4043,萬華區,新起里,漢中分隊,110-G01,KEJ-0038,漢中-1,第3車,2141,2145,臺北市萬華區內江街110號前,121.503430,25.041577
4044,萬華區,新起里,漢中分隊,110-G01,KEJ-0038,漢中-1,第3車,2146,2150,臺北市萬華區內江街74之1號前,121.504185,25.041492
4045,萬華區,西門里,漢中分隊,110-G01,KEJ-0038,漢中-1,第3車,2151,2155,臺北市萬華區昆明街160號前,121.504607,25.042125
4046,萬華區,西門里,漢中分隊,110-G01,KEJ-0038,漢中-1,第3車,2156,2200,臺北市萬華區昆明街134之2號前,121.504724,25.042720


In [19]:
# 寫入 csv 檔案
'''
預設是 row number 和 column name 都包括進去，不習慣加進 csv 檔的話，可以這樣寫:
df.to_csv(path_or_buf="./output.csv", index=False, header=False)

另外，引數 path_or_buf 不一定要寫:
df.to_csv("./output.csv", index=False, header=False)
'''
df.to_csv(path_or_buf="./垃圾車點位資訊_output.csv", index=False, encoding="utf-8-sig"); df.head()

Unnamed: 0,行政區,里別,分隊,局編,車號,路線,車次,抵達時間,離開時間,地點,緯度,經度
0,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1630,1638,臺北市中山區建國北路一段69號前,121.536944,25.051111
1,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1640,1649,臺北市中山區南京東路三段176號前(遼寧街口),121.542222,25.051944
2,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1650,1658,臺北市中山區南京東路三段214號前,121.543385,25.051725
3,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1700,1709,臺北市中山區復興北路66號,121.543853,25.05082
4,中山區,力行里,長安分隊,100-021,119-BQ,長安-3,第1車,1710,1716,臺北市中山區復興北路28號前,121.543813,25.048861


# 讀寫 json 檔
- JSON（JavaScript Object Notation）
  - pd.read_json(): 讀取 json 檔
  - df.to_json(): 寫入 json 檔
- 使用 [Cafe Nomad](https://cafenomad.tw/developers/docs/v1.2) 的資料來測試。
  - 請另存下載: [https://cafenomad.tw/api/v1.2/cafes/taipei](https://cafenomad.tw/api/v1.2/cafes/taipei)

In [20]:
# 讀取 json 格式檔案
'''
參考連結:
[1] pandas.read_json
https://pandas.pydata.org/docs/reference/api/pandas.read_json.html
[2] pandas.json_normalize
https://pandas.pydata.org/docs/reference/api/pandas.json_normalize.html
'''
df = pd.read_json('./files/taipei.json'); df.head()

Unnamed: 0,id,name,city,wifi,seat,quiet,tasty,cheap,music,url,address,latitude,longitude,limited_time,socket,standing_desk,mrt,open_time
0,000703fe-cf8a-43c8-bd83-c90cfd61915f,蜂巢咖啡,taipei,0.0,4.5,3.0,5.0,4.0,4.0,https://www.facebook.com/honeycombcafe2016/,新北市永和區永貞路214號,25.004097,121.515287,no,no,yes,永安市場站,雙週四公休，有變更另外公告
1,0022fc3b-598f-4bb5-bb69-1b7d1b9b5202,(暫停營業) The Kaffa Lovers,taipei,5.0,5.0,5.0,5.0,4.0,5.0,https://www.facebook.com/thekaffalovers/?fref=ts,台北市中正區金山北路3號,25.044354,121.530456,no,maybe,yes,忠孝新生,週二至週五 10:00-19:00 六日09:00-19:00
2,005a5ee9-7460-4f8a-b965-8b9565ee1e4e,一杯咖啡士林店,taipei,0.0,0.0,0.0,0.0,0.0,0.0,https://www.facebook.com/acupofcoffeeshilin/,台北市士林區中山北路五段505巷36號,25.093021,121.526678,no,yes,yes,,
3,00971781-cad6-4a6f-8a38-b597d8a1488b,Full of Beans 充滿豆豆咖啡館,taipei,0.0,0.0,0.0,0.0,0.0,0.0,https://www.facebook.com/FOBcafe.gallery/,台北市中山區龍江路21巷9-6號,25.047838,121.541138,,,,,
4,00b6ce2b-d92e-44e5-b1cb-daaa925a5135,良食究好市集餐廳WONMI,taipei,5.0,3.0,3.0,5.0,0.0,5.0,http://www.wonmi.com.tw/home.php,台北市八德路四段138號 (京華城 Living Mall 10 F),25.048354,121.5623,,,,,


In [21]:
# 寫入 json 檔案
'''
參考連結:
[1] pandas.DataFrame.to_json
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_json.html
'''
df.to_json('./taipei_output.json', indent=None, orient='records', lines=False, force_ascii=False)

# 讀寫 xml
- eXtensible Markup Language
  - pd.read_xml(): 讀取 xml 檔
  - df.to_xml(): 寫入 xml 檔
- 使用 [臺北市政府求職徵才職缺資訊](https://data.taipei/dataset/detail?id=f2f3f0d3-9e84-4fc5-af4d-5814563e17b3) 的資料來測試
  - 請另存下載: [https://dop.blob.core.windows.net/ipsnworkcontainer/jobs.xml](https://dop.blob.core.windows.net/ipsnworkcontainer/jobs.xml)

In [22]:
# 讀取 xml 格式檔案
'''
參考連結:
[1] pandas.read_xml
https://pandas.pydata.org/docs/reference/api/pandas.read_xml.html
'''
df = pd.read_xml("./files/jobs.xml"); df

Unnamed: 0,No,dept_code,dept_name,Job_no,Modify_date,tel,level,job_Kind_Name,title,pop_Kind_Name,...,apply_rule,job_desc,job_location_Name,job_address,official_rule,is_duty,Special_rule,contact,File_Path,Note
0,1,379590000E,臺北市政府文化局,62120,112/04/06,,"280薪點，月支報酬新臺幣36,316元",無,約僱科員,約僱人員,...,一、中華民國國民並無雙重國籍者。<br>二、大專以上畢業者。<br>三、具土木、建築、營建工...,一、古蹟、歷史建築等文化資產修復及文化設施之委託技術服務招標、工程招標、施工監督及驗收等相關...,,臺北市政府文化局(11008 臺北市信義區市府路一號四樓),否,無需輪值,歡迎身心障礙、歡迎原住民族,報名應繳文件：\n一、個人履歷表。\n二、最高學歷畢業證書等資料影本（國內外學歷須經教育部認...,,
1,2,379670000G,臺北市政府產業發展局,62119,112/04/06,,280薪點,無,約僱辦事員,約僱人員,...,1、國內外之公、私立大專以上學校畢業。<br>2、具中華民國國籍，無公務人員任用法第26、2...,1.辦理工廠設立登記、動產擔保交易登記。<br>2.工廠管理輔導法相關法規與專案性質業務與查...,,臺北市信義區市府路1號北區10樓,否,無需輪值,歡迎身心障礙、歡迎原住民族,"1、本職缺⽉薪280薪點，折合為新臺幣36,316元，尚需扣除勞、健保及勞退個⼈⾃付等費⽤。...",,
2,3,379040300E,臺北市立圖書館,62118,112/04/06,,280薪點,無,政風室約僱課員,約僱人員,...,(一)國內外專科以上學校畢業者。<br> (二)高級中等學校畢業，並具有與擬任工作性質相當...,（一）廉政宣導。<br>（二）安全維護業務。<br>（三）錄影監視系統管理。<br>（四）採...,,臺北市立圖書館政風室(106210 臺北市大安區建國南路二段125號7樓),否,無需輪值,歡迎身心障礙、歡迎原住民族,(一)意者請檢具履歷、自傳及相關學歷畢業證書影本，如具政風、工程或建築管理及與本職務相關之實...,,
3,4,379490000A,臺北市文山區公所,62117,112/04/06,,"約僱5等280薪點(約新台幣36,316元)",無,約僱人員,約僱人員,...,1.國內外大專以上學校畢業，或高級中等學校畢業，並具有與擬任工作性質相當之訓練6個月以上或2...,1.總收文及相關公文處理等業務。<br>2.協助檔案管理相關作業。<br>3.每日郵局寄信及...,,116008臺北市文山區木柵路３段220號8、9樓,否,無需輪值,,(一)網路報名者：請於公告日期截止前至行政院人事行政總處「事求人」網頁－本職缺公告點選「我要...,,
4,5,379064100X,臺北市立北政國民中學,62116,112/04/06,,委任第5職等至薦任第7職等,綜合行政,事務組長,一般人員,...,一、經銓敘合格實授委任第五職等(含)以上，並具綜合行政職系任用資格之<br>公務人員，且無特...,一、大額工程發包、大額財物招標、大額勞物招標。<br>二、各招標合約製作及採購案之擴充續約等...,,臺北市立北政國民中學總務處(臺北市文山區指南路三段 2 巷 14 號)。,是,無需輪值,,(02)29393651轉12，聯絡人：劉主任。,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
144,145,379700300A,臺北市建成地政事務所,61824,112/04/06,,委任第5職等或薦任第6職等至第7職等,地政,課員,一般人員,...,1.教育部認可之國內外大專以上學歷，且具地政職系任用資格者。<br>2.熟稔地政業務，具審查...,1.辦理土地登記案件審查。<br>2.承辦相關公文業務。<br>3.土地登記法令諮詢服務。<...,,臺北市建成地政事務所(臺北市萬華區和平西路3段120號7~9樓),是,無需輪值,歡迎身心障礙、歡迎原住民族,(一)\t本職缺採線上作業方式，意者請於112年4月6日前進入行政院人事行政總處「事求人」徵...,,
145,146,379145700I,臺北市中山區健康服務中心,61806,112/04/06,,無,無,技工,技工,...,1.需為臺北市政府所屬各機關現職技工、工友或駕駛，並符合下列資格條件：<br>(1)國民小學...,1.公文交換。<br>2.辦公機具簡易維護。<br>3.環境清潔及維護。<br>4.協助庶務...,,臺北市中山區健康服務中心（臺北市中山區松江路367號7樓）,否,無需輪值,歡迎身心障礙、歡迎原住民族,1.請將「調僱意願表」親自簽章後，併同履歷表（亦可採用公務人員簡式履歷表）、畢業證書影本、身...,,
146,147,379023300A,臺北市中山區戶政事務所,61770,112/04/06,,無,無,工友,工友,...,需為臺北市政府所屬各機關學校現職職工，並符合下列資格條件：<br>1.國小以上畢業或具有同等...,1.行政庶務（市府公文交換及繳款外勤工作等）。<br>2.勞務工作（辦公廳舍打掃清潔等）。<...,,臺北市中山區戶政事務所（臺北市中山區松江路367號2樓）,否,無需輪值,歡迎身心障礙、歡迎原住民族,一、符合資格條件且有意願者，請填妥事務工友甄選履歷表及職工調僱意願表後由當事人簽章，並檢附(...,,
147,148,379091000Y,臺北市中山區濱江國民小學,61758,112/04/06,,無,無,代理教師,代理教師,...,凡中華民國國民，且身心健康、品德優良，無現行教師法第14條、109年6月30日施行之教師法第...,幼兒園教學工作(詳見簡章),,臺北市中山區濱江國民小學(臺北市中山區樂群二路266巷99號),否,無需輪值,歡迎身心障礙、歡迎原住民族,一、甄選類別與員額：\n代理教師職缺(幼兒園差假代理教師，詳見簡章11-20招)\n二、報考...,,


In [23]:
# 寫入 xml 檔案
'''
參考連結:
[1] pandas.DataFrame.to_xml
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_xml.html
'''
df.to_xml("./jobs_output.xml")

# 讀寫 excel
- 語法: 
  - pd.read_excel(): 讀取 excel 檔
  - df.to_excel(): 寫入 excel 檔
- 記得先安裝套件: `pip install openpyxl`

In [24]:
# 讀取 excel 格式檔案
'''
參考連結:
[1] openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files
https://openpyxl.readthedocs.io/en/stable/
[2] pandas.read_excel
https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html
'''

df = pd.read_excel("./files/通訊錄.xlsx"); df

Unnamed: 0,中文姓名,電話,英文名稱
0,楊○○,978000000,Darren
1,林○○,910000000,Lin
2,江○○,939000000,Jiang


In [25]:
# 寫入 excel 檔案
'''
參考連結:
[1] pandas.DataFrame.to_excel
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_excel.html
'''
df.to_excel("./通訊錄_output.xlsx", index=False)