## 輸入輸出簡述

    - 指將資料讀進Python中做操作，或是將資料從Python以其他形式匯出的動作

---

## 編碼與解碼


    - 編碼: 將字元轉換為二進位bit，以利電腦儲存的過程
    - 解碼: 將bit轉為可讀字元的過程
    - Python中字元表示方法為Unicode，Unicode並非編碼，而是一套包含世界所有語言與符號的字元標準
    - UTF-8是遵循Unicode標準制定的編碼法，其他類似的還有UTF-16, UTF-32
    - 中文的常用編碼: cpXXXX，或是通稱的big5(大五碼)


- ### 檔案讀寫過程詳解

    
    讀檔(輸入): 檔案 --(編碼)--> bits --(解碼)--> Python字串
    寫檔(輸出): Python字串 --(編碼)--> bits --(解碼)--> 檔案內容
    
    

- ### 路徑簡介


    - 樹狀結構
    - 路徑的寫法中，"."可以表示當前目錄，".."表示上一層目錄
    - 不同目錄之間用"/"區隔 (windows用"\")
    - 決定路徑的要點在於知道目前所在位置
    
    - 例: 當前位置在dir1底下時
          home --- test1.py
               |
               --- dir1---------  test2.py
            
          test2.py路徑 : test2.py
          test1.py路徑 : ../test1.py
                      
              

---

## 輸入

    - 讀取檔案

- ### open(file, mode='r')


    - 開啟檔案，但不等於讀取
    - 僅是將要使用的檔案啟動
    - Python的open()會使用作業系統的預設編碼存取檔案
    - mode: 
        - r: 唯讀
        - w: 唯寫 (會覆蓋原本內容)
        - a: 唯寫 (接續原本內容)
        

- ### 讀取方法


    - read(): 讀取全部資料
    - readline(): 讀取一行資料
    - readlines(): 逐行讀取資料，用list承接所有資料

- ### file.close()


        - 被啟動的檔案不會自己關閉，而且一旦開啟則會消耗資源
        - 故動作完成後需要有將檔案關閉的動作

- ### 範例


    - 請下載test.txt檔案

In [1]:
f = open('test.txt')   # 產生一個檔案物件 (物件是對檔案的客觀描述，包含但不限於檔案內容本身)
texts = f.read()       # 取得檔案內容，用變數承接
f.close()              # 關閉檔案

texts                  # 檔案內容以字串表示

'hello world\n\nHi, my name is Tony.\n\nI am an AI engineer.\n\nNice to meet you.\n\n'

In [2]:
f = open('test.txt')
text = f.readline()
f.close()

text                   # readline() 只會讀取一行

'hello world\n'

In [3]:
f = open('test.txt')
texts = f.readlines()
f.close()

texts                   # readlines() 將每一行以字串方式，儲存在 list 裡

['hello world\n',
 '\n',
 'Hi, my name is Tony.\n',
 '\n',
 'I am an AI engineer.\n',
 '\n',
 'Nice to meet you.\n',
 '\n']

---

## 輸出
    
    - 寫入檔案

- ### 寫入方法
    
    
    - file.write()
    - 與讀取時相同，需要先開啟檔案物件，執行寫入，之後關閉檔案物件

In [4]:
text = 'hello world'

f = open('new_test.txt', 'w')
f.write(text)
f.close()

# 查看目錄是否新增檔案

---

## with 關鍵字

    - 前面提到開啟檔案資源之後要記得使用close()關閉
    - 但實際上每次都要寫一次close其實是很麻煩的
    - 使用with語法可以讓python在執行完工作後自動關閉資源

In [5]:
# 將前面的範例改成 with 寫法
with open('test.txt') as f:     # as 後面的 f 即是檔案物件變數名稱
    texts = f.readlines()       # 縮排的區塊定義 with 要執行的動作  
    
texts

['hello world\n',
 '\n',
 'Hi, my name is Tony.\n',
 '\n',
 'I am an AI engineer.\n',
 '\n',
 'Nice to meet you.\n',
 '\n',
 '\n']

---

## 載入模組

    - 內建模組
    - 下載套件/模組

- ### import


    - 載入整個模組

In [None]:
import datetime

- ### from ... import ...


    - 載入部分模組 (物件, 函式)

In [None]:
from datetime import date

---

## csv

    - 是一種檔案類型
    - 定義是以逗號分隔的檔案
    - 經常用來呈現表格類型的資料
    

- ### 範例


    - 下載csv_file.csv

In [3]:
import csv  # 載入 csv模組

In [8]:
#讀取
with open('csv_file.csv') as f:
    texts = f.read()                                   # 讀出所有文字內容
    texts = list(csv.reader(texts.splitlines()))       # csv.reader 接受 iterable 故先將內容分割為 rows 
    # 注意這裡回傳一個產生器 可以用 list 直接取得所有結果
    
texts

[['Name', 'Age', 'Gender'], ['Tony', '30', 'M']]

In [9]:
#寫入
with open('output.csv', 'w') as f:
    writer = csv.writer(f)
    writer.writerows(texts)

[--QUIZ--]

下載foodtracer_nightmarket_merge.csv

找出原物料來源(產地)來自台南市的店家

取出夜市名稱,攤商名稱與攤位資料 (注意排除掉重複的資料)

將取出的資料轉換為字典形式

原物料來自台南的店家分布於那些夜市


In [5]:
import csv

In [6]:
with open('foodtracer_nightmarket_merge.csv') as f:
    data = list(csv.reader(f.readlines()))
    

In [31]:
for d in data:
    if '台南市' in d[-1] or '臺南市' in d[-1]:
        print(d[-2])

台灣糖業股份有限公司
台灣糖業股份有限公司
台灣可果美股份有限公司
台灣糖業股份有限公司
美食家
台灣糖業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
永芳香料食品加工所
台灣糖業股份有限公司
美食家食材通路股份有限公司
台鹽實業股份有限公司?
台灣糖業股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
大統益股份有限公司
台灣糖業股份有限公司
大成長城企業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台鹽實業股份有限公司?
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
豐年豐和企業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
美食家食材通路股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
美食家(大統益股份有限公司)
台灣糖業股份有限公司
台灣糖業股份有限公司
台鹽實業股份有限公司
美食家食材通路股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
牛頭牌(好帝一食品有限公司)
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
瑞西莎拉醬(維味香食品工廠)
台鹽實業股份有限公司 
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
大成長城企業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
統一企業股份有限公司
好帝一食品有限公司
台灣糖業股份有限公司
台灣糖業股份有限公司
大成長城企業股份有限公司
台灣糖業股份有限公司
臺灣糖業股份有限公司
大成長城企業股份有限公司
台灣糖業股份有限公司
大統益股份有限公

In [22]:
data

[['夜市名稱', '攤商名稱', '攤位', '調味名稱', '品牌', '來源(產地)'],
 ['南機場夜市', '正宗福州麵', '中華路二段315巷口', '薑', '青禾商行', '臺北市萬華區國興路52號1樓(青年公園附近)'],
 ['南機場夜市', '黑嚕嚕粉圓', '中華路二段307-309巷間', '黑糖', '黑嚕嚕粉圓店', '台中市大里區仁德里四維街29巷15號1樓'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '冰糖', '台灣糖業股份有限公司', '台南市仁德區田厝里文華路2段326號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '香油', '辰邦股份有限公司', '新北市新莊區化成路403巷47號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '醬油', '金蘭食品股份有限公司', '桃園市大溪區介壽路236號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '鹽', '台鹽實業股份有限公司', '苗栗縣通霄鎮內島里122號'],
 ['南機場夜市',
  '天品滷味',
  '中華路二段307-309巷間',
  '胡椒',
  '小磨坊國際貿易股份有限公司',
  '台中市西屯區工業區一路70號7樓之1'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '香油', '北斗馨油股份有限公司', '彰化縣北斗鎮地政路326之1號'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '辣椒', '自製', '自製'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '糖', '台灣糖業股份有限公司', '台南市仁德區田厝里文華路2段326號'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '鹽', '台鹽實業股份有限公司', '苗栗縣通霄鎮內島里122號'],
 ['南機場夜市',
  '厚道丼飯',
  '中華路二段307-311巷間',
  '沙拉油',
  '美食家食材通路股份有限公司',
  '新北市五股區成泰路二段185-2號'],
 ['南機場夜市', '厚道丼飯', '中

In [9]:
data[1:]

['南機場夜市', '正宗福州麵', '中華路二段315巷口', '薑', '青禾商行', '臺北市萬華區國興路52號1樓(青年公園附近)']

In [10]:
stores = []
for d in data:
    store = (d[0], d[1], d[2])
    if store not in stores:
        stores.append(store)
        
stores

[('夜市名稱', '攤商名稱', '攤位'),
 ('南機場夜市', '正宗福州麵', '中華路二段315巷口'),
 ('南機場夜市', '黑嚕嚕粉圓', '中華路二段307-309巷間'),
 ('南機場夜市', '肉羹涼麵', '中華路二段309-311巷間'),
 ('南機場夜市', '天品滷味', '中華路二段307-309巷間'),
 ('南機場夜市', '厚道丼飯', '中華路二段307-311巷間'),
 ('南機場夜市', '東山鴨頭', '中華路二段307-313巷間'),
 ('南機場夜市', '罔市手工粉圓', '中華路二段307巷'),
 ('南機場夜市', '深海旗魚串', '中華路二段307-309巷間'),
 ('南機場夜市', '美珍越南', '中華路二段307-309巷間'),
 ('南機場夜市', '大腸包小腸', '中華路二段307-309巷間'),
 ('廣州街觀光夜市', '台灣人燒仙草', '廣州街235號路中'),
 ('廣州街觀光夜市', '仙草冰', '廣州街200號'),
 ('廣州街觀光夜市', '豬血糕', '廣州街200號'),
 ('廣州街觀光夜市', '桃鳳湯', '廣州街241號'),
 ('廣州街觀光夜市', '玉米竹竹烤玉米', '廣州街241號路中'),
 ('士林觀光夜市', '台灣水果', '士林夜市地上一樓206攤'),
 ('士林觀光夜市', '冠魚蛋小屋', '士林夜市慈諴宮對面'),
 ('士林觀光夜市', '士林廟口我豪蝦', '士林夜市慈諴宮對面'),
 ('士林觀光夜市', '佳佳實業', '士林夜市地上一樓'),
 ('景美夜市', '大漢草原新疆羊肉串', '文山區景文街75號'),
 ('景美夜市', '瘋吃逢甲大腸包小腸', '文山區景文街43號對面'),
 ('景美夜市', '好口味蔥油餅', '文山區景美街81號'),
 ('景美夜市', '景美廖家古早味雞蛋糕', '文山區景美街36號'),
 ('饒河街觀光夜市', '狀元糕', '饒河街10攤位'),
 ('饒河街觀光夜市', '永哥爆漿好吃雞腿捲', '饒河街23號攤位'),
 ('饒河街觀光夜市', '現炸魷魚船', '饒河街25號攤位'),
 ('饒河街觀光夜市', '北極螺', '饒河街26攤位'),

In [12]:
data

[['夜市名稱', '攤商名稱', '攤位', '調味名稱', '品牌', '來源(產地)'],
 ['南機場夜市', '正宗福州麵', '中華路二段315巷口', '薑', '青禾商行', '臺北市萬華區國興路52號1樓(青年公園附近)'],
 ['南機場夜市', '黑嚕嚕粉圓', '中華路二段307-309巷間', '黑糖', '黑嚕嚕粉圓店', '台中市大里區仁德里四維街29巷15號1樓'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '冰糖', '台灣糖業股份有限公司', '台南市仁德區田厝里文華路2段326號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '香油', '辰邦股份有限公司', '新北市新莊區化成路403巷47號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '醬油', '金蘭食品股份有限公司', '桃園市大溪區介壽路236號'],
 ['南機場夜市', '肉羹涼麵', '中華路二段309-311巷間', '鹽', '台鹽實業股份有限公司', '苗栗縣通霄鎮內島里122號'],
 ['南機場夜市',
  '天品滷味',
  '中華路二段307-309巷間',
  '胡椒',
  '小磨坊國際貿易股份有限公司',
  '台中市西屯區工業區一路70號7樓之1'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '香油', '北斗馨油股份有限公司', '彰化縣北斗鎮地政路326之1號'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '辣椒', '自製', '自製'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '糖', '台灣糖業股份有限公司', '台南市仁德區田厝里文華路2段326號'],
 ['南機場夜市', '天品滷味', '中華路二段307-309巷間', '鹽', '台鹽實業股份有限公司', '苗栗縣通霄鎮內島里122號'],
 ['南機場夜市',
  '厚道丼飯',
  '中華路二段307-311巷間',
  '沙拉油',
  '美食家食材通路股份有限公司',
  '新北市五股區成泰路二段185-2號'],
 ['南機場夜市', '厚道丼飯', '中

In [13]:
nmarkets = []
for d in data:
    if '台南市' in d[-1] or '臺南市' in d[-1]:
        if d[0] not in nmarkets:
            nmarkets.append(d[0])

nmarkets

['南機場夜市',
 '廣州街觀光夜市',
 '士林觀光夜市',
 '景美夜市',
 '饒河街觀光夜市',
 '延三觀光夜市',
 '臨江街觀光夜市',
 '雙城街夜市',
 '華西街觀光夜市',
 '遼寧街夜市',
 '西昌街觀光夜市',
 '寧夏觀光夜市',
 '梧州街觀光夜市',
 '大龍街夜市']

In [19]:
t = set()
for d in data:
    if '台南市' in d[-1] or '臺南市' in d[-1]:
        t.add(d[0])
        
t

{'南機場夜市',
 '士林觀光夜市',
 '大龍街夜市',
 '寧夏觀光夜市',
 '廣州街觀光夜市',
 '延三觀光夜市',
 '景美夜市',
 '梧州街觀光夜市',
 '臨江街觀光夜市',
 '華西街觀光夜市',
 '西昌街觀光夜市',
 '遼寧街夜市',
 '雙城街夜市',
 '饒河街觀光夜市'}

In [18]:
s = {1,2,3}
s.add(3)
s

{1, 2, 3}