# 檔案存取與 Numpy

##  本堂教學重點
1. 檔案基本操作
2. CSV 與JSON 操作
3. 檔案例外處理
4. 檔案關閉動作

##  檔案存取
- 在讀取或寫入文件之前，必須使用 Python 內建的 open( ) 函數開啟 文件。 這個函數將建立一個文件物件，這個文件物件會與真實的文件做連結，可讓您透過文件物件對文件進行存取動作。
- file object = open(file_name [, access_mode])
- UTF8 編碼資料還請加入另一個參數才可避免亂碼:encoding=‘utf-8'
- file object = open(file_name [, access_mode])
    1. file_name:file_name 參數是一個字串資料，代表包含要連結的文件名稱。
    2. access_mode:access_mode 確定文件必須打開的模式，包括讀取、寫 入、附加等等。稍後會列完整列表。這是可選參數，默認文件訪問模式為 讀取(r)。
    

| 存取模式 | 描述 |
|:--      |:-- |
| r | 連結開啟僅供閱讀的文件， 這是預設模式。|
| rb | 以二進位方式連結開啟僅供閱讀的文件。|
| r+ | 連結一個用於閱讀和寫作的文件。|
| rb+ | 連結一個用於閱讀和寫作的二進位格式文件。|
| w | 連結文件後僅供寫入。 如果文件存在，則覆蓋該文件。 如果文件不存在，則建立一個新文件後進行寫入。 |
| wb | 連結二進位格式的文件後僅供寫入。如果文件存在，則覆蓋該文件。 如果文件不存在，則建立一個新文件進行寫入。 |
| w+ | 連結文件後可以寫入和閱讀。如果文件存在，則覆蓋現有文件。 如果文件不存在，則建立一個新文件進行閱讀和寫入。 |
| wb+ | 連結二進位格式文件後可以寫入和閱讀。如果文件存在，則覆蓋現有文件。 如果文件不存在，則建立一個新文件進行閱讀和寫入。 |
| a | 連結一個文件進行附加。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入。 |
| ab | 連結一個二進位格式文件進行附加。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入。 |
| a+ | 連結一個文件進行附加與讀取。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入與讀取。 |
| ab+ | 連結一個文件進行附加與二進位格式讀取。 如果文件存在，將處於從後面加入的 模式。 如果文件不存在，它將建立一個新文件進行寫入與讀取。 |

In [1]:
# 操作範例 1:請動手操作，並留意輸出結果
# 使用print()寫入
text = '''python與中文
1. 我們來試試看中文儲存能力。
2. 許這個字會有編碼衝突風險。
3. 犇這個字必須是utf8編碼才有。'''

print(text ,file=open('data.txt','w',encoding='utf-8'))
#print(text ,file=open('data.txt','w'))


In [None]:
# 操作範例 1:請動手操作，並留意輸出結果
# 使用檔案實體方法write()寫入檔案
text = '''
python與中文
1. 我們來試試看中文儲存能力。
2. 許這個字會有編碼衝突風險。
3. 犇這個字必須是utf8編碼才有。
'''
file = open('sample1.txt','w',encoding='utf-8')
file.write(text)
file.close()

In [None]:
# 操作範例 2:請動手操作，並留意輸出結果
#建立50位學生,每位學生5個分數
# write()


import random

students = []
for _ in range(50):
    scores = [] #建立一個0元素的list
    for _ in range(5):
        scores += [random.randint(50,100)]
    students.append(scores)

file = open('students.txt','w',encoding='utf-8')
file.write(str(students))
file.close()

###  檔案讀取方式
- read([size]) 方法
    1. read([size]) 方法從文件當前位置起讀取 size 個字元數量，若無參數，則代表讀取至文件結束為止。
    2. 中文、英數與換行都是一格。

In [None]:
# 操作範例:請動手操作，並留意輸出結果

file = open('data.txt', 'r', encoding='UTF-8') 
content = file.read()
print(content)
#file.close( )
print("-------------")
#file = open('data.txt', 'r', encoding='UTF-8') 
content2 = file.read(5)
print(content2)
file.close( )


###  檔案讀取方式
- readline 方法
    1. 這個方法每次讀出一行內容，所以讀取時占用緩衝區較小，比較適合大型文件讀取，讀取到沒有資料為止。
- 若不使用 readline 可用 with 敘述一行一行讀取資料，再使用 for 迴圈 逐一進行處理。
- len( ) 代表計算字串字數。
- readlines 方法
    1. 這方法將讀取整個文件所有行，保存在一個 list 內。
- 讀取文件後可搭配使用的方法
    1. strip() 去除字串首尾的空白。
    2. lstrip( ) 去除字串左邊的空白。
    3. rstrip( ) 去除字串右邊的空白。
    4. startswith(‘字元’): 第一個字元。

In [None]:
# 操作範例:請動手操作，並留意輸出結果

f=open('data1.txt', 'r', encoding='UTF-8') 
result = list( )
for line in f.readlines( ):
    line = line.strip( )
    if not len(line) or line.startswith('#'):
        continue 
    result.append(line)
f.close()
result.sort( )
print(result)
open('result-readlines.txt', 'w', encoding='UTF-8').write('%s' % '\n'.join(result))

###  寫入 CSV 檔案
- 必須加入 import csv
- 利用 writer( ) 可寫入資料，寫入時注意
    1. delimiter - 這是代表分隔符號
    2. quotechar - 這是代表包住字串的符號
- 使用 writerow( ) 方法進行特定的儲存格寫入

In [None]:
#csv寫入檔案
import csv
'''
編號, 國文, 英文, 數學, 自然, 社會
01, 87, 90, 56, 87, 89
02, 98, 56, 78, 90, 49
'''
with open('students.csv','w', newline='') as file:
    csvWriter = csv.writer(file)
    csvWriter.writerow(['編號', '國文', '英文', '數學', '自然', '社會'])
    csvWriter.writerow(['01', 87, 90, 56, 87, 89])
    csvWriter.writerow(['02', 98, 56, 78, 90, 49])
print("程式結束")

In [None]:
#csv寫人檔案
#建立50位學生,每位學生5個分數
import random
import csv

with open('students.csv','w', newline='', encoding='UTF-8') as file:
    csvWriter = csv.writer(file)
    csvWriter.writerow(['編號', '國文', '英文', '數學', '自然', '社會'])
    for i in range(50):
        scores = [str(i+1)] #建立一個1元素的list
        for _ in range(5):
            scores += [random.randint(50,100)]
        csvWriter.writerow(scores)
print("程式結束")

###  讀取 CSV 檔案

逗點分隔（Comma-Separated Values，簡稱 csv）是一種簡單的文字檔格式，以逗號分隔不同欄位的資料，很多軟體在儲存與交換表格資料時都支援這樣的格式。 

- CSV 格式是資料庫最常用的導入和導出格式。
- 資料均沒有類型，一切都是字串。
- 沒有字體或顏色與儲存格寬度高度的設置。
- Python 語法必須加入 import csv。
- 讀取儲存格資料:
 1. reader( ):依照每一列的編號 由0開始
 2. DictReader( )
    - 以第一列的值為每一行的名稱，第一列不是資料
    - 也可以重新命名，但第一列必須是資料

In [None]:
#我們使用 csv.reader 讀取出來的 rows 會是一個二維的 list
#裡面就是整張表格的資料，這裡我們把每一列的 list 直接輸出，執行後會像這樣：
import csv
with open('students.csv','r',encoding='UTF-8') as file:
    rows = csv.reader(file) #rows是一個generator
    print(rows.__class__)
    
    #for row in rows:
    #   print(row.__class__) #取出的是list物件
    studentsList = list(rows)
    print(studentsList)

In [None]:
#延序上題
import csv
with open('students.csv','r',encoding='UTF-8') as file:
    rows = csv.reader(file) #rows是一個generator
    print(rows.__class__)
    
    #for row in rows:
    #   print(row.__class__) #取出的是list物件
    studentsList = list(rows)
    #print(studentsList)
    studentsList.pop(0)
    #print(studentsList)
    #list(map(int, ['1','2','3'])) #map的使用方法
    for index in range(len(studentsList)):
        student = studentsList[index]
        student = list(map(int, student))
        studentsList[index] = student
print(studentsList)    
studentIndex = int(input('請輸入學生編號(1-50):'))
for student in studentsList:
    if studentIndex == student[0]:
        print(student)
        break
print("程式結束")

In [None]:
#請讀入資料集內的(各鄉鎮市區人口密度.csv)
#將資料轉為2維的list=>[[],[],[]]
#將資料轉為2維的list=>[{},{},{}]

import csv

t
f = open('各鄉鎮市區人口密度.csv','r',encoding='UTF-8')
rows = csv.reader(f)
for row in rows:
    if row[0] == '106':
        poplist.append(row)
f.close()
poplist

In [None]:
#請讀入資料集內的(各鄉鎮市區人口密度.csv)
#將資料轉為2維的list=>[{},{},{}]
import csv
poplist = list()
f = open('各鄉鎮市區人口密度.csv','r',encoding='UTF-8')
next(f)
reader = csv.DictReader(f)
data=[{'統計年':row['統計年'],'區域別':row['區域別'],'年底人口數':row['年底人口數'],'土地面積':row['土地面積'],'人口密度':row['人口密度']} for row in reader]
for item in data:
    if '新北市' in item['區域別']:
        poplist.append(item)
poplist

###  Python 與 JSON

#### Python 的資料型態與 JSON 的資料型態略有差異:
| Python 資料型態 | JSON 資料型態 |
|:-- |:-- |
| dict | object |
| list,tuple | array |
| int,float | number |
| True | true |
| False | false |
| None | null |

###  從 Python 到 JSON
1. 以 json.dumps( ) 函數從 Python dictionary轉出JSON字串。
2. 以 json.dump( ) 函數從 Python dictionary轉出 JSON 檔案中。
3. json資料於Python處理UTF8碼內容會產生亂碼，建議 dumps 時加入 以下的參數才可以正確處理UTF8碼內容:ensure_ascii=False 
4. Python 與 JSON 檔案:
    - JSON 檔案的中文資料於某些編輯軟體內會變成亂碼，但 Python 可以存取。
    - 檔案寫入可用一般文件方式寫入，也可以使用 JSON 的方法寫入。

In [None]:
# 操作範例 1:請動手操作，並留意輸出結果
# 將dictionary轉成json格式的字串

import json
pyDic = {'python': 'good', 'gjun': 100, 'python-class':True,'ICQ': None}
json2 = json.dumps(pyDic, ensure_ascii=False)
print(type(json2))
json3=json2.encode('utf8')
print(type(json3))
print(json2)
print(json3)

In [None]:
# 操作範例 2:請動手操作，並留意輸出結果

import json
data = {}
data['people'] = []
data['people'].append({'name': 'Scott','website': 'stackabuse.com','from': 'Nebraska'})
data['people'].append({'name': 'Larry', 'website': 'google.com', 'from': 'Michigan'})

#使用dump寫入json檔案,必需使用python的dictionary物件
with open('data.json', 'w') as outfile:
    json.dump(data, outfile)

#使用write寫入使需使用的json字串格式
json2 = json.dumps(data)
file=open('score.json','w',encoding='utf-8')
file.write((json2));
file.close();


###  從 JSON 到 Python
1. 以 json.loads( ) 函數從 JSON 字串中取出資料轉入 Python。
2. 以 json.load( ) 函數從 JSON 檔案中取出資料轉入 Python。

In [None]:
# 操作範例 1:請動手操作，並留意輸出結果
#使用loads將json格式的字串傳成python的Dict

import json
json1 = '{"python": "good", "gjun": 100, "python-class": true, "ICQ": null}'
json2 = json.loads(json1)
print(json2)

In [None]:
# 操作範例 2:請動手操作，並留意輸出結果
#使用load()將json檔轉成Dictionary

import json

#data = json.load('score.json')  #會出錯

with open('score.json') as json_file:
    data = json.load(json_file)
    for p in data['people']:
        print('Name:' + p['name'])
        print('Website:' + p['website'])
        print('From:'+p['from'])
        print()


In [None]:
# 請處理(新北市公共自行車租賃系統.json)
# google搜尋online json viewer

import json
with open('新北市公共自行車租賃系統.json') as json_file:
    data = json.load(json_file)
    if data['success']:
        records = data['result']['records']
    else:
        print('讀取失敗')

for record in records:
    if '新店區' in record['sarea']:        
        print('區域',record['sarea'])
        print('站名',record['sna'])
        print('地址',record['ar'])
        print('緯經度座標[{},{}]'.format(record['lat'],record['lng']))
        print('全部數量',record['tot'])
        print('可借',record['sbi'])
        print('可還',record['bemp'])
        print('----------------------')
        print()
           

## 檔案進階操作
###  檔案存取與例外處理
1. Python 的文件存取是透過 open( ) 方法建立文件物件方式進行存取， 如果文件不存在或讀取存限限制將會產生例外。
2. 檔案存取例外為 IOError ，另外有兩個子類別:
    - FileNotFoundError，代表 “找不到檔案”。
    - PermissionError，代表 “沒有權限存取”。

#### 操作範例:請動手操作，並留意輸出結果
- file_except1.py

In [None]:
try:
    f = open('data.txt', 'r', encoding="utf8") 
    print(f.read( ))
    
except FileNotFoundError: 
    print("找不到檔案")
except PermissionError: 
    print("你沒有權限存取")
except IOError: 
    print("其他檔案IO問題")
except: 
    print("其他例外")
    
f.close( )

###  關於檔案關閉動作
1. 檔案開啟後須進行 close( ) 方法進行關閉動作。
2. 若檔案沒關閉會造成:
    - 開啟的文件物件會占用系統資源。
    - Python 可以同時間開啟的文件數量有限制 (約 20 份文件)。
    - 開啟文件物件的模式若為寫入 (w 或 a) 模式，一般都是暫存於緩衝區，系統閒置或文件關閉前才會進行寫入，若沒有進行 close( ) 動作可能造成文 件儲存不完整。

In [None]:
# 操作範例:請動手操作，並留意輸出結果
import os

class tryopenfile:
    def openfile(self, filePath):
        self.handle = open(filePath, 'w')
        self.handle.close()

if __name__ == '__main__':
    t = tryopenfile( )
    filePath = 'test.txt' 
    t.openfile(filePath) 
    os.remove(filePath) 
    print('success')


### With 方式操作檔案
1. 多個檔案存取時若前一個檔案產生 IO 例外，將會造成後面無法進行close( ) 動作。
2. 以 with 方式操作檔案:
    - 檔案存取仍有可能產生 IO 例外。
    - 離開 with 區塊時檔案將會自動進行close( )動作，自動關閉檔案。

In [None]:
# 操作範例 1:請動手操作，並留意輸出結果
try:
    with open('data.txt', 'r', encoding="utf8") as f:
        print(f.read( ))
except FileNotFoundError:
    print("找不到檔案") 
except PermissionError:
    print("你沒有權限存取")
except IOError: 
    print("其他檔案IO問題")
except: 
    print("其他例外") 

####  請問以下的問題答案為哪一個?(選擇題)

```python
關於 with 方式操作檔案的說明，哪一個是錯誤的?
```
(1) 離開 with 區塊時檔案將會自動進行 close( ) 動作，自動關閉檔案。  
(2) 檔案存取仍有可能產生 IO 例外。  
(3) 檔案存取不會產生 IO 例外。  