# 檔案存取與 Numpy

##  本堂教學重點
1. 檔案基本操作
2. CSV 與JSON 操作
3. 檔案例外處理
4. 檔案關閉動作
5. Numpy 簡介
6. Numpy 陣列形狀

##  檔案存取
- 在讀取或寫入文件之前，必須使用 Python 內建的 open( ) 函數開啟 文件。 這個函數將建立一個文件物件，這個文件物件會與真實的文 件做連結，可讓您透過文件物件對文件進行存取動作。
- file object = open(file_name [, access_mode])
- UTF8 編碼資料還請加入另一個參數才可避免亂碼:encoding=‘utf-8'
- file object = open(file_name [, access_mode])
    1. file_name:file_name 參數是一個字串資料，代表包含要連結的文件名稱。
    2. access_mode:access_mode 確定文件必須打開的模式，包括讀取、寫 入、附加等等。稍後會列完整列表。這是可選參數，默認文件訪問模式為 讀取(r)。
    

| 存取模式 | 描述 |
|:--      |:-- |
| r | 連結開啟僅供閱讀的文件， 這是默認模式。|
| rb | 以二進位方式連結開啟僅供閱讀的文件。|
| r+ | 連結一個用於閱讀和寫作的文件。|
| rb+ | 連結一個用於閱讀和寫作的二進位格式文件。|
| w | 連結文件後僅供寫入。 如果文件存在，則覆蓋該文件。 如果文件不存在，則建立一個新文件後進行寫入。 |
| wb | 連結二進位格式的文件後僅供寫入。如果文件存在，則覆蓋該文件。 如果文件不存在，則建立一個新文件進行寫入。 |
| w+ | 連結文件後可以寫入和閱讀。如果文件存在，則覆蓋現有文件。 如果文件不存在，則建立一個新文件進行閱讀和寫入。 |
| wb+ | 連結二進位格式文件後可以寫入和閱讀。如果文件存在，則覆蓋現有文件。 如果文件不存在，則建立一個新文件進行閱讀和寫入。 |
| a | 連結一個文件進行附加。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入。 |
| ab | 連結一個二進位格式文件進行附加。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入。 |
| a+ | 連結一個文件進行附加與讀取。 如果文件存在，將處於從後面加入的模式。 如果文件不存在，它將建立一個新文件進行寫入與讀取。 |
| ab+ | 連結一個文件進行附加與二進位格式讀取。 如果文件存在，將處於從後面加入的 模式。 如果文件不存在，它將建立一個新文件進行寫入與讀取。 |


#### 操作範例 1:請動手操作，並留意輸出結果


- file1.py


In [4]:
text = '''python與中文
1. 我們來試試看中文儲存能力。
2. 許這個字會有編碼衝突風險。
3. 犇這個字必須是utf8編碼才有。'''
print(text ,file=open('data.txt','w',encoding='utf-8'))
#print(text ,file=open('data.txt','w')) 

#### 操作範例 2:請動手操作，並留意輸出結果

- 操作檔案file1-1.py

In [None]:
no=1 
scores=dict( ) 
while True:
    score = int(input('請輸入第'+str(no)+'號的成績:(-1結束)')) 
    if score == -1: 
        break;
    scores[no] = score
    no += 1
    
file=open('score.txt','w',encoding='utf-8') 
file.write(str(scores))


###  檔案讀取方式
- read([size]) 方法
    1. read([size]) 方法從文件當前位置起讀取 size 個字元數量，若無參數，則代表讀取至文件結束為止。
    2. 中文、英數與換行都是一格。

#### 操作範例:請動手操作，並留意輸出結果
- file2.py

In [8]:
file = open('data.txt', 'r', encoding='UTF-8') 
content = file.read( )
print(content)
#file.close( )
print("-------------")
#file = open('data.txt', 'r', encoding='UTF-8') 
content2 = file.read(5)
print(content2)
file.close( )


python與中文
1. 我們來試試看中文儲存能力。
2. 許這個字會有編碼衝突風險。
3. 犇這個字必須是utf8編碼才有。

-------------
pytho


###  檔案讀取方式
- readline 方法
    1. 這個方法每次讀出一行內容，所以讀取時占用緩衝區較小，比較適合大型文件讀取，讀取到沒有資料為止。
- 若不使用 readline 可用 with 敘述一行一行讀取資料，再使用 for 迴圈 逐一進行處理。
- len( ) 代表計算字串字數。
- readlines 方法
    1. 這方法將讀取整個文件所有行，保存在一個 list 內。
- 讀取文件後可搭配使用的方法
    1. strip() 去除字串首尾的空白。
    2. lstrip( ) 去除字串左邊的空白。
    3. rstrip( ) 去除字串右邊的空白。
    4. startswith(‘字元’): 第一個字元。

#### 操作範例:請動手操作，並留意輸出結果
- file4.py

In [10]:
f=open('data1.txt', 'r', encoding='UTF-8') 
result = list( )
for line in f.readlines( ):
    line = line.strip( )
    if not len(line) or line.startswith('#'):
        continue 
    result.append(line)

result.sort( )
print(result)
open('result-readlines.txt', 'w', encoding='UTF-8').write('%s' % '\n'.join(result))

['但帕內洛引述杜特蒂的話宣稱，菲律賓決定把台灣納入旅行禁令，跟一中政策「無關」。', '台灣現有武漢肺炎確診病例為18例，中國大陸約6萬例。台灣已多次抱怨世衛把台灣視為中國一部分的作法不公，會誤導其他國家認為台灣疫情跟中國大陸一樣嚴重。', '根據菲律賓總統府發言人帕內洛（Salvador Panelo），杜特蒂（Rodrigo Duterte）表示：「我首要關切的是我國人民的健康和安全。」', '菲律賓拒解除對台旅行禁令 杜特蒂稱無涉一中政策', '菲律賓本週以抑制俗稱武漢肺炎的2019年冠狀病毒疾病（COVID-19）疫情為由，對台實施旅行禁令。台灣當局已表示，若菲方不解除禁令，台灣將考慮反制措施。但杜特蒂仍決定維持禁令。', '路透社報導，由於北京宣稱台灣是中國的一部分，世界衛生組織（WHO）處理疫情資訊時把台灣納入中國，導致若干國家對台灣人實施跟對中國人一樣的限制。', '（中央社台北/馬尼拉13日綜合外電報導）菲律賓總統杜特蒂今天拒絕台灣方面的呼籲，不解除對台灣人實施的旅行禁令。杜特蒂並稱自己首要關切的是菲律賓人的安全，這項決定跟一中政策「無關」。']


467

###  讀取 CSV 檔案
- CSV 格式是資料庫最常用的導入和導出格式。
- 資料均沒有類型，一切都是字串。
- 沒有字體或顏色與儲存格寬度高度的設置。
- Python 語法必須加入 import csv。
- 讀取儲存格資料:
 1. reader( ):依照每一列的編號 由0開始
 2. DictReader( )
    - 以第一列的值為每一行的名稱，第一列不是資料
    - 也可以重新命名，但第一列必須是資料

#### 操作範例 1:請動手操作，並留意輸出結果
- csv01.py

In [12]:
import csv 
f=open('ex1.csv',"r",encoding='utf-8')
csv1 = csv.reader(f)
list1 = list(csv1)
print(list1)
f.close()

<class '_csv.reader'>
[['a', 'b', 'c', 'd', 'message'], ['1', '2', '3', '4', 'hello'], ['5', '6', '7', '8', 'world'], ['9', '10', '11', '12', 'foo']]


###  寫入 CSV 檔案
- 必須加入 import csv
- 利用 writer( ) 可寫入資料，寫入時注意
    1. delimiter - 這是代表分隔符號
    2. quotechar - 這是代表包住字串的符號
- 使用 writerow( ) 方法進行特定的儲存格寫入

#### 操作範例:請動手操作，並留意輸出結果
- csv06.py

In [13]:
import csv
f=open('ex2.csv',"r",encoding='utf-8')
reader = csv.reader(f)
ofile = open('ttest.csv', "w",encoding='utf-8')
writer = csv.writer(ofile, delimiter='-', quotechar='"')
for row in reader:
    writer.writerow(row)
f.close()
ofile.close()

###  Python 與 JSON

#### Python 的資料型態與 JSON 的資料型態略有差異:
| Python 資料型態 | JSON 資料型態 |
|:-- |:-- |
| dict | object |
| list,tuple | array |
| int,float | number |
| True | true |
| False | false |
| None | null |

###  從 Python 到 JSON
1. 以 json.dumps( ) 函數從 Python 字串中取出資料轉入 JSON。
2. 以 json.dump( ) 函數從 Python 字串中取出資料轉入 JSON 檔案中。
3. json資料於Python處理UTF8碼內容會產生亂碼，建議 dumps 時加入 以下的參數才可以正確處理UTF8碼內容:ensure_ascii=False 
4. Python 與 JSON 檔案:
    - JSON 檔案的中文資料於某些編輯軟體內會變成亂碼，但 Python 可以存取。
    - 檔案寫入可用一般文件方式寫入，也可以使用 JSON 的方法寫入。

#### 操作範例 1:請動手操作，並留意輸出結果
- json01.py

In [17]:
import json
json1 = {'python': 'good', 'gjun': 100, 'python-class':True,'ICQ': None}
json2 = json.dumps(json1, ensure_ascii=False)
print(type(json2))
json3=json2.encode('utf8')
print(type(json3))
print(json2)
print(json3)

<class 'str'>
<class 'bytes'>
{"python": "good", "gjun": 100, "python-class": true, "ICQ": null}
b'{"python": "good", "gjun": 100, "python-class": true, "ICQ": null}'


### 操作範例 2:請動手操作，並留意輸出結果
- json02.py




In [1]:
import json
data = {}
data['people'] = []
data['people'].append({'name': 'Scott','website': 'stackabuse.com','from': 'Nebraska'})
data['people'].append({'name': 'Larry', 'website': 'google.com', 'from': 'Michigan'})

with open('data.json', 'w') as outfile:
    json.dump(data, outfile)
    
json2 = json.dumps(data)
file=open('score.json','w',encoding='utf-8')
file.write((json2));
file.close();

###  從 JSON 到 Python
1. 以 json.loads( ) 函數從 JSON 字串中取出資料轉入 Python。
2. 以 json.load( ) 函數從 JSON 檔案中取出資料轉入 Python。

### 操作範例 1:請動手操作，並留意輸出結果
- json03.py

In [None]:
import json
json1 = '{"python": "good", "gjun": 100, "python-class": true, "ICQ": null}'
json2 = json.loads(json1)
print(json2)