<a id='top'></a>
<font color='#77aaaa' size=40> File handling(檔案處理) & Exception(例外處理)</font>

<a id='file_handling'></a>
### File handling(檔案處理)
很多時候我們會想以 python 作資料處理，或將 python 中的某些內容紀錄在某個檔案內，故這邊說明簡單的檔案處理概念及常見的用法。

我們可以在 python 中打開一個檔案物件（file object），基本語法如下
```python
f = open(path, mode='r', encoding=None)
```
- <font color='#ffaa00' face='monospace'>__path__</font>: 放入要開啟的檔案路徑，可以是<font color='#77aaaa'>相對路徑</font>或<font color='#77aaaa'>絕對路徑</font>
- <font color='#ffaa00' face='monospace'>__mode__</font>: 指定檔案要開啟的模式，詳見下表或查閱 `open` 的文件內容，預設為 `'r'`

```
========= ===============================================================
Character Meaning
--------- ---------------------------------------------------------------
'r'       open for reading (default)
'w'       open for writing, truncating the file first
'x'       create a new file and open it for writing
'a'       open for writing, appending to the end of the file if it exists
'b'       binary mode
't'       text mode (default)
'+'       open a disk file for updating (reading and writing)
'U'       universal newline mode (deprecated)
========= ===============================================================
```
- <font color='#ffaa00' face='monospace'>__encoding__</font>: 指定要開啟的編碼，預設為 `None`，會自動帶入系統使用的編碼，但基本上支援各式編碼，若想指定編碼但不知道該用什麼，問就是 `'utf-8'`

> <font color='#ff7777'>[超級注意]</font> 若不需要使用該檔案需用<font color='#ff7777' face='monospace'> __f.close()__ </font>關閉，否則檔案有可能會發生不可預測的異常

可以用 `f.closed` 檢測該檔案物件是否為關閉裝態，在開啟狀態下可以使用 `read`/`write` 等方法，根據物件的開啟方式決定

- `read mode`

1. <font face='monospace'>f.<font color='ffaa00'>__read__</font>(size=<font color='44aa44'>-1</font>)</font>
    - 讀取 `size` 數量的字元(若物件是 binary mode 則計算 bytes)，預設為 `-1`，會讀取整份檔案
    - 若檔案已經結束，則讀取會回傳空字串
    
2. <font face='monospace'>f.<font color='ffaa00'>__readline__</font>()</font>
    - 會讀取一行，並且會把換行符號留在尾端
    - 想讀取多行可以搭配 `for` 迴圈執行，如下範例
    ```python
    for line in f:
        print(line)
    ```
    
3. <font face='monospace'>f.<font color='ffaa00'>__readlines__</font>(hint=<font color='44aa44'>-1</font>)</font>
    - 把每一行讀取之後放到一個 `list`，一樣會在尾端留下換行符號
    - `hint` 預設為 `-1`，表示會讀取整份檔案。若指定數字，會讀取每一行直到字元數超過指定的數量為止
    - 使用 `list(f)` 也可以達成一樣的效果


> <font color='#ff7777'>[超級注意]</font> 讀取進來的每一行都會以字串的方式儲存。

In [None]:
src = '/Users/cypan/Documents/NPTU_course/testFolder/poem.txt'
# 以讀取方式開啟一個檔案物件
f = open(src, 'r')

In [None]:
f.readlines()

> 有以上這些了解之後，我們可以來做一些簡單的嘗試

#### 找到一份檔案內出現最多次的字元（換行字元除外）
想要找到出現最多次的字元，我們會需要有一個 container 來存放我們的字元，並且要能記錄該字元出現的次數。<br>
故這邊我們選用 `dict` 來儲存<br>

我們的思路如下
1. 用迴圈依序讀取，每次讀取一個字元
2. 若該字元是換行符號則跳過，否則記錄至 `dict`
3. 若讀取到空字串代表檔案已經結束（故迴圈我們選用 `while`）

In [None]:
src = 'data/poem.txt'
chars = {}   ### 儲存我們讀取到的字元，以字元為 key，出現次數為 value 儲存
##### START Parctice #####
pass
#####  End  Parctice #####

讀取完之後 <font color='#77aaaa'>chars</font> 應該會取得如下的值
```
{'黎': 2, '明': 3, '的': 11, ..., '道': 1, '路': 1, '。': 1}
```
想要知道出現最多次數的字元，我們必須找到 <font color='#77aaaa'>chars</font> 中 `value` 最大值所對應的 `key`<br>
你可以用迴圈迭代去判定（D.I.Y.）<br>
也可以用 <font color='#ffaa00' face='monospace'>__sorted__</font> 這個函數來取得排序之後的結過<br>

In [None]:
sorted(chars)

不過你會發現對一個 `dict` 做 `sorted` 會使用他的 `key` 來做，但我們需要他的 `value` 來排序<br>
這時候你可以帶入 sorted 的引數來指定你想要排序的目標，如下說明

- <font face='monospace'><font color='ffaa00'>__sorted__</font>(iterable, key=<font color='44aa44'>None</font>, reverse=<font color='44aa44'>False</font>)</font>
    - 可以排序任意一個可迭代物
    - `key` 可以放入一個函數，會依照把可迭代物依序丟入函數後取得的值來排序
    - `reverse` 預設為 `False`，由小到大排序，設為 `True` 則變為由大到小


故我們改為排序 <font color='#ffaa00' face='monospace'>chars.items()</font>，並把 `key` 設為取出其 `value`，就可以讓他以 `value` 來排序，並且把 `reverse` 設為 `True`，則排序後的第一個元素即為出現次數最多的字元

In [None]:
sorted(chars.items(), key=lambda item: item[1], reverse=True)

> <font color='#ff7777' face='monospace'>__lambda__</font>: <font color='#77aaaa'>lambda 運算式</font>：aka <font color='#77aaaa'>匿名函數（anonymous function）</font>，旨在建立小巧的函數，通常被用在功能簡單但需要一個函數來運作時，語法上限定只能做單一運算式
>
> 其定義方式跟數學上定義函數的長相非常相似，只是把 `=` 改寫成 `:`，如下範例是一個平方的 <font color='#ff7777' face='monospace'>__lambda__</font> 函數
>
> ```python
> f = lambda x: x**2
> ```
> 
> 就像是數學上的 $f(x) = x^2$ 一樣
> 
> 甚至可以不只一個變數，如下
>
> ```python
> f = lambda x, y: (x**2 + y**2)**0.5
> ```
> 
> 就像是數學上的 $f(x, y) = \sqrt{x^2 + y^2}$ 一樣
> 
> 使用上，就如同一般函數使用即可

- `write mode`

1. <font face='monospace'>f.<font color='ffaa00'>__write__</font>(text)</font>
    - 把字串寫入檔案
    - 會回傳一個整數，為寫入的字元數
    - 換行需要自己寫入換行符號（`\n`），否則連續寫入只會往後銜接
    
2. <font face='monospace'>f.<font color='ffaa00'>__writelines__</font>(lines)</font>
    - 把 `list` 內的字串寫入檔案
    - 一樣需要在需要換行的地方自行寫入換行符號（`\n`）

In [None]:
src = '/Users/cypan/Documents/NPTU_course/testFolder/test.txt'
# 以寫入模式(w)開啟一個檔案物件，若檔案存在會開啟一個新的並覆蓋已存在的檔案
f = open(src, 'w')

In [None]:
# 寫入字串
f.write('This is the first line.')
f.write('This will be concatenated at the end.\n')
f.write('This is the second line.\n')
f.close()

In [None]:
# 以 append 模式(a)開啟一個檔案物件，寫入的字串會銜接在後面
f = open(src, 'a')

In [None]:
f.write('This is the third line.\n')
f.write('1 + 1 = 2.\n')
f.close()

> 有以上這些了解之後，我們可以來做一些簡單的嘗試

```
Random 十萬個 1 ~ 9999 的數字
寫入一個檔案，檔名設定為 `numbers10w.txt`
每個數字都各自獨立一行寫入
```

我們可以使用 `random` 模組搭配 `for` 迴圈來產生隨機的十萬個數字<br>

寫入的方式有兩個選項<br>

1. 用 `f.write()` 一個一個數字寫入
2. 先把生成的數字存為一個 `list`，接著再用 `f.writelines()` 一次寫入

In [None]:
src = 'data/numbers10w.txt'
##### START Parctice #####
pass
#####  End  Parctice #####

##### 關閉檔案
從上面的例子可以看到，我們在每次開啟檔案物件都必須要用 `f.close()` 關閉它<br>

但會有一個問題是，若我們在還未關閉檔案前就出現 error，導致後續的 `f.close()` 沒有正常執行<br>

則檔案就無法正常關閉，可能會有不可預期的問題發生<br>

其中，我們可以用 `f.closed` 來確認該檔案是否已經被關閉，如下範例<br>

In [None]:
src = '/Users/cypan/Documents/NPTU_course/testFolder/test.txt'
f = open(src, 'w')
print(f'檔案是否被關閉：{f.closed}')

# 產生 error
a = 1 / 0

f.close()

In [None]:
print(f'檔案是否被關閉：{f.closed}')
f.close()
print(f'檔案是否被關閉：{f.closed}')

針對這個問題，Python 提供一個相當好用的語法可以解決這個問題，那就是 <font color='#ff7777' face='monospace'>__with - as__</font> 語法<br>

基本語法如下
```python
with open(src, 'r') as f:
    '''
    Do somthing to the file object `f`
    '''
```

上述語法不管在什麼情況下離開該區塊，皆會正常關閉該檔案物件，如下範例

In [None]:
src = '/Users/cypan/Documents/NPTU_course/testFolder/test.txt'
with open(src, 'w') as f:
    print(f'檔案是否被關閉：{f.closed}')
    a = 1 / 0

In [None]:
print(f'檔案是否被關閉：{f.closed}')

> 因此，使用上建議都習慣使用 <font color='#ff7777' face='monospace'>__with - as__</font> 的語法來使用
>
> 除了可以正確關閉檔案以外，也可以避免忘記寫上 `f.close()` 的狀況

---

<a id='exception'></a>
### Error & Exception (錯誤＆例外)
在 Python 中，我們大致上可以把會出現的錯誤訊息分成兩種，<font color='#77aaaa' face='monospace'>語法錯誤（syntax error）</font> 和 <font color='#77aaaa' face='monospace'>例外（exception）</font><br>

##### 語法錯誤（syntax error）
語法錯誤不外乎是你的程式不符合 python 的規範，常見的像是忘記加：、括號數量不對等等，如下範例

In [None]:
if True
    print('Hello World!')

In [None]:
print('Hello World!'

##### 例外（Exception）
例外則不同於語法錯誤，語法雖然是正確的，但執行時還是可能導致錯誤發生，這些時候程式會拋出對應的錯誤就被稱之為例外

例外處理顧名思義，主要是避免程式在執行中，因為可預測或不可預測的例外導致程式中斷，常常又被稱為 <font color='#ff7777' face='monospace'>try-catch</font>，<br>

意思是我們嘗試去執行某一段程式（try），當程式發生錯誤時通常我們會說程式會「拋出（throw）」一個 `error/exception`，<br>

而我們去接收（catch）那個 `error/exception` 並做出對應的處理。<br>

在 Python 中，我們可以使用 `try-except` 語法來做例外處理，基本語法如下
```python
try:
   # code that may throw an exception
except ExceptionType:
   # code to handle the exception
```

如上範例可以看到，在 <font color='#ff7777' face='monospace'>try</font> 區塊中放置你原本要執行的程式碼，而在 <font color='#ff7777' face='monospace'>except</font> 區塊中則放置「當例外發生時要做的處理」，當例外正確被接收時程式就不會被中斷。<br>

另外可以發現，在 <font color='#ff7777' face='monospace'>except</font> 語句後面有一個 <font color='#77aaaa' face='monospace'>ExceptionType</font>，即代表程式拋出的例外種類<br>

Python 中已經有內建許多例外的類別，一部分的類別如下階層<font size=2>（完整詳見 [Python document](https://docs.python.org/zh-tw/3/library/exceptions.html#exception-hierarchy)）</font><br>

```
BaseException
 ├── KeyboardInterrupt                (使用者自行中斷，通常是 Ctrl + C)
 └── Exception                        (一般的例外類別)
      ├── ArithmeticError
      │    └── ZeroDivisionError      (除以 0 會引發的 error)
      ├── ImportError
      │    └── ModuleNotFoundError    (import 了不存在的 package 或 module)
      ├── LookupError
      │    ├── IndexError             (索引 index 發生錯誤，例如索引超出範圍的 index)
      │    └── KeyError               (常見在對字典索引不存在的 key 值)
      ├── NameError                   (使用了未定義的變數)
      ├── OSError
      │    ├── FileNotFoundError      (檔案不存在)
      ├── TypeError                   (因為類型引發的錯誤，例如用整數加字串)
      ├── ValueError                  (類型正確但值不正確會引發的錯誤)
```

比較需要注意的主要是 <font color='#77aaaa' face='monospace'>Exception</font> 和 <font color='#77aaaa' face='monospace'>KeyboardInterrupt</font><br>

與一般的例外不同， <font color='#77aaaa' face='monospace'>KeyboardInterrupt</font> 由使用者引發，所以可能會出現在任何地方<br>

為了不讓他與其他 <font color='#77aaaa' face='monospace'>Exception</font> 互相影響，故兩者歸類在同一個 level<br>

所以當我們只有 catch <font color='#77aaaa' face='monospace'>Exception</font> 時，並不會 catch 到 <font color='#77aaaa' face='monospace'>KeyboardInterrupt</font>

如下語法只可接收所有 <font color='#77aaaa' face='monospace'>Exception</font> 及其以下階層的所有例外
```python
try:
    # code that may throw an exception
except Exception:
    # 注意！這裡的 Exception 是 python 內建的類別，如上看到的階層中的每一個例外也都是
    # code to handle the Exception level
```
<br>

如下語法只可接收對應的 `ExceptionType`，及其以下階層的所有例外，若出現同階層或上一個階層的例外則會正常拋出 error
```python
try:
    # code that may throw an exception
except TypeError:
    # code to handle the Exception level
    # 這邊只負責接收 TypeError，舉例來說，若發生 ZeroDivisionError 則不會進入這個 block
```

In [None]:
try:
    1 + '1'
except TypeError:
    print('整數與字串無法相加')

In [None]:
try:
    1 / 0
except TypeError:
    print('整數與字串無法相加')

In [None]:
try:
    while True:
        pass
except Exception:
    print('停止無限迴圈')

In [None]:
try:
    while True:
        pass
except KeyboardInterrupt:
    print('停止無限迴圈')

除了像上述例子以外，我們也可以同時接收多種 `ExceptionType`，並且對不同的例外做不同的處理，基本語法如下
```python
try:
   # code that may throw an exception
except ExceptionType1:
   # code to handle ExceptionType1
except ExceptionType2:
   # code to handle ExceptionType2
```

In [None]:
try:
    1 + '1'
except TypeError:
    print('整數與字串無法相加')
except ZeroDivisionError:
    print('數字無法除以 0')

In [None]:
try:
    1 / 0
except TypeError:
    print('整數與字串無法相加')
except ZeroDivisionError:
    print('數字無法除以 0')

當然，我們也不一定要指定 `ExceptionType`，直接接收所有例外，基本語法如下
```python
try:
   # code that may throw an exception
except:
   # code to handle all exceptions
```

In [None]:
try:
    while True:
        pass
except:
    print('反正就是有例外')

最後，例外處理的語法還有兩個可以配合使用的關鍵字，分別是 <font color='#77aaaa' face='monospace'>else</font> 跟 <font color='#77aaaa' face='monospace'>finally</font><br>

1. <font color='#77aaaa' face='monospace'>else</font>: 當 <font color='#ff7777' face='monospace'>try</font> 的區塊沒有引發任何例外時，則會進入 <font color='#77aaaa' face='monospace'>else</font> 的區塊
2. <font color='#77aaaa' face='monospace'>finally</font>: 整個 `try-catch` 的過程不論有沒有引發例外，或是進入哪一個區塊，在整個結束時都會執行 <font color='#77aaaa' face='monospace'>finally</font> 的區塊

如下範例

In [None]:
try:
    num = int(input('輸入一個整數： '))
except:
    print('請輸入整數')
else:
    print(f'你輸入的整數為：{num}')
finally:
    print('try-catch 結束')

### 引發例外
除了程式碼自己因為錯誤而引發的例外以外，我們也可以手動引發例外，基本語法如下
```python
# 單純引發 excpetion
raise
# 引發特定類型的 exception，並且可以客製化引發時的 error message
raise ExceptionType('Exception message')
```
如下範例

In [None]:
raise

In [None]:
raise ValueError('這是一個 ValueError')

### 自定義例外
除了內建的例外，我們也可以自定義例外的類別，尤其當我們在處理較大的專案時，適時的去客製化例外類別，也可以較有效率的去做例外處理<br>

自定義例外類別需要用到 <font color='#ff7777' face='monospace'>class</font> 這個關鍵字，這個關鍵字被拿來自定義各種資料型態（詳見 `Lecture_7`），在這邊我們可以先依照以下方式使用
```python
class CustomError(Exception):
    pass
```
如上語法使用，即可定義一個名為 `CustomError` 的例外，且這個例外被歸類在 `Exception` 這個階層之下，如下範例

In [None]:
class CustomError(Exception):
    pass

In [None]:
try:
    raise CustomError('這是一個 error')
except Exception:
    print('接收到一個 error')

### 進階用法
就如同上述說的，例外處理是非常重要且很常見的做法，這邊分享我個人喜歡且常用的做法<br>

一般若我們不做例外處理，我們可以看到 python 引發例外之後會顯示該<font color='#77aaaa' face='monospace'>例外類別</font>及<font color='#77aaaa' face='monospace'>例外訊息</font><br>

我們這邊要做得即是把原本可以看到的訊息以 `print` 的方式顯示出來<br>
<br>

程式碼如下：
```python
try:
    # code that may throw an exception
except Exception as e:
    # code to handle the Exception level
    err_class = e.__class__.__name__
    err_msg = e.args[0]
    msg = f'[{err_class}] {err_msg}'
    print(msg)
```

In [None]:
try:
    raise CustomError('這是一個 error')
except Exception as e:
    err_class = e.__class__.__name__
    err_msg = e.args[0]
    msg = f'[{err_class}] {err_msg}'
    print(msg)

並且可以把這個 `try-catch` 寫成一個 `decorator` 加在各函數上，如下範例
```python
def logger(func):
    def wrap(*args, **kwargs):
        try:
            result = func(*args, **kwargs)
            return result
        except Exception as e:
            err_class = e.__class__.__name__
            err_msg = e.args[0]
            msg = f'[{err_class}] {err_msg}'
            print(msg)
    return wrap
```

In [None]:
def logger(func):
    def wrap(*args, **kwargs):
        try:
            result = func(*args, **kwargs)
            return result
        except Exception as e:
            err_class = e.__class__.__name__
            err_msg = e.args[0]
            msg = f'[{err_class}] {err_msg}'
            print(msg)
    return wrap

In [None]:
@logger
def division(a, b):
    return a / b

In [None]:
division(3, 5)

In [None]:
division(3, 0)

### Exercise 6-1
請讀取由上方程式產生出的 `numbers10w.txt`，其中包含了 10 萬個 1 ~ 9999 的隨機數字<br>

計算該 10 萬個數字的
1. 最小值
2. 最大值
3. 平均值
4. 中位數
5. 標準差