# File I/O (读/写文件)

`f = open(path/to/filename, mode)`

`f` 是一个指针, 指向 路徑在 `<path/to/filename>` 的文件中的 **`第一行`**, (除了 `mode` 为 `'a'`时 例外)

`mode` 可以为以下:
- `'r'` read character (读进来的 一定都是 `str`)

- `'w'` write character (当 选项为 `'w` 时, `open()` 打开文件的瞬间 会把文件里原有的内容全部清空删掉!!)

- `'a'` append character (不会删掉原有的内容, 从最后一行, 接着往后写)

- `'rb'`, `'wb'` 读/写 的是 `Bytes` 而不是 character

- 如果不提供, 默认为 `'r'`

通常读完后 会用 `s.strip()` 把 leading (前面) 和 trailing (后面) 的 `' '`, `'\n'`, `'\t'` 删掉

最后记得一定要 `f.close()`

---

### `4 种不同的方法 去读取文件`

```python
f.read()
```
- <ins>从 `f` 指向的那一行开始</ins>, 读完 整个 文件, 返回 一个很长的 `str`

- 读完之后 `f` 会指向 最后一行 `(空的)`

In [8]:
f = open("FileIO_files/a.txt", "r")
lines = f.read() # lines 會是 'Hello\n    How are u?\n  Bye'
print(lines)

print("try to read again: " + f.read()) # 這是空的 啥都沒有, 因為 f 已經指向最後一行了
f.close()

Hello
    How are u?
  Bye
try to read again: 


```python
f.readlines()
```
- <ins>从 `f` 指向的那一行开始</ins>, 读完 整个 文件, 返回 一个很长的 `list of str`, 每个item 是一行

- 读完之后 `f` 会指向 最后一行 `(空的)`

In [3]:
f = open("FileIO_files/a.txt", "r")
lines = f.readlines() # lines 會是 ['Hello\n', '    How are u?\n', '  Bye']
for line in lines:
    print(line.strip('\n'))
f.close()

Hello
    How are u?
  Bye


```python
f.readline()
```
- 读并返回 <ins> `f` 指向的那一行</ins>, 读完 把 `f` 指向 <ins>下一行</ins>, 返回 `str`

- 因为一次只读一行, 所以通常会搭配 `while` loop 进行循环

- 也很常拿来去 skip 掉一些 文件中 不需要的行数, 比如: `csv 文件`, `excel 表格` 中 前面的 `header`

- 注意, 后面没有个 `s`, 别和 `.readlines()` 搞混了

In [11]:
f = open("FileIO_files/a.txt", "r")
# 先 手動 讀第一行
line = f.readline()
# 檢查 是否依然能 讀得到內容, 讀不到 則是空的str
while line != "":
    print(line.strip('\n'))
    # 回去 while loop, 之前 讀下一行, 
    line = f.readline()
f.close()

Hello
    How are u?
  Bye


```python
for line in f:
```
- <ins>从 `f` 指向的那一行开始</ins>, 用 `for` loop 的方式 读完整个文件


In [12]:
f = open("FileIO_files/a.txt", "r")
for line in f:
    print(line.strip('\n'))
f.close()

Hello
    How are u?
  Bye


## `Writing & Appending to file` 写内容进文件

```python
f.write(s)
```
- 把 `s` 写进 <ins> `f` 指向的那一行</ins>, 写完 把 `f` 指向 <ins>下一行</ins>, 返回 `None`

- 一定要 `f.close()` 才会 save (存挡)

In [8]:
f = open("FileIO_files/b.txt", "w")
f.write("Hello\n") # 注意: 要 加 '\n' 才會 換行
f.write("vincent")
f.close()

f = open("FileIO_files/b.txt", "w") # 又把之前的內容 清空掉了！！！！
f.write("Bye~\n")
f.close()

f = open("FileIO_files/b.txt", "a")
f.write("Anya\n")
f.close()

最后文件的内容如下:<br/>
`Bye~`<br/>
`Anya`

## Library: `Pickle`

直接把 python 里的 `object` 存到 file 里

```python
pickle.dump(x, f)
```
- 直接把 `x` 整个 object 写进去 `f` 这个文件里, 存的是 `bytes`

```python
x = pickle.load(f)
```
- 直接把 `f` 里的内容, 读出来, 放进 `x`里

因为 读/写的 都是 `bytes` 所以 mode 要用 `wb`, `rb`, 文件名的 extension (后缀) 也要用 `.p`

In [19]:
import pickle

items = {"apple": 3.99, "banana": 2.99, "carrot": 1.99}

# 寫 binary 進去一個文件
f = open('FileIO_files/items.p', 'wb')
pickle.dump(items, f)
f.close()

# 從文件裡 讀 binary
f = open('FileIO_files/items.p', 'rb')
data = pickle.load(f)
f.close()

print(data)

{'apple': 3.99, 'banana': 2.99, 'carrot': 1.99}


## `f = open(...)` 和 `with open(...) as f` 的區別

In [None]:
f = open("FileIO_files/a.txt", "r")
# do something...
f.close() # 一定要手動close, 但是如果前面有Error (crash) 就會導致 沒有close

with open("FileIO_files/a.txt", "r") as f:
    ...
    # so something
    # python 會自動幫你 close :)

## *`Example:`*

Create a dictionary that maps student name to a dictionary mapping course to grade based on the file `grades.txt`. Noted that lines after `---` are not part of the data, and should be ignored.

In [23]:
expected_result = {
  "alice": {"MGT201": 95.0, "MAT135": 70},
  "bob": {"MGT220": 80, "MAT135": 67},
  "carol": {"MGT201": 80},
  "vincent": {"MGT201": 90}
}

In [13]:
student_marks = {}
# ------------------------------------
f = open("FileIO_files/grades.txt", "r")
# skip the header
f.readline()

# read the rest until we reach '---'
line = f.readline()
while not line.startswith('---'): # line != '---\n' OR line.strip() != '---' OR line[:3] != '---'
    s, c, g = line.strip().split(',')
    
    if s in student_marks:
        student_marks[s][c] = float(g)
    else:
        student_marks[s] = {c: float(g)}

    # 回去之前 讀下一行
    line = f.readline()
f.close()

print(student_marks)

{'alice': {'MGT201': 95.0, 'MAT135': 70.0}, 'bob': {'MGT220': 80.0, 'MAT135': 67.0}, 'carol': {'MGT201': 80.0}, 'vincent': {'MGT201': 90.0}}


part 2) Given the student dictionary generated above, create a new dictionary that maps student to their average mark

In [None]:
student_marks = {
  'alice': {'MGT201': 95.0, 'MAT135': 70.0}, 
  'bob': {'MGT220': 80.0, 'MAT135': 67.0}, 
  'carol': {'MGT201': 80.0}, 
  'vincent': {'MGT201': 90.0}
}

expected = {
  "MGT201": 83.33,
  "MAT135": 68.5,
  "MGT220": 80.0
}

In [14]:
temp = {}
for s in student_marks:
  for c in student_marks[s]:
    g = student_marks[s][c]

    if c in temp:
        temp[c].append(g)
    else:
        temp[c] = [g]

course_avg = {}
for c in temp:
    course_avg[c] = sum(temp[c]) / len(temp[c])   

print(course_avg)


{'MGT201': 88.33333333333333, 'MAT135': 68.5, 'MGT220': 80.0}
