#7. Input and Output

##7.1. Fancier Output Formatting

通常你會想要對輸出格式有更多地控制，而不是僅列印出以空格隔開的值。

以下是幾種格式化輸出的方式。

In [1]:
# 要使用格式化字串文本 (formatted string literals)，需在字串開始前的引號或連續三個引號前加上 f 或 F。
# 你可以在這個字串中使用 { 與 } 包夾 Python 的運算式，引用變數或其他字面值 (literal values)。
year = 2016
event = 'Referendum'
f'Results of the {year} {event}'

'Results of the 2016 Referendum'

In [2]:
# 字串的 str.format() method 需要更多手動操作。
# 你還是可以用 { 和 } 標示欲替代變數的位置，且可給予詳細的格式指令，但你也需提供要被格式化的資訊。
yes_votes = 42_572_654
no_votes = 43_132_495
percentage = yes_votes / (yes_votes + no_votes)
'{:-9} YES votes  {:2.2%}'.format(yes_votes, percentage)

' 42572654 YES votes  49.67%'

In [3]:
# 如果你不需要華麗的輸出，只想快速顯示變數以進行除錯，可以用 repr() 或 str() 函式把任何的值轉換為字串。
# str() 函式的用意是回傳一個 "人類易讀" 的表示法，
# 而 repr() 的用意是產生 "直譯器可讀取" 的表示法（如果沒有等效的語法，則造成 SyntaxError）。
# 如果物件沒有人類易讀的特定表示法，str() 會回傳與 repr() 相同的值。
# 有許多的值，像是數字，或 list 及 dictionary 等結構，使用這兩個函式會有相同的表示法。
# 而字串，則較為特別，有兩種不同的表示法。

# string 模組包含一個 Template class（類別），提供了將值替代為字串的另一種方法。
# 該方法使用 $x 佔位符號，並以 dictionary 的值進行取代，但對格式的控制明顯較少。

In [4]:
s = 'Hello, world.'
str(s)

'Hello, world.'

In [5]:
repr(s)

"'Hello, world.'"

In [6]:
str(1/7)

'0.14285714285714285'

In [7]:
repr(1/7)

'0.14285714285714285'

In [8]:
x = 10 * 3.25
y = 200 * 200
s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
print(s)
s2 = 'The value of x is ' + str(x) + ', and y is ' + str(y) + '...'
print(s2)

The value of x is 32.5, and y is 40000...
The value of x is 32.5, and y is 40000...


In [9]:
# The repr() of a string adds string quotes and backslashes:
hello = 'hello, world\n'
hello_1 = repr(hello)
hello_2 = str(hello)

print(hello)
print(hello_1)
print(hello_2)

hello, world

'hello, world\n'
hello, world



In [10]:
# The argument to repr() may be any Python object:
repr((x, y, ('spam', 'eggs')))

"(32.5, 40000, ('spam', 'eggs'))"

###7.1.1. 格式化的字串文本 (Formatted String Literals)

格式化的字串文本（簡稱為 f-字串），透過在字串加入前綴 `f` 或 `F`，並將運算式編寫為 `{expression}`，讓你可以在字串內加入 Python 運算式的值。

In [11]:
# 格式說明符 (format specifier) 是選擇性的，寫在運算式後面，可以更好地控制值的格式化方式。
# 以下範例將 pi 捨入到小數點後三位：
import math
print(f'The value of pi is approximately {math.pi:.3f}.')

The value of pi is approximately 3.142.


In [12]:
# 在 ':' 後傳遞一個整數，可以設定該欄位至少為幾個字元寬，常用於將每一欄對齊。
table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
for name, phone in table.items():
    print(f'{name:10} ==> {phone:10d}')

Sjoerd     ==>       4127
Jack       ==>       4098
Dcab       ==>       7678


In [13]:
# 還有一些修飾符號可以在格式化前先將值轉換過。
# '!a' 會套用 ascii()，'!s' 會套用 str()，'!r' 會套用 repr()：
animals = 'eels'
print(f'My hovercraft is full of {animals}.')
print(f'My hovercraft is full of {animals!r}.')

My hovercraft is full of eels.
My hovercraft is full of 'eels'.


In [14]:
# = 說明符可用於將一個運算式擴充為該運算式的文字、一個等號、以及對該運算式求值 (evaluate) 後的表示法：
bugs = 'roaches'
count = 13
area = 'living room'

print(f'Debugging {bugs} {count} {area}')
print(f'Debugging {bugs=} {count=} {area=}')

Debugging roaches 13 living room
Debugging bugs='roaches' count=13 area='living room'


###7.1.2. 字串的 format() method

In [15]:
# str.format() method 的基本用法如下：
print('We are the {} who say "{}!"'.format('knights', 'Ni'))

We are the knights who say "Ni!"


In [16]:
# 大括號及其內的字元（稱為格式欄位）會被取代為傳遞給 str.format() method 的物件。
# 大括號中的數字表示該物件在傳遞給 str.format() method 時所在的位置。
print('{0} and {1}'.format('spam', 'eggs'))
print('{1} and {0}'.format('spam', 'eggs'))

spam and eggs
eggs and spam


In [17]:
# 如果在 str.format() method 中使用關鍵字引數，可以使用引數名稱去引用它們的值。
print('This {food} is {adjective}.'.format(
      food='spam', adjective='absolutely horrible'))

This spam is absolutely horrible.


In [18]:
# 位置引數和關鍵字引數可以任意組合：
print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
                                                   other='Georg'))

The story of Bill, Manfred, and Georg.


In [19]:
# 如果你有一個不想分割的長格式化字串，比較好的方式是按名稱而不是按位置來引用變數。
# 這項操作可以透過傳遞字典 (dict)，並用方括號 '[]' 使用鍵 (key) 來輕鬆完成。
table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
print('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
      'Dcab: {0[Dcab]:d}'.format(table))

Jack: 4098; Sjoerd: 4127; Dcab: 8637678


In [20]:
# 用 '**' 符號，把 table 字典當作關鍵字引數來傳遞，也有一樣的結果。
table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table))

Jack: 4098; Sjoerd: 4127; Dcab: 8637678


In [21]:
# 下面的程式碼產生一組排列整齊的欄，列出整數及其平方與立方：
for x in range(1, 11):
    print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))

 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000


##7.2 讀寫檔案
`open()` 回傳一個 `file object`，而它最常使用的兩個位置引數和一個關鍵字引數是：`open(filename, mode, encoding=None)`

```python
f = open('workfile', 'w', encoding="utf-8")
```

第一個引數是一個包含檔案名稱的字串。第二個引數是另一個字串，包含了描述檔案使用方式的幾個字元。
* *mode* 為 `'r'` 時，表示以唯讀模式開啟檔案；
* 為 `'w'` 時，表示以唯寫模式開啟檔案（已存在的同名檔案會被抹除）；
* 為 `'a'` 時，以附加內容為目的開啟檔案，任何寫入檔案的資料會自動被加入到檔案的結尾。
* `'r+'` 可以開啟檔案並進行讀取和寫入。
* *mode* 引數是選擇性的，若省略時會預設為 `'r'`。


通常，檔案以 *text mode* 開啟，意即，從檔案中讀取或寫入字串時，都以特定編碼方式 *encoding* 進行編碼。如未指定 *encoding*，則預設值會取決於系統平台。因為 UTF-8 是現時的標準，除非你很清楚該用什麼編碼，否則推薦使用 `encoding="utf-8"`。在 mode 後面加上 `'b'` 會以 *binary mode*（二進制模式）開啟檔案，二進制模式資料以 bytes 物件的形式被讀寫。以二進制模式開啟檔案時不可以指定 encoding。


在文字模式 (*text mode*) 下，讀取時會預設把平台特定的行尾符號（Unix 上為 \n，Windows 上為 \r\n）轉換為 \n。在文字模式下寫入時，預設會把 \n 出現之處轉換回平台特定的行尾符號。這種在幕後對檔案資料的修改方式對文字檔案來說沒有問題，但會毀壞像是 JPEG 或 EXE 檔案中的二進制資料。在讀寫此類檔案時，注意一定要使用二進制模式。

在處理檔案物件時，使用 `with` 關鍵字是個好習慣。
* 優點是，當它的套件結束後，即使在某個時刻引發了例外，檔案仍會正確地被關閉。
* 使用 `with` 也比寫等效的 `try-finally` 區塊，來得簡短許多：
```python
with open('workfile', encoding="utf-8") as f:
    read_data = f.read()
```
* 如果你沒有使用 `with` 關鍵字，則應呼叫 `f.close()` 關閉檔案，可以立即釋放被它所使用的系統資源。
* 警告 呼叫 `f.write()` 時，若未使用 `with` 關鍵字或呼叫 `f.close()`，即使程式成功退出，也可能導致 `f.write()` 的引數沒有被完全寫入硬碟。

不論是透過 `with` 陳述式，或呼叫 `f.close()` 關閉一個檔案物件之後，嘗試使用該檔案物件將會自動失效。
```python
f.close()
f.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file.
```

###7.2.1. 檔案物件的 method
本節其餘的範例皆假設一個名為 f 的檔案物件已被建立。

要讀取檔案的內容，可呼叫 `f.read(size)`，
* 它可讀取一部份的資料，並以字串（文字模式）或位元組串物件（二進制模式）形式回傳。
* `size` 是個選擇性的數字引數。當 `size` 被省略或為負數時，檔案的全部內容會被讀取並回傳；
* 如果檔案是機器記憶體容量的兩倍大時，這會是你的問題。否則，最多只有等同於 `size` 數量的字元（文字模式）或 `size` 數量的位元組串（二進制模式）會被讀取及回傳。如果之前已經到達檔案的末端，`f.read()` 會回傳空字串（`''`）。

```python
>>> f.read()
'This is the entire file.\n'
>>> f.read()
''
```

`f.readline()` 從檔案中讀取單獨一行；
* 換行字元（`\n`）會被留在字串的結尾，只有當檔案末端不是換行字元時，它才會在檔案的最後一行被省略。
* 這種方式讓回傳值清晰明確；只要 `f.readline()` 回傳一個空字串，就表示已經到達了檔案末端，而空白行的表示法是 `'\n'`，也就是只含一個換行字元的字串。

```python
>>> f.readline()
'This is the first line of the file.\n'
>>> f.readline()
'Second line of the file\n'
>>> f.readline()
''
```

想從檔案中讀取多行時，可以對檔案物件進行迴圈。這種方法能有效地使用記憶體、快速，且程式碼簡潔：

```python
>>> for line in f:
...     print(line, end='')
...
This is the first line of the file.
Second line of the file
```

* 如果你想把一個檔案的所有行讀進一個 `list` 裡，可以用 `list(f)` 或 `f.readlines()`。

`f.write(string)` 把 *string* 的內容寫入檔案，並回傳寫入的字元數。
```python
>>> f.write('This is a test\n')
15
```

寫入其他類型的物件之前，要先把它們轉換為字串（文字模式）或位元組串物件（二進制模式）：
```python
>>> value = ('the answer', 42)
>>> s = str(value)  # convert the tuple to string
>>> f.write(s)
18
```

###7.2.2. 使用 json 儲存結構化資料

字串可以簡單地從檔案中被寫入和讀取。
* 數字則稍嫌麻煩，因為 `read()` method 只回傳字串，這些字串必須傳遞給像 `int()` 這樣的函式，它接受 `'123'` 這樣的字串，並回傳數值 `123`。
* 當你想儲存像是巢狀 `list` 和 `dictionary`等複雜的資料類型時，手動剖析 (parsing) 和序列化 (serializing) 就變得複雜。

相較於讓使用者不斷地編寫和除錯程式碼才能把複雜的資料類型儲存到檔案，Python 支援一個普及的資料交換格式，稱為 JSON (JavaScript Object Notation)。
* 標準模組 json 可接收 Python 資料階層，並將它們轉換為字串表示法；這個過程稱為 *serializing*（序列化）。
* 從字串表示法中重建資料則稱為 deserializing（反序列化）。在序列化和反序列化之間，表示物件的字串可以被儲存在檔案或資料中，或通過網路連接發送到遠端的機器。

備註: JSON 格式經常地使用於現代應用程式的資料交換。許多程序設計師早已對它耳熟能詳，使它成為提升互操作性 (interoperability) 的好選擇。

In [22]:
# 如果你有一個物件 x，只需一行簡單的程式碼即可檢視它的 JSON 字串表示法：
import json
x = [1, 'simple', 'list']
json.dumps(x)

'[1, "simple", "list"]'

`dumps()` 函式有一個變體，稱為 `dump()`，它單純地將物件序列化為 text file。
因此，如果 `f` 是一個為了寫入而開啟的 text file 物件，我們可以這樣做：

```python
json.dump(x, f)
```

備註: JSON 檔案必須以 UTF-8 格式編碼。在開啟 JSON 檔案以作為一個可讀取與寫入的 text file 時，要用 encoding="utf-8"。

這種簡單的序列化技術可以處理 list 和 dictionary，但要在 JSON 中序列化任意的 class（類別）實例，則需要一些額外的工作。json 模組的參考資料包含對此的說明。


---

也參考 pickle - pickle 模組
與 JSON 不同，pickle 是一種允許對任意的複雜 Python 物件進行序列化的協定。因此，它為 Python 所特有，不能用於與其他語言編寫的應用程式溝通。在預設情況，它也是不安全的：如果資料是由手段高明的攻擊者精心設計，將這段來自於不受信任來源的 pickle 資料反序列化，可以執行任意的程式碼。

##JSON
1. 什麼是 JSON？

JSON 的全名是 **JavaScript Object Notation** (JavaScript 物件表示法)。它是一種輕量級的資料交換格式，基於 JavaScript 語法的一個子集。

儘管它的名字來自 JavaScript，但 JSON 是完全獨立於語言的。幾乎所有的程式語言（包括 Python、Java、C#、PHP 等）都有解析和生成 JSON 資料的函式庫。

它的主要優點是：

**人類可讀性高**：它的結構清晰，非常容易閱讀和編寫。

**機器易於解析**：對於電腦程式來說，解析和生成 JSON 資料非常高效。

JSON 主要由兩種結構組成：

**物件 (Object)**：由大括號 `{}` 包圍的「鍵/值」(key/value) 對集合。鍵是字串，值可以是字串、數字、布林值、陣列或另一個物件。這在 Python 中對應的就是**字典 (dictionary)**。

**陣列 (Array)**：由中括號 `[]` 包圍的值的有序列表。值可以是字串、數字、布林值、物件或另一個陣列。這在 Python 中對應的就是**列表 (list)**。

一個簡單的 JSON 範例：

```js
{
  "name": "John Doe",
  "age": 30,
  "isStudent": false,
  "courses": [
    {
      "title": "History",
      "credits": 3
    },
    {
      "title": "Math",
      "credits": 4
    }
  ],
  "address": null
}
```

2. JSON 的主要用途
JSON 已經成為在不同系統之間傳輸資料的標準格式，主要用途包括：

* **Web API 資料交換**：這是最常見的用途。當你的瀏覽器或手機 App 需要從伺服器獲取資料時（例如，天氣資訊、社群媒體貼文、新聞列表），伺服器最常回傳的格式就是 JSON。你的程式接收到這個 JSON 字串後，再將其轉換為程式內部的物件來使用。

* **設定檔 (Configuration Files)**：許多應用程式使用 `.json` 檔案來儲存設定。因為它的結構清晰，比傳統的 INI 或 XML 格式更容易閱讀和修改。

* **NoSQL 資料庫**：像 MongoDB 這樣的 NoSQL 資料庫使用類似 JSON 的格式 (稱為 BSON) 來儲存文件，讓資料的儲存和查詢變得非常靈活。

* **非同步通訊**：在網頁上，當 JavaScript 需要在不重新整理頁面的情況下與伺服器交換資料時（這種技術稱為 AJAX），JSON 是首選的資料格式。


3. 如何在 Python 中使用 JSON
Python 內建了一個非常強大且易於使用的函式庫叫做 `json`，你只需要 `import json` 就可以開始使用。

操作 JSON 主要有兩個核心過程：

* **序列化 (Serialization) 或 編碼 (Encoding)**：將 Python 物件 (例如 `dict` 或 `list`) 轉換成 JSON 格式的字串。

* **反序列化 (Deserialization) 或 解碼 (Decoding)**：將 JSON 格式的字串轉換回 Python 物件。

Python 與 JSON 型別的對應關係
```
Python          JSON
dict           object
list, tuple       array
str           string
int, float        number
True/False        true/false
None           null
```

In [23]:
# (A) 將 Python 物件轉換為 JSON 字串 (序列化)
# 使用 json.dumps() (dump string) 函式。
import json

# 1. Prepare a Python dict
python_data = {
    "name": "Jason",
    "age": 32,
    "is_active": True,
    "skills": ["Python", "Data Analysis", "Machine Learning"],
    "pet": None
}

# 2. Use dumps() to convert Python dict into JSON string
# indent=4 -> output format with 4 indents. More readable.
json_string = json.dumps(python_data, indent=4)

# 3. Print
print(json_string)
print(type(json_string))

{
    "name": "Jason",
    "age": 32,
    "is_active": true,
    "skills": [
        "Python",
        "Data Analysis",
        "Machine Learning"
    ],
    "pet": null
}
<class 'str'>


In [24]:
# (B) 將 JSON 字串轉換回 Python 物件 (反序列化)
# 使用 json.loads() (load string) 函式。

# Use loads() to parse json string to Python object
python_obj = json.loads(json_string)

# Print
print(python_obj)
print(type(python_obj))

{'name': 'Jason', 'age': 32, 'is_active': True, 'skills': ['Python', 'Data Analysis', 'Machine Learning'], 'pet': None}
<class 'dict'>


In [25]:
# (C) 讀寫 JSON 檔案
# 當你需要將資料儲存到檔案或從檔案讀取設定時，json 模組也提供了方便的函式：
# json.dump()：將 Python 物件序列化後寫入一個檔案。
# json.load()：從一個檔案中讀取 JSON 資料並載入為 Python 物件。


In [26]:
# 寫入檔案 (dump)
import json

user_profile = {
    "user_id": 12345,
    "username": "testuser",
    "email": "test@example.com",
    "settings": {
        "theme": "dark",
        "notifications_enabled": True
    }
}

# 使用 'w' (寫入模式) 開啟檔案
# encoding='utf-8' 確保能正確處理中文字元
with open('test_user_profile.json', 'w', encoding='utf-8') as f:
    json.dump(user_profile, f, indent=4)

In [27]:
# 讀取檔案 (load)
with open('test_user_profile.json', 'r', encoding='utf-8') as f:
    loaded_data = json.load(f)

print(type(loaded_data))
print(loaded_data)

<class 'dict'>
{'user_id': 12345, 'username': 'testuser', 'email': 'test@example.com', 'settings': {'theme': 'dark', 'notifications_enabled': True}}
