# Python的字元編碼


電腦有許多位元，儲存的資料為1跟0，為了要表示複雜的資料，例如字元、圖片等等，必須將**多個位元合併成一組，形成2進位的數字**。字元編碼格式有許多種，最通用的為Unicode標準的UTF-8格式，也是Python檔案所採用的字元編碼系統。除了UTF-8以外，常見的有ASCII碼。這是較早期的編碼系統，有7位碼、8位碼兩種形式，前者可以表示$2^7=128$種字元，主要是常用的英文字母和符號；後者則從128位開始，擴充了更多符號。各字元對應的編碼如下圖。
![](https://lh3.googleusercontent.com/proxy/AIxKDeisTpbnwn82dk2riC2VSsn_QoKTWxNIO06VeZy8mZ2Pko_nsVNCEVt0AJ9VeCT7IbTqv0dWJTnFlWvLQI_ZA7w4-7YeLDE7C0NFOYXfAeIREdICNclV)
![](https://lh3.googleusercontent.com/proxy/AkuU-f7x-Kc4GtJqSgImq9nDIshgQrsgiBbYNMD3yqWOoCObBqCRMuFMSCEYVnuShDDU4iDQ6h8Gn8E1ux8HZM71WfIgfgzxG1gCODrEy1I8uNHAvX4yF3LjYxEFfz3mqjU)

ASCII主要用於顯示現代英文，除了英文以外的語言幾乎都採用Unicode標準。為了相容性，UTF-8的前128個字元編碼和ASCII一樣。因此在撰寫python檔案時，盡量使用前128種字元，否則可能會出現無法顯示的亂碼。

### 控制字元
在ASCII中，前33個字元是控制字元，用來控制已經處理過的文字，實際上很少使用，無法被列印。

# Python的輸出:print()函數

電腦與使用者互動的基本模式為輸入輸出(I/O)，將某些訊息傳入電腦之中，經過處理，再重新輸出到用戶端。Python中內建的輸出函數為`print()`，函數的概念之後會再提到，此處先不多做敘述。`print`函數的主要功能是將處理過的資料輸出到螢幕，資料有許多型別，例如：整數、字串等等。將要輸出的資料放到括弧中便可輸出，如果有多筆資料要輸出，可以在括號中用' , '分隔。

In [2]:
# 用""或者''包起來的部分是字串
print("Hello World!")
print('Hello World!')
print("a")
print('a')

Hello World!
Hello World!
a
a


In [1]:
# 這是整數
print(100)

100


In [4]:
# 浮點數
print(3.14)

# 複數，Python中用j表示虛部
print(2-3j)

# 布林值
print(True, False)

3.14
(2-3j)
True False


In [3]:
# 也可以放入運算式
print(1+1)

# 同時印出多種型別
print(1, 2, 3, 4, 'sequence')

2
1 2 3 4 sequence


我們可以看到，每次呼叫`print`之後，會先印出括號中的內容，接著換行，再執行下一行程式。如果傳入多筆資料，每筆資料會用一個空格隔開。如果我們不希望每次呼叫`print`之後都換行，或者在各筆資料之間不是空格，可以透過傳入`end,sep`參數來控制。例如如果希望在每行之後印出'XD'，只要設定`end='XD'`，`sep`同理。兩個參數的順序沒有影響，在之後的函數部分會解釋。

In [4]:
# 注意end,sep只能設定為字串，否則會發生錯誤 
print('word', end = 1)

TypeError: end must be None or a string, not int

In [5]:
# 預設的end, sep如下
print(1, 2, 3, sep = ' ', end = '\n')

# 如果沒有更改，end, sep會依照預設值輸出
print('哈哈', '笑死', end = '🤣'*3)
print('\n新', '年', '快', '樂', sep = '~')

print(2021, 9, 22, sep = '/', end = ' 開學\n')
print('庭院', '', '幾許', end = '深\n', sep = '深')

1 2 3
哈哈 笑死🤣🤣🤣
新~年~快~樂
2021/9/22 開學
庭院深深幾許深


In [6]:
# help()函數是python內建的函數之一，可以幫助了解內建的許多資料型別、函數、類別等等
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



## 跳脫序列
以上的程式範例中，我們可以看到一個特殊的字元'\n'，這是Python的跳脫序列。\
跳脫字元\\，標示了跳脫序列的開頭，在**跳脫字元之後的下一個字元會和它組成跳脫序列**。
Python中有幾種常見的跳脫序列，如圖:
![](https://3.bp.blogspot.com/-PUeZZRqulQM/Wj8xP6vkrVI/AAAAAAAAEv8/1hOGFLbe9uULZ08qLmILmX9e3hh2ECFmACLcBGAs/s1600/Image%2B27.png)
通常會用到的只有\n  , \\ , \\" , \\' 。\
大多數程式語言都有自己的**跳脫字元**，例如C/C++的跳脫字元也是\\，這跟ASCII的**控制字元**不一樣。

In [46]:
print(1)
print('\a')
print(2)
print('\b')
print(3)
print('\r')
print(4)
print('\f')
print(5)
print('\tword')
print(6)
print('word1\vword2')

# 根據ASCII碼來輸出
print(7)
print('\141')
print(8)
print('\x61')

1

2

3

4

5
	word
6
word1word2
7
a
8
a


除了以上的方法以外，我們可以還可以透過其他方法，根據ASCII來輸出，或者得到某個字元的ASCII值。

In [48]:
print(ord('🤣'))
print(chr(129315))
print(f'{129315:c}')

129315
🤣
🤣


# 變數

接著我們來到程式語言中非常重要的概念:變數。變數就像一個代數，藉由**賦值運算**，用來儲存經過處理的資料。根據儲存資料的不同，可以將變數分成不同型別，例如：整數變數、字串變數等等。變數的名稱可以由用戶自訂，Python2.x中，只能以{A-Z、\_、1-9}來為變數取名，在Python3之後，支援UTF-8的大多數字元。變數取名有限制，不能是關鍵字，不能以數字開頭，且如果沒有特殊需求，應該避免以\_開頭，也應該避免和內建函數名稱相同，例如把變數取名為print。\
關鍵字，或稱保留字有以下幾種，通常是程式語法會使用到的字詞:
![](https://beginnersbook.com/wp-content/uploads/2019/03/Python_keywords.jpg)

# 運算子
> 用來組成**表達式**的基本元素，讓表達式可以返回一個特定的值。

## 算數運算子

除了基本的`+,-,*,/`，在大多數程式語言中很常見到的**取餘運算(mod)**`%`，`a%b`會回傳a除以b的餘數。\
以上是大多數程式語言中都有的運算子，Python還有兩種比較特別的運算子。
`**`:指數運算，`3**2`會回傳9\
`//`:除法並取向下取整，`3//2`回傳1\
除了以上的二元運算(a operator b)，還有一元運算子`-`，功能就跟數學的負號一樣。
## 賦值運算子

語法:`a = 3`,`b = True`,`c = 'string'`，用`=`將右邊的運算結果指定給左式，跟數學的等號不一樣。\
除了普通的`=`以外，Python也支援將算術運算結合賦值運算的`+=, -=, *=, /=, //=, **=, %=`，`a += 1`的意思相當於`a = a+1`
## 比較運算子

比較運算子用來比較左右兩條**表達式**的大小關係，有`>=, >, ==, <=, <, !=`六種，如果兩式符合所描述的關係，會回傳`True`，否則會回傳`False`。初學很常犯錯的地方是想要比較兩式是否相等時，誤用了賦值運算的`=`。
## 邏輯(布林)運算子
`and`:當左右兩條表達式的值都為真，則回傳`True`，否則回傳`False`
`or`:當左右兩條表達是有一者為真，回傳`True`，否則回傳`False`
`not`:若右側表達式為真，回傳`False`，否則回傳`True`

## 位元運算子
比較少用到，所以省略。

## 運算子的優先順序
大原則是**算數>(位元運算子)>賦值=比較>邏輯，由左向右執行**，但注意`**`是唯一一個由右向左執行的運算子。各運算子的詳細優先順序見下圖
![](https://techvidvan.com/tutorials/wp-content/uploads/sites/2/2019/12/python-operator-precedence.jpg)
![](https://study.com/cimages/multimages/16/precedence_table.png)

In [7]:

print(3+3%2)
print(3%2+3)
print(3*3%2)
print(3%7*2)
print(3**3%2)
print(3%7**2)
print(2**3**2)

4
4
1
6
1
3
512


In [8]:
print(1 == True)
print(2 == 5%3)

a = b = 3
a += b
print(a, b)

True
True
6 3


有了運算子和變數的概念，`print`可以玩出更多花樣。

# 格式化輸出
如果我們想要在一段文字中嵌入變數，可以使用格式化字串，如`f'string'`的形式。藉由不同的前綴，可以對字串做出不同處理，有f,r,b,u四種，此處只簡單介紹f,r兩種。
## 格式化字串
f-string可以在字串中嵌入表達式`f'...{expression}...'`;注意，在f-string的大括弧中，不能使用\\反斜線符號，不能用和最外層一樣的字串分隔符。
括弧中應該遵守以下格式，`{expression ['='] ['!'conversation] [':'format_spec]}`

其中expression包含先前提過除了賦值運算外的表達式，conversation通常不會用到，format_spec的部分非常複雜，如:\
`{[[fill]align][sign][#][0][width][grouping_option][.precision][type]}`
詳情參見[格式字符串微語言](https://docs.python.org/zh-tw/3/library/string.html#formatspec)。


通常只會用到align, sign, width, grouping_option, .precision幾種:\
align:`<`,`>`,`^`，分別為置左、置右、置中。`=`只能對數字(int,float,complex)類型使用，會把fill置於sign跟數字之間。\
sign:`+`會標記正負、`-`只會標記負數、` `對正數空一格，對負數標負號。\
width:控制輸出格數，如果變數的範圍超過指定的格數，會被無視。\
grouping_option:為了方便閱讀，對數字所加的分格符號，有`,`,`_`兩種，只對整數部分有效。10進位的數字每三位一個分隔符，2,8,16進位每四格一個分隔。
.precision:對浮點數型別使用，控制小數點後的位數，**包含小數點**，會自動進位;對非數字型別，控制最大輸出寬度，如果超出會被省略。
## 原始字串
r-string可以表示字串中的'\\'，也就是讓跳脫字元失效。但想要印出`'`,`"`時，就需要控制內外的分號不能一樣。

In [45]:
# r-string
print(r"'\n' will not change line")

'\n' will not change line


In [10]:
# f-string
Class_name = 'Principle of economics'
professor = 'Joseph Wang'
a = f'{Class_name} is teached by {professor:3}, which as {1+1+3} hours per week'
print(a)
professor = 'Ming-Jen Lin'
print(a)

# 如果想在f-string中使用大括號，必須連用兩層，而且第二層沒辦法顯示變數
print(f'{{professor}}')

# 用三層可以同時顯示大括號和變數
print(f'{{{professor}}}')

# conversation
print(f'{{{professor!r}}}')
print(repr(professor))

Principle of economics is teached by Joseph Wang, which as 5 hours per week
Principle of economics is teached by Joseph Wang, which as 5 hours per week
{professor}
{Ming-Jen Lin}
{'Ming-Jen Lin'}
'Ming-Jen Lin'


In [17]:
# format_spec的各種範例
# fill, align, width of integer
print(f'{97:5}')
print(f'{97:05}')
print(f'{97:l<5}')
print(f'{97:m^5}')

   97
00097
97lll
m97mm


In [16]:
# fill, align, width, precision of string
str1 = 'str1'
str2 = 'str2'
print(f'{str1:5}')
print(f'{str1:r>5}')
print(f'{str1:3}')
print(f'{str1:.3}')

str1 
rstr1
str1
str


In [15]:
# align, width, precision of float
import math
print(f'{math.pi:10.3}')
print(f'{math.pi:<10.4}')
print(f'{math.pi:^10.5}')

      3.14
3.142     
  3.1416  


In [14]:
# some operation about string
print(f'{str1+str2=}')
print(f'{str1*3=}')

str1+str2='str1str2'
str1*3='str1str1str1'


In [13]:
# grouping_option, type
print(f'{10**8:,}')
print(f'{math.pi*1000000:20,}')
print(f'{97:5_b}')

100,000,000
 3,141,592.653589793
110_0001


In [12]:
# 從這裡以後的程式就不用太認真看了
# #, type
print(f'{97:#5b}')
print(f'{97:#5o}')
print(f'{97:#5x}')
print(f'{97:5c}')
c = 'c'
print(f'{c:5}')

0b1100001
0o141
 0x61
    a
c    


In [11]:
# fill, align, sign, width
print(f'{1-2:0=+5}')
print(f'{1+2:0=+5}')
print(f'{1-2:0=-5}')
print(f'{1+2:0=-5}')
print(f'{1-2:0= 5}')
print(f'{1+2:0= 5}')

-0001
+0003
-0001
00003
-0001
 0003


# Python的標準輸入:input()
Python的內建輸入函數為`input`，主要將用戶輸入的訊息轉為**字串**傳給變數，如果用戶輸入數字或者運算式，可以透過`eval()`函數將字串轉換為適合的數字類別。

In [19]:
# 在括號中可以添加希望打在螢幕上的字串，輸入的文字會緊跟在字串之後，沒有空格
# 10
a = input('type a number')
print(type(a))

# 每次呼叫input之後會換行
# 3**2
b = eval(input('type an expression: '))
print(type(b))
print(b)

type a number10
<class 'str'>
type an expression: 3**2
<class 'int'>
9


In [20]:
# 6.02e23
c = eval(input())
print(type(c))
print(c)

# 0x41
d = eval(input())
print(type(d))
print(d)

6.02e23
<class 'float'>
6.02e+23
0x41
<class 'int'>
65


In [25]:
print(bin(97))
print(oct(97))
print(hex(97))
print(0b1100001)
print(0o141)
print(0x61)

0b1100001
0o141
0x61
97
97
97
97
