# Chapter 2 - Datatypes and Operators：資料型態與運算子

電腦發展快速所帶來的直接效益，就是計算量大大地增加了，而計算正是一個讓電腦幫我們做事情的入門點。本章節我們先從簡單的數學運算開始介紹 Python 的功能、以及一些不同的資料型態 (Datatype)。

## Numbers：數字類的資料型態

數字的資料型態有兩種，分別是：

* `int`：整數 (Integer)
* `float`：浮點數 (Float)

References:

* [Numbers - Python Documentation](https://docs.python.org/3/tutorial/introduction.html#numbers)
* [int - Python Documentation](https://docs.python.org/3/library/functions.html#int)
* [float - Python Documentation](https://docs.python.org/3/library/functions.html#float)

In [1]:
# 試著顯示數字在畫面上
print(1)
print(2.0)

1
2.0


配合 `type()` 函式，我們可以觀察不同樣態的數字，分別是什麼資料型態。

In [2]:
# 顯示整數 (int) 的資料型態
print(type(1))
# 顯示浮點數 (float)的資料型態
print(type(2.0))

<class 'int'>
<class 'float'>


### Opeators：運算子

程式是由許多的表達式 (Expression) 組成的，最直覺的表達式就是使用各種運算子執行四則運算：加 `+`、減 `-`、乘 `*`、除 `/`。除此之外，還有一些特別的運算：

References:

* [Mapping Operators to Functions - Python Documentation](https://docs.python.org/3/library/operator.html#mapping-operators-to-functions)
* [Operator precedence - Python Documentation](https://docs.python.org/3/reference/expressions.html#operator-precedence)

In [3]:
print(1 + 2)  # Addition：加法運算
print(4 - 3)  # Substraction：減法運算
print(5 * 6)  # Multiplication：乘法運算
print(8 / 7)  # Division：除法運算

3
1
30
1.1428571428571428


In [4]:
print(2 ** 3)  # Exponentiation：指數運算
print(7 // 6)  # Division：整除運算

8
1


In [5]:
print(10 % 3)  # Modulo：求餘數

1


也可以搭配括號 `()` 執行。

In [6]:
# 小括號 () 的應用
print(1 + 2 * 3)    # 沒有小括號
print((1 + 2) * 3)  # 使用小括號

7
9


如果需要表示數值之間的相對關係，可以使用比較運算子，而比較的結果將會以布林值 (Boolean) 回傳

> 備註：不認識布林值？不用擔心，我們很快地會在下一個小節提到布林值！

In [7]:
print(5 > 3)    # 大於
print(1 >= 10)  # 大於或等於

True
False


In [8]:
print(7 < 4)   # 小於
print(2 <= 9)  # 小於或等於

False
True


In [9]:
print(3 == 1 + 2)  # 等於
print(8 != 9)      # 不等於

True
True


### 浮點數計算的陷阱

由於大部分的電腦的浮點數計算都是透過二進位小數來表示，而目前幾乎所有浮點數的計算都採用了 IEEE 754 的標準來執行，所以可能會顯示近似值：

In [10]:
print(0.1 + 0.1 + 0.1)

0.30000000000000004


Python 官方文件中也提供了解決方法，大致羅列：

* 採用 [Decimal module](https://docs.python.org/3/library/decimal.html#module-decimal)
* 採用 [Fractions module](https://docs.python.org/3/library/fractions.html#module-fractions)
* （推薦）採用 [Numpy](https://numpy.org/) / [Scipy](https://scipy.org/)

References:

* [Floating Point Arithmetic: Issues and Limitations - Python documentation](https://docs.python.org/3/tutorial/floatingpoint.html)
   * [浮點數運算：問題與限制](https://docs.python.org/zh-tw/3/tutorial/floatingpoint.html)
* [IEEE 754 - Wikipedia](https://en.wikipedia.org/wiki/IEEE_754)
   * [IEEE 754 - 維基百科](https://zh.wikipedia.org/zh-tw/IEEE_754)

## Booleans：布林值，標示是、否的資料型態

布林值用 `True` 表示真值、而用 `False` 表示假值。

布林值也是整數 (`int`) 型態的子集合，用 `0` 表示 `False`，而其他的數值均表示 `True`。

> 備註：初學的時候最容易忘記的是布林值的 `True` 跟 `False` 的首字都是大寫！

References:

* [bool - Python documentation](https://docs.python.org/3/library/functions.html#bool)
* [Truth Table - Wikipedia](https://en.wikipedia.org/wiki/Truth_table)
   * [真值表 - 維基百科](https://zh.wikipedia.org/zh-tw/%E7%9C%9F%E5%80%BC%E8%A1%A8)

In [11]:
bool(0.01)

True

In [12]:
print(True)   # 是
print(False)  # 否

True
False


In [13]:
print(type(True))

<class 'bool'>


In [14]:
print(True == 1)   # 驗證 0 以外的數字是否代表 True
print(False == 0)  # 驗證 0 以外的數字是否代表 False

True
True


在 Python 中，有兩個類似的運算子，是可以用來比較兩物件是否相等的：

* `==`：相等 (Equality) 運算子
* `is`：標示 (Identity) 運算子

若要用一個表達式與布林值相比較，正確的用法應該是用標示運算子 `is` 來比較（即使兩者回傳的結果相當，仍會有些許的效率差異）。

In [15]:
# 用 `is` 來驗證兩表達式是否相等
print((3 + 1 == 4) is True)
print((3 + 1 == 4) == True)  # 此方式執行較慢

True
True


而標示運算子除了 `is`（是）以外，常用的還有 `or`（或）與 `not`（非）：

In [16]:
# not 的用法：將真偽逆轉
print(not(True) is False)

True


In [17]:
# or 的用法：任意表達式為真，即為真
print(True or False)

True


## Strings：字串的資料型態

若需要表達一串字元，可以將字元至於成對單引號（`'`, Single quote）或是雙引號（`"`, Double quote）之中。型別名稱為 `str`。

而若有特殊符號需作為字串表示時，可以使用倒斜線（`\`, Backslash） 作為「逃脫字元 (Escape character)」，讓逃脫字元之後的字元被視為一般字元來顯示。

References:

* [Text Sequence Type — str - Python Documentation](https://docs.python.org/3/library/stdtypes.html#textseq)
* [PEP 257 -- Docstring Conventions](https://www.python.org/dev/peps/pep-0257/#multi-line-docstrings)

In [18]:
print("Hello world!")        # 試著建立一個字串物件
print(type("Hello world!"))  # 驗證物件是否為字串

Hello world!
<class 'str'>


In [19]:
print('We can also use single quotes')  # 使用成對單引號 '' 來建立字串
print("Also, double quotes are fine")   # 使用成對雙引號 "" 來建立字串

We can also use single quotes
Also, double quotes are fine


In [20]:
# 逃脫字元
# 範例：在使用雙引號的字串裡顯示雙引號
print("Hey, \"Vivi\" is my name. Don't forget!")

Hey, "Vivi" is my name. Don't forget!


若是要建立多行的字串，可以使用三個重複的單引號或雙引號來建立字串物件：

In [21]:
print("""This is an one-line string""")
print("""And these are
multiline strings
""")  # ''' also works!

This is an one-line string
And these are
multiline strings



多行字串常見的用途，是作為函式或是方法的文件字串 (Docstrings)：

In [22]:
# 搭配內建函式 help()，我們將可以查看物件的說明文件內容！
# 例：查看 print() 的用法
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [23]:
# 接著我們來驗證一下 Docstrings 的製作
def foo():
    """
    This is the docstrings
    """
    pass

help(foo)

Help on function foo in module __main__:

foo()
    This is the docstrings



> 看不懂 `def` 在做什麼嗎？其實就是建立一個函式。不知道為什麼這樣用？別用擔心，後面的章節會講解到！

### 索引 (Indexing) 與分割 (slicing) 字串

在 Python 中，並沒有單一字元的 `char` 型態，而 `str` 字串型態可以視為多個單一字元的集合，所以可以從中擷取部分的內容。

用來指定擷取的內容位置是索引值 (Index)。在電腦程式的世界裡，通常第一個物件的索引值都是 `0`，之後的索引值則為 `1`, `2`, `3`......。Python 還有提供由後往前數的功能，而最後一個字元往前算的索引值則為 `-1`, `-2`, `-3`......。

指定索引值的格式為：`[start:stop:step]`，其中：

* `start`：欲擷取字串中首字的索引值
* `stop`：欲擷取字串中末字的索引值 + 1（也就是擷取的內容不包含 `stop` 位置的字元），此值可忽略
* `step`：從擷取首字的位置起算，每隔幾個字元擷取一次，預設為 `1`，此值可忽略


In [24]:
# 試著指定 start 索引值來取得字串中的單一字元
print("String"[3])
print("String"[-3])

i
i


In [25]:
# 試著指定 start 以及 stop 的索引值，來擷取數個字元
print("String"[2:6])

ring


In [26]:
print("String"[:3])  # 若不指定 start，則預設從第一個字元開始擷取
print("String"[2:])  # 若不指定 stop，則預設擷取到最後一個字元

Str
ring


In [27]:
# 試著指定 step
print("String"[1:6:2])
print("String"[1::2])  # 可以不指定 start 或 stop 的任意一項

tig
tig


### 字串相關小技巧

在顯示字串時，可以將字串用不同的方式組合在一起，提高閱讀性：

In [28]:
print("Hello " + "world!")  # 多個字串可以用 + 號連接成一個字串
print("Hello ""world!")     # 可以將字串連續放置在 print() 函式內
print("Hello", "world!")    # 字串間如果用逗號 "," 隔開，則在顯示時會自動在兩倆之間加上空格

Hello world!
Hello world!
Hello world!


而使用 `in`: 包含測試運算子，可以驗證某字串是否包含在某個字串之內

In [29]:
print('lo' in "Hello")

True


### 字串方法

字串帶有一些內建的方法 (methods) 可以使用，例如大小寫轉換、尋找字元、取代、去除字串內的空白字元⋯⋯等等。

> 「方法 (methods)」容易與「函式 (functions)」稍微產生混淆。下一個章節我們會把這兩個要素放在一起講解，現在讓我們先學會操作一些實用的方法吧！

In [30]:
print("Hello world!".upper())  # 將字串轉換為大寫
print("Hello world!".lower())  # 將字串轉換為小寫

HELLO WORLD!
hello world!


In [31]:
print("string".find('ring'))  # 在字串中，搜尋特定字串第一次出現的位置的索引值

2


In [32]:
print("string".replace("ng", "ke"))  # 將字串取代為另一個字串

strike


In [33]:
print("    string    ".strip() + "<EOL>")   # 消除字串左側與右側的所有空格
print("    string    ".lstrip() + "<EOL>")  # 消除字串左側的所有空格
print("    string    ".rstrip() + "<EOL>")  # 消除字串右側的所有空格

string<EOL>
string    <EOL>
    string<EOL>


In [34]:
print("1,1,2,3,5,8,13,21".split(","))  # 將字串以特定字元為界線，將其分割成許多分開的字串

['1', '1', '2', '3', '5', '8', '13', '21']


In [35]:
print("-".join("ENGLISH"))  # 將字串中的每個字元，用指定的字元相互連接起來

E-N-G-L-I-S-H
