# 成為初級資料分析師 | Python 程式設計

> 資料型態

## 郭耀仁

> There are only two hard things in Computer Science: cache invalidation and naming things.
> 
> Phil Karlton

## 大綱

- 文字
- 布林
- 空值
- 資料型態轉換
- 隨堂練習

## 文字

## 使用成雙的單引號或成對的雙引號來建立文字，多數的時候使用單引號或者雙引號不會有分別

In [None]:
# 使用單引號
movie_title = 'Avengers: Endgame'
print(movie_title)
print(type(movie_title))

In [None]:
# 使用雙引號
movie_title = "Avengers: Endgame"
print(movie_title)
print(type(movie_title))

## 亦可以使用六個雙引號來建立長文字，像是一個有換行的文章段落

In [None]:
story_line = """
After the devastating events of Avengers: Infinity War (2018), the universe is in ruins. 

With the help of remaining allies, the Avengers assemble once more in order to undo Thanos' actions and restore order to the universe.
"""
print(story_line)
print(type(story_line))

## 長文字在自訂函式時，會被視為函式的說明文件，在使用 `help()` 函式時會被印出來

In [None]:
def endgame_story_line():
    """
    This function returns the story line of Avengers: Endgame (2019).
    """
    story_line = """
    After the devastating events of Avengers: Infinity War (2018), the universe is in ruins. 

    With the help of remaining allies, the Avengers assemble once more in order to undo Thanos' actions and restore order to the universe.
    """
    return story_line

help(endgame_story_line)

## 少數時候宣告一個儲存文字資料值的物件使用單引號或雙引號會有差異

In [None]:
shaq = "Shaquille O'Neal"
shaq = 'Shaquille O'Neal'

## Single quotes 與 Apostrophe 是不同的

必須使用 `\`（跳脫字元）來標註 Apostrophe。

In [None]:
shaq = 'Shaquille O\'Neal'
print(shaq)
print(type(shaq))

In [None]:
mcd = 'I\'m lovin\' it!'
print(mcd)
print(type(mcd))

## 文字支援 `+` 和 `*` 這兩個運算符號

- `+` 可以將文字進行連接
- `*` 可以將文字重複

In [None]:
print("55" + "66")
print("5566"*2)

## 使用 `.format()` 在文字中嵌入物件的資料值（String interpolation）

`"{}".format(object_name)`

In [None]:
great_center = "Shaquille O'Neal"
print("{} is one of the greatest center in NBA history.".format(great_center))

## 使用 `.format()` 在文字中嵌入物件的數值時指定格式

- `{:.0f}` 整數
- `{:.2f}` 小數位數兩位的浮點數
- `{:02}` 有兩個位數且補零的整數
- `{:,}` 千分位逗點

In [None]:
pi = 3.14159
print("{:.0f}".format(pi))
print("{:.2f}".format(pi))

In [None]:
movie_title = "Avengers: Endgame"
hours = 3
mins = 1
print("The movie time of {} is {:02} hours and {:02} minutes.".format(movie_title, hours, mins))

In [None]:
box_office = 357115007 # Opening Weekend USA: $357,115,007
print("The box office of {} on opening weekend, USA is ${:,},".format(movie_title, box_office))

## 布林

## 以 `True` 與 `False` 這兩個保留字獲得布林

In [None]:
type(True)

In [None]:
type(False)

## 我們需要布林來進行：

- 條件判斷
- `while` 迴圈
- 資料篩選

## 除了直接寫 `True` 或 `False`，布林也可以透過下列方式產生

- 比較符號
- 布林運算符號

## 比較符號（Comparison Operators）

- `==` 、 `!=` ：等於以及不等於
- `>` 、 `>=` 、 `<` 、 `<=` ：大於、大於等於、小於以及小於等於

In [None]:
55 == 66

## 布林運算符號（Boolean Operators）

- `not` ：非
- `is` 、 `is not` ：是否為相同的值與類型
- `and` 、 `or` ：交集與聯集

## 空值

## 以 `None` 保留字可以獲得空值

In [None]:
type(None)

## 空值可以用來代表一個「遺漏值」

- 空值並不等於 0
- 空值並不等於 False
- 空值並不等於空文字 `''`

In [None]:
print(None is 0)
print(None is False)
print(None is '')

## 空值是自成一格的類別

In [None]:
print(None is None)
print(None == None)

## 如果自訂函式沒有運用 `return` 將輸出拋回，就無法將函式結果宣告給物件，意即會獲得一個 `None`

In [None]:
def subtract(a, b):
    ans = a - b

subtract_ans = subtract(5, 6)
type(subtract_ans)

In [None]:
def subtract(a, b):
    ans = a - b
    return ans

subtract_ans = subtract(5, 6)
type(subtract_ans)

## 資料型態轉換

## 使用與資料類別相同名稱的內建函式轉換

- `int()`：轉換為整數類別
- `float()`：轉換為浮點數類別
- `str()`：轉換為文字類別
- `bool()`：轉換為布林類別

## 資料型態轉換採取一種稱為「向上轉型」（Upcasting）的規則

`bool` -> `int` -> `float` - > `str`

## 遵循「向上轉型」的方向可以保證轉型成功

In [None]:
print(int(False))
print(int(True))

In [None]:
print(float(0))
print(float(1))

In [None]:
print(str(0.0))
print(str(1.0))

## 推薦大家看 Harvard CS50 的 Lecture 0，對電腦如何儲存不同的資料型態會有更深入的暸解

<https://youtu.be/jjqgP9dpD1k>

## 隨堂練習

## 隨堂練習：定義一個函式 `what_ross_said()` 回傳這段文字

```
Let's put aside the fact that you "accidentally" pick up my grandmother's ring.
```

- 預期輸入：無
- 預期輸出：一個文字

In [None]:
def what_ross_said():
    """
    >>> what_ross_said() # The One Where Emma Cries, Episode 9.02, Friends
    Let's put aside the fact that you "accidentally" pick up my grandmother's ring.
    """

## 隨堂練習：定義一個函式 `hello_something(something)` 可以回傳這段文字

```
Hello, ＯＯＯ!
```

- 預期輸入：一個文字 `something`
- 預期輸出：一個文字

In [None]:
def hello_something(something):
    """
    >>> hello_something('world')
    'Hello, world!'
    >>> hello_something('Earth')
    'Hello, Earth!'
    """

## 隨堂練習：定義一個函式 `is_odd(x)` 回傳 `x` 是否為一個奇數，若是奇數回傳 `True` 否則回傳`False`

- 預期輸入：一個整數 `x`
- 預期輸出：一個布林

In [None]:
def is_odd(x):
    """
    >>> is_odd(0)
    False
    >>> is_odd(1)
    True
    >>> is_odd(2)
    False
    >>> is_odd(3)
    True
    """

## 隨堂練習：定義一個函式 `last_digit_is_odd(id_str)` 判斷身分證字號尾數是否為一個奇數，若是奇數回傳 `True` 否則回傳`False`

- 預期輸入：一個文字 `id_str`
- 預期輸出：一個布林

備註：使用 `id_str[-1]` 可以取出 `id_str` 最末端的文字

In [None]:
def last_digit_is_odd(id_str):
    """
    >>> last_digit_is_odd('A123456789')
    True
    >>> last_digit_is_odd('A123456780')
    False
    """

## 隨堂練習：定義一個函式 `is_overweight(height, weight)` 可以依據身高（公分）與體重（公斤）判斷是否符合 BMI 定義的過重（BMI > 30 則判定為過重）

\begin{equation}
BMI = \frac{weight_{kg}}{height_{m}^2}
\end{equation}

- 預期輸入：兩個數值 `height` 與 `weight`
- 預期輸出：一個布林

In [None]:
def is_overweight(height, weight):
    """
    >>> is_overweight(198, 129) # Zion Williamson
    True
    >>> is_overweight(198, 98)  # Michael Jordan
    False
    """

In [None]:
%load ../test_cases/test_cases_03.py