# 成為初級資料分析師 | Python 程式設計

> 模組與套件

## 郭耀仁

> One feature of Python that makes it useful for a wide range of tasks is that it comes "batteries included"—that is, the Python standard library contains useful tools for a wide range of tasks.

## 程式封裝的三個層級

- **模組與套件（Modules and classes）**
    - 類別（Classes）
        - 函式（Functions）

## 大綱

- `import` 指令
- 自訂模組
- 自訂套件

## `import` 指令

## 使用 `import` 指令載入標準與外部模組套件

- 標準函式庫（Standard Libraries）
- 外部函式庫（Third-party Libraries）

## 標準函式庫：伴隨 Python 直譯器而來，無需額外安裝

- `re`
- `datetime`
- `random`
- `math`
- ...etc.

<https://docs.python.org/3/library/>

## 使用 `import` 指令：以 `math` 標準函式庫為例

In [None]:
import math

print(math.pi)

## 使用 `import` 指令搭配縮寫

In [None]:
import math as m

print(m.pi)

## 使用 `from` 搭配 `import` 指令載入部分功能

In [None]:
from math import sin, pi

print(sin(pi/2))

## 外部函式庫：使用 `pip install` 指令

```bash
pip install LIBRARY_NAME
```

## `pip` 是 Python 套件管理工具

- 不需額外安裝
- 協助使用者從 [Python Pacakge Index](https://pypi.org/) 下載、安裝或更新

## 更新 `pip`

- Linux / macOS

```bash
pip install -U pip
```

- Windows

```bash
python -m pip install -U pip
```

## 隨堂練習

## 使用 `pip` 安裝 `pyquery`

```bash
pip install pyquery
```

## 載入 `pyquery` 中的 `PyQuery` 函數，並縮寫為 `pq`

```python
from pyquery import PyQuery as pq
```

## 自訂模組

## 何謂模組

- 將函數或類別封裝在一個 `.py` 檔案中
- `.py` 的檔名就是模組名稱

## 自訂一個名為 `movie` 的模組

In [None]:
# movie.py ------
import requests
from bs4 import BeautifulSoup

class Movie:
    def __init__(self, movie_title):
        self._movie_title = movie_title
        
    def get_movie_url(self):
        query_string_parameters = {
            'q': self._movie_title,
            's': 'tt',
            'ttype': 'ft',
            'ref_': 'fn_ft'
        }
        page_url = "https://www.imdb.com/find"
        r = requests.get(page_url, params=query_string_parameters)
        soup = BeautifulSoup(r.text, 'lxml')
        first_link = soup.select(".result_text a")[0].get("href")
        movie_url = "https://www.imdb.com" + first_link
        self._movie_url = movie_url
        self._movie_title = soup.select(".result_text a")[0].text
    def get_movie_info(self):
        self.get_movie_url()
        r = requests.get(self._movie_url)
        soup = BeautifulSoup(r.text, 'lxml')
        rating = float(soup.select("strong span")[0].text)
        movie_time = soup.select("time")[0].text.strip()
        genre = [i.text for i in soup.select(".subtext a")]
        release_date = genre.pop()
        release_date = release_date.strip()
        movie_info = {
            'title': self._movie_title,
            'rating': rating,
            'movieTime': movie_time,
            'releaseDate': release_date
        }
        return movie_info

## 將 `movie.py` 放置在工作目錄下

In [None]:
from movie import Movie

endgame = Movie("Avengers: Endgame")
endgame.get_movie_info()

## 隨堂練習

## 自訂一個名為 `bmi` 的模組

- 在該模組中定義一個函數 `get_bmi(height, weight)`
- 載入模組並成功呼叫 `get_bmi` 函數

In [None]:
from bmi import get_bmi

get_bmi(191, 91)

In [None]:
# bmi.py ------
def get_bmi(height, weight):
    bmi = weight / (height*0.01)**2
    return bmi

## 自訂套件

## 何謂套件

- 多個功能相關的模組（.py 檔案）可以組織成一個套件（資料夾）
- 在工作目錄建立一個資料夾，將這個資料夾的名稱更改為 movie_package
- 在這個資料夾中新增檔案：
    - movie.py

In [None]:
# movie.py ------
import requests
from bs4 import BeautifulSoup

class Movie:
    def __init__(self, movie_title):
        self._movie_title = movie_title
        
    def get_movie_url(self):
        query_string_parameters = {
            'q': self._movie_title,
            's': 'tt',
            'ttype': 'ft',
            'ref_': 'fn_ft'
        }
        page_url = "https://www.imdb.com/find"
        r = requests.get(page_url, params=query_string_parameters)
        soup = BeautifulSoup(r.text, 'lxml')
        first_link = soup.select(".result_text a")[0].get("href")
        movie_url = "https://www.imdb.com" + first_link
        self._movie_url = movie_url
        self._movie_title = soup.select(".result_text a")[0].text
    def get_movie_info(self):
        self.get_movie_url()
        r = requests.get(self._movie_url)
        soup = BeautifulSoup(r.text, 'lxml')
        rating = float(soup.select("strong span")[0].text)
        movie_time = soup.select("time")[0].text
        genre = [i.text for i in soup.select(".subtext a")]
        release_date = genre.pop()
        movie_info = {
            'title': self._movie_title,
            'rating': rating,
            'movieTime': movie_time,
            'releaseDate': release_date
        }
        return movie_info

In [None]:
from movie_package.movie import Movie

endgame = Movie("Avengers: Endgame")
endgame.get_movie_info()

## 作業

## 在工作目錄建立一個套件：casino

- 這個資料夾中新增 2 個檔案：
    - dice.py
    - poker.py
- dice 模組中定義一個 `roll_a_dice` 函數，可以回傳擲一粒骰子的點數
- poker 模組中定義一個 `deal_a_card` 函數，可以回傳發一張撲克牌的花色點數

## 執行範例

```python
from casino import dice, poker

print(dice.roll_a_dice())
print(poker.deal_a_card())

## 6
## 'Diamond Ace'
```