## Function

- 函數：被呼叫 (call) 時，才會運行的程式碼 
  
  `(A function is a code block which only runs when it is called.)`

  
- 我們可以將資料（參數 parameter）傳入函數

- 函數可以回傳資料作為結果


<mark>可以把函數想像成一個 Lab，它獨立於外面世界的環境、有自己的工作空間</mark>
- 外面環境的人可以傳資料進 Lab、請 Lab 運算；Lab 完成運算之後，再把結果回傳給外面的人。
- 如果外面的人沒有叫 Lab 做運算，Lab 就不會運作。


In [None]:
# 創造函數
# a function is defined using "def"

def my_function():
  print("這是我創造的函數，他負責印出這句話")

In [None]:
def func2():
  result = 1 + 2
  print("這是另一個函數，他負責印出 1 + 2 的結果")
  print(result)

In [None]:
# 呼叫函數
def my_function():
  a = 1 + 1
  print("這是我創造的函數，他負責印出這句話")

## 這裡是函數的外面（global scope）
## 呼叫函數的方式是在函數名稱後面加上小括號
my_function()

In [None]:
def my_function():
  print("明天就週五了 耶")

In [None]:
my_function()
my_function()

## Argument

- 資料可以作為參數 (argument) 傳遞到函數中。
  
- 參數是在函數名稱後面的括號內指定。  
  - `def my_function(這裡放參數的名字):`
  
  - 可以根據需要添加任意數量的參數，需用逗號分隔它們。
  
- 下方的函數帶有參數 `name` 
  - 呼叫這個函數時，我們需要傳遞一個名字（餵一個名字給函數）
  
  - 該名字在函數的內部會被作為 `name` 來使用


In [None]:
## 有1個參數的函數

def my_function(name):
  print('名字：', name)

my_function("陳品而")

In [3]:
my_function("陳品且")
my_function("且")

名字： 陳品且
名字： 且


In [None]:
## 有2個參數的函數

def full(lastname, firstname):
  print('全名：')
  print(lastname, firstname)

In [None]:
full("瑪卡", "巴卡")

In [5]:
full("烏西", "蒂西")

全名：
烏西 蒂西


In [None]:
# 可以使用 key = value 語法傳送參數
# 這樣就不需按照順序排列

def my_function(lastname, firstname):
  print('晚安', lastname + firstname)

In [None]:
my_function(firstname = "巴卡", lastname = "瑪卡")

晚安 瑪卡巴卡


In [None]:
my_function(lastname = "瑪卡", firstname = "巴卡")

晚安 瑪卡巴卡


In [6]:
## 有預設參數的函數

def my_function(country = "Taiwan"):
  print("我來自" + country)

In [8]:
my_function()

我來自Taiwan


In [7]:
my_function("Japan")

我來自Japan


<mark>傳送任何資料類型的參數</mark>

以下範例，我們傳送一個 <mark>列表</mark> 給函數

> 在外面環境時，這個列表是 "global variable (全域變數)"

> 當被傳到函數內部時，這個列表是 "local variable (區域變數)"
  
在以下範例中，
   - `food` 是區域變數，只存在於函數內部，不能在函數外面使用 `food`
   - `food` 有點像 `wishlist` 在函數內運作的代號
   - 當函數結束時，`food` 這個代號也跟著消失

In [9]:
def try_list(food):
  for x in food:
    print(x)

In [10]:
wishlist = ["芋頭", "南瓜", "馬鈴薯"]

try_list(wishlist)

芋頭
南瓜
馬鈴薯


In [None]:
food
# 這裡會出現錯誤，因為 food 是在函數裡面定義的變數

In [None]:
## 新函數 try_dictionary() 需要我們傳送一個 dictionary
def try_dictionary(food):
  for key, value in food.items():
    print(key, '有', value, '個')

In [None]:
wish_dict = {'蘋果':1, '香蕉':2,'橘子':3}

try_dictionary(wish_dict)

蘋果 有 1 個
香蕉 有 2 個
橘子 有 3 個


**上週作業也可以這樣寫**

In [8]:
grades = {
    "Richard": [60, 0, 45, -1],
    "Una": [100, 99, 101, 100],
    "Linda": [99, 100, 99, 100],
}

def print_grades(input):
  for name, g in input.items():
    print(name,'的分數：', g)
    print('====')

print_grades(grades)

Richard 的分數： [60, 0, 45, -1]
====
Una 的分數： [100, 99, 101, 100]
====
Linda 的分數： [99, 100, 99, 100]
====


**但當我們有好幾個 grades 字典時，就有必要了😉**

In [6]:
grades = {
    "Richard": [60, 0, 45, -1],
    "Una": [100, 99, 101, 100],
    "Linda": [99, 100, 99, 100],
}

grades2 = {
    "A": [60, 0, 45, -1],
    "B": [100, 99, 101, 100],
    "C": [99, 100, 99, 100],
}

grades3 = {
    "aaa": [60, 0, 45, -1],
    "bbb": [100, 99, 101, 100],
    "ccc": [99, 100, 99, 100],
}

In [9]:
# 先把 grades, grades2, grades3 放進一個 list
# 再用 for 迴圈，把每一個 list 都傳給剛剛定義的 print_grades() 函數

for g in [grades, grades2, grades3]:
  print_grades(g)

Richard 的分數： [60, 0, 45, -1]
====
Una 的分數： [100, 99, 101, 100]
====
Linda 的分數： [99, 100, 99, 100]
====
A 的分數： [60, 0, 45, -1]
====
B 的分數： [100, 99, 101, 100]
====
C 的分數： [99, 100, 99, 100]
====
aaa 的分數： [60, 0, 45, -1]
====
bbb 的分數： [100, 99, 101, 100]
====
ccc 的分數： [99, 100, 99, 100]
====


<mark>函數回傳</mark>

前面提過，可以把函數想像成一個 Lab，它獨立於外面環境、有自己的工作空間：
- 外面的人可以丟資料進 Lab `（傳遞參數）`
- 叫 Lab 運算 `（呼叫函數並運行）`
- Lab 完成運算之後，再把結果回報給外面的人 `（return 回傳結果值）`


In [11]:
def pingfang(x):
  result =  x ** 2

  return result

In [None]:
pingfang(5)

25

In [12]:
# 把回傳的結果存到一個變數裡面，以便之後使用
first = pingfang(9)  # 81

second = first + 1000

print(second)

1081


### 練習

設計一個 total_price() 計算不同水果的總價
- 蘋果一斤 100 元，買了 2 斤
- 橘子一斤 50 元，買了 3 斤

In [None]:
def total_price(price, quantity):
  result = ???
  ???


print('蘋果是', ??? )
print('橘子是', ???)

In [None]:
# 項目太多就用字典來處理

## key 是水果名稱
## value 是一個列表，第一個元素value[0]是價格，第二個元素value[1]是數量
mydict = {
  "蘋果": [100,2],
  "橘子": [50,3],
  "香蕉": [20,5]
}

for key, value in mydict.items():
  print(key, '是', total_price(value[0], value[1]) )

## Pandas

先了解 <mark>package</mark> 的概念：

- Python 中的 套件（package）是一種用於組織和管理程式碼的方式。它是一個包含多個模組（module）的目錄，這些模組的運行通常相關聯。package 的目的是結構化、將相關的功能組織在一起，以便更容易維護和管理程式。
- 剛開始學 Python 時，用Python內建＆別人寫好的package就非常足夠了 😉

<div>
<img src="https://drive.google.com/uc?id=1B_4HOJhvXtH6ehkimOtgOiXAI1jhN3Q3" width="200"/>
</div>

<mark>從來沒有用過的套件/模組，要先安裝</mark>

1. 打開終端機或cmd

2. 輸入以下命令，然後按Enter鍵執行：

      `pip install pandas`

      這個命令會讓pip下載並安裝pandas的最新版本

3. pip會自動處理所有的依賴項，並將Pandas安裝到你的Python環境中

4. 一旦安裝完成，你就可以在Python程式中使用pandas這個模組
   
5. 可以在終端機輸入以下命令來檢查pandas是否安裝好：

      `python -c "import pandas as pd; print(pd.__version__)"`

      如果安裝成功，它應該會輸出pandas的版本編號


---
<mark>Pandas</mark>

- 一個強大的Python數據處理和分析庫，提供了易使用的數據結構和數據分析工具，廣泛用於機器學習、統計摘要、數據可視化等領域

- Pandas 的兩種主要數據結構
    - Series 是一維數據結構，類似於一維陣列，但每個元素都有一個標籤，稱為索引
  
    - DataFrame 是二維數據結構，類似於表格或試算表，由多個 Series 組成

- 可讀取和寫入 CSV、Excel、SQL 數據庫、JSON 等等檔案格式

- 能進行處理缺失/重複數據、數據篩選、數據轉換等操作


In [None]:
# 也可以只在此ipynb安裝特定套件

## !pip install pandas

In [None]:
'''
!pip 和!pip3 是在命令列或終端機的指令，用於執行Python套件管理工具 pip 的操作。主要區別是它們使用的Python版本。

     !pip: 這是預設使用的命令，通常與系統預設的 Python 2 版本關聯。 如果你在終端機中使用 !pip install package_name，就是使用 Python 2.x 的 pip 來安裝套件。

     !pip3: 這是針對 Python 3.x 版本的 pip 指令。 如果你在終端機中使用 !pip3 install package_name，就是使用 Python 3.x 的 pip 來安裝套件。

 使用哪個指令取決於你的系統和 Python 環境。
 如果你的系統預設的是 Python 3.x，可能就不需使用 !pip3，你可以直接使用 !pip。但如果你同時安裝了多個 Python 版本，或者你明確希望使用 Python 3.x 版本，那麼最好使用 !pip3 來確保你操作的是正確的 Python 3.x 環境。
'''

In [None]:
# 通常在程式碼的開頭會先導入"所有"需要的模組
# 這樣才能使用模組裡的函數（後續不用一直import）

import pandas as pd

**創造一個 Series (s)**

- Pandas中的 Series 就像試算表的一直欄/一橫列
- 是一維數組，可以存任何類型資料

In [None]:
a = ["KFC", "麥當勞", "頂呱呱"]

myvar = pd.Series(a)

myvar

0    KFC
1    麥當勞
2    頂呱呱
dtype: object


In [None]:
# 如果沒有特別指定，則 Series 中的值會使用索引號當作標籤
# 第一個值的索引為 0，第二個值的索引為 1，依此類推
# 可使用索引標籤來取得 Series 中的值

a = ["KFC", "麥當勞", "頂呱呱"]

myvar = pd.Series(a)

myvar[2]

'頂呱呱'

In [None]:
# 在 pd.Series() 使用 `index` 參數，可以自己命名索引標籤

a = ["KFC", "麥當勞", "頂呱呱"]

myvar = pd.Series(a, index = ["x", "y", "z"])

print(myvar)

x    KFC
y    麥當勞
z    頂呱呱
dtype: object


In [None]:
# 建立自己的索引標籤後，可以透過標籤來存取項目

a = ["KFC", "麥當勞", "頂呱呱"]
myvar = pd.Series(a, index = ["x", "y", "z"])

myvar["z"]

'頂呱呱'

**創造一個 DataFrame (df)**
- Pandas 的資料集是多維的表，稱為 DataFrame
- Series 就像一直欄/橫列，DataFrame 就像一整個試算表

In [None]:
data = {
  'shop': ["KFC", "麥當勞", "頂呱呱"],
  'count': [3, 5, 1]
}

# load data into a DataFrame object
df = pd.DataFrame(data)

df

Unnamed: 0,shop,count
0,KFC,3
1,麥當勞,5
2,頂呱呱,1


In [None]:
# 用pandas讀取csv檔案

data = pd.read_csv('./iris.csv')

In [None]:
# 顯示前幾行數據
data.head()

Unnamed: 0,Id,SepalLengthCm,SepalWidthCm,PetalLengthCm,PetalWidthCm,Species
0,1,5.1,3.5,1.4,0.2,Iris-setosa
1,2,4.9,3.0,1.4,0.2,Iris-setosa
2,3,4.7,3.2,1.3,0.2,Iris-setosa
3,4,4.6,3.1,1.5,0.2,Iris-setosa
4,5,5.0,3.6,1.4,0.2,Iris-setosa


In [None]:
# 獲取數據的統計摘要
data.describe()

Unnamed: 0,Id,SepalLengthCm,SepalWidthCm,PetalLengthCm,PetalWidthCm
count,150.0,150.0,150.0,150.0,150.0
mean,75.5,5.843333,3.054,3.758667,1.198667
std,43.445368,0.828066,0.433594,1.76442,0.763161
min,1.0,4.3,2.0,1.0,0.1
25%,38.25,5.1,2.8,1.6,0.3
50%,75.5,5.8,3.0,4.35,1.3
75%,112.75,6.4,3.3,5.1,1.8
max,150.0,7.9,4.4,6.9,2.5


In [None]:
# 選擇特定列
## data['column_name']

data['SepalLengthCm']

0      5.1
1      4.9
2      4.7
3      4.6
4      5.0
      ... 
145    6.7
146    6.3
147    6.5
148    6.2
149    5.9
Name: SepalLengthCm, Length: 150, dtype: float64