## 什麼是 Pandas？
概念類似試算表的資料分析套件

## Series(單維度的資料)
就像是一個列表、或是試算表中直向的欄位資料

In [1]:
# 載入 Pandas 模組
import pandas as pd

# 建立 Series
data=pd.Series([20,10,15])

# 基本 Series 操作
print("Max:",data.max())
print("Median:",data.median())
# data = data*2
# print(data)

data=data==20
print(data)

Max: 20
Median: 15.0
0     True
1    False
2    False
dtype: bool


### 資料索引

In [2]:
# 載入 Pandas 模組
import pandas as pd

# 資料索引(內建索引)
data=pd.Series([ 5, 4, -2, 3, 7])
# print(data)

# 資料索引(自訂索引)
data=pd.Series([ 5, 4, -2, 3, 7], index=["a","b","c","d","e"])
print(data)

a    5
b    4
c   -2
d    3
e    7
dtype: int64


### 觀察資料 

In [3]:
data=pd.Series([ 5, 4, -2, 3, 7], index=["a","b","c","d","e"])

# 觀察資料
print("資料型態",data.dtype)
print("資料數量",data.size)
print("資料索引",data.index)

資料型態 int64
資料數量 5
資料索引 Index(['a', 'b', 'c', 'd', 'e'], dtype='object')


### 取得資料

In [4]:
data=pd.Series([ 5, 4, -2, 3, 7], index=["a","b","c","d","e"])

# 根據順序取值取得資料
print(data[2], data[0])

# 根據索引取值取得資料
print(data["e"], data["b"])

-2 5
7 4


### 數學數字運算

In [5]:
data=pd.Series([ 5, 4, -2, 3, 7], index=["a","b","c","d","e"])

# 數學運算：基本、統計、順序
print("最大值",data.max()) 
print("總和",data.sum())
print("標準差",data.std())
print("中位數",data.median()) 
print("最大的三個數",data.nlargest(3))

最大值 7
總和 17
標準差 3.361547262794322
中位數 4.0
最大的三個數 e    7
a    5
b    4
dtype: int64


### 字串運算 

In [6]:
data=pd.Series(["您好","Python","Pandas"])

# 字串運算：基本、串接、搜尋、取代
print(data.str.lower()) # 全部變小寫(中文不受影響)
print(data.str.len())   # 算出每個字串的長度
print(data.str.cat(sep="-")) # 用"-"串在一起
print(data.str.contains("P")) # 判斷每個字串中是否包含"P"
print(data.str.contains("好")) 
print(data.str.replace("您好","Hello"))

0        您好
1    python
2    pandas
dtype: object
0    2
1    6
2    6
dtype: int64
您好-Python-Pandas
0    False
1     True
2     True
dtype: bool
0     True
1    False
2    False
dtype: bool
0     Hello
1    Python
2    Pandas
dtype: object


## DataFrame(雙維度的資料)
就像是一個表格，有欄和列的概念

In [7]:
# 建立 DataFrame
data=pd.DataFrame({
    "name":["Amy","John","Bob"],
    "salary":[30000,50000,40000]
})

# 基本 DataFrame 操作
# print(data)

# 取得特定的欄位
# print(data["name"])
# print(data["salary"])

# 取得特定的列
print(data.iloc[0])   # 印出第一列
print(data.iloc[1])   # 印出第二列

name        Amy
salary    30000
Name: 0, dtype: object
name       John
salary    50000
Name: 1, dtype: object
