## 建立 DataFrame
import pandas as pd

#### 從字典建立 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'Paris', 'London', 'Tokyo']}
df = pd.DataFrame(data)

#### 從 CSV 檔案建立 DataFrame
df = pd.read_csv('filename.csv')

#### 從 Excel 檔案建立 DataFrame
df = pd.read_excel('filename.xlsx')
##查看 DataFrame 資訊

## 查看 DataFrame 資訊

#### 查看 DataFrame 前 n 筆資料
df.head(n)

#### 查看 DataFrame 後 n 筆資料
df.tail(n)

#### 查看 DataFrame 摘要資訊
df.info()

#### 查看 DataFrame 統計資訊
df.describe()

#### 轉換欄位內容為字串
df['Age'] = df['Age'].astype(str)

#### 轉換欄位內容為字串並指定小數點位數
df['Salary'] = df['Salary'].apply(lambda x: '{:.2f}'.format(x))

#### 轉換欄位內容為數值
df['Age'] = pd.to_numeric(df['Age'], errors='coerce')

#### 轉換欄位內容為布林值
df['IsMale'] = df['Gender'].apply(lambda x: True if x == 'Male' else False)

#### 將欄位內容拆分成多個欄位
df[['First Name', 'Last Name']] = df['Name'].str.split(expand=True)

#### 將多個欄位內容合併成一個欄位
df['Full Name'] = df[['First Name', 'Last Name']].apply(lambda x: ' '.join(x), axis=1)

#### 將欄位內容進行運算
df['Total'] = df['Score1'] + df['Score2'] + df['Score3']

#### 將欄位內容按條件分組
df['Age Group'] = pd.cut(df['Age'], bins=[0, 18, 25, 35, 50], labels=['Under 18', '18-25', '26-35', 'Over 35'])

#### 將欄位內容進行替換
df['Gender'] = df['Gender'].replace({'Male': 'M', 'Female': 'F'})


## 選取、篩選資料

#### 選取單一欄位
df['Name']

#### 選取多個欄位
df[['Name', 'Age']]

#### 按欄位條件篩選資料
df[df['Age'] > 30]

#### 按多個欄位條件篩選資料
df[(df['Age'] > 30) & (df['City'] == 'Paris')]

#### 按索引篩選資料
df.loc[2]

#### 按多個索引篩選資料
df.loc[[1, 3]]

#### 按列篩選資料
df.iloc[1]

#### 按多列篩選資料
df.iloc[1:3]

#### 選取單一欄位
df['Age']

#### 選取多個欄位
df[['Age', 'Gender']]

#### 選取單一列
df.loc[0]

#### 選取多個列
df.loc[[0, 1, 2]]

#### 使用條件選取列
df.loc[df['Age'] > 25]

#### 選取特定的資料
df.loc[0, 'Age']

#### 選取多個特定的資料
df.loc[[0, 1], ['Age', 'Gender']]

#### 使用條件選取特定的資料
df.loc[df['Age'] > 25, 'Gender']

#### 使用 iloc 方法選取單一資料
df.iloc[0, 1]

#### 使用 iloc 方法選取多個資料
df.iloc[[0, 1], [0, 2]]

#### 使用 iloc 方法選取特定的資料
df.iloc[df['Age'] > 25, 1]

#### 使用 query 方法進行條件選取
df.query('Age > 25 and Gender == "Male"')

#### 使用 isin 方法進行多重條件篩選
df[df['Gender'].isin(['Male', 'Female']) & (df['Age'] > 25)]

#### 使用 between 方法進行範圍篩選
df[df['Age'].between(18, 25)]


## 排序資料

#### 按欄位排序資料
df.sort_values('Age')

#### 按欄位倒序排序資料
df.sort_values('Age', ascending=False)

#### 根據 Age 欄位升序排序
df.sort_values('Age', ascending=True)

#### 根據 Age 欄位降序排序
df.sort_values('Age', ascending=False)

#### 先根據 Gender 欄位排序，再根據 Age 欄位排序
df.sort_values(['Gender', 'Age'])

#### 先根據 Gender 欄位降序排序，再根據 Age 欄位升序排序
df.sort_values(['Gender', 'Age'], ascending=[False, True])

#### 在排序時保留原索引
df.sort_values('Age', ascending=False, ignore_index=True)

## 處理缺失值

#### 檢查 DataFrame 中是否有缺失值
df.isna().sum()

#### 刪除含有缺失值的列
df.dropna()

#### 將缺失值填充為指定值
df.fillna(0)

## 資料轉換

#### 新增一個欄位
df['Gender'] = ['Female', 'Male', 'Male', 'Male']

#### 將欄位內容轉換為大寫
df['City'] = df['City'].str.upper()

#### 將欄位內容轉換為小寫
df['Name'] = df['Name'].str.lower()

#### 將欄位內容轉換為日期格式
df['Date'] = pd.to_datetime(df['Date'])
