# Pandas Level 3: Manipulation

หลังจากทำความสะอาดข้อมูลแล้ว ขั้นตอนต่อไปคือการ "เล่น" กับข้อมูล (Manipulation)
ใน Level 3 นี้ เราจะเรียนรู้:
1. **Selection**: การเลือกข้อมูลเฉพาะส่วน (`loc`, `iloc`)
2. **Filtering**: การกรองข้อมูลตามเงื่อนไข
3. **Adding/Removing Columns**: การเพิ่มและลบคอลัมน์
4. **Applying Functions**: การใช้ฟังก์ชันกับข้อมูล (`apply`, `map`)
5. **Sorting**: การเรียงลำดับ

In [None]:
import pandas as pd
import numpy as np

<a id='loading'></a>
## 1. Load Data

ใช้ข้อมูลนักเรียนจาก Level 1 มาเป็นตัวอย่าง

In [None]:
df = pd.read_csv('data/students.csv')
display(df.head())

<a id='selection'></a>
## 2. Selection (loc & iloc)

การเลือกข้อมูลที่เราต้องการ:
- `loc`: เลือกด้วย **Label** (ชื่อแถว/ชื่อคอลัมน์)
- `iloc`: เลือกด้วย **Index** (ตัวเลขตำแหน่ง 0, 1, 2...)

In [None]:
# 2.1 loc (Label-based)
# เลือกแถวที่ 0-2 และเอาเฉพาะคอลัมน์ Name กับ Math_Score
print("--- loc (Rows 0-2, Name & Math) ---")
display(df.loc[0:2, ['Name', 'Math_Score']])

# 2.2 iloc (Index-based)
# เลือกแถวที่ 0-2 (ไม่รวม 3) และคอลัมน์ที่ 1-3 (ไม่รวม 4)
print("\n--- iloc (Rows 0-2, Cols 1-3) ---")
display(df.iloc[0:3, 1:4])

<a id='filtering'></a>
## 3. Filtering (การกรองข้อมูล)

เลือกเฉพาะแถวที่ตรงตามเงื่อนไขที่กำหนด

In [None]:
# 3.1 เงื่อนไขเดียว: หาคนที่ได้คะแนน Math > 80
math_gt_80 = df[df['Math_Score'] > 80]
print("--- Math Score > 80 ---")
display(math_gt_80)

# 3.2 หลายเงื่อนไข: Math > 80 AND Science > 80
# ต้องใช้วงเล็บ () ครอบแต่ละเงื่อนไข และใช้ & แทน and, | แทน or
top_students = df[(df['Math_Score'] > 80) & (df['Science_Score'] > 80)]
print("\n--- Top Students (Math > 80 & Science > 80) ---")
display(top_students)

<a id='columns'></a>
## 4. Adds & Removes Columns

การสร้างคอลัมน์ใหม่จากข้อมูลเดิม หรือลบคอลัมน์ที่ไม่ใช้ออก

In [None]:
# 4.1 เพิ่มคอลัมน์ Total_Score (รวมคะแนน)
df['Total_Score'] = df['Math_Score'] + df['English_Score'] + df['Science_Score']

# 4.2 เพิ่มคอลัมน์ Average_Score (คะแนนเฉลี่ย)
df['Average_Score'] = df['Total_Score'] / 3

print("--- After Adding Columns ---")
display(df.head())

# 4.3 ลบคอลัมน์ Student_ID (axis=1 หมายถึงคอลัมน์)
df_dropped = df.drop('Student_ID', axis=1)
print("\n--- After Dropping Student_ID ---")
display(df_dropped.head())

<a id='apply'></a>
## 5. Applying Functions

การใช้ฟังก์ชันกับข้อมูลใน DataFrame มีประโยชน์มากเมื่อเราต้องทำ Logic ซับซ้อน

In [None]:
# ฟังก์ชันตัดเกรดอย่างง่าย
def grade_score(score):
    if score >= 80:
        return 'A'
    elif score >= 70:
        return 'B'
    elif score >= 60:
        return 'C'
    else:
        return 'D'

# ใช้ .apply() เพื่อนำฟังก์ชันไปใช้กับทั้งคอลัมน์
df['Math_Grade'] = df['Math_Score'].apply(grade_score)
print("--- After Apply Grade Function ---")
display(df[['Name', 'Math_Score', 'Math_Grade']].head())

<a id='sorting'></a>
## 6. Sorting

เรียงลำดับข้อมูล

In [None]:
# เรียงตาม Total_Score จากมากไปน้อย (ascending=False)
sorted_df = df.sort_values(by='Total_Score', ascending=False)
print("--- Sorted by Total Score (Top 5) ---")
display(sorted_df.head())