# 🎯 การจัดการและเลือกข้อมูลใน DataFrame

**บทเรียนที่ 2.1c - DataFrame Selection และ Manipulation**

---

## 🎯 วัตถุประสงค์

หลังจากเรียนบทนี้แล้ว ผู้เรียนจะสามารถ:
- เลือกข้อมูลจาก DataFrame ด้วยวิธีต่างๆ
- กรองข้อมูลตามเงื่อนไข
- เรียงลำดับและจัดกลุ่มข้อมูล
- ปรับแต่งและแก้ไขข้อมูลใน DataFrame

In [None]:
# นำเข้า libraries ที่จำเป็น
import pandas as pd
import numpy as np

print("🎯 การจัดการและเลือกข้อมูลใน DataFrame")
print("=" * 50)

## 📊 เตรียมข้อมูลตัวอย่าง

In [None]:
# สร้างข้อมูล Lending Club จำลอง
np.random.seed(42)

lending_data = {
    'loan_id': [f'LC{i:04d}' for i in range(1, 16)],
    'member_id': [f'M{i:06d}' for i in range(100001, 100016)],
    'loan_amount': [150000, 200000, 300000, 250000, 180000, 350000, 120000, 
                   280000, 160000, 400000, 220000, 190000, 320000, 170000, 240000],
    'funded_amount': [150000, 195000, 295000, 240000, 180000, 340000, 115000,
                     275000, 155000, 390000, 210000, 185000, 310000, 165000, 235000],
    'term': [36, 60, 36, 60, 36, 60, 36, 60, 36, 60, 36, 60, 36, 60, 36],
    'interest_rate': [8.5, 12.3, 15.1, 9.8, 11.2, 16.8, 7.2, 13.5, 10.1, 
                     18.2, 14.3, 8.9, 17.1, 9.5, 12.8],
    'grade': ['A', 'B', 'D', 'A', 'B', 'E', 'A', 'C', 'B', 'E', 'D', 'A', 'E', 'A', 'C'],
    'loan_status': ['Current', 'Fully Paid', 'Charged Off', 'Current', 'Late (31-120 days)',
                   'Fully Paid', 'Current', 'Charged Off', 'Current', 'Fully Paid',
                   'Late (16-30 days)', 'Current', 'Charged Off', 'Current', 'Fully Paid'],
    'purpose': ['debt_consolidation', 'credit_card', 'home_improvement', 'car', 'medical',
               'debt_consolidation', 'vacation', 'home_improvement', 'credit_card', 'major_purchase',
               'car', 'debt_consolidation', 'home_improvement', 'credit_card', 'car']
}

df = pd.DataFrame(lending_data)

print("📊 ข้อมูล Lending Club ตัวอย่าง:")
print(f"ขนาด: {df.shape}")
print(df.head())

## 🔍 การเลือกข้อมูลพื้นฐาน

In [None]:
print("🔍 การเลือกข้อมูลพื้นฐาน")
print("=" * 35)

# 1. เลือกคอลัมน์เดียว
print("1️⃣ เลือกคอลัมน์ 'loan_amount':")
loan_amounts = df['loan_amount']
print(f"ประเภท: {type(loan_amounts)}")
print(f"5 ค่าแรก: {loan_amounts.head().tolist()}")

# 2. เลือกหลายคอลัมน์
print("\n2️⃣ เลือกหลายคอลัมน์:")
basic_info = df[['loan_id', 'loan_amount', 'grade', 'loan_status']]
print(f"ขนาด: {basic_info.shape}")
print(basic_info.head(3))

## 📚 สรุป

### ✅ สิ่งที่เราได้เรียนรู้:

1. **การเลือกข้อมูล**:
   - เลือกคอลัมน์เดียวและหลายคอลัมน์
   - การใช้ .iloc และ .loc

2. **การกรองข้อมูล**:
   - เงื่อนไขเดียวและหลายเงื่อนไข
   - การใช้ .isin() และ .str.contains()

### 🚀 บทถัดไป:
เราจะเรียนรู้การ **ทำ Data Profiling** - การตรวจสอบคุณภาพข้อมูล

---
*💡 เคล็ดลับ: การเลือกข้อมูลที่ถูกต้องเป็นพื้นฐานของการวิเคราะห์ที่มีประสิทธิภาพ!*