# 📊 Descriptive Analytics - "เกิดอะไรขึ้นแล้ว?"

**บทเรียนที่ 1.2 - การวิเคราะห์เชิงพรรณนา**

---

## 🎯 วัตถุประสงค์

หลังจากเรียนบทนี้แล้ว ผู้เรียนจะสามารถ:
- เข้าใจความหมายของ Descriptive Analytics
- ใช้ Python ในการคำนวณสถิติเบื้องต้น
- สร้างสรุปข้อมูลแบบง่ายๆ
- ประยุกต์ใช้กับข้อมูล Lending Club

## 📖 ความหมาย

**Descriptive Analytics** คือ การวิเคราะห์ข้อมูลเพื่อ **อธิบายสิ่งที่เกิดขึ้นแล้ว**

### 🎯 จุดประสงค์
- เข้าใจสถานการณ์ปัจจุบัน
- สรุปแนวโน้มที่เกิดขึ้น
- เตรียมข้อมูลสำหรับการวิเคราะห์ขั้นสูง

### ❓ คำถามที่ตอบได้
- ยอดขายเดือนที่แล้วเท่าไหร่?
- ลูกค้ามีอายุเฉลี่ยเท่าไหร่?
- สินค้าไหนขายดีที่สุด?
- เว็บไซต์มีผู้เข้าชมกี่คน?

## 🛠️ เครื่องมือพื้นฐาน

### 📊 สถิติเบื้องต้น
1. **ค่าเฉลี่ย (Mean)** - ค่ากลางของข้อมูล
2. **ค่าสูงสุด/ต่ำสุด (Max/Min)** - ขอบเขตของข้อมูล
3. **ผลรวม (Sum)** - ยอดรวมทั้งหมด
4. **จำนวน (Count)** - จำนวนรายการ
5. **เปอร์เซ็นต์** - สัดส่วนต่างๆ

In [None]:
# ตัวอย่างข้อมูลเงินกู้ของ Lending Club (จำลอง)
loan_amounts = [250000, 150000, 300000, 100000, 200000, 350000, 180000, 120000, 280000, 160000]
print("🏦 ข้อมูลจำนวนเงินกู้ 10 รายการ:")
print(f"📋 ข้อมูล: {loan_amounts}")
print()

# คำนวณสถิติพื้นฐาน
print("📊 การวิเคราะห์เชิงพรรณนา (Descriptive Analytics):")
print("="*50)

# 1. ค่าเฉลี่ย
mean_amount = sum(loan_amounts) / len(loan_amounts)
print(f"💰 จำนวนเงินกู้เฉลี่ย: {mean_amount:,.0f} บาท")

# 2. ค่าสูงสุดและต่ำสุด
max_amount = max(loan_amounts)
min_amount = min(loan_amounts)
print(f"🏆 จำนวนเงินกู้สูงสุด: {max_amount:,.0f} บาท")
print(f"📉 จำนวนเงินกู้ต่ำสุด: {min_amount:,.0f} บาท")

# 3. ผลรวมและจำนวน
total_amount = sum(loan_amounts)
count = len(loan_amounts)
print(f"📈 ยอดเงินกู้รวม: {total_amount:,.0f} บาท")
print(f"🔢 จำนวนรายการ: {count} รายการ")

# 4. ช่วงของข้อมูล (Range)
data_range = max_amount - min_amount
print(f"📏 ช่วงของข้อมูล: {data_range:,.0f} บาท")

## 📈 การจัดกลุ่มข้อมูล

เป็นการแบ่งข้อมูลออกเป็นกลุ่มต่างๆ เพื่อดูรูปแบบและสัดส่วน

In [None]:
# ตัวอย่างการจัดกลุ่มเงินกู้ตามจำนวน

print("📊 การจัดกลุ่มเงินกู้ตามจำนวน:")
print("="*40)

# กำหนดช่วงการจัดกลุ่ม
ranges = {
    'น้อยกว่า 150,000': 0,
    '150,000 - 250,000': 0,
    '250,000 - 350,000': 0,
    'มากกว่า 350,000': 0
}

# จัดกลุ่มข้อมูล
for amount in loan_amounts:
    if amount < 150000:
        ranges['น้อยกว่า 150,000'] += 1
    elif amount <= 250000:
        ranges['150,000 - 250,000'] += 1
    elif amount <= 350000:
        ranges['250,000 - 350,000'] += 1
    else:
        ranges['มากกว่า 350,000'] += 1

# แสดงผลการจัดกลุ่ม
total_loans = len(loan_amounts)
for range_name, count in ranges.items():
    percentage = (count / total_loans) * 100
    bar = '█' * count  # สร้าง bar chart ง่ายๆ
    print(f"{range_name:>20}: {count:>2} รายการ ({percentage:>5.1f}%) {bar}")

## 🏦 ตัวอย่างจาก Lending Club จริง

มาดูตัวอย่างการใช้ Descriptive Analytics กับข้อมูลที่ซับซ้อนขึ้น

In [None]:
# ข้อมูลลูกค้า Lending Club ที่สมบูรณ์ขึ้น
customers = {
    'loan_amount': [25000, 15000, 35000, 10000, 20000, 30000, 18000, 22000, 28000, 12000],
    'interest_rate': [10.5, 13.2, 8.9, 15.1, 11.8, 9.2, 12.5, 10.1, 9.8, 14.3],
    'annual_income': [60000, 45000, 80000, 35000, 55000, 70000, 48000, 62000, 75000, 40000],
    'loan_grade': ['B', 'C', 'A', 'D', 'B', 'A', 'C', 'B', 'A', 'D'],
    'employment_length': [5, 2, 8, 1, 3, 10, 2, 6, 12, 1]  # ปีของการทำงาน
}

print("🏦 การวิเคราะห์ข้อมูลลูกค้า Lending Club")
print("="*50)

# 1. วิเคราะห์จำนวนเงินกู้
print("💰 สถิติจำนวนเงินกู้:")
avg_loan = sum(customers['loan_amount']) / len(customers['loan_amount'])
print(f"   เฉลี่ย: {avg_loan:,.0f} บาท")
print(f"   สูงสุด: {max(customers['loan_amount']):,.0f} บาท")
print(f"   ต่ำสุด: {min(customers['loan_amount']):,.0f} บาท")

# 2. วิเคราะห์อัตราดอกเบี้ย
print("\n📈 สถิติอัตราดอกเบี้ย:")
avg_rate = sum(customers['interest_rate']) / len(customers['interest_rate'])
print(f"   เฉลี่ย: {avg_rate:.1f}%")
print(f"   สูงสุด: {max(customers['interest_rate'])}%")
print(f"   ต่ำสุด: {min(customers['interest_rate'])}%")

# 3. วิเคราะห์รายได้
print("\n💼 สถิติรายได้ประจำปี:")
avg_income = sum(customers['annual_income']) / len(customers['annual_income'])
print(f"   เฉลี่ย: {avg_income:,.0f} บาท")
print(f"   สูงสุด: {max(customers['annual_income']):,.0f} บาท")
print(f"   ต่ำสุด: {min(customers['annual_income']):,.0f} บาท")

# 4. การแจกแจงเกรด
print("\n📊 การแจกแจงเกรดเงินกู้:")
grade_count = {}
for grade in customers['loan_grade']:
    grade_count[grade] = grade_count.get(grade, 0) + 1

total_customers = len(customers['loan_grade'])
for grade in sorted(grade_count.keys()):
    count = grade_count[grade]
    percentage = (count / total_customers) * 100
    print(f"   เกรด {grade}: {count} คน ({percentage:.1f}%)")

## 📱 Dashboard ง่ายๆ

การสร้าง Dashboard เบื้องต้นเพื่อแสดงข้อมูลสำคัญ

In [None]:
# สร้าง Dashboard สรุปประจำวัน

print("📱 LENDING CLUB DASHBOARD - สรุปประจำวัน")
print("="*60)
print("📅 วันที่: 15 มิถุนายน 2567")
print()

# ข้อมูลสำคัญ (KPIs)
total_applications = 85  # จำนวนใบสมัครทั้งหมด
approved_loans = 62      # จำนวนที่อนุมัติ
total_loan_value = 15750000  # มูลค่าเงินกู้รวม
avg_interest_rate = 11.2     # อัตราดอกเบี้ยเฉลี่ย

print("🎯 ตัวเลขสำคัญ (KPIs):")
approval_rate = (approved_loans / total_applications) * 100
avg_loan_size = total_loan_value / approved_loans

print(f"📝 ใบสมัครรวม: {total_applications:,} ใบ")
print(f"✅ อนุมัติแล้ว: {approved_loans:,} ใบ")
print(f"📊 อัตราการอนุมัติ: {approval_rate:.1f}%")
print(f"💰 มูลค่าเงินกู้รวม: {total_loan_value:,.0f} บาท")
print(f"📏 ขนาดเงินกู้เฉลี่ย: {avg_loan_size:,.0f} บาท")
print(f"📈 อัตราดอกเบี้ยเฉลี่ย: {avg_interest_rate}%")

# แสดงกราฟง่ายๆ
print("\n📊 การแจกแจงตามเกรด:")
grade_data = {'A': 15, 'B': 22, 'C': 18, 'D': 7}

for grade, count in grade_data.items():
    percentage = (count / approved_loans) * 100
    bar = '█' * (count // 2)  # แต่ละ █ แทน 2 รายการ
    print(f"เกรด {grade}: {count:>2} รายการ ({percentage:>5.1f}%) {bar}")

print("\n💡 ข้อสังเกต:")
print("   - เกรด B มีสัดส่วนสูงสุด (35.5%)")
print("   - อัตราการอนุมัติอยู่ในเกณฑ์ดี (72.9%)")
print("   - ขนาดเงินกู้เฉลี่ยสอดคล้องกับเป้าหมาย")

## 🎯 แบบฝึกหัด

### 💭 คำถามให้คิด:

1. **จากข้อมูลลูกค้า Lending Club ข้างต้น:**
   - ลูกค้าเกรดไหนได้อัตราดอกเบี้ยต่ำที่สุด?
   - มีความสัมพันธ์ระหว่างรายได้กับจำนวนเงินกู้หรือไม่?

2. **ถ้าคุณเป็นผู้จัดการ Lending Club จะสนใจข้อมูลอะไรเพิ่มเติม?**

3. **Dashboard ข้างต้นขาดข้อมูลอะไรที่สำคัญ?**

In [None]:
# 🏃‍♂️ Mini Exercise: วิเคราะห์ข้อมูลการศึกษา

# ข้อมูลระดับการศึกษาของลูกค้า (จำลอง)
education_levels = ['ปริญญาตรี', 'ปริญญาโท', 'มัธยมศึกษา', 'ปริญญาตรี', 'ปริญญาเอก', 
                   'ปริญญาตรี', 'มัธยมศึกษา', 'ปริญญาโท', 'ปริญญาตรี', 'ปริญญาตรี']

corresponding_incomes = [55000, 75000, 35000, 60000, 95000, 
                        58000, 32000, 78000, 62000, 59000]

print("🎓 แบบฝึกหัด: วิเคราะห์ข้อมูลการศึกษาและรายได้")
print("="*55)

# TODO: เขียนโค้ดเพื่อหา
# 1. การแจกแจงตามระดับการศึกษา
# 2. รายได้เฉลี่ยของแต่ละระดับการศึกษา
# 3. ระดับการศึกษาไหนมีรายได้สูงสุด?

print("💭 ลองเขียนโค้ดวิเคราะห์ข้อมูลนี้ดูนะ!")
print("🎯 เป้าหมาย: หาความสัมพันธ์ระหว่างการศึกษาและรายได้")
print("💡 เคล็ดลับ: ใช้ dictionary เก็บข้อมูลแต่ละกลุ่ม")

## 📚 สรุป

### ✅ สิ่งที่เราได้เรียนรู้:

1. **Descriptive Analytics** = การอธิบายสิ่งที่เกิดขึ้นแล้ว

2. **เครื่องมือพื้นฐาน**:
   - ค่าเฉลี่ย, สูงสุด, ต่ำสุด
   - การจัดกลุ่มข้อมูล
   - การคำนวณเปอร์เซ็นต์

3. **การประยุกต์ใช้**:
   - สร้าง Dashboard
   - รายงานสรุป
   - การติดตาม KPIs

4. **ตัวอย่างจาก Lending Club**:
   - วิเคราะห์ข้อมูลลูกค้า
   - การแจกแจงเกรดเงินกู้
   - สถิติการอนุมัติ

### 🚀 บทถัดไป:
เราจะเรียนรู้ **Diagnostic Analytics** - การหาสาเหตุว่า "ทำไมถึงเกิดขึ้น?"

---
*💡 เคล็ดลับ: Descriptive Analytics เป็นจุดเริ่มต้นของการวิเคราะห์ทุกครั้ง!*