# บทที่ 1: พื้นฐาน Python สำหรับงาน Data Science (Python Foundations)
---
**บริษัท:** บริษัท แลนด์ แอนด์ เฮ้าส์ จำกัด (มหาชน) | Land & Houses  
**ผู้บรรยาย:** ผู้ช่วยศาสตราจารย์ ดร.วสิศ ลิ้มประเสริฐ  
**วันที่:** 11 พฤศจิกายน 2025




## Executive Summary

บทนี้ปูพื้นฐานการใช้งาน Python สำหรับงาน Data Science โดยเริ่มจากการเตรียมเครื่องมือและการตั้งค่า เช่น Anaconda, VS Code และการใช้งาน Jupyter Notebook ไปจนถึงแนวคิดการทำงานของ Data Science Workflow (Load → Clean → Transform → Analyze → Visualize → Automate) 

เนื้อหาครอบคลุมตัวแปรและประเภทข้อมูลพื้นฐาน (int, float, str, bool), โครงสร้างข้อมูลสำคัญ (list, dict, tuple, set), คำสั่งควบคุมและการวนซ้ำ (if / for / nested logic), การสร้างฟังก์ชันเพื่อใช้งานซ้ำ และการประยุกต์ใช้ฟังก์ชันและเมธอดที่มีใน Python เพื่อเทียบเท่าฟังก์ชันใน Excel นอกจากนี้ยังสอนแนวทางการจัดการข้อผิดพลาด (try / except) และมี Workshop ให้ฝึกปฏิบัติจริงเพื่อให้ผู้เรียนสามารถนำไปใช้ในงานวิเคราะห์ข้อมูลพื้นฐานได้ทันที


## Key Takeaways

- เข้าใจประเภทข้อมูลพื้นฐานและโครงสร้างข้อมูล (Data Types & Data Structures)
- เขียนเงื่อนไข, วนซ้ำ และฟังก์ชันเพื่อสร้าง Logic ที่นำกลับมาใช้ซ้ำได้
- ใช้ Python แทนสูตร Excel เบื้องต้นและจัดการข้อผิดพลาดเพื่อความทนทานของสคริปต์



## Section 1.1 — การเตรียมความพร้อมและเครื่องมือ (Setup & Tools)

สรุป: แนะนำเครื่องมือพื้นฐาน (Anaconda, VS Code, Jupyter) และ Data Science Workflow: Load → Clean → Transform → Analyze → Visualize → Automate

### Demo
- การติดตั้ง Anaconda, VS Code (แนะนำ extension: Python, Jupyter)
- การใช้งาน Jupyter Notebook: รัน cell, ประเภท Markdown vs Code

---

## Section 1.2 — การเขียนโปรแกรม Python เบื้องต้น (Python Basics)

### 1.2.1 ตัวแปรและประเภทข้อมูล (Variables & Data Types)
สรุปสั้น: แนะนำ int, float, str, bool และตัวอย่างจาก Case Study


In [1]:
# ตัวอย่างตัวแปร (Contextual)
customer_name = "Mr. A"       # str
account_no = "1234567890"    # str (ถึงจะเป็นตัวเลข แต่เราไม่นำไปคำนวณ)
principal = 5000000.0         # float
dpd_days = 35                 # int
is_overdue = True             # bool
loan_type = 'L'               # str


### 1.2.2 โครงสร้างข้อมูลพื้นฐาน (Data Structures)
สรุปสั้น: list, dict, tuple, set — วิธีเข้าถึงและแก้ไขข้อมูล


In [2]:
# รายการ DPD และตัวอย่างการใช้งาน list
dpd_list = [0, 15, 92]
# Access และ append
second_dpd = dpd_list[1]  # index เริ่มที่ 0
dpd_list.append(3)

# ตัวอย่าง dict (customer profile)
customer_profile = {
    'cif': 12345,
    'name': 'Mr. A',
    'dpd': 15,
    'fprodt': 'PP'
}

# ตัวอย่างการเข้าถึงและแก้ไขค่าใน dict
dpd_value = customer_profile['dpd']
customer_profile['dpd'] = 20
customer_profile['principal'] = 5000000.0


In [3]:
print(customer_profile)

{'cif': 12345, 'name': 'Mr. A', 'dpd': 20, 'fprodt': 'PP', 'principal': 5000000.0}


### Workshop 1.1 (Data Structures)
สร้าง List ของยอดหนี้ และ Dict ข้อมูลลูกค้า 1 ราย

**โจทย์:**
1. สร้าง list ของยอดหนี้ `[100000, 250000, 50000]` และหาผลรวม sum()
2. สร้าง dict ข้อมูลลูกค้า (keys: FCUSNO, FPRINCAM, FDPDUE01)

---

In [4]:
def sum_debts(debt_list):
    """คืนผลรวมของยอดหนี้ใน list"""
    return sum(debt_list)

def create_customer_record(cif, principal, dpd):
    """สร้าง dict ที่แทนข้อมูลลูกค้า 1 ราย"""
    return {'FCUSNO': cif, 'FPRINCAM': principal, 'FDPDUE01': dpd}

# ตัวอย่างการเรียกใช้
_debts = [100000, 250000, 50000]
_total = sum_debts(_debts)
_customer = create_customer_record(12345, 500000.0, 30)

In [5]:
print(_total, _customer)

400000 {'FCUSNO': 12345, 'FPRINCAM': 500000.0, 'FDPDUE01': 30}


## Section 1.3 — คำสั่งควบคุมและฟังก์ชัน (Control Flow & Functions)

### 1.3.1 คำสั่งควบคุม (if / for)
สรุป: การเขียนเงื่อนไขเพื่อจัดกลุ่มลูกหนี้ และการวนซ้ำเพื่อประมวลผลลูกค้าทีละคน


In [6]:
def classify_stage_simple(dpd):
    """Classify DPD into stages (simple rules). Returns a string stage."""
    if dpd > 90:
        return "3. NPL"
    elif dpd > 30:
        return "2. Under-performing"
    else:
        return "1. Performing"

# ตัวอย่าง nested if
principal = 6000000
stage_label = classify_stage_simple(15)
if stage_label == "1. Performing":
    if principal > 5000000:
        high_value = True
    else:
        high_value = False
else:
    high_value = False

stage_label, high_value


('1. Performing', True)

In [7]:
# ตัวอย่างการวนซ้ำผ่านรายการลูกค้า (list of dicts)
customer_list = [
    {'cif': 12345, 'name': 'Mr. A', 'dpd': 15},
    {'cif': 12346, 'name': 'Ms. B', 'dpd': 91},
    {'cif': 12347, 'name': 'Mr. C', 'dpd': 0}
]

def count_npl(customers):
    """Return number of customers with dpd > 90"""
    npl_count = 0
    for customer in customers:
        if customer.get('dpd', 0) > 90:
            # เพิ่มตัวนับถ้าเป็น NPL
            npl_count += 1
    return npl_count

_npl_count = count_npl(customer_list)
_npl_count


1

### 1.3.2 ฟังก์ชัน (Functions)
สรุป: การสร้างฟังก์ชันที่นำกลับมาใช้ได้ เช่น การคำนวณดอกเบี้ย


In [8]:
def calculate_interest(principal, rate_percent):
    """คำนวณดอกเบี้ยอย่างง่าย (principal * rate_percent/100)"""
    return principal * (rate_percent / 100)

# ตัวอย่างการใช้งาน
loan1_interest = calculate_interest(5000000, 5)
loan1_interest


250000.0

### Workshop 1.2 (Function)
**โจทย์:** สร้างฟังก์ชัน `classify_stage(dpd_days)` ที่ return stage และนำไปใช้กับ list of dicts

---

In [9]:
def classify_stage(dpd_days):
    """Return stage string based on dpd_days"""
    if dpd_days > 90:
        return "3. NPL"
    elif dpd_days > 30:
        return "2. Under-performing"
    else:
        return "1. Performing"

def apply_classification(customers):
    """เพิ่ม field 'stage' ให้ลูกค้าแต่ละรายใน list ของ dicts"""
    for customer in customers:
        customer['stage'] = classify_stage(customer.get('dpd', 0))
    return customers

# ตัวอย่างนำไปใช้
_customers = [
    {'cif': 12345, 'name': 'Mr. A', 'dpd': 15},
    {'cif': 12346, 'name': 'Ms. B', 'dpd': 91},
    {'cif': 12347, 'name': 'Mr. C', 'dpd': 0}
]
_apply = apply_classification(_customers)
_apply


[{'cif': 12345, 'name': 'Mr. A', 'dpd': 15, 'stage': '1. Performing'},
 {'cif': 12346, 'name': 'Ms. B', 'dpd': 91, 'stage': '3. NPL'},
 {'cif': 12347, 'name': 'Mr. C', 'dpd': 0, 'stage': '1. Performing'}]

## Section 1.4 — การประยุกต์ Python กับงาน (เทียบเคียง Excel)

### 1.4.1 สูตรคำนวณและข้อความ
สรุป: การใช้ฟังก์ชัน built-in เช่น sum, max, min, len, round และการจัดการข้อความด้วย slicing และ methods


In [10]:
# Math examples (SUM, MAX, MIN, LEN)
my_list = [10, 20, 30, 40]

total = sum(my_list)
maximum = max(my_list)
minimum = min(my_list)
count = len(my_list)
rounded = round(123.456, 2)

print(total, maximum, minimum, count, rounded)

100 40 10 4 123.46


In [11]:
# String slicing and methods

account_no = "1234567890"

branch_code = account_no[0:3]     # LEFT(3)
last_4_digits = account_no[-4:]   # RIGHT(4)
account_class = account_no[3:5]   # MID(4,2)
starts_with_123 = account_no.startswith("123")

print(branch_code)
print(last_4_digits)
print(account_class)
print(starts_with_123)

123
7890
45
True


In [12]:
# String slicing and methods

customer_name = "  Mr. A  "

trimmed = customer_name.strip()
lowered = customer_name.lower().strip()

print(trimmed)
print(lowered)

Mr. A
mr. a


### 1.4.2 การจัดการ Error (Error Handling)
สรุป: ใช้ try...except เพื่อป้องกันโปรแกรมหยุดเมื่อเจอข้อมูลผิดพลาด


In [13]:
def safe_get_dpd(data):
    """พยายามอ่าน dpd จาก data; หากไม่สามารถแปลงเป็นตัวเลขได้ ให้คืนค่า 0"""
    try:
        dpd = data.get('dpd', 0)
        # หาก dpd อยู่ในรูปสตริงที่ไม่ใช่ตัวเลข จะเกิด TypeError/ValueError
        if isinstance(dpd, str):
            dpd = int(dpd)
        return dpd
    except (TypeError, ValueError):
        # กรณีข้อมูลไม่ถูกต้อง ให้ตั้งค่าเป็น 0
        return 0

def calculate_ratio(principal, installment):
    """คืนอัตราส่วน principal/installment หรือ None หากหารด้วยศูนย์"""
    try:
        return principal / installment
    except ZeroDivisionError:
        return None

# ตัวอย่างการใช้งาน
_safe = safe_get_dpd({'dpd': 'N/A'})  # คืนค่า 0 เพราะ ค่า 'N/A'
_ratio_ok = calculate_ratio(500000, 10000)
_ratio_err = calculate_ratio(500000, 0)
_safe, _ratio_ok, _ratio_err


(0, 50.0, None)

## Section 1.5 — Mini-Game: ทบทวนความรู้ (Review Game)

จับคู่ 'สิ่งที่เราอยากทำ' กับ 'โค้ดที่ถูกต้อง' (เฉลยด้านล่าง)


##  Review Game — Challenge

จับคู่ “สิ่งที่เราอยากทำ” กับ “โค้ดที่ถูกต้อง (A–F)”

| สิ่งที่เราอยากทำ (ข้อ) | โค้ดที่ถูกต้อง (A–F) |  
|---------------------------|-------------------------|
| 1️. เก็บข้อมูลลูกหนี้ 1 คน (cif: 12345, dpd: 30) | ___ |
| 2️. สร้าง “เครื่องมือ” ที่ใช้ซ้ำได้ เพื่อจัดกลุ่ม Stage | ___ |
| 3️. ประมวลผลลูกค้า “ทุกคน” ในลิสต์ ทีละคน | ___ |
| 4️. ป้องกันโปรแกรม “พัง” ถ้าเจอข้อมูล DPD เป็นตัวอักษร 'N/A' | ___ |
| 5️. ตัดสินใจว่า DPD 35 วัน ควรอยู่กลุ่มไหน | ___ |
| 6️. เก็บ “ลำดับ” ของ DPD ของลูกหนี้หลายคน [0, 15, 92] | ___ |

 **ตัวเลือกโค้ด (A–F):**

| ตัวอักษร | ตัวอย่างโค้ด |
|------------|----------------|
| **A** | `for c in customers: print(c)` |
| **B** | `dpd_list = [0, 15, 92]` |
| **C** | `if dpd > 30: stage = "2. Under-performing"` |
| **D** | `customer = {'cif':12345, 'dpd':30}` |
| **E** | `try: dpd = int(x) except: dpd = 0` |
| **F** | `def classify_stage(dpd): ... return stage` |


### **คำแนะนำ:**  
### พิมพ์คำตอบในช่อง `___` ก่อน แล้วเลื่อนไปดูเฉลยในส่วนถัดไป  


##  Review Game — เฉลย

| สิ่งที่เราอยากทำ (ข้อ) | โค้ดที่ถูกต้อง (ตัวอักษร) |
|---|---|
| 1. เก็บข้อมูลลูกหนี้ 1 คน (cif: 12345, dpd: 30) | D |
| 2. สร้าง “เครื่องมือ” ที่ใช้ซ้ำได้ เพื่อจัดกลุ่ม Stage | F |
| 3. ประมวลผลลูกค้า “ทุกคน” ในลิสต์ ทีละคน | A |
| 4. ป้องกันโปรแกรม “พัง” ถ้าเจอข้อมูล DPD เป็นตัวอักษร 'N/A' | E |
| 5. ตัดสินใจว่า DPD 35 วัน ควรอยู่กลุ่มไหน | C |
| 6. เก็บ “ลำดับ” ของ DPD ของลูกหนี้หลายคน [0, 15, 92] | B |

**สรุปแนวคิด:**
- D — เก็บข้อมูลลูกหนี้ใน dict  
- F — ฟังก์ชันจัดกลุ่ม stage  
- A — วนลูปลูกค้าทีละคน  
- E — ใช้ `try/except` ป้องกัน error  
- C — การใช้ if/elif ตัดสิน stage  
- B — การเก็บค่าใน list  


### What you learned

- เข้าใจพื้นฐานตัวแปรและโครงสร้างข้อมูลสำคัญ
- สามารถเขียนฟังก์ชันและควบคุมการไหลของโปรแกรมด้วย if/for
- ใช้ try/except เพื่อทำให้สคริปต์ทนทานต่อข้อมูลผิดพลาด

---