# Pandas Level 1: Basics & Loading Data

ยินดีต้อนรับสู่คอร์ส Pandas! ใน Level 1 นี้ เราจะมาทำความรู้จักกับโครงสร้างข้อมูลพื้นฐานของ Pandas และวิธีการโหลดข้อมูลจากไฟล์ต่างๆ เข้ามาทำงานครับ

## หัวข้อในบทเรียนนี้
1. **Introduction to Pandas**: Pandas คืออะไร?
2. **Pandas Series**: ข้อมูล 1 มิติ (เหมือน List แต่เก่งกว่า)
3. **Pandas DataFrame**: ข้อมูล 2 มิติ (ตาราง)
4. **Loading Data**: การอ่านไฟล์ CSV และ JSON
5. **Basic Inspection**: การสำรวจหน้าตาของข้อมูล (Head, Tail, Info, Describe)

In [None]:
import pandas as pd
import numpy as np

<a id='series'></a>
## 1. Pandas Series

Series เปรียบเสมือน List หรือ Array ที่มี **Index** (ป้ายกำกับ) ประจำตัวแต่ละข้อมูล

In [None]:
# สร้าง Series จาก List ทั่วไป
scores = [80, 95, 78, 88]
s1 = pd.Series(scores)
print("Series แบบ Default Index:")
print(s1)

# สร้าง Series แบบกำหนด Index เอง (เช่น แทนที่จะเป็น 0,1,2,3... ก็ใช้ชื่อคนแทน)
names = ['Somchai', 'Somsri', 'Mana', 'Manee']
s2 = pd.Series(scores, index=names)
print("\nSeries แบบกำหนด Index:")
print(s2)

# การเข้าถึงข้อมูล
print(f"\nคะแนนของ Somsri: {s2['Somsri']}")
print(f"คะแนนคนที่ 1 (Index 0): {s2.iloc[0]}")

<a id='dataframe'></a>
## 2. Pandas DataFrame

DataFrame คือ **ตาราง** (Table) ที่มีแถว (Rows) และคอลัมน์ (Columns) เป็นโครงสร้างข้อมูลหลักที่เราจะใช้ทำงานจริง

In [None]:
# สร้าง DataFrame จาก Dictionary (วิธีที่พบบ่อยในการสร้าง manual)
data = {
    'Name': ['Somchai', 'Somsri', 'Mana', 'Manee', 'Piti'],
    'Age': [20, 21, 19, 20, 22],
    'City': ['Bangkok', 'Chiang Mai', 'Phuket', 'Bangkok', 'Khon Kaen'],
    'Score': [85, 90, 78, 88, 92]
}

df = pd.DataFrame(data)
print("หน้าตาของ DataFrame:")
display(df)  # ใน Jupyter ใช้ display() จะสวยกว่า print()

<a id='loading'></a>
## 3. Loading Data (การโหลดข้อมูล)

ในชีวิตจริง เรามักจะโหลดข้อมูลจากไฟล์ CSV, Excel หรือ JSON

*หมายเหตุ: เรามีไฟล์ตัวอย่างอยู่ในโฟลเดอร์ `data/` เรียบร้อยแล้ว*

In [None]:
# 3.1 โหลดไฟล์ CSV (Comma-Separated Values)
csv_path = 'data/students.csv'
df_student = pd.read_csv(csv_path)

print("--- Data from CSV (students.csv) ---")
display(df_student.head(3)) # ดู 3 แถวแรก

In [None]:
# 3.2 โหลดไฟล์ JSON (JavaScript Object Notation)
json_path = 'data/products.json'
df_product = pd.read_json(json_path)

print("--- Data from JSON (products.json) ---")
display(df_product.head(3))

<a id='inspection'></a>
## 4. Basic Inspection (การสำรวจข้อมูลเบื้องต้น)

เมื่อได้ข้อมูลมา สิ่งแรกที่ต้องทำคือตรวจสอบดูว่าข้อมูลหน้าตาเป็นอย่างไร มีกี่แถว กี่คอลัมน์ มีค่าหายไปหรือไม่

In [None]:
print("1. head(): ดูข้อมูล 5 แถวแรก")
display(df_student.head()) 

print("\n2. tail(): ดูข้อมูล 5 แถวสุดท้าย")
display(df_student.tail())

print("\n3. shape: ดูขนาด (แถว, คอลัมน์)")
print(f"ขนาดของข้อมูล: {df_student.shape} -> มี {df_student.shape[0]} แถว, {df_student.shape[1]} คอลัมน์")

print("\n4. columns: ดูชื่อคอลัมน์ทั้งหมด")
print(df_student.columns.tolist())

print("\n5. info(): ดูชนิดข้อมูลและค่า Missing Value (สำคัญมาก!)")
df_student.info()

print("\n6. describe(): ดูสถิติเบื้องต้นของตัวเลข (Mean, Max, Min, etc.)")
display(df_student.describe())