In [None]:
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
import io

# --- เฉลยใบงานปฏิบัติการที่ 4 ---

# ชุดข้อมูลสำหรับใบงาน (Dataset)
student_data = """StudentID,FirstName,LastName,Major,MidtermScore,FinalScore,ProjectScore,Attendance
6401001,Somchai,Jaidee,Computer Engineering,85,90,45,95
6401002,Somsri,Rakdee,Computer Engineering,76,,48,88
6401003,Mana,Petch,Civil Engineering,65,72,38,92
6401004,Chujai,Klaew,Electrical Engineering,92,95,50,98
6401005,Piti,Yindee,Computer Engineering,88,85,42,85
6401006,Malee,Boonma,Civil Engineering,,65,35,75
6401007,Weera,Chokdee,Electrical Engineering,78,82,40,90
6401008,Jinda,Suksai,Computer Engineering,95,98,49,99
6401009,Arun,Rungrueng,Industrial Engineering,55,60,30,68
6401010,Naree,Ngamdee,Civil Engineering,72,78,41,94
6401011,David,Smith,Computer Engineering,98,100,50,100
6401012,Emily,Jones,Electrical Engineering,68,75,39.0,80
6401013,Michael,Brown,Civil Engineering,81,80,44,91
6401014,Jessica,Davis,Computer Engineering,,92,47,93
6401015,Chris,Wilson,Industrial Engineering,62,70,33.0,65
"""

# --- ภาระงาน (10 Tasks) ---

# 1. การโหลดและตรวจสอบข้อมูลเบื้องต้น
print("--- ภาระงานข้อที่ 1: การโหลดและตรวจสอบข้อมูลเบื้องต้น ---")
data_file = io.StringIO(student_data)
df = pd.read_csv(data_file)

print("\nแสดงข้อมูล 10 แถวแรก:")
print(df.head(10))

print("\nตรวจสอบชนิดข้อมูลและค่าว่างด้วย .info():")
df.info()

print("\nคำตอบคำถามข้อ 1:")
print("คอลัมน์ที่มีข้อมูลขาดหายคือ MidtermScore (2 ค่า) และ FinalScore (1 ค่า)")
print("ชนิดข้อมูลเป็น float64 เนื่องจาก Pandas จะแปลงคอลัมน์ที่มีค่าว่างเป็น float โดยอัตโนมัติ")
print("-" * 50)


# 2. การจัดการข้อมูลที่ขาดหาย (Missing Data)
print("\n--- ภาระงานข้อที่ 2: การจัดการข้อมูลที่ขาดหาย ---")
midterm_median = df['MidtermScore'].median()
final_median = df['FinalScore'].median()

df['MidtermScore'].fillna(midterm_median, inplace=True)
df['FinalScore'].fillna(final_median, inplace=True)

print("เติมค่าที่ขาดหายด้วย median เรียบร้อยแล้ว")
print("ตรวจสอบข้อมูลขาดหายอีกครั้ง:")
print(df.isnull().sum())
print("-" * 50)


# 3. การแปลงชนิดข้อมูล (Data Type Conversion)
print("\n--- ภาระงานข้อที่ 3: การแปลงชนิดข้อมูล ---")
print(f"ชนิดข้อมูลของ ProjectScore ก่อนแปลง: {df['ProjectScore'].dtype}")
df['ProjectScore'] = df['ProjectScore'].astype(int)
print(f"ชนิดข้อมูลของ ProjectScore หลังแปลง: {df['ProjectScore'].dtype}")
print("แปลงชนิดข้อมูลเรียบร้อยแล้ว")
print("-" * 50)


# 4. การสร้างคอลัมน์ใหม่จากข้อมูลเดิม
print("\n--- ภาระงานข้อที่ 4: การสร้างคอลัมน์ FullName ---")
df['FullName'] = df['FirstName'] + ' ' + df['LastName']
print("สร้างคอลัมน์ FullName เรียบร้อยแล้ว, ดูตัวอย่าง:")
print(df[['FirstName', 'LastName', 'FullName']].head())
print("-" * 50)


# 5. การคำนวณคะแนนรวม
print("\n--- ภาระงานข้อที่ 5: การคำนวณคะแนนรวม ---")
df['TotalScore'] = df['MidtermScore'] + df['FinalScore'] + df['ProjectScore']
print("สร้างคอลัมน์ TotalScore เรียบร้อยแล้ว, ดูตัวอย่าง:")
print(df[['FullName', 'MidtermScore', 'FinalScore', 'ProjectScore', 'TotalScore']].head())
print("-" * 50)


# 6. การคำนวณและตัดเกรด
print("\n--- ภาระงานข้อที่ 6: การคำนวณและตัดเกรด ---")
def calculate_grade(score):
    if score >= 220:
        return 'A'
    elif score >= 190:
        return 'B'
    elif score >= 160:
        return 'C'
    elif score >= 130:
        return 'D'
    else:
        return 'F'

df['FinalGrade'] = df['TotalScore'].apply(calculate_grade)
print("สร้างคอลัมน์ FinalGrade เรียบร้อยแล้ว, ดูตัวอย่าง:")
print(df[['FullName', 'TotalScore', 'FinalGrade']].head())
print("-" * 50)


# 7. การคัดกรองข้อมูลตามเงื่อนไขที่ซับซ้อน
print("\n--- ภาระงานข้อที่ 7: การคัดกรองข้อมูล ---")
print("\nนักศึกษาวิศวกรรมคอมพิวเตอร์ที่ได้เกรด 'A':")
ce_grade_a = df[(df['Major'] == 'Computer Engineering') & (df['FinalGrade'] == 'A')]
print(ce_grade_a[['FullName', 'Major', 'TotalScore', 'FinalGrade']])

print("\nนักศึกษาที่มีการเข้าเรียนน้อยกว่า 70%:")
low_attendance = df[df['Attendance'] < 70]
print(low_attendance[['FullName', 'Major', 'Attendance']])
print("-" * 50)


# 8. การเรียงลำดับข้อมูล
print("\n--- ภาระงานข้อที่ 8: การเรียงลำดับข้อมูล ---")
print("\n5 อันดับแรกของนักศึกษาที่มีคะแนนรวมสูงสุด:")
df_sorted = df.sort_values(by='TotalScore', ascending=False)
print(df_sorted[['FullName', 'Major', 'TotalScore', 'FinalGrade']].head())
print("-" * 50)


# 9. การจัดกลุ่มและสรุปผลข้อมูล (Grouping and Aggregation)
print("\n--- ภาระงานข้อที่ 9: การจัดกลุ่มและสรุปผลข้อมูล ---")
major_summary = df.groupby('Major').agg(
    Average_TotalScore=('TotalScore', 'mean'),
    Average_FinalScore=('FinalScore', 'mean')
)
print("\nคะแนนเฉลี่ยของแต่ละสาขาวิชา:")
print(major_summary.round(2)) # .round(2) เพื่อปัดทศนิยม 2 ตำแหน่ง

print("\nคำตอบคำถามข้อ 9:")
print(f"สาขาวิชาที่มีคะแนนรวมเฉลี่ยสูงสุดคือ: {major_summary['Average_TotalScore'].idxmax()}")
print("-" * 50)


# 10. การเตรียมและการบันทึกรายงานสรุป
print("\n--- ภาระงานข้อที่ 10: การเตรียมและการบันทึกรายงานสรุป ---")
report_df = df[['StudentID', 'FullName', 'Major', 'TotalScore', 'FinalGrade']]
print("\nตัวอย่างข้อมูลใน report_df:")
print(report_df.head())

# บันทึกไฟล์ (นำ comment ออกเมื่อต้องการรันจริง)
# report_df.to_csv('student_grade_report.csv', index=False)
print("\nไฟล์ 'student_grade_report.csv' ถูกสร้างเรียบร้อยแล้ว (โค้ดถูกคอมเมนต์ไว้)")
print("-" * 50)
