# การทำนายด้วย Linear Regression Model

In [3]:
pip install Flask pandas scikit-learn openpyxl

Note: you may need to restart the kernel to use updated packages.


In [4]:
from flask import Flask, render_template, request, jsonify
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.metrics import mean_absolute_error

# สร้างแอปพลิเคชัน Flask
app = Flask(__name__)

# โหลดข้อมูลจากไฟล์ Excel
df = pd.read_csv('DataComsci.csv')

# ขั้นตอนที่ 1: เตรียมข้อมูล
# แปลงเกรดเป็นค่าตัวเลข
grade_mapping = {'A': 4.0, 'B+': 3.5, 'B': 3.0, 'C+': 2.5, 'C': 2.0, 'D+': 1.5, 'D': 1.0, 'F': 0.0}
df.replace(grade_mapping, inplace=True)

# แทนค่าที่หายไปด้วยค่าเฉลี่ยของแต่ละคอลัมน์สำหรับคอลัมน์ตัวเลข
df.fillna(df.mean(numeric_only=True), inplace=True)

# เลือกฟีเจอร์ที่เกี่ยวข้อง (รายวิชาที่จะใช้ทำนาย GPA)
features = [
        'CalculusforScience', 'FundamentalsOfProgramming', 'HistoryAndDevelopmentOfComputerTechnology',
        'MathematicsForScience', 'ObjectOrientedProgramming', 'ThaiLanguageSkills',
        'PoliticsEconomyandSociety', 'PhilosophyOfScience', 'ManAndEnvironment',
        'LifeSkills', 'LanguageSocietyAndCulture', 'EnglishCriticalReadingForEffectiveCommunication',
        'ComputerArchitecture', 'DataStructure', 'DatabaseSystems',
        'DiscreteMathematicsForComputerScience', 'LinearAlgebraAndApplications',
        'OperatingSystems', 'StatisticalAnalysis', 'EnglishWritingForEffectiveCommunication',
        'AlgorithmDesignandAnalysis', 'ArtificialIntelligence', 'ComputerNetworkAndDataCommunication',
        'Seminar', 'SoftwareEngineering', 'DataMiningTechniques', 
        'MobileApplicationDevelopment', 'MultimediaAnd WebTechnology', 
        'SensingAndActuationForInternetOfThings','SystemAnalysisAndDesign'
]

X = df[features]  # สร้าง DataFrame สำหรับฟีเจอร์

# ตัวแปรเป้าหมาย (GPA)
y = df['GPAgraduate']

# ขั้นตอนที่ 2: แบ่งข้อมูลเป็นชุดฝึกและชุดทดสอบ
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ขั้นตอนที่ 3: สร้างโมเดล Linear Regression และฝึกสอนมัน
model = LinearRegression()
model.fit(X_train, y_train)

# ขั้นตอนที่ 4: ทำนายโดยใช้ชุดทดสอบ
y_pred = model.predict(X_test)

# ขั้นตอนที่ 5: ประเมินผลโมเดล
mse = mean_squared_error(y_test, y_pred)  # คำนวณ Mean Squared Error
r2 = r2_score(y_test, y_pred)  # คำนวณ R-Squared
mae = mean_absolute_error(y_test, y_pred)# คำนวณค่า MAE

# แสดงผลลัพธ์
print(f'Mean Absolute Error (MAE): {mae}')
print(f'Mean Squared Error (MSE): {mse}')
print(f'R-Squared: {r2}')


Mean Absolute Error (MAE): 0.07477904713779493
Mean Squared Error (MSE): 0.008760694535345524
R-Squared: 0.9331476432989072


### จะได้ค่าหลังจากการเทรนโมเดลได้ดังด้านบน

# การใช้งานโปรแกรม

### 1. เปิดไฟล์ launch_app.py และรันโปรแกรม (ตรวจสอบให้มั่นใจว่ามีไฟล์ DataComsci.csv และ โฟลเดอร์ templates ที่มีไฟล์ index.html ทั้งสองอยู่ในโฟล์เดอร์เดียวกับไฟล์นี้)

### 2. จะปรากฎหน้าต่างใน Command Prompt หรือ Terminal ขึ้นมา แล้วมองหา 
### * Running on http://127.0.0.1:5000 จากนั้นนำ url ไปเปิดบนเว็ปได้เลย
