In [2]:
import ollama
import time

start_time = time.time()
response = ollama.chat(
    model='gemma3:12b',
    messages=[{'role': 'user', 'content': 'สวัสดี! อธิบายสั้นๆ ว่า Data Science คืออะไร?'}]
)
end_time = time.time()

print("คำตอบ:", response['message']['content'])
print("เวลา:", end_time - start_time, "นาที")

คำตอบ: สวัสดีครับ!

Data Science (วิทยาศาสตร์ข้อมูล) คือศาสตร์ที่ผสมผสานความรู้จากหลายสาขา เช่น **สถิติ, คณิตศาสตร์, คอมพิวเตอร์ และความรู้เฉพาะทางในธุรกิจ** เพื่อ **ดึงข้อมูลเชิงลึกที่มีคุณค่าจากข้อมูลจำนวนมหาศาล**

**พูดง่ายๆ ก็คือ:**

*   **เก็บข้อมูล:** รวบรวมข้อมูลจากแหล่งต่างๆ
*   **วิเคราะห์ข้อมูล:** ใช้เทคนิคทางสถิติและ Machine Learning เพื่อหาความสัมพันธ์, รูปแบบ และแนวโน้ม
*   **นำเสนอข้อมูล:** สื่อสารผลลัพธ์ที่ได้ออกมาในรูปแบบที่เข้าใจง่าย (เช่น กราฟ, ตาราง, หรือรายงาน)
*   **ใช้ข้อมูลเพื่อตัดสินใจ:** ช่วยให้องค์กรตัดสินใจได้อย่างมีข้อมูลรองรับ

**ตัวอย่างการใช้งาน:**

*   Netflix แนะนำหนังให้คุณดูตามประวัติการรับชม
*   ธนาคารตรวจจับการทุจริตในการทำธุรกรรม
*   แพทย์วินิจฉัยโรคด้วยการวิเคราะห์ข้อมูลผู้ป่วย

หวังว่าคำอธิบายนี้จะช่วยให้เข้าใจ Data Science มากขึ้นนะครับ!
เวลา: 37.18027591705322 นาที


In [3]:
import ollama
import time

start_time = time.time()
response = ollama.chat(
    model='gemma3:12b',
    messages=[{'role': 'user', 'content': "เขียนโค้ด Python ใช้ pandas อ่านไฟล์ CSV และหาค่าเฉลี่ยของคอลัมน์ 'sales' พร้อมทั้งจัดการ missing values ด้วยการเติมค่าเฉลี่ย"}]
)
end_time = time.time()

print("คำตอบ:", response['message']['content'])
print("เวลา:", end_time - start_time, "วินาที")

คำตอบ: ```python
import pandas as pd

def calculate_average_sales(csv_file_path):
  """
  อ่านไฟล์ CSV, คำนวณค่าเฉลี่ยของคอลัมน์ 'sales', และจัดการ missing values

  Args:
    csv_file_path (str): พาธไปยังไฟล์ CSV

  Returns:
    float: ค่าเฉลี่ยของคอลัมน์ 'sales' หลังจากจัดการ missing values แล้ว
    หรือ None หากเกิดข้อผิดพลาดในการอ่านไฟล์
  """
  try:
    # อ่านไฟล์ CSV ด้วย pandas
    df = pd.read_csv(csv_file_path)

    # ตรวจสอบว่าคอลัมน์ 'sales' มีอยู่ใน DataFrame หรือไม่
    if 'sales' not in df.columns:
      print("Error: Column 'sales' not found in the CSV file.")
      return None

    # คำนวณค่าเฉลี่ยของคอลัมน์ 'sales' ก่อนจัดการ missing values
    mean_sales = df['sales'].mean()

    # เติม missing values ในคอลัมน์ 'sales' ด้วยค่าเฉลี่ย
    df['sales'].fillna(mean_sales, inplace=True)

    # คำนวณค่าเฉลี่ยของคอลัมน์ 'sales' อีกครั้งหลังจากเติม missing values
    mean_sales_filled = df['sales'].mean()

    return mean_sales_filled

  except FileNotFoundError:
    print(f"E

In [4]:
import ollama
import time

start_time = time.time()
response = ollama.chat(
    model='gemma3:12b',
    messages=[{'role': 'user', 'content': "เขียนโค้ด Python ใช้ scikit-learn สร้างโมเดล Random Forest สำหรับ classification, ทำ cross-validation 5-fold, และคำนวณ accuracy กับ confusion matrix"}]
)
end_time = time.time()

print("คำตอบ:", response['message']['content'])
print("เวลา:", end_time - start_time, "วินาที")

คำตอบ: ```python
import numpy as np
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.datasets import make_classification  # ใช้เพื่อสร้าง dataset จำลอง

# 1. สร้าง dataset จำลอง (ใช้เพื่อให้โค้ดทำงานได้ แม้จะไม่มี dataset จริง)
# คุณสามารถเปลี่ยนส่วนนี้เพื่อโหลด dataset ของคุณเอง
X, y = make_classification(n_samples=1000, n_features=20, random_state=42,
                           n_informative=15, n_redundant=5, n_repeated=0,
                           n_classes=2, class_sep=1.0, flip_y=0.1)

# 2. แบ่ง dataset เป็น training set และ testing set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. สร้างโมเดล Random Forest Classifier
model = RandomForestClassifier(n_estimators=100, random_state=42)  # ปรับ hyperparameters ได้ตามต้องการ

# 4. ทำ Cross-validation 5-fold
scores = cr