In [None]:
# 題：每日數據採集與報告生成 自動化
# 1. 編寫數據採集腳本
# 使用 requests 庫從設備 API 中提取實時數據，轉為 Python 字典或列表（取決於 API 返回的 JSON 結構）。

import requests

def collect_data():
    # 1. 訪問設備 API 提取數據
    try:
        response = requests.get('http://api.device.com/data')  # API URL 示例
        response.raise_for_status()  # 檢查請求是否成功，傳回狀態碼 ##
        data = response.json()  # 獲取 JSON 格式的數據
        return data
    except requests.exceptions.RequestException as e: # 捕獲錯誤 ##
        print(f"Error fetching data: {e}")
        return None

In [None]:
# 2. 存儲數據到資料庫
# 使用 SQLAlchemy 將數據寫入 MySQL 資料庫。
# 若 API 提供的是批量數據，可以一次性將多筆記錄寫入資料庫。

from sqlalchemy import create_engine
import pandas as pd

def store_data_to_db(data):
    # 2. 連接到 MySQL 資料庫
    engine = create_engine('mysql+pymysql://user:password@host/db')
    # 或是使用 SQL Server
    # engine = create_engine("mssql+pyodbc://username:password@server/database?driver=ODBC+Driver+17+for+SQL+Server") # 用戶名+密碼
    # engine = create_engine("mssql+pyodbc://@server/database?driver=ODBC+Driver+17+for+SQL+Server;Trusted_Connection=yes") # Windows 身份驗證
    
    # 3. 將數據轉換為 DataFrame 格式
    df = pd.DataFrame([data])  # 假設 data 是字典列表，將其轉換為 DataFrame
    
    # 4. 將數據存入資料庫表 'production_data'
    try:
        df.to_sql('production_data', engine, if_exists='append', index=False)
        print("Data stored to database successfully.")
    except Exception as e: ##
        print(f"Error storing data: {e}")

# if_exists 參數用來指定當數據表已經存在於資料庫中時應該執行的操作：
    # if_exists='fail'（預設值）：報錯。如果資料庫中已經存在目標表，則操作會失敗，並引發 ValueError 錯誤。
    # if_exists='replace'：複寫。如果資料庫中已經存在目標表，則刪除該表並重新創建，然後將數據插入。
    # if_exists='append'：同時存在。如果資料庫中已經存在目標表，則將數據追加到該表中，不會刪除或替換原有數據。

In [None]:
# 3. 生成自動化報告
# 使用 Pandas 生成報告，並輸出為 Excel 或 CSV 文件。可以根據需求生成其他統計分析。

def generate_report():
    # 5. 從資料庫中讀取數據
    engine = create_engine('mysql+pymysql://user:password@host/db')
    df = pd.read_sql('production_data', engine)
    
    # 6. 計算描述性統計信息
    report = df.describe()  # 包括良率、缺陷率等指標 ##
    # describe()：用於生成數據的系統性描述統計信息。
        # count：非空值的數量
        # min, max：最小值，最大值。
        # 25%、50%（中位數）、75%：分位數
        # mean：平均值
        # std：標準差

    # 7. 保存為 CSV 或 Excel 文件
    report.to_csv('report.csv', index=True)
    print("Report generated successfully.")

In [None]:
# 4. 設置自動化任務調度
# 使用 schedule 庫來定時運行數據採集和報告生成腳本。

import schedule
import time

def run_data_collection(): ##
    # 採集數據並存入資料庫
    data = collect_data()
    if data:
        store_data_to_db(data)
    # 生成報告
    generate_report()

# 8. 設置每天早上10點運行
schedule.every().day.at("10:00").do(run_data_collection) ##

# 9. 保持程序持續運行
while True:
    schedule.run_pending() ##
    time.sleep(60)  # 每分鐘檢查一次
    
# 9. 或只檢查一次
# schedule.run_pending()

# 9. 或執行指定次數
# 設置計數器和指定的次數
# count = 0
# max_count = 10

# while count < max_count:
    # schedule.run_pending()
    # time.sleep(60)
    # count += 1  # 每次循環增加計數器

# schedule.run_pending()：檢查是否有計劃的任務需要執行。如果有，觸發該任務的執行；如果沒有，什麼也不做。

ModuleNotFoundError: No module named 'schedule'