In [5]:
import pandas as pd
import numpy as np
import os # 파일 경로 관리를 위해 os 모듈을 추가합니다.

# PDF 8페이지에 언급된 데이터 소스를 기반으로 파일 경로를 정의합니다.
# 실제 파일이 있는 경로로 수정해주세요.
BASE_DIR = "." # 스크립트가 실행되는 폴더를 기준으로 합니다.
FILE_PATHS = {
    "epl_stats": os.path.join(BASE_DIR, "England Premier League.csv"),
    "championship_stats": os.path.join(BASE_DIR, "England Championship.csv"),
    "player_stats_24_25": os.path.join(BASE_DIR, "epl_player_stats_24_25.csv"),
    # PDF에 언급된 다른 파일들도 여기에 추가할 수 있습니다.
}

def load_data(file_paths):
    """
    지정된 경로에서 CSV 파일들을 불러와 DataFrame 딕셔너리로 반환합니다.
    """
    raw_data = {}
    print("데이터 로딩 시작...")
    try:
        for key, path in file_paths.items():
            if not os.path.exists(path):
                print(f"경고: '{path}' 파일을 찾을 수 없습니다. 이 파일은 건너뜁니다.")
                continue
            raw_data[key] = pd.read_csv(path)
            print(f"성공: '{path}' 로드 완료 (행: {len(raw_data[key])})")
            
        if not raw_data:
            print("오류: 로드할 수 있는 데이터 파일이 하나도 없습니다. 파일 경로를 확인해주세요.")
            return None
            
        return raw_data
        
    except FileNotFoundError as e:
        print(f"오류: 파일을 찾을 수 없습니다. {e}")
        print("FILE_PATHS 변수의 경로가 올바른지 확인해주세요.")
        return None
    except Exception as e:
        print(f"데이터 로딩 중 예기치 않은 오류 발생: {e}")
        return None

def preprocess_data(raw_data):
    """
    원본 DataFrame들을 받아 PDF 4페이지의 '개발범위'에 맞게 전처리합니다.
    """
    print("데이터 전처리 시작...")
    
    # 예시: 'epl_stats' 데이터 전처리
    if "epl_stats" in raw_data:
        epl_df = raw_data["epl_stats"].copy()
        
        # TODO: (PDF 개발범위 1) 결측치 처리
        # 예: epl_df.fillna(0, inplace=True)
        print(" - (TODO) 결측치 처리 수행...")
        
        # TODO: (PDF 개발범위 1) 데이터 타입 변환
        # 예: epl_df['Date'] = pd.to_datetime(epl_df['Date'])
        print(" - (TODO) 데이터 타입 변환 수행...")

        # TODO: (PDF 개발범위 1) 불필요한 컬럼 제거
        # 예: epl_df.drop(columns=['UnnecessaryColumn'], inplace=True)
        print(" - (TODO) 불필요한 컬럼 제거 수행...")

        # TODO: (PDF 개발범위 1) Feature(특성) 엔지니어링
        # 예: epl_df['GoalDifference'] = epl_df['FTHG'] - epl_df['FTAG']
        print(" - (TODO) Feature 엔지니어링 수행...")

        print("'epl_stats' 전처리 완료.")
        raw_data["epl_stats_cleaned"] = epl_df

    # TODO: 'championship_stats', 'player_stats_24_25' 등 다른 데이터들도 위와 같이 전처리합니다.
    if "player_stats_24_25" in raw_data:
        player_df = raw_data["player_stats_24_25"].copy()
        # ... (player_df에 대한 전처리 수행) ...
        print(" - (TODO) 'player_stats_24_25' 전처리 수행...")
        raw_data["player_stats_cleaned"] = player_df

    print("모든 데이터 전처리 완료.")
    return raw_data # 전처리된 DataFrame들을 포함한 딕셔너리 반환

def save_data(processed_data):
    """
    전처리된 DataFrame들을 별도의 파일로 저장합니다.
    """
    print("전처리된 데이터 저장 시작...")
    try:
        # 전처리된 데이터만 필터링하여 저장
        for key, df in processed_data.items():
            if key.endswith("_cleaned"):
                save_path = os.path.join(BASE_DIR, f"cleaned_{key}.csv")
                df.to_csv(save_path, index=False, encoding='utf-8-sig')
                print(f"성공: '{save_path}' 저장 완료")
                
    except Exception as e:
        print(f"데이터 저장 중 오류 발생: {e}")

def main():
    """
    메인 실행 함수: 데이터 로드 -> 전처리 -> 저장
    """
    raw_dataframes = load_data(FILE_PATHS)
    
    if raw_dataframes:
        processed_dataframes = preprocess_data(raw_dataframes)
        save_data(processed_dataframes)
        print("\n=== 데이터 전처리 작업 완료 ===")
    else:
        print("\n=== 데이터 전처리 작업 실패: 데이터를 로드할 수 없습니다. ===")

if __name__ == "__main__":
    main()

데이터 로딩 시작...
경고: './England Premier League.csv' 파일을 찾을 수 없습니다. 이 파일은 건너뜁니다.
경고: './England Championship.csv' 파일을 찾을 수 없습니다. 이 파일은 건너뜁니다.
경고: './epl_player_stats_24_25.csv' 파일을 찾을 수 없습니다. 이 파일은 건너뜁니다.
오류: 로드할 수 있는 데이터 파일이 하나도 없습니다. 파일 경로를 확인해주세요.

=== 데이터 전처리 작업 실패: 데이터를 로드할 수 없습니다. ===


In [7]:
import pandas as pd
import os

# data_preprocessor.py가 데이터를 저장하기로 한 경로
PROCESSED_DATA_DIR = "processed_data"
TEAM_DATA_PATH = os.path.join(PROCESSED_DATA_DIR, "team_data.csv")
PLAYER_DATA_PATH = os.path.join(PROCESSED_DATA_DIR, "player_data.csv")

class SeasonAnalyzer:
    """
    PDF 7페이지의 클래스 다이어그램에 정의된 SeasonAnalyzer 클래스입니다.
    전처리된 데이터를 로드하여, 팀/선수의 성과를 분석하는 메서드를 제공합니다.
    """
    def __init__(self, team_data_path=TEAM_DATA_PATH, player_data_path=PLAYER_DATA_PATH):
        """
        분석기는 생성될 때 전처리된 데이터를 로드합니다.
        """
        print("SeasonAnalyzer 초기화 중...")
        self.team_data = self.load_data(team_data_path)
        self.player_data = self.load_data(player_data_path)
        
        if self.team_data is None or self.player_data is None:
            print("오류: 분석에 필요한 데이터를 로드하지 못했습니다.")
            print(f"'{PROCESSED_DATA_DIR}' 폴더에 전처리된 CSV 파일이 있는지 확인하세요.")
        else:
            print("데이터 로드 완료. 분석기 준비 완료.")

    def load_data(self, file_path):
        """
        지정된 경로의 CSV 파일을 로드합니다.
        """
        try:
            if not os.path.exists(file_path):
                print(f"경고: '{file_path}' 파일을 찾을 수 없습니다.")
                return None
            return pd.read_csv(file_path)
        except Exception as e:
            print(f"'{file_path}' 로드 중 오류 발생: {e}")
            return None

    def get_team_stats(self, team_name, season="2024-2025"):
        """
        (PDF 개발범위 2) 특정 팀의 24-25 시즌 주요 스탯 계산 로직
        """
        if self.team_data is None:
            return {"error": "팀 데이터가 로드되지 않았습니다."}

        print(f"'{team_name}' (2024-2025 시즌) 스탯 계산 중...")
        
        # TODO: (PDF 개발범위 2)
        # 1. self.team_data에서 'team_name'과 'season'으로 데이터 필터링
        # team_season_data = self.team_data[...]
        
        # 2. 주요 스탯 계산 (승점, 득점, 실점, 승/무/패 등)
        # total_points = ...
        # total_goals_for = ...
        
        # 3. 딕셔너리 형태로 결과 반환
        stats = {
            "team": team_name,
            "season": season,
            "points": 89, # (TODO: 실제 계산 값)
            "goals_for": 92, # (TODO: 실제 계산 값)
            "goals_against": 38 # (TODO: 실제 계산 값)
        }
        
        return stats

    def get_player_stats(self, player_name, season="2024-2025"):
        """
        (PDF 개발범위 2) 특정 선수의 24-25 시즌 주요 스탯 계산 로직
        """
        if self.player_data is None:
            return {"error": "선수 데이터가 로드되지 않았습니다."}
            
        print(f"'{player_name}' (2024-2025 시즌) 스탯 계산 중...")

        # TODO: (PDF 개발범위 2)
        # 1. self.player_data에서 'player_name'과 'season'으로 데이터 필터링
        # player_season_data = self.player_data[
        #    (self.player_data['Player'] == player_name) & 
        #    (self.player_data['Season'] == season)
        # ]
        
        # 2. 주요 스탯 집계 (골, 어시스트, 출전 시간, 90분당 스탯 등)
        # player_row = player_season_data.iloc[0] # 선수는 유니크하다고 가정
        # goals = player_row['Goals']
        # assists = player_row['Assists']
        # goals_per_90 = player_row['Goals_per_90'] # (data_preprocessor에서 계산됨)
        
        # 3. 딕셔너리 형태로 결과 반환
        stats = {
            "player": player_name,
            "season": season,
            "goals": 16, # (TODO: 실제 계산 값)
            "assists": 9, # (TODO: 실제 계산 값)
            "minutes_played": 2980, # (TODO: 실제 계산 값)
            "goals_per_90": 0.48, # (TODO: 실제 계산 값)
        }
        
        return stats

    def get_team_trend(self, team_name, season="2024-2025"):
        """
        (PDF 개발범위 2) 팀의 시즌 성과 추이 (월별 득점 등) 분석 로직
        """
        if self.team_data is None:
            return {"error": "팀 데이터가 로드되지 않았습니다."}
            
        print(f"'{team_name}' (2024-2025 시즌) 성과 추이 분석 중...")
        
        # TODO: (PDF 개발범위 2)
        # 1. self.team_data에서 'team_name'과 'season'으로 데이터 필터링
        # 2. 'Date' 컬럼을 datetime 객체로 변환 (data_preprocessor에서 처리 권장)
        # 3. 날짜(Date)별로 그룹화(groupby)하여 월별 득점, 승점 등 계산
        # monthly_data = ...
        
        # 4. Chart.js가 이해하기 쉬운 포맷으로 반환
        trend_data = {
            "labels": ["Aug", "Sep", "Oct", "Nov", "Dec", "Jan", "Feb", "Mar", "Apr", "May"],
            "goals_per_month": [5, 7, 3, 6, 8, 5, 7, 4, 6, 3], # (TODO: 실제 계산 값)
            "points_per_month": [9, 7, 6, 7, 9, 6, 7, 6, 9, 3] # (TODO: 실제 계산 값)
        }
        
        return trend_data

# 이 스크립트를 직접 실행했을 때 테스트할 수 있는 코드
if __name__ == "__main__":
    print("=== SeasonAnalyzer 테스트 시작 ===")
    
    # 1. data_preprocessor.py를 먼저 실행해서 
    #    processed_data/team_data.csv와 
    #    processed_data/player_data.csv가 생성되었다고 가정합니다.
    
    analyzer = SeasonAnalyzer()
    
    if analyzer.team_data is not None and analyzer.player_data is not None:
        # 1. 테스트: 특정 팀 스탯 조회
        # (TODO: 'Arsenal'을 실제 team_data.csv에 있는 팀 이름으로 변경)
        team_stats = analyzer.get_team_stats("Arsenal")
        print("\n[팀 스탯 조회 결과]")
        print(team_stats)
        
        # 2. 테스트: 특정 선수 스탯 조회
        # (TODO: 'Bukayo Saka'를 실제 player_data.csv에 있는 선수 이름으로 변경)
        player_stats = analyzer.get_player_stats("Bukayo Saka")
        print("\n[선수 스탯 조회 결과]")
        print(player_stats)
        
        # 3. 테스트: 팀 성과 추이 조회
        team_trend = analyzer.get_team_trend("Arsenal")
        print("\n[팀 성과 추이 조회 결과]")
        print(team_trend)
    
    print("\n=== SeasonAnalyzer 테스트 종료 ===")

=== SeasonAnalyzer 테스트 시작 ===
SeasonAnalyzer 초기화 중...
경고: 'processed_data/team_data.csv' 파일을 찾을 수 없습니다.
경고: 'processed_data/player_data.csv' 파일을 찾을 수 없습니다.
오류: 분석에 필요한 데이터를 로드하지 못했습니다.
'processed_data' 폴더에 전처리된 CSV 파일이 있는지 확인하세요.

=== SeasonAnalyzer 테스트 종료 ===


In [9]:
import pandas as pd
import joblib # Scikit-learn 모델을 불러오기 위해 joblib을 사용합니다.
import os

# 훈련된 모델이 저장될 경로
MODEL_DIR = "trained_models"
TEAM_MODEL_PATH = os.path.join(MODEL_DIR, "team_prediction_model.pkl")
PLAYER_MODEL_PATH = os.path.join(MODEL_DIR, "player_prediction_model.pkl")

class PredictionModel:
    """
    PDF 7페이지의 클래스 다이어그램에 정의된 PredictionModel 클래스입니다.
    미리 훈련된 Scikit-learn 모델을 로드하여, 25-26 시즌 성적을 예측합니다.
    """
    def __init__(self, team_model_path=TEAM_MODEL_PATH, player_model_path=PLAYER_MODEL_PATH):
        """
        예측 모델은 생성될 때 훈련된 .pkl 파일을 로드합니다.
        """
        print("PredictionModel 초기화 중...")
        self.team_model = self.load_model(team_model_path)
        self.player_model = self.load_model(player_model_path)
        
        if self.team_model is None or self.player_model is None:
            print("오류: 예측 모델을 로드하지 못했습니다.")
            print(f"'{MODEL_DIR}' 폴더에 훈련된 .pkl 파일이 있는지 확인하세요.")
        else:
            print("모델 로드 완료. 예측기 준비 완료.")

    def load_model(self, file_path):
        """
        지정된 경로의 .pkl 또는 .joblib 파일을 로드합니다.
        """
        try:
            if not os.path.exists(file_path):
                print(f"경고: '{file_path}' 모델 파일을 찾을 수 없습니다.")
                return None
            
            model = joblib.load(file_path)
            print(f"성공: '{file_path}' 모델 로드 완료")
            return model
        except Exception as e:
            print(f"'{file_path}' 모델 로드 중 오류 발생: {e}")
            return None

    def predict_team_performance(self, features):
        """
        (PDF 개발범위 3) 25-26 시즌 팀 성적(순위, 승점) 예측
        """
        if self.team_model is None:
            return {"error": "팀 예측 모델이 로드되지 않았습니다."}

        print("팀 성적 예측 중...")
        
        # TODO: (PDF 개발범위 3)
        # 1. 'features'는 모델 훈련에 사용된 것과 동일한 형태의 
        #    24-25 시즌 데이터여야 합니다. (예: DataFrame)
        # 2. self.team_model.predict()를 사용하여 예측 수행
        
        # prediction = self.team_model.predict(features)
        
        # 3. 예측 결과를 딕셔너리 형태로 가공
        result = {
            "predicted_points": 75, # (TODO: 실제 예측 값)
            "predicted_rank": 4,     # (TODO: 실제 예측 값)
        }
        
        return result

    def predict_player_performance(self, features):
        """
        (PDF 개발범위 3) 25-26 시즌 선수 성적(골, 어시스트) 예측
        """
        if self.player_model is None:
            return {"error": "선수 예측 모델이 로드되지 않았습니다."}
            
        print("선수 성적 예측 중...")
        
        # TODO: (PDF 개발범위 3)
        # 1. 'features'는 모델 훈련에 사용된 것과 동일한 형태의 
        #    24-25 시즌 선수 데이터여야 합니다.
        # 2. self.player_model.predict()를 사용하여 예측 수행
        
        # prediction = self.player_model.predict(features)
        
        # 3. 예측 결과를 딕셔너리 형태로 가공
        result = {
            "predicted_goals": 14,    # (TODO: 실제 예측 값)
            "predicted_assists": 11,  # (TODO: 실제 예측 값)
        }
        
        return result

# 이 스크립트를 직접 실행했을 때 테스트할 수 있는 코드
if __name__ == "__main__":
    print("=== PredictionModel 테스트 시작 ===")
    
    # 이 테스트는 trained_models/team_prediction_model.pkl와
    # trained_models/player_prediction_model.pkl이 
    # 생성되었다고 가정합니다.
    
    predictor = PredictionModel()
    
    if predictor.team_model is not None and predictor.player_model is not None:
        
        # (TODO): 'test_team_features'와 'test_player_features'는
        #         모델이 예측할 수 있는 실제 24-25시즌 데이터 샘플이어야 합니다.
        #         (예: pd.DataFrame(...))
        
        test_team_features = pd.DataFrame([{"past_points": 89, "past_goals": 92}]) # (TODO: 실제 피처로 수정)
        team_prediction = predictor.predict_team_performance(test_team_features)
        print("\n[팀 예측 결과]")
        print(team_prediction)
        
        test_player_features = pd.DataFrame([{"past_goals": 16, "past_assists": 9}]) # (TODO: 실제 피처로 수정)
        player_prediction = predictor.predict_player_performance(test_player_features)
        print("\n[선수 예측 결과]")
        print(player_prediction)
    
    print("\n=== PredictionModel 테스트 종료 ===")

=== PredictionModel 테스트 시작 ===
PredictionModel 초기화 중...
경고: 'trained_models/team_prediction_model.pkl' 모델 파일을 찾을 수 없습니다.
경고: 'trained_models/player_prediction_model.pkl' 모델 파일을 찾을 수 없습니다.
오류: 예측 모델을 로드하지 못했습니다.
'trained_models' 폴더에 훈련된 .pkl 파일이 있는지 확인하세요.

=== PredictionModel 테스트 종료 ===


In [11]:
import pandas as pd
import numpy as np
import os
import joblib
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression # 예시 모델 (회귀)
from sklearn.metrics import mean_squared_error

# 1. 설정
PROCESSED_DATA_DIR = "processed_data"
TEAM_DATA_PATH = os.path.join(PROCESSED_DATA_DIR, "team_data_cleaned.csv")
PLAYER_DATA_PATH = os.path.join(PROCESSED_DATA_DIR, "player_data_cleaned.csv")

MODEL_DIR = "trained_models"
TEAM_MODEL_PATH = os.path.join(MODEL_DIR, "team_prediction_model.pkl")
PLAYER_MODEL_PATH = os.path.join(MODEL_DIR, "player_prediction_model.pkl")

# 훈련된 모델을 저장할 폴더 생성
os.makedirs(MODEL_DIR, exist_ok=True)

def train_team_model(data_path):
    """
    (PDF 개발범위 3) 팀 성적 예측 모델을 훈련하고 저장합니다.
    """
    print(f"\n--- 팀 모델 훈련 시작 ({data_path}) ---")
    try:
        df = pd.read_csv(data_path)
    except FileNotFoundError:
        print(f"오류: '{data_path}' 파일을 찾을 수 없습니다.")
        print("data_preprocessor.py를 먼저 실행하여 전처리된 데이터를 생성해야 합니다.")
        return

    # TODO: (PDF 개발범위 3)
    # 1. Feature(X)와 Target(y)을 정의해야 합니다.
    # 예: 과거 시즌 데이터(X)로 다음 시즌 승점(y)을 예측
    
    # 이 예제에서는 24-25시즌 데이터로 25-26시즌을 예측해야 하므로,
    # 실제로는 과거 여러 시즌의 데이터(X)와 그 *다음* 시즌의 성적(y)이 필요합니다.
    # data_preprocessor.py에서 이 X, y를 미리 잘 만들어 두는 것이 중요합니다.
    
    # (가상 예제: 'past_points'로 'points'를 예측한다고 가정)
    # features = ['past_points', 'past_goals_for', 'past_goals_against']
    # target = 'points'
    
    # (TODO)
    # X = df[features]
    # y = df[target]

    # (임시 코드: 실행을 위해 가상의 X, y 생성)
    print(" (임시) 가상의 훈련 데이터 생성 중...")
    X = pd.DataFrame(np.random.rand(100, 3), columns=['past_points', 'past_goals', 'past_rank'])
    y = pd.Series(50 + X['past_points']*0.5 + np.random.randn(100))
    
    # 2. 데이터를 훈련용/테스트용으로 분리
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    print(f"훈련 데이터: {X_train.shape}, 테스트 데이터: {X_test.shape}")

    # 3. 모델 선택 및 훈련 (PDF 4페이지 - Scikit-learn)
    # (간단한 선형 회귀 모델 사용)
    model = LinearRegression()
    model.fit(X_train, y_train)
    print("모델 훈련 완료.")

    # 4. 모델 성능 평가 (옵션)
    preds = model.predict(X_test)
    rmse = np.sqrt(mean_squared_error(y_test, preds))
    print(f"모델 성능 (RMSE): {rmse:.2f}")

    # 5. 훈련된 모델을 파일로 저장 (PDF 5페이지)
    joblib.dump(model, TEAM_MODEL_PATH)
    print(f"성공: 팀 모델을 '{TEAM_MODEL_PATH}'에 저장했습니다.")

def train_player_model(data_path):
    """
    (PDF 개발범위 3) 선수 성적 예측 모델을 훈련하고 저장합니다.
    """
    print(f"\n--- 선수 모델 훈련 시작 ({data_path}) ---")
    try:
        df = pd.read_csv(data_path)
    except FileNotFoundError:
        print(f"오류: '{data_path}' 파일을 찾을 수 없습니다.")
        return

    # TODO: (PDF 개발범위 3)
    # 1. Feature(X)와 Target(y)을 정의
    # 예: 24-25 시즌 스탯(X)으로 25-26 시즌 골/어시스트(y) 예측
    #     (이 역시 과거 여러 시즌 데이터가 필요)
    
    # (임시 코드: 실행을 위해 가상의 X, y 생성)
    print(" (임시) 가상의 훈련 데이터 생성 중...")
    X = pd.DataFrame(np.random.rand(500, 3), columns=['past_goals', 'past_assists', 'past_min'])
    # (두 개의 값을 예측: [goals, assists])
    y = pd.DataFrame({
        'goals': 5 + X['past_goals']*0.8 + np.random.randn(500),
        'assists': 3 + X['past_assists']*0.7 + np.random.randn(500)
    })
    
    # 2. 훈련/테스트 분리
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    print(f"훈련 데이터: {X_train.shape}, 테스트 데이터: {X_test.shape}")

    # 3. 모델 선택 및 훈련 (여러 값을 예측하므로, 각각 모델을 만들거나 MultiOutputRegressor 사용)
    # (여기서는 간단히 골만 예측하는 모델로 가정)
    model_goals = LinearRegression()
    model_goals.fit(X_train, y_train['goals'])
    # (TODO: 어시스트 모델도 따로 훈련해야 함, 또는 MultiOutput 모델 사용)
    
    print("모델 훈련 완료 (Goals).")

    # 4. 모델 저장
    # (TODO: 실제로는 골/어시스트 모델을 함께 래핑(wrapping)해서 저장해야 함)
    joblib.dump(model_goals, PLAYER_MODEL_PATH)
    print(f"성공: 선수 모델(Goals)을 '{PLAYER_MODEL_PATH}'에 저장했습니다.")

def main():
    print("=== 모델 훈련기 시작 ===")
    
    # 1. 팀 모델 훈련
    train_team_model(TEAM_DATA_PATH)
    
    # 2. 선수 모델 훈련
    train_player_model(PLAYER_DATA_PATH)
    
    print("\n=== 모든 모델 훈련 작업 완료 ===")
    print(f"'{MODEL_DIR}' 폴더에 .pkl 파일이 생성되었는지 확인하세요.")

if __name__ == "__main__":
    main()

=== 모델 훈련기 시작 ===

--- 팀 모델 훈련 시작 (processed_data/team_data_cleaned.csv) ---
오류: 'processed_data/team_data_cleaned.csv' 파일을 찾을 수 없습니다.
data_preprocessor.py를 먼저 실행하여 전처리된 데이터를 생성해야 합니다.

--- 선수 모델 훈련 시작 (processed_data/player_data_cleaned.csv) ---
오류: 'processed_data/player_data_cleaned.csv' 파일을 찾을 수 없습니다.

=== 모든 모델 훈련 작업 완료 ===
'trained_models' 폴더에 .pkl 파일이 생성되었는지 확인하세요.


In [18]:
from flask import Flask, jsonify
from flask_cors import CORS # 브라우저에서 오는 요청을 허용하기 위해 필요

# 2, 3단계에서 만들었던 .py 파일에서 클래스를 가져옵니다.
#from season_analyzer import SeasonAnalyzer
#from prediction_model import PredictionModel

# Flask 앱 생성
app = Flask(__name__)
CORS(app) # 모든 도메인에서의 API 요청을 허용합니다 (개발용)

# --- PDF 7페이지 '클래스 다이어그램' ---
# 1. 전역 변수로 분석기 및 예측기 인스턴스 생성
# (Flask 앱이 시작될 때 딱 한 번 실행됩니다)
print("Flask 앱 시작 중... 분석기 및 예측 모델을 로드합니다.")
analyzer = SeasonAnalyzer()
predictor = PredictionModel()
print("분석기 및 예측 모델 로드 완료. API 서버 준비 완료.")
# -------------------------------------

@app.route('/')
def home():
    """
    서버가 살아있는지 확인하는 기본 페이지
    """
    return "EPL 데이터 분석 API 서버가 실행 중입니다."

# --- PDF 5페이지 '개발범위 4' 및 PDF 7페이지 '순차 다이어그램' ---

@app.route('/api/stats/team/<team_name>', methods=['GET'])
def get_team_stats(team_name):
    """
    (API 엔드포인트 1)
    특정 팀의 24-25 시즌 성과(스탯, 트렌드)를 반환합니다.
    """
    print(f"[API 요청] 팀 스탯: {team_name}")
    
    # 1. SeasonAnalyzer 사용
    stats = analyzer.get_team_stats(team_name)
    trend = analyzer.get_team_trend(team_name)
    
    # 2. JSON으로 결합하여 반환
    response = {
        "stats": stats,
        "trend": trend
    }
    return jsonify(response)

@app.route('/api/stats/player/<player_name>', methods=['GET'])
def get_player_stats(player_name):
    """
    (API 엔드포인트 2)
    특정 선수의 24-25 시즌 성과를 반환합니다.
    """
    print(f"[API 요청] 선수 스탯: {player_name}")
    
    # 1. SeasonAnalyzer 사용
    stats = analyzer.get_player_stats(player_name)
    
    # 2. JSON으로 반환
    return jsonify(stats)


@app.route('/api/predict/team/<team_name>', methods=['GET'])
def get_team_prediction(team_name):
    """
    (API 엔드포인트 3)
    특정 팀의 25-26 시즌 성적을 예측합니다.
    """
    print(f"[API 요청] 팀 예측: {team_name}")
    
    # TODO: 
    # 1. 'team_name'을 기반으로 24-25시즌 데이터(Feature)를 가져와야 합니다.
    #    (이 로직은 analyzer에 추가하거나 여기서 구현해야 함)
    #    features_df = ... 
    
    # (임시 피처)
    import pandas as pd
    features_df = pd.DataFrame([{"past_points": 80, "past_goals": 90}]) # (TODO: 실제 피처로 수정)

    # 2. PredictionModel 사용
    prediction = predictor.predict_team_performance(features_df)
    
    return jsonify(prediction)


@app.route('/api/predict/player/<player_name>', methods=['GET'])
def get_player_prediction(player_name):
    """
    (API 엔드포인트 4)
    특정 선수의 25-26 시즌 성적을 예측합니다.
    """
    print(f"[API 요청] 선수 예측: {player_name}")
    
    # TODO:
    # 1. 'player_name'을 기반으로 24-25시즌 데이터(Feature)를 가져와야 합니다.
    #    features_df = ...

    # (임시 피처)
    import pandas as pd
    features_df = pd.DataFrame([{"past_goals": 15, "past_assists": 8}]) # (TODO: 실제 피처로 수정)
    
    # 2. PredictionModel 사용
    prediction = predictor.predict_player_performance(features_df)
    
    return jsonify(prediction)

# --- 서버 실행 ---
if __name__ == '__main__':
    # Flask 서버를 5000번 포트로 실행합니다.
    app.run(debug=True, port=5000)

Flask 앱 시작 중... 분석기 및 예측 모델을 로드합니다.
SeasonAnalyzer 초기화 중...
경고: 'processed_data/team_data.csv' 파일을 찾을 수 없습니다.
경고: 'processed_data/player_data.csv' 파일을 찾을 수 없습니다.
오류: 분석에 필요한 데이터를 로드하지 못했습니다.
'processed_data' 폴더에 전처리된 CSV 파일이 있는지 확인하세요.
PredictionModel 초기화 중...
경고: 'trained_models/team_prediction_model.pkl' 모델 파일을 찾을 수 없습니다.
경고: 'trained_models/player_prediction_model.pkl' 모델 파일을 찾을 수 없습니다.
오류: 예측 모델을 로드하지 못했습니다.
'trained_models' 폴더에 훈련된 .pkl 파일이 있는지 확인하세요.
분석기 및 예측 모델 로드 완료. API 서버 준비 완료.
 * Serving Flask app '__main__'
 * Debug mode: on


 * Running on http://127.0.0.1:5000
Press CTRL+C to quit
 * Restarting with watchdog (fsevents)
0.00s - make the debugger miss breakpoints. Please pass -Xfrozen_modules=off
0.00s - to python to disable frozen modules.
0.00s - Note: Debugging will proceed. Set PYDEVD_DISABLE_FILE_VALIDATION=1 to disable this validation.
Traceback (most recent call last):
  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "/opt/anaconda3/lib/python3.12/site-packages/ipykernel_launcher.py", line 17, in <module>
    app.launch_new_instance()
  File "/opt/anaconda3/lib/python3.12/site-packages/traitlets/config/application.py", line 1074, in launch_instance
    app.initialize(argv)
  File "/opt/anaconda3/lib/python3.12/site-packages/traitlets/config/application.py", line 118, in inner
    return method(app, *args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/opt/anaconda3/lib/python3.12/site-packages/ipykernel/kernelapp.py", line 654,

SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
