In [1]:
# 필요한 라이브러리
import pandas as pd
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

from inference.exercise_related import feature_df

In [2]:
# Step 1: 운동 데이터 로드 및 전처리
new_data = {
    "운동 종류": [
        "테니스 (복식)",
        "수상스키",
        "체조",
        "걷기 (5.6km/시간)",
        "에어로빅",
        "테니스(단식)",
        "수영",
        "골프",
        "스키",
        "등산",
        "자전거타기 (9.6km/시간)",
        "스케이팅 (6.4km/시간)",
        "볼링",
        "자전거타기 (16km/시간)",
        "달리기 (9km/시간)",
        "탁구",
        "계단오르내리기",
        "배드민턴",
        "배구",
        "웨이트 트레이닝",
        "스쿼트",
        "윗몸 일으키기",
        "팔굽혀펴기",
    ],
    "시간당 칼로리 소모량 (kcal)": [
        330,
        450,
        180,
        270,
        330,
        450,
        720,
        270,
        540,
        780,
        270,
        390,
        270,
        390,
        630,
        330,
        310,
        330,
        330,
        440,
        420,
        600,
        300,
    ],
}

# 데이터프레임으로 변환
exercise_df = pd.DataFrame(new_data)
exercise_df.head()

Unnamed: 0,운동 종류,시간당 칼로리 소모량 (kcal)
0,테니스 (복식),330
1,수상스키,450
2,체조,180
3,걷기 (5.6km/시간),270
4,에어로빅,330


In [3]:
# 간단하게 집에서 할 수 있는 운동 목록
simple_home_exercises = [
    "팔굽혀펴기",
    "윗몸 일으키기",
    "스쿼트",
    "계단오르내리기",
    "자전거타기 (9.6km/시간)",
    "걷기 (5.6km/시간)",
    "체조",
]

# 운동 유형과 장소 분류 (유산소/무산소, 실외/실내) 코드
exercise_categories = {
    "테니스 (복식)": ("유산소", "실외"),
    "수상스키": ("유산소", "실외"),
    "체조": ("무산소", "실내"),
    "걷기 (5.6km/시간)": ("유산소", "실외"),
    "에어로빅": ("유산소", "실내"),
    "테니스(단식)": ("유산소", "실외"),
    "수영": ("유산소", "실내"),
    "골프": ("유산소", "실외"),
    "스키": ("유산소", "실외"),
    "등산": ("유산소", "실외"),
    "자전거타기 (9.6km/시간)": ("유산소", "실외"),
    "스케이팅 (6.4km/시간)": ("유산소", "실내"),
    "볼링": ("유산소", "실내"),
    "자전거타기 (16km/시간)": ("유산소", "실외"),
    "달리기 (9km/시간)": ("유산소", "실외"),
    "탁구": ("유산소", "실내"),
    "계단오르내리기": ("유산소", "실내"),
    "배드민턴": ("유산소", "실내"),
    "배구": ("유산소", "실내"),
    "웨이트 트레이닝": ("무산소", "실내"),
    "스쿼트": ("무산소", "실내"),
    "윗몸 일으키기": ("무산소", "실내"),
    "팔굽혀펴기": ("무산소", "실내"),
}

In [4]:
exercise_df["type"] = exercise_df["운동 종류"].map(
    lambda x: exercise_categories.get(x, ("기타", "기타"))[0]
)
exercise_df["location"] = exercise_df["운동 종류"].map(
    lambda x: exercise_categories.get(x, ("기타", "기타"))[1]
)

# 최종 데이터셋 구성
exercise_dataset = exercise_df[
    ["운동 종류", "시간당 칼로리 소모량 (kcal)", "location", "type"]
].copy()

In [5]:
exercise_dataset

Unnamed: 0,운동 종류,시간당 칼로리 소모량 (kcal),location,type
0,테니스 (복식),330,실외,유산소
1,수상스키,450,실외,유산소
2,체조,180,실내,무산소
3,걷기 (5.6km/시간),270,실외,유산소
4,에어로빅,330,실내,유산소
5,테니스(단식),450,실외,유산소
6,수영,720,실내,유산소
7,골프,270,실외,유산소
8,스키,540,실외,유산소
9,등산,780,실외,유산소


In [6]:
feature_df

Unnamed: 0,시간당 칼로리 소모량 (kcal),location_encoded,type_encoded
0,330,0,1
1,450,0,1
2,180,1,0
3,270,0,1
4,330,1,1
5,450,0,1
6,720,1,1
7,270,0,1
8,540,0,1
9,780,0,1


In [7]:
# Step 2: 특징 벡터 준비 - 기존 데이터셋을 feature 벡터로 변환
feature_df = exercise_dataset[["시간당 칼로리 소모량 (kcal)"]].copy()
feature_df["location_encoded"] = exercise_dataset["location"].apply(
    lambda x: 1 if x == "실내" else 0
)
feature_df["type_encoded"] = exercise_dataset["type"].apply(
    lambda x: 1 if x == "유산소" else 0
)

In [8]:
# Step 3: 추천 함수 (잔여 칼로리, 현재 시간, 유산소/무산소 횟수에 따른 운동 추천)
def recommend_exercises(
        remaining_calories, current_time, aerobic_count, anaerobic_count
):
    # 사용자 입력에 해당하는 벡터 생성
    user_vector = pd.DataFrame(
        [[remaining_calories, 1 if current_time >= 18 else 0, aerobic_count]],
        columns=["시간당 칼로리 소모량 (kcal)", "location_encoded", "type_encoded"],
    )

    # 현재 시간이 18시 이후일 경우 간단한 운동으로 필터링
    if current_time >= 18:
        filtered_exercises = exercise_dataset[
            exercise_dataset["운동 종류"].isin(simple_home_exercises)
        ].copy()
    else:
        filtered_exercises = exercise_dataset.copy()

    # feature_df도 동일하게 필터링
    filtered_features = feature_df.loc[filtered_exercises.index]

    # 현재 시간에 따라 실외/실내 운동 가중치 적용
    if current_time >= 18:  # 저녁 시간
        filtered_features["weighted_location"] = (
                filtered_features["location_encoded"] * 3
        )  # 실내 운동 가중치 증가
    else:  # 아침 및 오후 시간
        filtered_features["weighted_location"] = (
                                                         1 - filtered_features["location_encoded"]
                                                 ) * 3  # 실외 운동 가중치 증가

    # 잠깐 생각.
    # 가중치 적용하는 것 알고리즘이
    # 현재 시간이 18 이상인경우
    # 1을 3으로 만들고,
    # 현재 시간이 18 이전인경우
    # 1을 0으로 만들고 3을 곱한다.

    # 코사인 유사도 계산
    similarity_scores = cosine_similarity(
        filtered_features[
            ["시간당 칼로리 소모량 (kcal)", "weighted_location", "type_encoded"]
        ],
        user_vector,
    )  #
    # [['칼로리 소모량', '18시넘었니?', '유산소횟수']]
    # [['remaining_calories', 'is_time_over_18('weighted')', 'is_유산소']]

    # 유사도가 가장 높은 운동을 찾기
    filtered_exercises = filtered_exercises.copy()
    filtered_exercises["similarity"] = similarity_scores
    print(filtered_exercises)
    recommended_exercise = filtered_exercises.sort_values(
        by="similarity", ascending=False
    ).iloc[0]["운동 종류"]

    return recommended_exercise

In [9]:
def normalize_features(df):
    """Normalize numerical features to 0-1 range"""
    result = df.copy()
    result["시간당 칼로리 소모량 (kcal)"] = (
                                           df["시간당 칼로리 소모량 (kcal)"] - df["시간당 칼로리 소모량 (kcal)"].min()
                                   ) / (
                                           df["시간당 칼로리 소모량 (kcal)"].max()
                                           - df["시간당 칼로리 소모량 (kcal)"].min()
                                   )
    return result


def recommend_exercises(
        remaining_calories, current_time, aerobic_count, anaerobic_count
):
    # Normalize remaining calories to match dataset scale
    max_calories = exercise_dataset["시간당 칼로리 소모량 (kcal)"].max()
    normalized_calories = remaining_calories / max_calories

    # Calculate preferred exercise type based on previous exercise counts
    prefer_aerobic = 1 if aerobic_count < anaerobic_count else 0

    # Create user vector with normalized values
    user_vector = pd.DataFrame(
        [
            [
                normalized_calories,
                1 if current_time >= 18 else 0,  # Location preference
                prefer_aerobic,
            ]
        ],  # Exercise type preference
        columns=["시간당 칼로리 소모량 (kcal)", "location_encoded", "type_encoded"],
    )

    # Filter exercises based on time
    if current_time >= 18:
        filtered_exercises = exercise_dataset[
            exercise_dataset["운동 종류"].isin(simple_home_exercises)
        ].copy()
    else:
        filtered_exercises = exercise_dataset.copy()

    # Get features for filtered exercises
    filtered_features = feature_df.loc[filtered_exercises.index].copy()

    # Normalize features
    filtered_features = normalize_features(filtered_features)

    # Apply time-based weights
    time_weight = 2.0 if current_time >= 18 else 1.0
    filtered_features["location_score"] = (
            filtered_features["location_encoded"] * time_weight
    )

    # Calculate similarity with normalized features
    similarity_scores = cosine_similarity(
        filtered_features[
            ["시간당 칼로리 소모량 (kcal)", "location_score", "type_encoded"]
        ],
        user_vector,
    )

    # Get recommendations
    filtered_exercises["similarity"] = similarity_scores
    recommended = filtered_exercises.nlargest(3, "similarity")

    return recommended["운동 종류"].values

In [10]:
# Step 4: 추천 실행 예시
remaining_calories = 235  # 잔여 칼로리 예시 값
current_time = 19  # 현재 시간 예시 (저녁)
aerobic_count = 5  # 유산소 운동 횟수 예시
anaerobic_count = 2  # 무산소 운동 횟수 예시

# 추천 함수 호출
recommended_exercise = recommend_exercises(
    remaining_calories, current_time, aerobic_count, anaerobic_count
)
print("추천 운동:", recommended_exercise)

추천 운동: ['스쿼트' '팔굽혀펴기' '윗몸 일으키기']
