In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 🎲 시드 값 고정 (재현 가능성 확보)
np.random.seed(42)

# 📂 데이터셋 불러오기 (파일 경로 설정)
file_path = '/Users/dean/Desktop/iris/iris.data'
columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']
df = pd.read_csv(file_path, header=None, names=columns)

# 🎨 종(species) 컬럼을 숫자로 변환
df['species'] = df['species'].astype('category').cat.codes

# 🧪 데이터 분할 (학습용/테스트용)
X = df.drop('species', axis=1)  # Features (입력 데이터)
y = df['species']  # Target (출력 데이터)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 🤖 모델 훈련 (Random Forest 사용)
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# 🔍 사용자 입력 기반 예측 함수
def predict_iris():
    print("Iris 꽃의 데이터를 입력하세요.")
    
    # 사용자 입력 받기
    sepal_length = float(input("꽃받침 길이(sepal_length)를 입력하세요: "))
    sepal_width = float(input("꽃받침 너비(sepal_width)를 입력하세요: "))
    petal_length = float(input("꽃잎 길이(petal_length)를 입력하세요: "))
    petal_width = float(input("꽃잎 너비(petal_width)를 입력하세요: "))
    
    # 입력 데이터를 배열이 아닌 DataFrame으로 변환
    input_data = pd.DataFrame([[sepal_length, sepal_width, petal_length, petal_width]],
    columns=['sepal_length', 'sepal_width', 'petal_length', 'petal_width'])

    # 모델 예측
    prediction = model.predict(input_data)
    
    # 예측 결과 해석
    species_dict = {0: 'Setosa', 1: 'Versicolor', 2: 'Virginica'}
    print(f"예측된 품종: {species_dict[prediction[0]]}")

# 📢 예측 함수 실행
predict_iris()