# 🤖 첫 번째 AI 만들기 - 꽃 구별 로봇!

**문제**: 꽃의 크기를 재면 어떤 종류인지 알 수 있을까?
**해결**: 컴퓨터에게 150개 꽃 데이터를 보여주고 패턴을 학습시켜보자!

## 🤔 scikit-learn이 뭐야?
- **쉽게 말해**: 파이썬용 AI 만들기 도구상자
- **들어있는 것**: 다양한 AI 알고리즘들 + 연습용 데이터
- **마치**: 레고 블록처럼 조립해서 AI를 만드는 도구

## 🎯 오늘의 목표
**"꽃 크기 넣으면 → 꽃 종류 나오는" AI 만들기!**

1. 🌸 꽃 데이터 150개 구경하기
2. 📚 컴퓨터에게 패턴 학습시키기  
3. 📝 "이 꽃은 어떤 종류야?" 물어보기
4. 🎯 정답률 확인하기
5. 🚀 우리가 직접 예측 요청해보기


In [74]:
# 🧰 도구 꺼내기 (라이브러리 가져오기)
import pandas as pd  # 데이터 정리 도구 (엑셀같은 거)
import numpy as np   # 숫자 계산 도구 (계산기)

# sklearn에서 필요한 것들 가져오기
from sklearn import datasets                    # 연습용 데이터 모음
from sklearn.model_selection import train_test_split  # 데이터 나누기 도구
from sklearn.tree import DecisionTreeClassifier       # AI 두뇌 중 하나
from sklearn.metrics import accuracy_score            # 점수 매기기 도구

print("🧰 도구 준비 완료!")
print("✅ pandas - 엑셀같이 데이터 정리")
print("✅ numpy - 계산기")  
print("✅ sklearn - AI 만들기 도구상자")
print("\n🚀 이제 AI 만들 준비가 다 됐어요!")


🧰 도구 준비 완료!
✅ pandas - 엑셀같이 데이터 정리
✅ numpy - 계산기
✅ sklearn - AI 만들기 도구상자

🚀 이제 AI 만들 준비가 다 됐어요!


## 1단계: 꽃 데이터 구경하기 🌸

**상황**: sklearn 안에 150개 꽃 데이터가 들어있어요
**목표**: 이 데이터를 구경하고 뭐가 들어있는지 알아보기

**아이리스란?**: 보라색, 노란색 꽃이 예쁜 꽃 종류  
**왜 이걸 쓸까?**: 크기만 재면 품종을 구별할 수 있어서 AI 연습하기 딱 좋음!


In [75]:
# sklearn 도구상자에서 꽃 데이터 꺼내기
print("📦 sklearn 상자에서 아이리스 꽃 데이터 꺼내는 중...")
iris = datasets.load_iris()
print("✅ 꽃 데이터 꺼냄!")

# 뭐가 들어있나 구경하기
print("\n🔍 들어있는 것들:")
print(f"🌸 꽃 개수: {len(iris.data)}개")
print(f"📏 측정한 부위: {len(iris.feature_names)}개 (꽃잎, 꽃받침 등)")
print(f"🏷️ 꽃 종류: {len(iris.target_names)}개")

print(f"\n📏 어떤 부위를 쟀나?")
for i, feature in enumerate(iris.feature_names):
    print(f"  {i+1}. {feature}")

print(f"\n🏷️ 어떤 꽃 종류가 있나?") 
for i, name in enumerate(iris.target_names):
    print(f"  {i+1}. {name}")

# 실제 데이터 몇 개 보기 (3개 열로 간단하게)
print("\n📋 실제 데이터 5개만 보기:")
simple_df = pd.DataFrame({
    'sepal (length,width)': [f"{row[0]:.1f}, {row[1]:.1f}" for row in iris.data],
    'petal (length,width)': [f"{row[2]:.1f}, {row[3]:.1f}" for row in iris.data],
    '정답': [iris.target_names[i] for i in iris.target]
})
print(simple_df.head())

# 더 자세한 원본 데이터도 보여주기
print("\n📊 자세한 형태로 보기:")
for i in range(5):
    sepal = f"꽃받침: {iris.data[i][0]:.1f}×{iris.data[i][1]:.1f}"
    petal = f"꽃잎: {iris.data[i][2]:.1f}×{iris.data[i][3]:.1f}"
    flower_name = iris.target_names[iris.target[i]]
    print(f"꽃 {i+1}번: {sepal}, {petal} → {flower_name}")

print("\n💡 해석:")
print("- 각 행 = 꽃 1개")  
print("- 각 열 = 측정값 (길이, 너비)")
print("- 마지막 열 = 정답 (어떤 종류인지)")


📦 sklearn 상자에서 아이리스 꽃 데이터 꺼내는 중...
✅ 꽃 데이터 꺼냄!

🔍 들어있는 것들:
🌸 꽃 개수: 150개
📏 측정한 부위: 4개 (꽃잎, 꽃받침 등)
🏷️ 꽃 종류: 3개

📏 어떤 부위를 쟀나?
  1. sepal length (cm)
  2. sepal width (cm)
  3. petal length (cm)
  4. petal width (cm)

🏷️ 어떤 꽃 종류가 있나?
  1. setosa
  2. versicolor
  3. virginica

📋 실제 데이터 5개만 보기:
  sepal (length,width) petal (length,width)      정답
0             5.1, 3.5             1.4, 0.2  setosa
1             4.9, 3.0             1.4, 0.2  setosa
2             4.7, 3.2             1.3, 0.2  setosa
3             4.6, 3.1             1.5, 0.2  setosa
4             5.0, 3.6             1.4, 0.2  setosa

📊 자세한 형태로 보기:
꽃 1번: 꽃받침: 5.1×3.5, 꽃잎: 1.4×0.2 → setosa
꽃 2번: 꽃받침: 4.9×3.0, 꽃잎: 1.4×0.2 → setosa
꽃 3번: 꽃받침: 4.7×3.2, 꽃잎: 1.3×0.2 → setosa
꽃 4번: 꽃받침: 4.6×3.1, 꽃잎: 1.5×0.2 → setosa
꽃 5번: 꽃받침: 5.0×3.6, 꽃잎: 1.4×0.2 → setosa

💡 해석:
- 각 행 = 꽃 1개
- 각 열 = 측정값 (길이, 너비)
- 마지막 열 = 정답 (어떤 종류인지)


## 2단계: AI가 학습할 데이터 준비하기 📚

**AI 학습의 핵심**: AI는 **문제(X)**와 **정답(y)**을 보고 패턴을 찾아요!

**비유하면**: 
- 학생에게 문제집 주는 것과 같아요
- 문제: "이 꽃의 크기는..."  
- 정답: "setosa야!"
- AI: "아하! 이런 크기면 setosa구나!"


In [76]:
# 데이터를 X(문제)와 y(정답)로 나누기
print("📋 데이터 정리하기")
print("="*40)

X = iris.data    # 문제: 꽃의 크기 정보 (꽃잎, 꽃받침 길이/너비)
y = iris.target  # 정답: 꽃의 종류 (0, 1, 2 숫자로 되어있음)

print("✅ X (문제): 꽃의 크기 측정값들")
print(f"   모양: {X.shape} → {X.shape[0]}개 꽃, {X.shape[1]}개 측정값")

print("✅ y (정답): 꽃의 종류") 
print(f"   모양: {y.shape} → {y.shape[0]}개 정답")

print(f"\n🔍 실제로 어떻게 생겼나? (각 종류별 1개씩)")
# 각 꽃 종류별로 1개씩 보여주기
sample_indices = [0, 50, 100]  # setosa, versicolor, virginica 각 1개
for i, idx in enumerate(sample_indices):
    print(f"꽃 {idx+1}번 ({iris.target_names[y[idx]]}):")
    print(f"  크기: {X[idx]} → 정답: {y[idx]} ({iris.target_names[y[idx]]})")

print(f"\n💡 이해했나요?")
print("- X = 시험 문제 (꽃 크기)")  
print("- y = 정답지 (꽃 종류)")
print("- AI는 X를 보고 y를 맞히도록 학습할 거예요!")


📋 데이터 정리하기
✅ X (문제): 꽃의 크기 측정값들
   모양: (150, 4) → 150개 꽃, 4개 측정값
✅ y (정답): 꽃의 종류
   모양: (150,) → 150개 정답

🔍 실제로 어떻게 생겼나? (각 종류별 1개씩)
꽃 1번 (setosa):
  크기: [5.1 3.5 1.4 0.2] → 정답: 0 (setosa)
꽃 51번 (versicolor):
  크기: [7.  3.2 4.7 1.4] → 정답: 1 (versicolor)
꽃 101번 (virginica):
  크기: [6.3 3.3 6.  2.5] → 정답: 2 (virginica)

💡 이해했나요?
- X = 시험 문제 (꽃 크기)
- y = 정답지 (꽃 종류)
- AI는 X를 보고 y를 맞히도록 학습할 거예요!


In [77]:
# 3단계: 학습용/시험용 데이터 나누기
print("✂️ 데이터 나누기")
print("="*40)

# 150개를 공부용 70%, 시험용 30%로 나누기
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

print(f"📚 공부용 데이터: {X_train.shape[0]}개")
print(f"📝 시험용 데이터: {X_test.shape[0]}개")

print(f"\n🤔 왜 나누나요?")
print("- 공부용: AI가 패턴을 배우는 데 사용")
print("- 시험용: AI가 얼마나 잘 배웠는지 테스트 (절대 못 본 새로운 데이터!)")

print(f"\n💡 핵심:")
print("- AI는 105개로만 공부해요")
print("- 45개는 AI가 절대 못 본 새로운 데이터")
print("- 이래야 진짜 실력을 알 수 있어요!")


✂️ 데이터 나누기
📚 공부용 데이터: 105개
📝 시험용 데이터: 45개

🤔 왜 나누나요?
- 공부용: AI가 패턴을 배우는 데 사용
- 시험용: AI가 얼마나 잘 배웠는지 테스트 (절대 못 본 새로운 데이터!)

💡 핵심:
- AI는 105개로만 공부해요
- 45개는 AI가 절대 못 본 새로운 데이터
- 이래야 진짜 실력을 알 수 있어요!


In [78]:
# 4단계: AI 만들고 학습시키기!
print("🤖 AI 로봇 만들기")
print("="*40)

# Decision Tree AI 소환!
print("🌳 Decision Tree AI 소환!")
print("   - 이 AI는 '나무'처럼 질문을 만들어요")
print("   - '꽃잎이 2cm보다 길어?' → Yes/No")
print("   - '꽃받침이 3cm보다 넓어?' → Yes/No")

model = DecisionTreeClassifier(random_state=42)
print("\n✅ AI 로봇 생성 완료!")

print(f"\n📚 이제 105개 꽃으로 학습 시작...")
print("   AI: '음... 꽃잎이 길면 versicolor가 많네?'")
print("   AI: '꽃받침이 좁으면 setosa인 경우가 많구나!'")
print("   AI: '패턴을 찾았다!'")

# 실제 학습 진행!
model.fit(X_train, y_train)
print("\n🎉 학습 완료! AI가 패턴을 익혔어요!")

print(f"\n🧠 AI가 배운 것:")
print("- 어떤 크기 조건이면 어떤 꽃인지의 규칙")
print("- 총 105개 예시로 패턴 학습")
print("- 이제 새로운 꽃도 분류할 수 있어요!")


🤖 AI 로봇 만들기
🌳 Decision Tree AI 소환!
   - 이 AI는 '나무'처럼 질문을 만들어요
   - '꽃잎이 2cm보다 길어?' → Yes/No
   - '꽃받침이 3cm보다 넓어?' → Yes/No

✅ AI 로봇 생성 완료!

📚 이제 105개 꽃으로 학습 시작...
   AI: '음... 꽃잎이 길면 versicolor가 많네?'
   AI: '꽃받침이 좁으면 setosa인 경우가 많구나!'
   AI: '패턴을 찾았다!'

🎉 학습 완료! AI가 패턴을 익혔어요!

🧠 AI가 배운 것:
- 어떤 크기 조건이면 어떤 꽃인지의 규칙
- 총 105개 예시로 패턴 학습
- 이제 새로운 꽃도 분류할 수 있어요!


In [79]:
# 5단계: AI 시험 보기!
print("📝 AI 시험 시간!")
print("="*40)

print("🔮 AI에게 처음 보는 45개 꽃 보여주기...")
print("   AI: '어디보자... 이 꽃은 꽃잎이 얼마나 길지?'")
print("   AI: '음, 학습한 패턴상 이건 versicolor같은데?'")

# AI에게 예측 요청
y_pred = model.predict(X_test)
print("✅ AI가 45개 꽃 모두 예측 완료!")

# 정확도 계산
accuracy = accuracy_score(y_test, y_pred)
correct_count = sum(y_pred == y_test)

print(f"\n🎯 시험 결과:")
print(f"   정답률: {accuracy:.1%}")
print(f"   맞춘 개수: {correct_count}개 / {len(y_test)}개")

# 결과 평가
if accuracy >= 0.9:
    print("🌟 와! AI가 거의 완벽해요!")
elif accuracy >= 0.8:
    print("👍 AI가 꽤 잘하네요!")
else:
    print("🤔 AI가 더 공부가 필요해요!")

print(f"\n💡 이것이 바로 AI예요!")
print("- 꽃 크기 넣으면 → 꽃 종류 나옴")
print("- 새로운 데이터도 패턴으로 예측")
print("- 완벽하지 않지만 대부분 맞춰요!")


📝 AI 시험 시간!
🔮 AI에게 처음 보는 45개 꽃 보여주기...
   AI: '어디보자... 이 꽃은 꽃잎이 얼마나 길지?'
   AI: '음, 학습한 패턴상 이건 versicolor같은데?'
✅ AI가 45개 꽃 모두 예측 완료!

🎯 시험 결과:
   정답률: 100.0%
   맞춘 개수: 45개 / 45개
🌟 와! AI가 거의 완벽해요!

💡 이것이 바로 AI예요!
- 꽃 크기 넣으면 → 꽃 종류 나옴
- 새로운 데이터도 패턴으로 예측
- 완벽하지 않지만 대부분 맞춰요!


In [80]:
# 6단계: 우리가 직접 AI에게 물어보기!
print("🎪 우리가 직접 AI에게 물어보자!")
print("="*50)

print("🌸 가상의 새로운 꽃을 만들어서 AI에게 물어볼게요!")

# 새로운 꽃 데이터 만들기 (가상의 꽃)
new_flowers = [
    [5.1, 3.5, 1.4, 0.2],  # 작은 꽃잎 → setosa 같음
    [6.0, 2.9, 4.5, 1.5],  # 중간 크기 → versicolor 같음  
    [7.2, 3.6, 6.1, 2.5]   # 큰 꽃잎 → virginica 같음
]

flower_descriptions = [
    "작고 둥근 꽃",
    "중간 크기 꽃", 
    "크고 긴 꽃"
]

for i, (flower, desc) in enumerate(zip(new_flowers, flower_descriptions)):
    print(f"\n🌺 {i+1}번째 꽃: {desc}")
    print(f"   크기: {flower}")
    
    # AI에게 예측 요청!
    prediction = model.predict([flower])
    prediction_name = iris.target_names[prediction[0]]
    
    # 확신도도 알아보기
    probabilities = model.predict_proba([flower])
    confidence = max(probabilities[0]) * 100
    
    print(f"   🤖 AI 예측: {prediction_name}")
    print(f"   🎯 확신도: {confidence:.1f}%")

print(f"\n🎉 축하합니다! 첫 AI 완성!")
print("="*50)
print("✅ 꽃 크기 → 꽃 종류 예측 기계 완성")
print("✅ 새로운 꽃도 분류 가능")  
print("✅ 높은 정확도 달성")
print("\n💫 이것이 머신러닝의 기본 원리입니다!")
print("   데이터로 패턴 학습 → 새로운 데이터 예측")


🎪 우리가 직접 AI에게 물어보자!
🌸 가상의 새로운 꽃을 만들어서 AI에게 물어볼게요!

🌺 1번째 꽃: 작고 둥근 꽃
   크기: [5.1, 3.5, 1.4, 0.2]
   🤖 AI 예측: setosa
   🎯 확신도: 100.0%

🌺 2번째 꽃: 중간 크기 꽃
   크기: [6.0, 2.9, 4.5, 1.5]
   🤖 AI 예측: versicolor
   🎯 확신도: 100.0%

🌺 3번째 꽃: 크고 긴 꽃
   크기: [7.2, 3.6, 6.1, 2.5]
   🤖 AI 예측: virginica
   🎯 확신도: 100.0%

🎉 축하합니다! 첫 AI 완성!
✅ 꽃 크기 → 꽃 종류 예측 기계 완성
✅ 새로운 꽃도 분류 가능
✅ 높은 정확도 달성

💫 이것이 머신러닝의 기본 원리입니다!
   데이터로 패턴 학습 → 새로운 데이터 예측


## 🎓 정리: 우리가 방금 만든 AI의 전체 과정

### ✅ AI/머신러닝의 완전한 과정
1. **문제 정의**: 꽃 종류 맞히기
2. **데이터 준비**: X(크기), y(품종) 분리
3. **데이터 분할**: 학습용 105개 / 시험용 45개
4. **모델 선택**: Decision Tree 알고리즘
5. **모델 훈련**: AI가 패턴 학습 (fit 함수)
6. **성능 평가**: 정확도 측정
7. **실제 활용**: 새로운 꽃 분류

### ✅ 핵심 개념들
- **특성(Features)**: 입력 데이터 (꽃 크기)
- **레이블(Labels)**: 정답 (꽃 품종)  
- **훈련(Training)**: AI가 패턴 학습
- **예측(Prediction)**: 새로운 데이터 분류
- **정확도(Accuracy)**: 맞춘 비율

### 🤔 생각해볼 점들
- **왜 데이터를 나누나요?** → 진짜 실력 측정을 위해
- **100% 정확도가 좋은가요?** → 과적합 위험 있음
- **실제 문제도 이렇게 쉬울까요?** → 보통 더 복잡함

### 🚀 다음 단계
- 다른 알고리즘들 (Random Forest, 신경망)
- 회귀 문제 (숫자 예측)
- 실제 복잡한 데이터 다루기

**🎉 축하합니다! 이제 진짜 AI 개발자입니다!** 🤖✨
