# 금융상품 추천 시스템 개발(RandomForest)

---

## 🎯 프로젝트 개요

### 목적
개인의 특성(나이, 소득, 투자성향 등)을 분석하여 적합한 금융상품을 AI로 추천하는 시스템

### 주요 기능
- **다중 라벨 분류**: 사용자에게 여러 금융상품 동시 추천
- **실제 상품 연동**: 금융감독원 API 데이터와 연결된 실제 상품 정보
- **대화형 입력**: 사용자 친화적인 정보 입력 인터페이스
- **카테고리별 추천**: 예금, 적금, 대출 등 특정 상품군 맞춤 추천

### 사용 기술
- **머신러닝**: RandomForest + MultiOutputClassifier
- **데이터**: 금융감독원 금융상품 통합 비교공시 API
- **평가 지표**: Accuracy, Precision, Recall, F1-Score

---

## 🏗️ 시스템 아키텍처
```
[사용자 입력] → [AI 모델 예측] → [상품 매칭] → [추천 결과]
↓              ↓              ↓            ↓
16개 특성      5개 라벨 확률    JSON 상품DB    맞춤형 추천
11
```

### 데이터 흐름
1. **입력**: 사용자의 16개 특성 (나이, 소득, 위험성향 등)
2. **예측**: AI 모델이 5개 금융상품 보유 확률 계산
3. **매칭**: 높은 확률의 카테고리에서 실제 상품 검색
4. **출력**: 금리, 은행명, 가입방법 등 상세 추천


### JSON 매칭 과정 설명

1.  AI 모델이 예측하는 것
AI 모델은 사용자 정보를 보고 **"이 사람이 어떤 금융상품을 보유할 확률"**을 예측합니다.
```
사용자 입력 → AI 모델 → 예측 결과
30세, 5000만원 소득... → 분석 → LIQ: 85%, STOCKS: 20%, CDS: 5%...
```
2.  예측 결과를 상품 카테고리로 변환
AI가 예측한 **라벨(LIQ, STOCKS 등)**을 실제 JSON 파일명으로 연결합니다.
```
pythonLABEL_TO_CATEGORY = {
    'LIQ': 'bank_deposits',      # 유동성자산 → 예금상품 JSON
    'CDS': 'bank_deposits',      # 양도성예금증서 → 예금상품 JSON  
    'NMMF': 'bank_savings',      # 비머니마켓펀드 → 적금상품 JSON
    'STOCKS': 'credit_loans',    # 주식보유 → 신용대출 JSON (투자자금)
    'RETQLIQ': 'bank_savings'    # 퇴직준비금 → 적금상품 JSON
}
예시: AI가 "LIQ 85% 확률"이라고 예측하면 → bank_deposits.json 파일을 열어봅니다.
```
3.  JSON에서 실제 상품 찾기
```
해당 JSON 파일을 열어서 금리가 높은 순서로 실제 상품들을 찾습니다.
bank_deposits.json 열기 → 모든 예금상품 리스트 → 금리 높은 순 정렬 → 상위 3개 선택
```
4.  사용자에게 보여주기
```
AI 예측 + 실제 상품 정보를 합쳐서 사용자에게 추천합니다.
최종 결과:
📂 유동성자산 (85% 확률) ✅ 추천
  1. Sh첫만남우대예금 (수협은행, 2.90%)
  2. NH고향사랑기부예금 (농협은행, 2.80%)
```

### 전체 흐름 요약
```
사용자 입력 → 나이, 소득 등
AI 예측 → LIQ 85%, STOCKS 20% 등
매핑 테이블 → LIQ = bank_deposits.json
JSON 검색 → 예금상품들 중 금리 높은 것들
최종 추천 → 구체적인 은행 상품명과 금리

핵심은 AI가 "어떤 종류의 상품이 적합한지" 예측하면, 그 종류에 해당하는 실제 상품들을 JSON에서 찾아서 보여주는 것입니다! 🎯
```


## 💻 코드 구조 및 설명

### 1. 환경 설정 및 라이브러리
**설명**: 데이터 처리, 머신러닝 모델, 성능 평가에 필요한 라이브러리들을 불러옵니다.

In [1]:
#1: 라이브러리 import
import pandas as pd
import numpy as np
import json
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.multioutput import MultiOutputClassifier
from sklearn.metrics import classification_report, precision_score, recall_score, f1_score, accuracy_score


### 2. 상품 카테고리 정의
**설명**: 
- AI 모델의 예측 라벨과 실제 상품 카테고리를 연결하는 매핑 테이블
- JSON 파일 경로와 상품 설명 정의

In [2]:
# 2: 상품 카테고리 정의
PRODUCT_CATEGORIES = {
    'bank_deposits': {
        'name': '예금상품', 
        'file': '../1.데이터수집/data/bank_deposits.json',
        'description': '정기예금, 자유적금 등'
    },
    'bank_savings': {
        'name': '적금상품', 
        'file': '../1.데이터수집/data/bank_savings.json',
        'description': '정기적금, 자유적금 등'
    },
    'credit_loans': {
        'name': '개인신용대출', 
        'file': '../1.데이터수집/data/credit_loans.json',
        'description': '신용대출, 마이너스통장 등'
    },
    'mortgage_loans': {
        'name': '주택담보대출', 
        'file': '../1.데이터수집/data/mortgage_loans.json',
        'description': '주택구입자금, 주택개량자금 등'
    },
    'rent_loans': {
        'name': '전세자금대출', 
        'file': '../1.데이터수집/data/rent_loans.json',
        'description': '전세자금, 보증금 대출 등'
    }
}

# 모델 라벨과 상품 카테고리 매핑
LABEL_TO_CATEGORY = {
    'MMMF': 'bank_deposits',      # 유동성자산 → 예금
    'CDS': 'bank_deposits',      # 양도성예금증서 → 예금  
    'NMMF': 'bank_savings',      # 비머니마켓펀드 → 적금
    'STOCKS': 'credit_loans',    # 주식보유 → 신용대출 (투자자금)
    'RETQLIQ': 'bank_savings'    # 퇴직준비금유동성 → 적금
}

target_names = {
    'MMMF': '단기금융상품펀드',
    'CDS': '양도성예금증서', 
    'NMMF': '비머니마켓펀드',
    'STOCKS': '주식보유',
    'RETQLIQ': '퇴직준비금유동성'
}

### 3. AI 모델 훈련 
**주요 특징**:
- **RandomForest**: 여러 의사결정트리의 앙상블로 과적합 방지
- **MultiOutputClassifier**: 5개 상품을 동시에 예측하는 다중 라벨 분류
- **class_weight='balanced'**: 데이터 불균형 문제 자동 해결

#### 📊 성능 평가

##### 평가 지표 해석

**1. 정확도 (Accuracy)**
- **의미**: 전체 예측 중 맞춘 비율
- **목표**: 60-75% (금융 추천에서는 양호)
- **해석**: 70% = 10명 중 7명에게 정확한 추천

**2. 정밀도 (Precision)**
- **의미**: 추천한 상품 중 실제로 적합한 비율
- **목표**: 80% 이상
- **해석**: 80% = 추천 상품 10개 중 8개가 정확

**3. 재현율 (Recall)**
- **의미**: 실제 적합한 상품 중 놓치지 않고 찾아낸 비율
- **목표**: 70% 이상
- **해석**: 70% = 적합한 상품 10개 중 7개 추천

**4. F1 점수**
- **의미**: 정밀도와 재현율의 조화평균
- **목표**: 75% 이상
- **해석**: 균형잡힌 성능 지표


### 🌲 RandomForest 파라미터

- **`n_estimators=800`** : 22K 데이터에 최적화된 트리 개수로 강력한 앙상블 효과
- **`max_depth=20`** : 14개 특성의 복잡한 상호작용 학습 + 과적합 방지 균형점  
- **`min_samples_split=15`** : 전체 데이터의 0.065%로 통계적 유의성 확보
- **`min_samples_leaf=5`** : 잎 노드 신뢰성 확보 + 과적합 방지
- **`max_features='sqrt'`** : 14개 중 4개 특성 선택으로 트리 다양성 극대화
- **`class_weight='balanced'`** : 5개 타겟별 클래스 불균형 자동 보정

In [7]:
# 3: 머신러닝 모델 훈련

print("-- 랜덤포레스트 모델 훈련 시작...--")

# 데이터 로드
df = pd.read_csv('../2.전처리/data/SCFP/cleaned_scf_data.csv')
X = df.iloc[:,:-5]  # 14개 독립변수
y = df.iloc[:,-5:]  # 5개 타겟변수

print(f"데이터 크기: {X.shape[0]:,}명, 특성: {X.shape[1]}개, 타겟: {y.shape[1]}개")

# 데이터 분할
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.2, random_state=42)

# 다중라벨 랜덤포레스트 모델
base_model = RandomForestClassifier(
     n_estimators=800,
    max_depth=20,
    min_samples_split=15,
    min_samples_leaf=5,
    class_weight='balanced',
    max_features='sqrt',    # 특성 선택 최적화
    random_state=42,
    n_jobs=-1              # 병렬 처리
)

multilabel_model = MultiOutputClassifier(base_model)
multilabel_model.fit(train_X, train_y)

# 모델 성능 평가
test_pred = multilabel_model.predict(test_X)

# 전체 성능 지표
accuracy = accuracy_score(test_y, test_pred)
precision = precision_score(test_y, test_pred, average='samples')
recall = recall_score(test_y, test_pred, average='samples')
f1 = f1_score(test_y, test_pred, average='samples')

print("★ 랜덤포레스트 모델 훈련 완료!")
print("\n★ 전체 모델 성능")
print("=" * 40)
print(f"정확도 (Accuracy):  {accuracy:.3f}")
print(f"정밀도 (Precision): {precision:.3f}")
print(f"재현율 (Recall):    {recall:.3f}")
print(f"F1 점수:           {f1:.3f}")

# 개별 상품별 성능
print("\n★ 상품별 성능 지표")
print("=" * 40)

target_names_list = ['단기금융상품펀드', '양도성예금증서', '비머니마켓펀드', '주식보유', '퇴직준비금유동성']

for i, name in enumerate(target_names_list):
    y_true_i = test_y.iloc[:, i]
    y_pred_i = test_pred[:, i]
    
    acc_i = accuracy_score(y_true_i, y_pred_i)
    prec_i = precision_score(y_true_i, y_pred_i, zero_division=0)
    rec_i = recall_score(y_true_i, y_pred_i, zero_division=0)
    f1_i = f1_score(y_true_i, y_pred_i, zero_division=0)
    
    print(f"\n● {name}")
    print(f"   정확도: {acc_i:.3f} | 정밀도: {prec_i:.3f} | 재현율: {rec_i:.3f} | F1: {f1_i:.3f}")

# 성능 해석
print("\n★ 성능 해석")
print("=" * 40)
if accuracy >= 0.7:
    print("★ 우수한 전체 정확도!")
elif accuracy >= 0.6:
    print("◎ 양호한 전체 정확도")
else:
    print("※ 정확도 개선 필요")

if precision >= 0.8:
    print("★ 높은 정밀도 - 추천 신뢰성 우수!")
elif precision >= 0.7:
    print("◎ 양호한 정밀도")
else:
    print("※ 정밀도 개선 필요 - 잘못된 추천 많음")

if recall >= 0.7:
    print("★ 높은 재현율 - 놓치는 상품 적음!")
elif recall >= 0.6:
    print("◎ 양호한 재현율")
else:
    print("※ 재현율 개선 필요 - 놓치는 상품 많음")

-- 랜덤포레스트 모델 훈련 시작...--
데이터 크기: 22,975명, 특성: 14개, 타겟: 5개
★ 랜덤포레스트 모델 훈련 완료!

★ 전체 모델 성능
정확도 (Accuracy):  0.789
정밀도 (Precision): 0.569
재현율 (Recall):    0.612
F1 점수:           0.580

★ 상품별 성능 지표

● 단기금융상품펀드
   정확도: 0.986 | 정밀도: 0.783 | 재현율: 0.917 | F1: 0.845

● 양도성예금증서
   정확도: 0.976 | 정밀도: 0.779 | 재현율: 0.978 | F1: 0.867

● 비머니마켓펀드
   정확도: 0.938 | 정밀도: 0.779 | 재현율: 0.959 | F1: 0.860

● 주식보유
   정확도: 0.922 | 정밀도: 0.816 | 재현율: 0.947 | F1: 0.877

● 퇴직준비금유동성
   정확도: 0.927 | 정밀도: 0.944 | 재현율: 0.932 | F1: 0.938

★ 성능 해석
★ 우수한 전체 정확도!
※ 정밀도 개선 필요 - 잘못된 추천 많음
◎ 양호한 재현율


  _warn_prf(average, modifier, f"{metric.capitalize()} is", result.shape[0])
  _warn_prf(average, modifier, f"{metric.capitalize()} is", result.shape[0])
  _warn_prf(average, modifier, f"{metric.capitalize()} is", result.shape[0])


In [None]:
# 모델 저장
import joblib
joblib.dump(multilabel_model, 'Models/RandomForest.joblib')

['Models/RandomForest.joblib']

### 4, 5. 상품 데이터 처리 
**핵심 로직**:
- 실제 금융감독원 API 데이터에서 상품 정보 추출
- 금리, 은행명, 가입방법 등 상세 정보 파싱
- 예금/적금은 금리 높은 순, 대출은 금리 낮은 순 정렬

In [5]:
# 4: 특정 카테고리 상품 로드 함수
def load_specific_products(category):
    """특정 카테고리의 상품만 로드"""
    if category not in PRODUCT_CATEGORIES:
        return None
    
    try:
        file_path = PRODUCT_CATEGORIES[category]['file']
        with open(file_path, 'r', encoding='utf-8') as f:
            data = json.load(f)
        
        print(f"★ {PRODUCT_CATEGORIES[category]['name']} 데이터 로드 성공!")
        return data
    except FileNotFoundError:
        print(f"※  {category} 파일을 찾을 수 없습니다.")
        return None
    except Exception as e:
        print(f"※  {category} 로드 오류: {e}")
        return None

In [6]:
# 5: 카테고리별 상품 추출 함수
def get_products_from_category(data, top_n=5):
    """카테고리별 상품 추출"""
    try:
        # JSON 구조에 따라 경로 조정
        if 'result' in data:
            products = data['result']['baseList']
            options = data['result']['optionList']
        else:
            # financial_data.json 구조인 경우
            products = data['products'][list(data['products'].keys())[0]]['result']['baseList']
            options = data['products'][list(data['products'].keys())[0]]['result']['optionList']
        
        # 상품별 최고 금리/최저 금리 계산
        product_rates = {}
        for option in options:
            product_id = option['fin_prdt_cd']
            
            # 예금/적금은 최고금리, 대출은 최저금리
            if 'loan' in data.get('data_source', '').lower():
                rate = option.get('lend_rate_min', option.get('lend_rate_avg', 0))
                rate_type = '최저금리'
            else:
                rate = option.get('intr_rate2', option.get('intr_rate', 0))
                rate_type = '최고금리'
            
            if product_id not in product_rates or rate > product_rates[product_id]['rate']:
                product_rates[product_id] = {'rate': rate, 'type': rate_type}
        
        # 상품 정보와 금리 매칭
        enriched_products = []
        for product in products:
            product_id = product['fin_prdt_cd']
            if product_id in product_rates:
                enriched_products.append({
                    'id': product_id,
                    'name': product['fin_prdt_nm'],
                    'bank': product['kor_co_nm'],
                    'rate': product_rates[product_id]['rate'],
                    'rate_type': product_rates[product_id]['type'],
                    'join_way': product.get('join_way', '영업점'),
                    'features': product.get('spcl_cnd', ''),
                    'max_limit': product.get('max_limit'),
                    'etc_note': product.get('etc_note', '')
                })
        
        # 예금/적금은 금리 높은 순, 대출은 금리 낮은 순 정렬
        reverse_sort = 'loan' not in data.get('data_source', '').lower()
        return sorted(enriched_products, key=lambda x: x['rate'], reverse=reverse_sort)[:top_n]
        
    except Exception as e:
        print(f"상품 처리 오류: {e}")
        return []

### 6. 사용자 입력 인터페이스
**입력 항목 (16개)**:
1. **인적사항**: 나이, 성별, 가족 수, 결혼 여부
2. **경제상황**: 소득, 자산, 부채
3. **직업/교육**: 직업 코드, 교육 수준
4. **투자성향**: 위험 성향, 투자 경험, 금융 지식
5. **기타**: 거주지역, 기존 상품 보유 등

In [7]:
# 6: 대화형 사용자 입력 함수
def get_user_input():
    """원본 데이터 컬럼에 맞는 사용자 정보 입력"""
    print(" 금융상품 추천을 위한 정보를 입력해주세요")
    print("=" * 50)
    
    try:
        # 1. 연령대분류 (자동 계산)
        age = int(input("● 나이: "))
        if age < 30: age_group = 1
        elif age < 40: age_group = 2  
        elif age < 50: age_group = 3
        elif age < 60: age_group = 4
        else: age_group = 5
        
        # 2. 교육수준분류
        print("\n● 교육 수준:")
        print("1. 고등학교 이하 2: 고등학교 졸업  3: 대학교 졸업  4: 대학교 졸업 이상")
        education_level_class = int(input("교육수준분류: "))
        
        # 3-4. 소득 관련
        business_income = int(input("● 사업/농업 소득 (만원, 없으면 0): "))
        capital_income = int(input("● 투자 수익 (만원, 없으면 0): "))
        
        # 5. 연령 (위에서 입력받음)
        
        # 6. 총소득
        
        #total_income = salary_income + business_income + capital_income
        #print(f"● 총소득: {total_income:,}만원")
        
        # 7. 금융위험감수
        print("\n● 투자(위험 감수) 성향:")
        print("1: 매우 안전하게 (원금 보장)  2: 안전하게  3: 보통  4: 적극적으로  5: 매우 적극적으로")
        risk_tolerance = int(input("투자 성향: "))
        
        # 8. 저축여부
        saving_status = int(input("● 저축 여부 (1:하고있음, 0:안함): "))
        
        # 9. 급여소득 (위에서 입력받음)
        salary_income = int(input("● 급여 소득 (만원): "))
        
        # 10. 금융위험회피
        risk_aversion = 6 - risk_tolerance  # 위험감수의 반대
        
        # 11. 교육수준 (교육수준분류와 동일)
        education_level = education_level_class
        
        # 12. 가구주성별
        gender = int(input("● 성별 (1:남성, 0:여성): "))
        
        # 13. 결혼상태
        marriage_status = int(input("● 결혼상태 (1:기혼, 0:미혼): "))
        
        # 14. 자녀수
        children_count = int(input("● 자녀수: "))
        
        # 15. 직업분류1
        print("\n● 직업 분류:")
        print("1: 관리자  2: 전문가  3: 사무종사자  4: 서비스업  5: 기타")
        occupation = int(input("직업분류: "))
        
        # 16. 총자산
        #total_assets = int(input("● 총자산 (만원): "))
        
        # 원본 데이터 순서대로 16개 특성 구성
        user_features = [
            age_group,              # 연령대분류
            education_level_class,  # 교육수준분류  
            business_income,        # 사업농업소득
            capital_income,         # 자본이득소득
            age,                    # 연령
            #total_income,           # 총소득
            risk_tolerance,         # 금융위험감수
            saving_status,          # 저축여부
            salary_income,          # 급여소득
            risk_aversion,          # 금융위험회피
            education_level,        # 교육수준
            gender,                 # 가구주성별
            marriage_status,        # 결혼상태
            children_count,         # 자녀수
            occupation,             # 직업분류1
            #total_assets            # 총자산
        ]
        
        print("\n★ 사용자 정보 입력 완료!")
        print(f" 총 {len(user_features)}개 특성 수집됨")
        
        return np.array(user_features)
        
    except ValueError:
        print("※ 숫자만 입력해주세요!")
        return None
    except KeyboardInterrupt:
        print("\n※ 입력이 취소되었습니다.")
        return None

### 7. AI 기반 종합 추천
**추천 과정**:
1. **AI 예측**: 사용자 특성 → 각 상품 보유 확률
2. **필터링**: 임계값(30%) 이상인 상품만 선별
3. **매칭**: 해당 카테고리의 실제 상품 검색
4. **정렬**: 금리/조건 우선순위로 정렬

In [8]:
# 7: AI 기반 맞춤 추천 함수
def ai_recommend_products(user_features, threshold=0.3, top_n=3):
    """AI 모델 기반 맞춤형 금융상품 추천"""
    
    print(" AI 분석 중...")
    print("=" * 50)
    
    # 사용자 특성을 모델 입력 형태로 변환
    user_input = user_features.reshape(1, -1)
    
    # 모델 예측: 각 상품 카테고리별 보유 확률
    probabilities = multilabel_model.predict_proba(user_input)
    
    # 예측 결과 분석
    print(" AI 예측 결과:")
    recommendations = []
    
    for i, (label, name) in enumerate(target_names.items()):
        prob = probabilities[i][0][1]  # 보유할 확률
        
        recommendation = {
            'label': label,
            'name': name,
            'probability': prob,
            'recommended': prob >= threshold,
            'category': LABEL_TO_CATEGORY[label]
        }
        recommendations.append(recommendation)
        
        status = "★ 추천" if prob >= threshold else "※ 비추천"
        print(f"  {name}: {prob:.3f} {status}")
    
    # 확률 순으로 정렬
    recommendations.sort(key=lambda x: x['probability'], reverse=True)
    
    # 추천된 카테고리의 실제 상품 가져오기
    print(f"\n 맞춤 상품 추천 (임계값: {threshold})")
    print("=" * 50)
    
    recommended_products = {}
    for rec in recommendations:
        if rec['recommended']:
            print(f"\n {rec['name']} (확률: {rec['probability']:.3f})")
            
            # 해당 카테고리의 실제 상품 로드
            category = rec['category']
            data = load_specific_products(category)
            
            if data:
                products = get_products_from_category(data, top_n)
                recommended_products[rec['name']] = products
                
                # 상품 출력
                for i, product in enumerate(products, 1):
                    print(f"  {i}. {product['name']}")
                    print(f"       {product['bank']} |   {product['rate']:.2f}%")
                    print(f"       {product['join_way']}")
            else:
                print(f"        {PRODUCT_CATEGORIES[category]['name']} 데이터를 찾을 수 없습니다.")
    
    if not any(rec['recommended'] for rec in recommendations):
        print("※ 추천 임계값을 넘는 상품이 없습니다.")
        print("※ 임계값을 낮춰보거나 다른 정보를 입력해보세요.")
    
    return recommendations, recommended_products

### 8. 카테고리별 맞춤 추천
**특징**:
- 사용자가 원하는 특정 상품군만 추천
- AI 적합도 분석으로 추천 신뢰도 제공
- 예: "예금상품만 보고 싶어요" → 예금 전용 추천

In [9]:
# 8: 특정 카테고리 직접 추천 함수
def recommend_by_category(user_features, category, top_n=5):
    """특정 카테고리 상품 직접 추천 (AI 예측 + 실제 상품)"""
    
    print(f"● {PRODUCT_CATEGORIES[category]['name']} 추천")
    print(f"● {PRODUCT_CATEGORIES[category]['description']}")
    print("=" * 50)
    
    # AI 모델로 해당 카테고리 적합도 예측
    user_input = user_features.reshape(1, -1)
    probabilities = multilabel_model.predict_proba(user_input)
    
    # 카테고리에 해당하는 라벨 찾기
    category_labels = [label for label, cat in LABEL_TO_CATEGORY.items() if cat == category]
    
    if category_labels:
        # 해당 카테고리의 평균 추천 확률 계산
        label_indices = [list(target_names.keys()).index(label) for label in category_labels]
        avg_prob = np.mean([probabilities[i][0][1] for i in label_indices])
        
        print(f" AI 적합도 분석: {avg_prob:.3f}")
        if avg_prob >= 0.3:
            print("★ 높은 적합도 - 강력 추천!")
        elif avg_prob >= 0.1:
            print("※ 보통 적합도 - 검토 추천")
        else:
            print("※ 낮은 적합도 - 신중한 검토 필요")
    
    # 사용자 프로필 표시
    print(f"\n💡 사용자 프로필")
    print(f"나이: {user_features[4]}세, 소득: {user_features[7]:,}만원")  
    print(f"위험성향: {'안전형' if user_features[9]==1 else '중간형' if user_features[9]==2 else '적극형'}")
    
    # 실제 상품 로드
    data = load_specific_products(category)
    if not data:
        return []
    
    products = get_products_from_category(data, top_n)
    
    if not products:
        print("※  추천할 상품이 없습니다.")
        return []
    
    # 상품 출력
    print(f"\n🏆 AI 추천 {PRODUCT_CATEGORIES[category]['name']} TOP {len(products)}")
    print("=" * 50)
    
    for i, product in enumerate(products, 1):
        print(f"\n{i}. {product['name']}")
        print(f"     {product['bank']}")
        print(f"     {product['rate_type']}: {product['rate']:.2f}%")
        print(f"     가입방법: {product['join_way']}")
        
        if product['features'] and product['features'] != '해당사항 없음':
            print(f"   ★ 특징: {product['features'][:100]}...")
        
        if product['max_limit']:
            if product['max_limit'] >= 100000000:
                limit = product['max_limit'] / 100000000
                unit = '억원'
            else:
                limit = product['max_limit'] / 10000
                unit = '만원'
            print(f"    한도: {limit:,.0f}{unit}")
    
    return products

## 🚀 실행 방법

### 단계별 실행 가이드

**1단계: 환경 준비**
1. 주피터 노트북 실행
2. 필요한 라이브러리 설치: `pip install scikit-learn pandas numpy`
3. 데이터 파일 경로 확인

**2단계: 모델 훈련**
- 셀 1-3 순서대로 실행
- AI 모델 훈련 완료 및 성능 확인

**3단계: 사용자 정보 입력**
- 셀 9 실행 → 대화형 입력 인터페이스
- 나이, 소득, 투자성향 등 16개 항목 입력

**4단계: 추천 받기**
- 옵션 A: 셀 10 - AI 종합 추천 (모든 상품군)
- 옵션 B: 셀 11 - 예금상품만 추천
- 옵션 C: 셀 12-13 - 기타 상품군 추천

### 입력 예시
```
📅 나이: 30
👤 성별 (1:남성, 0:여성): 1
💰 연소득 (만원 단위): 5000
👨‍👩‍👧‍👦 가족 수: 2
💒 결혼 여부 (1:기혼, 0:미혼): 1
⚖️ 위험 성향 (1:안전형, 2:중간형, 3:적극형): 2
```

In [10]:
# 9: 사용자 정보 입력받기
print("AI 기반 금융상품 추천 시스템을 시작합니다!")
print("\n")

user_data = get_user_input()

if user_data is not None:
    print("\n★ 사용자 데이터 준비 완료!")
    print(f"입력된 특성: {user_data}")
else:
    print("※ 사용자 데이터 입력에 실패했습니다.")

AI 기반 금융상품 추천 시스템을 시작합니다!


 금융상품 추천을 위한 정보를 입력해주세요

● 교육 수준:
1. 고등학교 이하 2: 고등학교 졸업  3: 대학교 졸업  4: 대학교 졸업 이상

● 투자(위험 감수) 성향:
1: 매우 안전하게 (원금 보장)  2: 안전하게  3: 보통  4: 적극적으로  5: 매우 적극적으로

● 직업 분류:
1: 관리자  2: 전문가  3: 사무종사자  4: 서비스업  5: 기타

★ 사용자 정보 입력 완료!
 총 14개 특성 수집됨

★ 사용자 데이터 준비 완료!
입력된 특성: [   1    2    0    0   20    1    0 3000    5    2    0    1    0    1]


In [11]:
# 10: AI 맞춤형 전체 추천 실행
if user_data is not None:
    print("\n" + "="*60)
    print("★ AI 기반 종합 맞춤 추천")
    print("="*60)
    
    recommendations, products = ai_recommend_products(user_data, threshold=0.3, top_n=3)


★ AI 기반 종합 맞춤 추천
 AI 분석 중...




 AI 예측 결과:
  단기금융상품펀드: 0.004 ※ 비추천
  양도성예금증서: 0.000 ※ 비추천
  비머니마켓펀드: 0.018 ※ 비추천
  주식보유: 0.008 ※ 비추천
  퇴직준비금유동성: 0.047 ※ 비추천

 맞춤 상품 추천 (임계값: 0.3)
※ 추천 임계값을 넘는 상품이 없습니다.
※ 임계값을 낮춰보거나 다른 정보를 입력해보세요.


In [12]:
# 11: 예금상품 전용 AI 추천
if user_data is not None:
    print("\n" + "="*60)
    deposits = recommend_by_category(user_data, 'bank_deposits', top_n=3)


● 예금상품 추천
● 정기예금, 자유적금 등




 AI 적합도 분석: 0.002
※ 낮은 적합도 - 신중한 검토 필요

💡 사용자 프로필
나이: 20세, 소득: 3,000만원
위험성향: 중간형
★ 예금상품 데이터 로드 성공!

🏆 AI 추천 예금상품 TOP 3

1. Sh첫만남우대예금
     수협은행
     최고금리: 2.90%
     가입방법: 인터넷,스마트폰
   ★ 특징: * 최대우대금리:1.05%
1. 첫거래우대 : 1.0% (신규시) 
  - 최근 1년간 수협은행 예적금 활동계좌 미보유 고객포함
2. 마케팅전체동의 : 0.05%(신규시) 
3. ...
    한도: 1,000만원

2. NH고향사랑기부예금
     농협은행주식회사
     최고금리: 2.80%
     가입방법: 영업점,인터넷,스마트폰
   ★ 특징: 1. 고향사랑기부금 납부고객 우대 : 0.5%p

2-1. 만65세 이상 고령자 우대 : 0.1%p
2-2. 만 19~34세 MZ고객 우대 : 0.1%p

3. 고향사랑 특별금리 ...

3. e-그린세이브예금
     한국스탠다드차타드은행
     최고금리: 2.75%
     가입방법: 인터넷,스마트폰
   ★ 특징: 1.SC제일은행 최초 거래 신규고객에 대하여 우대 이율을 제공함 (보너스이율0.2%)                     2.SC제일마이백통장에서 출금하여 이 예금을 신규하는경우에...
    한도: 10억원




In [13]:
# 12: 적금상품 전용 AI 추천 (파일이 있다면)
if user_data is not None:
    print("\n" + "="*60)
    savings = recommend_by_category(user_data, 'bank_savings', top_n=3)


● 적금상품 추천
● 정기적금, 자유적금 등




 AI 적합도 분석: 0.033
※ 낮은 적합도 - 신중한 검토 필요

💡 사용자 프로필
나이: 20세, 소득: 3,000만원
위험성향: 중간형
★ 적금상품 데이터 로드 성공!

🏆 AI 추천 적금상품 TOP 3

1. 궁금한 적금
     주식회사 케이뱅크
     최고금리: 6.70%
     가입방법: 스마트폰
   ★ 특징: 입금할 때마다 우대금리를 랜덤으로 제공하며, 입금 시 제공되는 우대금리를 누적으로 합산하여 만기 해지 시 적용 (최고 연 6.0%)...

2. KB 특★한 적금
     국민은행
     최고금리: 6.00%
     가입방법: 스마트폰
   ★ 특징: 항목별 적용 조건 충족시, 최고 연 4.0%p
① 목표달성 축하 우대이율: 최고 연 1.0%p
    50만원 이하: 연 0.5%p, 50만원 초과: 연 1.0%p 
② 별 모으기...

3. 카카오뱅크 한달적금
     주식회사 카카오뱅크
     최고금리: 6.00%
     가입방법: 스마트폰
   ★ 특징: 매일/보너스 우대금리 제공 : 최고 연 5.50%p
- 제공조건
① 매일 우대금리 : 매 입금 시 마다 연 0.10%p 제공(최대 연 3.10%p)
② 보너스 우대금리 : 누적하여...




In [14]:
# 셀 13: 대출상품 전용 AI 추천 (파일이 있다면)
if user_data is not None:
    print("\n" + "="*60)
    loans = recommend_by_category(user_data, 'credit_loans', top_n=3)




● 개인신용대출 추천
● 신용대출, 마이너스통장 등




 AI 적합도 분석: 0.008
※ 낮은 적합도 - 신중한 검토 필요

💡 사용자 프로필
나이: 20세, 소득: 3,000만원
위험성향: 중간형
★ 개인신용대출 데이터 로드 성공!

🏆 AI 추천 개인신용대출 TOP 3

1. 개인신용대출 우대고객
     우리은행
     최고금리: 0.00%
     가입방법: 영업점,인터넷,스마트폰

2. 개인신용대출 퍼펙트
     우리은행
     최고금리: 0.00%
     가입방법: 영업점,인터넷,스마트폰

3. 개인신용대출
     한국스탠다드차타드은행
     최고금리: 0.00%
     가입방법: 영업점,스마트폰


## 💼 활용 방안

### 실무 적용 시나리오

**1. 은행 지점 상담**
- 고객 정보 입력 → AI 추천 → 상담사 설명 → 상품 가입
- 상담 시간 단축 (30분 → 10분)
- 개인화된 추천으로 만족도 향상
- 상담사의 전문성 보완

**2. 모바일 뱅킹 앱**
- 간단한 설문 → 즉시 추천 → 앱 내 바로 가입
- 24시간 서비스 가능
- 사용자 편의성 극대화
- 디지털 전환 가속화

**3. 금융 플랫폼**
- 통합 금융상품 비교 → AI 맞춤 추천 → 최적 상품 선택
- 여러 금융사 상품 통합 비교
- 객관적인 추천 알고리즘
- 수수료 투명성

### 확장 가능성

**1. 추가 데이터 연동**
- 보험상품, 투자상품, 카드상품
- 실시간 금리 정보
- 고객 거래 이력 데이터

**2. 고도화 방향**
- 딥러닝 모델 적용 (신경망, LSTM)
- 강화학습 기반 개인화
- 자연어 처리 기반 상담 챗봇

**3. 비즈니스 모델**
- 금융사 라이선스 제공
- API 서비스 판매
- 추천 성과 기반 수수료

---

## 📝 결론

본 시스템은 **AI 기술과 실제 금융상품 데이터를 결합**하여 개인 맞춤형 추천을 제공하는 실용적인 솔루션입니다.

### 핵심 성과
- ✅ **실용성**: 실제 상품 데이터 연동으로 바로 활용 가능
- ✅ **정확성**: 70% 이상의 추천 정확도
- ✅ **사용성**: 직관적인 대화형 인터페이스
- ✅ **확장성**: 다양한 금융상품으로 확장 가능

### 차별화 요소
1. **다중 라벨 분류**로 여러 상품 동시 추천
2. **실시간 상품 정보** 연동
3. **투명한 AI 예측** 과정 공개
4. **카테고리별 맞춤** 추천 기능

이 시스템을 통해 금융업계의 **디지털 전환과 고객 만족도 향상**에 기여할 수 있을 것으로 기대됩니다.