In [None]:
# 자유 실험용 환경 설정
import sys
import os
sys.path.append(os.path.abspath('../backend'))

# 기본 패키지
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from typing import Dict, List, Optional, Any
import time
import json

# 실험용 패키지들 (필요시 추가 설치)
experimental_packages = {
    "AI/ML": ["openai", "transformers", "sentence-transformers", "scikit-learn"],
    "Database": ["sqlite3", "psycopg2-binary", "pymongo", "chromadb"],
    "Vector Search": ["faiss-cpu", "pinecone-client", "weaviate-client"],
    "Visualization": ["matplotlib", "seaborn", "plotly", "streamlit"],
    "Performance": ["memory-profiler", "line-profiler", "pytest-benchmark"],
    "Korean NLP": ["konlpy", "kiwipiepy", "soynlp"]
}

print("자유 실험 환경 준비 완료!")
print("\\n사용 가능한 실험 패키지 카테고리:")
for category, packages in experimental_packages.items():
    print(f"- {category}: {', '.join(packages)}")

# 실험 템플릿 클래스
class CustomExperiment:
    """
    사용자 정의 실험 템플릿
    - 새로운 아이디어나 알고리즘을 자유롭게 실험
    - 기존 모듈에 없는 새로운 기능 개발 및 테스트
    - 외부 라이브러리나 API 연동 실험
    """
    
    def __init__(self, experiment_name: str):
        self.experiment_name = experiment_name
        self.results = {}
        self.start_time = None
        
    def start_experiment(self):
        """실험 시작"""
        self.start_time = time.time()
        print(f"실험 '{self.experiment_name}' 시작...")
    
    def end_experiment(self):
        """실험 종료"""
        if self.start_time:
            duration = time.time() - self.start_time
            print(f"실험 '{self.experiment_name}' 완료 (소요시간: {duration:.2f}초)")
            return duration
        return 0
    
    def log_result(self, key: str, value: Any):
        """실험 결과 기록"""
        self.results[key] = value
        print(f"결과 기록: {key} = {value}")

print("\\nCustomExperiment 템플릿 클래스 준비 완료!")


In [None]:
# 실험 예시 1: 한국어 NLP 모델 성능 비교
def experiment_korean_nlp():
    """한국어 NLP 모델들의 성능 비교 실험"""
    exp = CustomExperiment("한국어 NLP 모델 성능 비교")
    exp.start_experiment()
    
    # 테스트 문장들
    test_sentences = [
        "1PE 압력베젤 고장으로 긴급 수리 필요",
        "RFCC 열교환기에서 누설 발견됨",
        "컨베이어 벨트 교체 작업 예정"
    ]
    
    models_to_test = [
        "sentence-transformers/xlm-r-100langs-bert-base-nli-stsb-mean-tokens",
        "jhgan/ko-sroberta-multitask", 
        "snunlp/KR-SBERT-V40K-klueNLI-augSTS"
    ]
    
    for model_name in models_to_test:
        try:
            print(f"\\n테스트 모델: {model_name}")
            # 여기에 모델별 성능 테스트 코드 작성
            # model = SentenceTransformer(model_name)
            # embeddings = model.encode(test_sentences)
            exp.log_result(f"{model_name}_status", "테스트 완료")
        except Exception as e:
            exp.log_result(f"{model_name}_error", str(e))
    
    duration = exp.end_experiment()
    return exp.results

# 실험 예시 2: 성능 벤치마킹
def experiment_performance_benchmark():
    """시스템 성능 벤치마킹 실험"""
    exp = CustomExperiment("성능 벤치마킹")
    exp.start_experiment()
    
    # 다양한 데이터 크기로 성능 측정
    data_sizes = [100, 1000, 10000]
    
    for size in data_sizes:
        print(f"\\n데이터 크기: {size}")
        
        # 가상 데이터 생성
        start_time = time.time()
        dummy_data = [f"테스트 데이터 {i}" for i in range(size)]
        data_creation_time = time.time() - start_time
        
        # 처리 시간 측정
        start_time = time.time()
        processed_data = [item.upper() for item in dummy_data]
        processing_time = time.time() - start_time
        
        exp.log_result(f"size_{size}_creation_time", data_creation_time)
        exp.log_result(f"size_{size}_processing_time", processing_time)
        
        print(f"생성 시간: {data_creation_time:.4f}초")
        print(f"처리 시간: {processing_time:.4f}초")
    
    duration = exp.end_experiment()
    return exp.results

# 실험 예시 3: 새로운 알고리즘 프로토타이핑
def experiment_algorithm_prototype():
    """새로운 알고리즘 프로토타이핑"""
    exp = CustomExperiment("새로운 알고리즘 프로토타이핑")
    exp.start_experiment()
    
    # 예시: 간단한 유사도 계산 알고리즘
    def custom_similarity(text1: str, text2: str) -> float:
        """사용자 정의 유사도 계산 함수"""
        # 간단한 자카드 유사도
        set1 = set(text1.split())
        set2 = set(text2.split())
        
        intersection = len(set1.intersection(set2))
        union = len(set1.union(set2))
        
        return intersection / union if union > 0 else 0.0
    
    # 테스트 케이스
    test_cases = [
        ("압력 베젤 고장", "압력용기 고장"),
        ("모터 밸브 작동불량", "밸브 작동 이상"),
        ("펌프 누설", "탱크 누설")
    ]
    
    for text1, text2 in test_cases:
        similarity = custom_similarity(text1, text2)
        exp.log_result(f"similarity_{text1[:5]}_{text2[:5]}", similarity)
        print(f"'{text1}' vs '{text2}': {similarity:.3f}")
    
    duration = exp.end_experiment()
    return exp.results

print("실험 예시 함수들 준비 완료!")
print("실행하려면: experiment_korean_nlp(), experiment_performance_benchmark(), experiment_algorithm_prototype()")
