# CsPbCl3 QD 특성 예측 프로젝트 계획

## 📋 프로젝트 개요
- **목적**: 문헌 데이터 기반 CsPbCl3 양자점 특성 예측 ML 모델 개발
- **최종 목표**: 학술 논문 작성

## 🎯 연구 질문

### 예측 목표 (Target Variables)
다음 중 어떤 특성을 예측하고 싶으신가요?

1. **광학적 특성**
   - PL 피크 위치 (nm)
   - Photoluminescence Quantum Yield (PLQY, %)
   - Full Width at Half Maximum (FWHM, nm)
   - Absorption 피크

2. **물리적 특성**
   - 양자점 크기 (nm)
   - 형태 (cubic, spherical 등)
   - 안정성 (시간에 따른 PL 유지율)

3. **합성 최적화**
   - 최적 합성 조건 예측
   - 수율 예측

## 📊 데이터 수집 계획

### Feature Variables (입력 변수)

#### 1. 합성 조건
```python
synthesis_conditions = {
    'temperature': [],          # 합성 온도 (°C)
    'reaction_time': [],        # 반응 시간 (min, hr)
    'precursor_ratio': [],      # Cs:Pb:Cl 비율
    'ligand_type': [],          # 리간드 종류 (OA, OAm 등)
    'ligand_concentration': [], # 리간드 농도
    'solvent': [],              # 용매 종류
    'injection_rate': [],       # 주입 속도
}
```

#### 2. 전구체 정보
```python
precursor_info = {
    'cs_source': [],      # Cs 전구체 (Cs2CO3, CsOAc 등)
    'pb_source': [],      # Pb 전구체 (PbCl2, PbBr2 등)
    'concentration': [],  # 전구체 농도
}
```

#### 3. 후처리 조건
```python
post_processing = {
    'purification_method': [],  # 정제 방법
    'storage_condition': [],    # 보관 조건
    'surface_treatment': [],    # 표면 처리
}
```

## 📚 문헌 데이터 추출 템플릿

### 데이터 입력 양식
```csv
paper_id,author,year,temperature,reaction_time,cs_pb_cl_ratio,ligand_type,solvent,pl_peak,plqy,fwhm,qd_size
```

### 필요한 정보
1. 논문 메타데이터 (저자, 연도, DOI)
2. 실험 조건 (위에서 정의한 features)
3. 측정 결과 (target variables)
4. 측정 방법 및 장비

## 🔄 워크플로우

### Phase 1: 데이터 수집 (2-4주)
- [ ] 관련 문헌 검색 및 선정 (50-100편 목표)
- [ ] 데이터 추출 및 데이터베이스 구축
- [ ] 데이터 품질 검증

### Phase 2: 데이터 전처리 (1-2주)
- [ ] 결측치 처리
- [ ] 이상치 탐지 및 제거
- [ ] 특성 엔지니어링
- [ ] 데이터 정규화

### Phase 3: 모델 개발 (2-3주)
- [ ] 기본 모델 학습 (Linear, RF, XGBoost)
- [ ] 하이퍼파라미터 튜닝
- [ ] 교차 검증
- [ ] 특성 중요도 분석

### Phase 4: 검증 및 해석 (1-2주)
- [ ] 모델 성능 평가
- [ ] 예측 vs 실제값 비교
- [ ] 물리화학적 해석
- [ ] 최적 합성 조건 제안

### Phase 5: 논문 작성 (3-4주)
- [ ] Introduction
- [ ] Methods
- [ ] Results & Discussion
- [ ] Conclusion

## 💡 다음 액션 아이템

### 즉시 시작 가능:
1. ✅ **문헌 공유**: PDF나 문헌 정보를 첨부해주세요
2. ✅ **타겟 변수 결정**: 어떤 특성을 예측하고 싶으신가요?
3. ✅ **데이터 범위 결정**: 몇 편의 논문을 대상으로 할까요?

### 준비할 것:
- 문헌 검색 키워드 리스트
- 데이터 수집 기준 (inclusion/exclusion criteria)
- 목표 샘플 수

In [None]:
# 프로젝트 설정
project_config = {
    'project_name': 'CsPbCl3_QD_ML_Prediction',
    'target_variable': 'TBD',  # 결정 필요
    'n_papers_target': 50,     # 목표 논문 수
    'min_samples': 100,        # 최소 샘플 수
}