1️⃣ 주제 : 추상 요약을 사용한 대화문 요약 AI
2️⃣ 데이터셋 : AI Hub : 한국어 대화 데이터 (https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=117)
3️⃣ 컬럼 : Id, Text(원문), Summary(대화 요약), Category(대화 유형)
4️⃣ 모델 : KoBART, KoGPT-2
5️⃣ 간단 설명 : 채팅 속 일상 대화 및 기록된 구어체 문장을 아이템에 입력하면 생성 요약한 간결한 문장을 제공
손기락 | 고도환 | 최지원 |
---|---|---|
- 팀장 - Modeling(KoGPT-2) - EDA 및 전처리 |
- PM - Modeling(KoBART) - 자료 조사 |
- 과업 정리 - Modeling(KoGPT-2) |
내용 | M1 | M2 | H1 | H2 | H3 | H4 | H5 |
---|---|---|---|---|---|---|---|
데이터 EDA 및 전처리 방향 결정 | 🟡 | 🟡 | |||||
Model 탐색 | 🟡 | 🟡 | 🟡 | ||||
Basic 분석 시행 | 🟡 | 🟡 | |||||
모델 선정 | 🟡 | 🟡 | |||||
모델 구축 및 성능 개선 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | ||
결과 분석 | 🟡 | 🟡 |
No | 내용 | 깃허브 | 관리대표 |
---|---|---|---|
01 | EDA 및 전처리 | 📂 | 손기락 |
02 | Modeling(1) - KoBART | 📂 | 고도환 |
03 | Modeling(2) - KoGPT-2 | 📂 | 최지원, 손기락 |
04 | 논문 내용 정리 | 📂 | 최지원 |
Model | KoGPT-2 | KoBART |
---|---|---|
Recall | 0.1873 | 0.2636 |
Precision | 0.2543 | 0.2602 |
F1-Score | 0.2078 | 0.2536 |