라이브러리 버전에 따른 오류 주의

라이브러리 설치시에는

pip install -r requirements.txt

위 코드를 활용하여 같은 버전의 라이브러리를 설치해야 오류없이 진행됩니다.

WellnessChatbot for Mental Health

정신건강을 위한 한국어 상담 챗봇입니다 🙂 22.04.06 기준 실행 가능합니다.

Based on KoGPT2 (v2)

KoGPT2 기반 일상대화 챗봇(https://github.com/haven-jeon/KoGPT2-chatbot) 의 코드를 참조하여 재구성하였습니다.

Datasets

Chit-chat datasets

더욱 자연스러운 대화를 위해 위 코드에서 사용한 일상 데이터셋을 함께 구성하였습니다.

제시된 sentiment label을 따라 '일상', '사랑', '이별'로 주었습니다.

user	system	sentiment
12시 땡!	하루가 또 가네요.	일상
1지망 학교 떨어졌어	위로해 드립니다.	일상
3박4일 놀러가고 싶다	여행은 언제나 좋죠.	일상

Wellness datasets

AI hub에서 제공하는 wellness 정신건강 상담 챗봇 데이터셋을 가공하였습니다.

wellness 1: 359개의 sentiment label
wellness 2: 19개의 sentiment label
- 대화의 turn을 포함하고 있는 것이 특징입니다.
- 우선 user-system 쌍을 1:1로 이루어야하기 때문에 각 발화들을 turn에 맞추어 재구성하였습니다.
1&2에서 모두 sentiment label을 자연언어 그대로 가져왔으며, turn에 따른 사용자 발화 중 '응', '아니'와 같은 답변을 <긍정답변> <부정답변>의 label로 전환하였습니다.

user	system	sentiment
너무 불안한 거 있지.	불안감을 느끼고 계시는군요. 00님이 불안감으로 많이 힘드신 건 아닌지 걱정이 돼요.	불안
완전 힘들고 짜증나요.	평소 즐기던 일이 더 이상 즐겁지 않거나 흥미가 사라졌나요?	무기력
다 때려치고 싶어.	마음이 잠깐 지쳤나 봐요. 아무 의미 없는 일은 없을 거예요.	의욕상실
친구들이 자꾸 차갑게 말 하니까 대화하기 싫어서 피하게 되더라	매사에 주눅들고 자신감이 없으신가요?	자존감저하
어 맞아	그러셨군요. 많이 당황스러우셨을 것 같아요. 이런 상황이 오래 지속될까 걱정돼요.	긍정답변
그런 것 같아요	그렇군요. 많이 지치신 것 같아 걱정이에요. 질문을 하나 드릴게요.	긍정답변
그건 아닌데	그렇군요. 불안을 줄이는 방법으로 꾸준한 운동이나 명상, 규칙적인 수면이 도움이 될 수 있어요. (...)	부정답변
그렇진 않은데	그렇군요. 불안을 줄이는 방법으로 꾸준한 운동이나 명상, 규칙적인 수면이 도움이 될 수 있어요.	부정답변

Architecture

<usr>사용자 발화 sentiment 정보 챗봇 답변 이 주어졌을 때 모델이 sentiment 정보를 생성한 후 그에 맞는 답변을 생성할 수 있도록 학습하였습니다.
sentiment가 <긍정답변> 혹은 <부정답변>을 생성하면 이전 발화 history과 합쳐 다시 input을 생성합니다.
따라서 context를 유지한채 대화의 turn을 이어갈 수 있습니다.

Chat Example

나 > 고민이 많다
챗봇 > 마음이 예민해져서 매우 괴로우셨겠어요. 저랑 차분하게 잠시 대화를 해봐요.
나 > 공부하는게 힘들어
챗봇 > 공부하면 더 많은 선택을 할 수 있죠.
나 > 그치만 너무 힘든걸
챗봇 > 조금만 더 버텨보세요.
나 > 싫어 너무 무기력해
챗봇 > 평소 즐기던 일이 더 이상 즐겁지 않거나 흥미가 사라졌나요?
나 > 응 아무것도 하기 싫어
챗봇 > 아무것도 하고 싶지 않고, 하루가 길게 느껴지나요.
나 > 맞아
챗봇 > 00님이 힘든 것 같아 걱정이에요. 더 얘기해볼까요?
나 > 성적이 자꾸 떨어져
챗봇 > 노력한 만큼 결과가 나오지 않으면 속상하죠.
나 > 친구들이랑도 잘 안맞는것같아
챗봇 > 사람들이 나에게 차갑게 대하는 것 같으신가요?
나 > 응응
챗봇 > 자신을 더 사랑해주세요.
나 > 친구들이 나를 안좋아하는것같아
챗봇 > 자존감이 떨어져 속상하고 고민이 많이 드셨겠어요.

generate setting에 따라 결과가 달라집니다.

How to train

python3 trainer.py --train --gpus 3 --max_epochs 3

multi-gpu를 사용하였으며, --gpus 1 설정시 오류가 난다면 trainer.py에서 accelerator="dp"를 지워보시기 바랍니다.

How to chat

python3 chat.py --chat

fine-tuning한 모델이 directory 안에 저장되어있어야 합니다.

Reference

Wellness 챗봇: https://github.com/eunjiinkim/WellnessChatbot
KoGPT2 chitchat: https://github.com/haven-jeon/KoGPT2-chatbot
wellness datasets: https://aihub.or.kr/keti_data_board/language_intelligence
Chitchat datasets: https://github.com/songys/Chatbot_data

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
KoBART-main		KoBART-main
KoGPT2-master		KoGPT2-master
KoGPT_telegram_chatbot-master		KoGPT_telegram_chatbot-master
.gitignore		.gitignore
README.md		README.md
chat.py		chat.py
chatbot_dataset.csv		chatbot_dataset.csv
requirements.txt		requirements.txt
streamlit_app.py		streamlit_app.py
test.py		test.py
trainer.py		trainer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

라이브러리 버전에 따른 오류 주의

WellnessChatbot for Mental Health

Based on KoGPT2 (v2)

Datasets

Chit-chat datasets

Wellness datasets

Architecture

Chat Example

How to train

How to chat

Reference

About

Releases

Packages

Languages

oocheol/Wellness_chatbot

Folders and files

Latest commit

History

Repository files navigation

라이브러리 버전에 따른 오류 주의

WellnessChatbot for Mental Health

Based on KoGPT2 (v2)

Datasets

Chit-chat datasets

Wellness datasets

Architecture

Chat Example

How to train

How to chat

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages