# 챗봇

In [2]:
# 공통코드
import numpy as np
import pandas as pd


## 데이터 가져오기

In [4]:
#corpus = pd.read_csv('https://raw.githubusercontent.com/songys/Chatbot_data/master/ChatbotData.csv')
corpus = pd.read_csv('./ChatbotData.csv')

# 2,000개 데이터 셋만 활용 (Google Colab 일 경우 3,000개에서는 메모리 오버되는 현상 발생)
texts = []
pairs = []
for i, (text, pair) in enumerate(zip(corpus['Q'], corpus['A'])):
    texts.append(text)
    pairs.append(pair)
    
    #메모리가 부족하면 데이터 개수 조절
    if i >= 3000: 
        break 

In [5]:
# question와 answer 데이터 확인
list(zip(texts, pairs))[0:10]

[('12시 땡!', '하루가 또 가네요.'),
 ('1지망 학교 떨어졌어', '위로해 드립니다.'),
 ('3박4일 놀러가고 싶다', '여행은 언제나 좋죠.'),
 ('3박4일 정도 놀러가고 싶다', '여행은 언제나 좋죠.'),
 ('PPL 심하네', '눈살이 찌푸려지죠.'),
 ('SD카드 망가졌어', '다시 새로 사는 게 마음 편해요.'),
 ('SD카드 안돼', '다시 새로 사는 게 마음 편해요.'),
 ('SNS 맞팔 왜 안하지ㅠㅠ', '잘 모르고 있을 수도 있어요.'),
 ('SNS 시간낭비인 거 아는데 매일 하는 중', '시간을 정하고 해보세요.'),
 ('SNS 시간낭비인데 자꾸 보게됨', '시간을 정하고 해보세요.')]

## 데이터 전처리

In [7]:
import re
def clean_sentence(sentence):
#     # 한글, 숫자, 영문 대/소문자를 제외한 모든 문자는 제거합니다.
#     sentence = re.sub(r'[^0-9ㄱ-ㅎㅏ-ㅣ가-힣ㅣa-zA-Z ]',r'', sentence)
    # 한글, 숫자를 제외한 모든 문자는 제거합니다.
    sentence = re.sub(r'[^0-9ㄱ-ㅎㅏ-ㅣ가-힣]',r'', sentence)
    return sentence

# 전처리 함수 테스트
print(clean_sentence('안녕하세요~:)'))
print(clean_sentence('TensorFlow^@^%#@!'))

안녕하세요
TensorFlow


In [8]:
#한글 형태소 분석
from konlpy.tag import Okt
okt = Okt()
def process_morph(sentence):
    return ' '.join(okt.morphs(sentence))

In [5]:
#챗봇을 위해 필요한 데이터 생성 함수
def clean_and_morph(sentence, is_question=True):
    # 한글 문장 전처리
    sentence = clean_sentence(sentence)
    # 형태소 변환
    sentence = process_morph(sentence)
    # Question 인 경우, Answer인 경우를 분기하여 처리
    # Answer에는 시작 과 종료 기호 추가
    if is_question:
        return sentence
    else:
        # START 토큰은 decoder input에 END 토큰은 decoder output에 추가합니다.
        return ('<START> ' + sentence, sentence + ' <END>')

In [6]:
#챗봇을 위한 데이터 생성
def preprocess(texts, pairs):
    questions = []
    answer_in = []
    answer_out = []

    # 질의에 대한 전처리
    for text in texts:
        # 전처리와 morph 수행
        question = clean_and_morph(text, is_question=True)
        questions.append(question)

    # 답변에 대한 전처리
    for pair in pairs:
        # 전처리와 morph 수행
        in_, out_ = clean_and_morph(pair, is_question=False)
        answer_in.append(in_)
        answer_out.append(out_)
    
    return questions, answer_in, answer_out

In [7]:
#챗봇 훈련에 필요한 데이터 생성 및 확인
questions, answer_in, answer_out = preprocess(texts, pairs)

print(questions[:2])
print(answer_in[:2])
print(answer_out[:2])

['맛있는 칵테일 추천 해줘', '20 대 여자 가 좋아할 만 한 칵테일 은']
['<START> 어떤 맛 좋아하세요', '<START> 저 는 롱티 좋아해요']
['어떤 맛 좋아하세요 <END>', '저 는 롱티 좋아해요 <END>']


In [8]:
# 전체 문장을 하나의 문장으로 생성
all_sentences = questions + answer_in + answer_out

In [9]:
#토크나이저 와 수치화 및 패딩
import numpy as np
import warnings
import tensorflow as tf

from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# WARNING 무시
warnings.filterwarnings('ignore')

# 토큰화
tokenizer = Tokenizer(filters='', lower=False, oov_token='<OOV>')
tokenizer.fit_on_texts(all_sentences)

# 텍스트를 시퀀스로 인코딩 (texts_to_sequences)
question_sequence = tokenizer.texts_to_sequences(questions)
answer_in_sequence = tokenizer.texts_to_sequences(answer_in)
answer_out_sequence = tokenizer.texts_to_sequences(answer_out)

# 문장의 길이 맞추기 (pad_sequences)
MAX_LENGTH = 30
question_padded = pad_sequences(question_sequence, 
                                maxlen=MAX_LENGTH, 
                                truncating='post', 
                                padding='post')
answer_in_padded = pad_sequences(answer_in_sequence, 
                                 maxlen=MAX_LENGTH, 
                                 truncating='post', 
                                 padding='post')
answer_out_padded = pad_sequences(answer_out_sequence, 
                                  maxlen=MAX_LENGTH, 
                                  truncating='post', 
                                  padding='post')

In [10]:
# 단어 사전 확인
for word, idx in tokenizer.word_index.items():
    print(f'{word}\t -> \t{idx}')
    if idx > 10:
        break

<OOV>	 -> 	1
<START>	 -> 	2
<END>	 -> 	3
이	 -> 	4
거	 -> 	5
을	 -> 	6
가	 -> 	7
예요	 -> 	8
도	 -> 	9
해보세요	 -> 	10
에	 -> 	11


In [11]:
# 토큰 개수 확인
len(tokenizer.word_index)

4720

In [12]:
#시퀀스 확인
question_padded.shape, answer_in_padded.shape, answer_out_padded.shape

((3001, 30), (3001, 30), (3001, 30))

In [13]:
#원핫 인코딩
VOCAB_SIZE = len(tokenizer.word_index)+1

#원핫 인코딩을 위한 함수
def convert_to_one_hot(padded):
    # 원핫인코딩 초기화
    one_hot_vector = np.zeros((len(answer_out_padded), 
                               MAX_LENGTH, 
                               VOCAB_SIZE))

    # 디코더 목표를 원핫 인코딩으로 변환
    # 학습시 입력은 인덱스이지만 출력은 원핫 인코딩 형식임
    for i, sequence in enumerate(answer_out_padded):
        for j, index in enumerate(sequence):
            one_hot_vector[i, j, index] = 1

    return one_hot_vector

answer_in_one_hot = convert_to_one_hot(answer_in_padded)
answer_out_one_hot = convert_to_one_hot(answer_out_padded)
answer_in_one_hot[0].shape, answer_in_one_hot[0].shape

((30, 4721), (30, 4721))

In [14]:
# 변환된 index를 다시 단어로 변환
def convert_index_to_text(indexs, end_token): 
    
    sentence = ''
    
    # 모든 문장에 대해서 반복
    for index in indexs:
        if index == end_token:
            # 끝 단어이므로 예측 중비
            break;
        # 사전에 존재하는 단어의 경우 단어 추가
        if index > 0 and tokenizer.index_word[index] is not None:
            sentence += tokenizer.index_word[index]
        else:
        # 사전에 없는 인덱스면 빈 문자열 추가
            sentence += ''
            
        # 빈칸 추가
        sentence += ' '
    return sentence

## 모델 생성

In [15]:
# 라이브러리 로드
from tensorflow.keras.layers import Input, Embedding, LSTM, Dense, Dropout, Attention
from tensorflow.keras.models import Model
from tensorflow.keras.callbacks import TensorBoard, ModelCheckpoint
from tensorflow.keras.utils import plot_model

In [16]:
#입력을 위한 클래스 - Attention 사용
class Encoder(tf.keras.Model):
    def __init__(self, units, vocab_size, embedding_dim, time_steps):
        super(Encoder, self).__init__()
        self.embedding = Embedding(vocab_size, 
                                   embedding_dim, 
                                   input_length=time_steps, 
                                   name='Embedding')
        self.dropout = Dropout(0.2, name='Dropout')
        # (attention) return_sequences=True 추가
        self.lstm = LSTM(units, 
                         return_state=True, 
                         return_sequences=True, 
                         name='LSTM')
        
    def call(self, inputs):
        x = self.embedding(inputs)
        x = self.dropout(x)
        x, hidden_state, cell_state = self.lstm(x)
        # (attention) x return 추가
        return x, [hidden_state, cell_state]

In [17]:
# 출력을 위한 디코더
class Decoder(tf.keras.Model):
    def __init__(self, units, vocab_size, embedding_dim, time_steps):
        super(Decoder, self).__init__()
        self.embedding = Embedding(vocab_size, 
                                   embedding_dim, 
                                   input_length=time_steps, 
                                   name='Embedding')
        self.dropout = Dropout(0.2, name='Dropout')
        self.lstm = LSTM(units, 
                         return_state=True, 
                         return_sequences=True, 
                         name='LSTM'
                        )
        self.attention = Attention(name='Attention')
        self.dense = Dense(vocab_size, 
                           activation='softmax', 
                           name='Dense')
    
    def call(self, inputs, initial_state):
        # (attention) encoder_inputs 추가
        encoder_inputs, decoder_inputs = inputs
        x = self.embedding(decoder_inputs)
        x = self.dropout(x)
        x, hidden_state, cell_state = self.lstm(x, initial_state=initial_state)
        
        # (attention) key_value, attention_matrix 추가
        # 이전 hidden_state의 값을 concat으로 만들어 vector를 생성합니다.        
        key_value = tf.concat([initial_state[0][:, tf.newaxis, :], 
                               x[:, :-1, :]], axis=1)        
        # 이전 hidden_state의 값을 concat으로 만든 vector와 encoder에서 나온 
        # 출력 값들로 attention을 구합니다.
        attention_matrix = self.attention([key_value, encoder_inputs])
        # 위에서 구한 attention_matrix와 decoder의 출력 값을 concat 합니다.
        x = tf.concat([x, attention_matrix], axis=-1)
        
        x = self.dense(x)
        return x, hidden_state, cell_state

In [18]:
class ChatModel(tf.keras.Model):
    def __init__(self, units, vocab_size, embedding_dim, time_steps, start_token, end_token):
        super(ChatModel, self).__init__()
        self.start_token = start_token
        self.end_token = end_token
        self.time_steps = time_steps
        
        self.encoder = Encoder(units, vocab_size, embedding_dim, time_steps)
        self.decoder = Decoder(units, vocab_size, embedding_dim, time_steps)
        
        
    def call(self, inputs, training=True):
        if training:
            encoder_inputs, decoder_inputs = inputs
            # (attention) encoder 출력 값 수정
            encoder_outputs, context_vector = self.encoder(encoder_inputs)
            # (attention) decoder 입력 값 수정
            decoder_outputs, _, _ = self.decoder((encoder_outputs, decoder_inputs), 
                                                 initial_state=context_vector)
            return decoder_outputs
        else:
            x = inputs
            # (attention) encoder 출력 값 수정
            encoder_outputs, context_vector = self.encoder(x)
            target_seq = tf.constant([[self.start_token]], dtype=tf.float32)
            results = tf.TensorArray(tf.int32, self.time_steps)
            
            for i in tf.range(self.time_steps):
                decoder_output, decoder_hidden, decoder_cell = self.decoder((encoder_outputs, target_seq), 
                                                                            initial_state=context_vector)
                decoder_output = tf.cast(tf.argmax(decoder_output, axis=-1), dtype=tf.int32)
                decoder_output = tf.reshape(decoder_output, shape=(1, 1))
                results = results.write(i, decoder_output)
                
                if decoder_output == self.end_token:
                    break
                    
                target_seq = decoder_output
                context_vector = [decoder_hidden, decoder_cell]
                
            return tf.reshape(results.stack(), shape=(1, self.time_steps))

## 모델 생성

In [19]:
# 하이퍼 파라미터 설정
BUFFER_SIZE = 1000
BATCH_SIZE = 16
EMBEDDING_DIM = 100
TIME_STEPS = MAX_LENGTH
START_TOKEN = tokenizer.word_index['<START>']
END_TOKEN = tokenizer.word_index['<END>']

UNITS = 128

VOCAB_SIZE = len(tokenizer.word_index)+1
DATA_LENGTH = len(questions)
SAMPLE_SIZE = 3
NUM_EPOCHS = 20

In [20]:
# 체크 포인트 생성
checkpoint_path = 'model/chatmodel-attention-checkpoint.ckpt'
checkpoint = ModelCheckpoint(filepath=checkpoint_path, 
                             save_weights_only=True,
                             save_best_only=True, 
                             monitor='loss', 
                             verbose=1
                            )

In [21]:
#모델 생성
chat = ChatModel(UNITS, 
                  VOCAB_SIZE, 
                  EMBEDDING_DIM, 
                  TIME_STEPS, 
                  START_TOKEN, 
                  END_TOKEN)

chat.compile(optimizer='adam', 
                loss='categorical_crossentropy', 
                metrics=['acc'])

2022-04-27 07:43:59.714200: I tensorflow/core/platform/cpu_feature_guard.cc:151] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.


In [22]:
# 예측을 위한 함수
def make_prediction(model, question_inputs):
    results = model(inputs=question_inputs, training=False)
    # 변환된 인덱스를 문장으로 변환
    results = np.asarray(results).reshape(-1)
    return results

## 모델 학습

In [23]:
for epoch in range(NUM_EPOCHS):
    print(f'processing epoch: {epoch * 10 + 1}...')
    chat.fit([question_padded, answer_in_padded],
                answer_out_one_hot,
                epochs=10,
                batch_size=BATCH_SIZE,
                callbacks=[checkpoint]
               )
    # 랜덤한 샘플 번호 추출
    samples = np.random.randint(DATA_LENGTH, size=SAMPLE_SIZE)

    # 예측 성능 테스트
    for idx in samples:
        question_inputs = question_padded[idx]
        # 문장 예측
        results = make_prediction(chat, np.expand_dims(question_inputs, 0))
        
        # 변환된 인덱스를 문장으로 변환
        results = convert_index_to_text(results, END_TOKEN)
        
        print(f'Q: {questions[idx]}')
        print(f'A: {results}\n')
        print()

processing epoch: 1...
Epoch 1/10


2022-04-27 07:44:05.514142: W tensorflow/core/grappler/costs/op_level_cost_estimator.cc:690] Error in PredictCost() for the op: op: "Softmax" attr { key: "T" value { type: DT_FLOAT } } inputs { dtype: DT_FLOAT shape { unknown_rank: true } } device { type: "CPU" vendor: "GenuineIntel" model: "110" frequency: 2400 num_cores: 8 environment { key: "cpu_instruction_set" value: "SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2" } environment { key: "eigen" value: "3.4.90" } l1_cache_size: 32768 l2_cache_size: 262144 l3_cache_size: 6291456 memory_size: 268435456 } outputs { dtype: DT_FLOAT shape { unknown_rank: true } }


Epoch 1: loss improved from inf to 1.89479, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 2/10
Epoch 2: loss improved from 1.89479 to 1.12936, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 3/10
Epoch 3: loss improved from 1.12936 to 1.05330, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 4/10
Epoch 4: loss improved from 1.05330 to 1.01129, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 5/10
Epoch 5: loss improved from 1.01129 to 0.97911, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 6/10
Epoch 6: loss improved from 0.97911 to 0.94919, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 7/10
Epoch 7: loss improved from 0.94919 to 0.91999, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss improved from 0.91999 to 0.89172, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 9/10
Epoch 9: loss improved from 0.89172 to 0.86082, saving model to mode

Epoch 7/10
Epoch 7: loss improved from 0.15619 to 0.15311, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss did not improve from 0.15311
Epoch 9/10
Epoch 9: loss improved from 0.15311 to 0.14978, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 10/10
Epoch 10: loss improved from 0.14978 to 0.14669, saving model to model/chatmodel-attention-checkpoint.ckpt
Q: 갑자기 눈물 나
A: 마음 이 아픈가요 


Q: 날씨 왜 이렇게 춥냐
A: 저 도 요 


Q: 세탁소 가기 귀찮네
A: 스타 일러 사세요 


processing epoch: 61...
Epoch 1/10
Epoch 1: loss improved from 0.14669 to 0.14409, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 2/10
Epoch 2: loss improved from 0.14409 to 0.13844, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 3/10
Epoch 3: loss improved from 0.13844 to 0.13493, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 4/10
Epoch 4: loss improved from 0.13493 to 0.13330, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 5/10
Epoch

Epoch 5/10
Epoch 5: loss improved from 0.08193 to 0.07901, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 6/10
Epoch 6: loss improved from 0.07901 to 0.07798, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 7/10
Epoch 7: loss improved from 0.07798 to 0.07445, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss improved from 0.07445 to 0.06943, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 9/10
Epoch 9: loss improved from 0.06943 to 0.06887, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 10/10
Epoch 10: loss improved from 0.06887 to 0.06806, saving model to model/chatmodel-attention-checkpoint.ckpt
Q: 문신 하고 싶은데 후회 할까
A: 나중 에 후회 할 수도 있을 것 같아요 


Q: 그 사람 이 나 좋아해 줬으면 좋겠다
A: 휴가 를 붙 여보세요 


Q: 넘 많이 먹었다
A: 산책 좀 해야 겠네여 


processing epoch: 91...
Epoch 1/10
Epoch 1: loss improved from 0.06806 to 0.06664, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 2/10
Epoch 2: loss improved fr

Epoch 4/10
Epoch 4: loss did not improve from 0.03100
Epoch 5/10
Epoch 5: loss improved from 0.03100 to 0.02750, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 6/10
Epoch 6: loss improved from 0.02750 to 0.02686, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 7/10
Epoch 7: loss improved from 0.02686 to 0.02676, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss improved from 0.02676 to 0.02536, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 9/10
Epoch 9: loss improved from 0.02536 to 0.02367, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 10/10
Epoch 10: loss improved from 0.02367 to 0.02278, saving model to model/chatmodel-attention-checkpoint.ckpt
Q: 나 그동안 뭐 한거니
A: 바람 좀 쐬고 오시 면 좋은텐데 


Q: 상의 도 없이 왜 그런 결정 을 하지
A: 이야기 를 하지 않고 결정 했나 봐요 


Q: 스키장 알바 재밌대
A: 실컷 스키 탈 수 있을 것 같아요 


processing epoch: 121...
Epoch 1/10
Epoch 1: loss improved from 0.02278 to 0.02264, saving model to model/chatmod

Epoch 4/10
Epoch 4: loss improved from 0.01191 to 0.01159, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 5/10
Epoch 5: loss improved from 0.01159 to 0.00978, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 6/10
Epoch 6: loss improved from 0.00978 to 0.00923, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 7/10
Epoch 7: loss improved from 0.00923 to 0.00861, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss improved from 0.00861 to 0.00860, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 9/10
Epoch 9: loss did not improve from 0.00860
Epoch 10/10
Epoch 10: loss did not improve from 0.00860
Q: 나 좋아하는 것 같아
A: 호의 인지 호감 인지 헷갈리나요 


Q: 김치볶음밥 먹어야지
A: 맛있는 식사 시간 되시길 바랄게요 


Q: 뭘 해도 귀여워
A: 사랑 하 나 봅니다 


processing epoch: 151...
Epoch 1/10
Epoch 1: loss improved from 0.00860 to 0.00795, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 2/10
Epoch 2: loss did not improve from 0.00795
Ep

Epoch 6/10
Epoch 6: loss did not improve from 0.00655
Epoch 7/10
Epoch 7: loss improved from 0.00655 to 0.00575, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 8/10
Epoch 8: loss did not improve from 0.00575
Epoch 9/10
Epoch 9: loss did not improve from 0.00575
Epoch 10/10
Epoch 10: loss did not improve from 0.00575
Q: 생각 없이 말 했어
A: 생각 하고 말 하세요 


Q: 골프 치러 가야 돼
A: 시간 내서 가보세요 


Q: 남친 어디서 만나
A: 원하는 사람 이 있는 장소 에 가보세요 


processing epoch: 181...
Epoch 1/10
Epoch 1: loss improved from 0.00575 to 0.00499, saving model to model/chatmodel-attention-checkpoint.ckpt
Epoch 2/10
Epoch 2: loss did not improve from 0.00499
Epoch 3/10
Epoch 3: loss did not improve from 0.00499
Epoch 4/10
Epoch 4: loss did not improve from 0.00499
Epoch 5/10
Epoch 5: loss did not improve from 0.00499
Epoch 6/10
Epoch 6: loss did not improve from 0.00499
Epoch 7/10
Epoch 7: loss did not improve from 0.00499
Epoch 8/10
Epoch 8: loss did not improve from 0.00499
Epoch 9/10
Epoch 9: loss improved from 0.

## 배포

In [24]:
# 자연어 (질문 입력) 대한 전처리 함수
def make_question(sentence):
    sentence = clean_and_morph(sentence)
    question_sequence = tokenizer.texts_to_sequences([sentence])
    question_padded = pad_sequences(question_sequence, maxlen=MAX_LENGTH, truncating='post', padding='post')
    return question_padded

make_question('오늘 날씨 어때?')

array([[163, 229, 352,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0]], dtype=int32)

In [25]:
# 질문에 대한 답변을 리턴해주는 함수
def run_chatbot(question):
    question_inputs = make_question(question)
    results = make_prediction(chat, question_inputs)
    results = convert_index_to_text(results, END_TOKEN)
    return results

In [26]:
# 콘솔에서 테스트
while True:
    user_input = input('<< 말을 걸어 보세요!\n')
    if user_input == 'q':
        break
    print('>> 챗봇 응답: {}'.format(run_chatbot(user_input)))

<< 말을 걸어 보세요!
20대 여자 칵테일 추천
>> 챗봇 응답: 저 는 롱티 좋아해요 
<< 말을 걸어 보세요!
남자 칵테일
>> 챗봇 응답: 다음 에는 다를거예요 
<< 말을 걸어 보세요!
어떤 보드카
>> 챗봇 응답: 가격 에 따라 천차만별 이지만 국내 에서 많이 찾는 보드카 로는 앱솔 루트 스미 노프 벨루가 등 이 있어요 
<< 말을 걸어 보세요!
q


In [None]:
# 웹 서비스를 위한 배포
from flask import Flask, request
from flask import jsonify

app = Flask(__name__)

#시작 요청이 왔을 때 아래 코드를 수행
@app.route('/', methods=['POST', 'GET'])
def main():
    return 'Hello Chatbot'

@app.route('/chatbot', methods=['POST', 'GET'])
def chatbot():
    print(request.args["question"])
    answer = run_chatbot(request.args["question"])
    print('>> 챗봇 응답: {}'.format(answer))
    response = {'answer': answer}
    return jsonify(response)

#서버 구동
app.run('0.0.0.0', port=9000, threaded=True)

 * Serving Flask app "__main__" (lazy loading)
 * Environment: production
[2m   Use a production WSGI server instead.[0m
 * Debug mode: off


 * Running on all addresses.
 * Running on http://192.168.20.105:9000/ (Press CTRL+C to quit)
192.168.20.105 - - [27/Apr/2022 08:59:31] "GET /chatbot?question=어떤%20보드카 HTTP/1.1" 200 -


어떤 보드카
>> 챗봇 응답: 가격 에 따라 천차만별 이지만 국내 에서 많이 찾는 보드카 로는 앱솔 루트 스미 노프 벨루가 등 이 있어요 
여자가 좋아하는 칵테일여자가 좋아하는 칵테일여자가 좋아하는 칵테일여자가 좋아하는 칵테일
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일





192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:07] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -


>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일
여자가 좋아하는 칵테일


192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -


>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 
여자가 좋아하는 칵테일여자가 좋아하는 칵테일

여자가 좋아하는 칵테일


192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:08] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -


>> 챗봇 응답: 저 는 주 당 이에요 
>> 챗봇 응답: 저 는 주 당 이에요 >> 챗봇 응답: 저 는 주 당 이에요 



192.168.20.97 - - [27/Apr/2022 09:19:22] "GET /chatbot?question=13 HTTP/1.1" 200 -
192.168.20.97 - - [27/Apr/2022 09:19:22] "GET /favicon.ico HTTP/1.1" 404 -


13
>> 챗봇 응답: 살아있음 그 자체 가 좋은 거 예요 


192.168.20.97 - - [27/Apr/2022 09:19:32] "GET /chatbot?question=여자가+좋아하는+칵테일 HTTP/1.1" 200 -


여자가 좋아하는 칵테일
>> 챗봇 응답: 저 는 주 당 이에요 


192.168.20.97 - - [27/Apr/2022 09:22:31] "GET /chatbot?question=20대+여자가+좋아하는+칵테일 HTTP/1.1" 200 -


20대 여자가 좋아하는 칵테일
>> 챗봇 응답: 저 는 롱티 좋아해요 


192.168.20.97 - - [27/Apr/2022 09:25:17] "GET /chatbot?question=맛있는+칵테일+추천해줘 HTTP/1.1" 200 -


맛있는 칵테일 추천해줘
>> 챗봇 응답: 어떤 맛 좋아하세요 


192.168.20.97 - - [27/Apr/2022 09:32:48] "GET /chatbot?question=어떤+보드카가+좋아%3F HTTP/1.1" 200 -


어떤 보드카가 좋아?
>> 챗봇 응답: 가격 에 따라 천차만별 이지만 국내 에서 많이 찾는 보드카 로는 앱솔 루트 스미 노프 벨루가 등 이 있어요 
