# QnA System

mecab & 기타 제외 & 카테고리 거침

<img width="500" alt="KakaoTalk_Photo_2021-05-24-15-37-48" src="https://user-images.githubusercontent.com/55127132/119307102-1ce08000-bca6-11eb-8ce7-c5764a9433fb.png">

## Install & Library

In [1]:
import torch
from torch import nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
import gluonnlp as nlp
import numpy as np
import pandas as pd
from tqdm import tqdm, tqdm_notebook

from KoBERT.kobert.utils import get_tokenizer
from KoBERT.kobert.pytorch_kobert import get_pytorch_kobert_model

from transformers import AdamW
from transformers.optimization import get_cosine_schedule_with_warmup

from konlpy.tag import Mecab

np.set_printoptions(formatter={'float_kind': lambda x: "{0:0.5f}".format(x)})

device = 'cuda:1' if torch.cuda.is_available() else 'cpu'
device

'cuda:1'

In [2]:
import warnings
warnings.filterwarnings(action='ignore')

pd.set_option('max_row', None)
pd.set_option('display.max_colwidth', -1)

## Path

In [3]:
# path
model_path = '/home/hyejeongeun/chatbot/Model/Model/'
data_path='/home/hyejeongeun/chatbot/Data/'
qna_path='/home/hyejeongeun/chatbot/Data/QnA/'
review_path = '/home/hyejeongeun/chatbot/Data/Review/Review_embedding/'

## BERT Model

In [4]:
class BERTDataset(Dataset):
    def __init__(self, dataset, sent_idx, bert_tokenizer, max_len,
                 pad, pair):
        transform = nlp.data.BERTSentenceTransform(
            bert_tokenizer, max_seq_length=max_len, pad=pad, pair=pair)

        self.sentences = [transform([i[sent_idx]]) for i in dataset]
        
    def __getitem__(self, i):
        return (self.sentences[i])

    def __len__(self):
        return (len(self.sentences))

In [5]:
class BERTClassifier(nn.Module):
    def __init__(self,
                 bert,
                 hidden_size = 768,
                 num_classes=5,  ##### 수정
                 dr_rate=None,
                 params=None):
        super(BERTClassifier, self).__init__()
        self.bert = bert
        self.dr_rate = dr_rate
                 
        self.classifier = nn.Linear(hidden_size , num_classes)
        if dr_rate:
            self.dropout = nn.Dropout(p=dr_rate)
    
    def gen_attention_mask(self, token_ids, valid_length):
        attention_mask = torch.zeros_like(token_ids)
        for i, v in enumerate(valid_length):
            attention_mask[i][:v] = 1
        return attention_mask.float()

    def forward(self, token_ids, valid_length, segment_ids):
        attention_mask = self.gen_attention_mask(token_ids, valid_length)
        
        _, pooler = self.bert(input_ids = token_ids, token_type_ids = segment_ids.long(), attention_mask = attention_mask.float().to(token_ids.device))
        
        classifier = self.classifier(pooler)
        
        if self.dr_rate:
            out = self.dropout(classifier)
  
        return pooler, out

## Parameter

In [6]:
## Setting parameters
max_len = 210 #수정
batch_size = 16 # 64 
warmup_ratio = 0.1
num_epochs = 5
max_grad_norm = 1
log_interval = 200
learning_rate =  5e-5

In [7]:
# load model
bertmodel, vocab = get_pytorch_kobert_model()
tokenizer = get_tokenizer()
tok = nlp.data.BERTSPTokenizer(tokenizer, vocab, lower=False)

using cached model
using cached model
using cached model


In [8]:
# load pre-trained KoBERTClassifier
model = BERTClassifier(bertmodel, dr_rate=0.5).to(device)
model.load_state_dict(torch.load(model_path+'epoch_5_qna_sep_model_4.pt'))
model.eval() 

BERTClassifier(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(8002, 768, padding_idx=1)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True

## Mecab

In [9]:
# load mecab
mecab = Mecab()

In [10]:
def make_question_mecab_tokens(question):

    # mecab 돌리기
    que_mecab = mecab.pos(question[0])

    # 조사 제거
    morpheme = ['NNG','NNP','NNB','NNBC','NR','NP','VV','VA','VX','VCP','VCN','MM','MAG','MAJ','IC']    
    tmp = []
    que_tokens = []

    for t in que_mecab:
        if t[1] in morpheme:
            que_tokens.append(t[0])

    if len(que_tokens)==0:
        que_tokens.append('')

    # 한 문장으로 결합
    que_tokens_str = [' '.join(que_tokens)+'\n']
    
    # print(que_tokens_str)
    
    return que_tokens_str

## Input Embedding & Classification

In [11]:
def input_BERTClassifier(model, test_dataloader):
    for batch_id, (token_ids, valid_length, segment_ids) in enumerate(test_dataloader):

        token_ids = token_ids.long().to(device)
        segment_ids = segment_ids.long().to(device)
        valid_length= valid_length  

        test_embedding, test_probability = model.forward(token_ids, valid_length, segment_ids)

        test_embedding = np.array(test_embedding.tolist())
        test_probability = np.array(test_probability.tolist())

        torch.cuda.empty_cache() # GPU 캐시 삭제
        
    # class 
    test_class = np.argmax(np.array(test_probability))
        
    return test_embedding, test_class

## Semantic Search

In [12]:
def pytorch_cos_sim(a, b):
    """
    Computes the cosine similarity cos_sim(a[i], b[j]) for all i and j.
    This function can be used as a faster replacement for 1-scipy.spatial.distance.cdist(a,b)
    :return: Matrix with res[i][j]  = cos_sim(a[i], b[j])
    """
    if not isinstance(a, torch.Tensor):
        a = torch.tensor(a)

    if not isinstance(b, torch.Tensor):
        b = torch.tensor(b)

    if len(a.shape) == 1:
        a = a.unsqueeze(0)

    if len(b.shape) == 1:
        b = b.unsqueeze(0)

    a_norm = a / a.norm(dim=1)[:, None]
    b_norm = b / b.norm(dim=1)[:, None]
    return torch.mm(a_norm, b_norm.transpose(0, 1))

In [13]:
def Semantic_Search_Question(question, input_embedding, input_class):
    # load file
    df = pd.read_csv(qna_path+'question_embedding.csv', sep='\t')
    
    # input_class와 같은 label만 추출
    label_idx = np.array(np.where(np.array(df['question_class'].tolist()) == input_class)).tolist()[0]
    df_in_input = df.loc[label_idx]
    df_in_input.reset_index(drop=True, inplace=True)
    # 질문 embedding
    df_in_input['question_embedding'] = df_in_input['question_embedding'].str.replace('[','').str.replace(']','').apply(lambda x:list(map(float, x.split(','))))
    question_embedding = np.array(df_in_input['question_embedding'].tolist())
    # 기존 label
    question_class = np.array(df_in_input['question_class'].tolist())

    # make tensor
    corpus_embeddings = torch.tensor(question_embedding)
    query_embedding = torch.tensor(input_embedding)
    
    # cosine similarity
    cos_scores = pytorch_cos_sim(query_embedding, corpus_embeddings)[0]
    cos_scores = cos_scores.cpu()
    
    # 0.99 이상만
    top_results = np.where(cos_scores >= 0.99)
    df_in_input_top = df_in_input.loc[top_results[0]]
    
    for idx in top_results[0]:
        df_in_input_top.loc[idx, 'input_question'] = question
        df_in_input_top.loc[idx, 'score'] = cos_scores.numpy()[idx]
        
    df_in_input_top.reset_index(drop=True, inplace=True)
    
    return df_in_input_top

In [14]:
def Semantic_Search_Review(question, input_embedding, input_class, product_id):
    # load review data
    df = pd.read_csv(review_path+'review_'+product_id+'_embedding.csv', sep=',')
    
    # input_class와 같은 label만 추출
    label_idx = np.array(np.where(np.array(df['review_class'].tolist()) == input_class)).tolist()[0]
    
    if len(label_idx) != 0: # 하나라도 있으면
        df_in_input = df.loc[label_idx]
        df_in_input['using_label'] = input_class
        df_in_input.reset_index(drop=True, inplace=True)    
    else: # 하나도 없으면
        label_idx = np.array(np.where(np.array(df['review_class'].tolist()) == 1)).tolist()[0] # 상품 카테고리
        df_in_input = df.loc[label_idx]
        df_in_input['using_label'] = 1
        df_in_input.reset_index(drop=True, inplace=True)
    
    # 질문 embedding
    df_in_input['review_embedding'] = df_in_input['review_embedding'].str.replace('[','').str.replace(']','').apply(lambda x:list(map(float, x.split(','))))
    review_embedding = np.array(df_in_input['review_embedding'].tolist())
    # 예측된 class
    review_class = np.array(df_in_input['review_class'].tolist())
              
    # make tensor
    corpus_embeddings = torch.tensor(review_embedding)
    query_embedding = torch.tensor(input_embedding)
    
    # cosine similarity
    cos_scores = pytorch_cos_sim(query_embedding, corpus_embeddings)[0]
    cos_scores = cos_scores.cpu()
    
    # 0.9 이상만
    top_results = np.where(cos_scores >= 0.9)
    df_in_input_top = df_in_input.loc[top_results[0]]
    
    for idx in top_results[0]:
        df_in_input_top.loc[idx, 'input_question'] = question
        df_in_input_top.loc[idx, 'score'] = cos_scores.numpy()[idx]
        
    df_in_input_top.reset_index(drop=True, inplace=True)
    
    return df_in_input_top

In [15]:
def select_top5_Question(df):
    # score 높은순 & 날짜 최신순
    df.sort_values(by=['score','answer_time'], ascending=False, inplace=True)
    
    # reset index
    df.reset_index(drop=True, inplace=True)
        
    if df.shape[0] < 5:
        df_return = df
    else:
        df_return = df[:5]

    # 필요한 내용만 추출
    df_return = df_return[['input_question', 'score', 'question', 'answer']]
    
    return df_return

In [16]:
def select_top5_Review(df):
    # score 높은순 & 추천 수 많은순 & image_url 여부
    df.sort_values(by=['score','praise_count','image_url'], ascending=False, inplace=True)

    # reset index
    df.reset_index(drop=True, inplace=True)
    
    if df.shape[0] < 5:
        df_return = df
    else:
        df_return = df[:5]
    
    # 필요한 내용만 추출
    df_return = df_return[['prod_id', 'prod_name', 'input_question', 'score', 'comment', 'praise_count', 'image_url']]
    
    return df_return

## Matching System

In [17]:
def matching_system(product_id, question):
    
    # run mecab
    que_mecab = make_question_mecab_tokens(question)

    # make dataloader
    input_data = BERTDataset(que_mecab, 0, tok, max_len, True, False)
    input_dataloader = torch.utils.data.DataLoader(input_data, batch_size=batch_size, num_workers=5)
    
    # input data embedding & class
    input_embedding, input_class = input_BERTClassifier(model, input_dataloader)
    

    # Semantic Search between input & question
    question_top = Semantic_Search_Question(question, input_embedding, input_class)
    # select question top5
    question_top5 = select_top5_Question(question_top)
    
    # Semantic Search between input & review
    review_top = Semantic_Search_Review(question, input_embedding, input_class, product_id)
    # select top5
    review_top5 = select_top5_Review(review_top)  

    return question_top5, review_top5

## Main

In [18]:
que = pd.read_csv(data_path+'question_30.csv')

In [19]:
question_top5, review_top5 = matching_system(str(que['product_id'][22]), [que['question'][22]])

In [20]:
question_top5

Unnamed: 0,input_question,score,question,answer
0,충전기가 안왔는데 추가 배송되나요?,1.0,충전기 꽂아도 충전도안되고 불도 안들어와요 \n어떻게해야하나요?,\r\n안녕하세요 고객님\r\n\r\n■ 작동중 전원꺼짐+ 완충후 멈춤+ 충전불량 >> 사용하신 충전기 수입원 ㈜홈니즈 적힌 충전기 사용하신게 맞는지 확인후 AS접수가 가능합니다. 사용중 타사 충전기를 잘못 사용하시게되면 작동시 전원꺼짐 등의 발생원인이 됩니다.\r\n충전기 스티커에 홈니즈라고 적혀있으면 as 접수가 가능하셔서\r\n성함/ 연락처/ 주소지 확인부탁드립니다. 본사에 전달하여 as 신청요청 하겠습니다.\r\n감사합니다.\r\n
1,충전기가 안왔는데 추가 배송되나요?,1.0,충전기만 다시 구매할수있을까요,\r\n안녕하세요 고객님\r\n\r\n본사에 전달해드려서 충전기 구매 안내 받으실수 있도록 전달 해드리겠습니다.\r\n주소지 연락처 성함 확인부탁드립니다.\r\n확인글 남겨주실때에 충전기만 구매 라고 내용도 함께 남겨주시면 감사하겠습니다.\r\n감사합니다.\r\n
2,충전기가 안왔는데 추가 배송되나요?,1.0,충전이 안됩니다. 케이블 문제인줄 알고 케이블 사서 바꾸어보고 했는데도 충전중 빨간불이 안들어오고 충전이 안돼요. 교환이나 a/s 되나요? 사진 보내드릴 수 있습니다,"고객님 안녕하세요 세비즈입니다.\r\n제품 불량현상을 사진이나 동영상으로 찍어 카카오톡 '세비즈'로 보내주시면\r\n저희가 확인 후, A/S 및 교환처리 도와드리겠습니다.\r\n감사합니다^^"
3,충전기가 안왔는데 추가 배송되나요?,1.0,충전케이블선 AUX선 두개다 없어요ㅠ 빨리보내주세요,"고객님 안녕하세요 세비즈입니다\r\n불편을 드려 죄송합니다\r\n고객센터 1661-7023 (상담시간 오전9시~오후6시, 점심시간 12시~13시)로 연락주시면 빠른 처리 도와드리겠습니다\r\n감사합니다^^"
4,충전기가 안왔는데 추가 배송되나요?,1.0,충전기가 본체는 없고 선만 오는게 맞는거죠 ?,"고객님 안녕하세요 세비즈입니다\r\n네 맞습니다 \r\n충전케이블선, AUX케이블선과 같이 선만 동봉되어 배송됩니다\r\n감사합니다 ^^"


In [21]:
review_top5

Unnamed: 0,prod_id,prod_name,input_question,score,comment,praise_count,image_url
0,228423,[5%쿠폰] GOLD20W 거치대형 스피커 (USB/AUX/블루투스5.0/FM라디오),충전기가 안왔는데 추가 배송되나요?,1.0,충전식이 아니라서 휴대가 안되는 점이 좀 아쉬운데 가성비 좋아요,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-161175293992216958.jpeg/1440/none
1,228423,[5%쿠폰] GOLD20W 거치대형 스피커 (USB/AUX/블루투스5.0/FM라디오),충전기가 안왔는데 추가 배송되나요?,1.0,예쁜데 충전기 꽂는곳 2주만에 접촉불량. 결국 완전 고장 났어요..ㅠ,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1607070761_UpnS.jpeg/1440/none
2,228423,[5%쿠폰] GOLD20W 거치대형 스피커 (USB/AUX/블루투스5.0/FM라디오),충전기가 안왔는데 추가 배송되나요?,1.0,충전중이라 아직써보진 안았지만 괜찬으리ㅣㅐ 같아요,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1604568168_mJDLb3U.jpeg/1440/none
3,228423,[5%쿠폰] GOLD20W 거치대형 스피커 (USB/AUX/블루투스5.0/FM라디오),충전기가 안왔는데 추가 배송되나요?,1.0,충전이 접촉이 잘안되는것 같은데 그거빼곤 \n음질도 괜찮고 좋습니다~분위기깡패에요~,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1604402059_dQRm.jpeg/1440/none
4,228423,[5%쿠폰] GOLD20W 거치대형 스피커 (USB/AUX/블루투스5.0/FM라디오),충전기가 안왔는데 추가 배송되나요?,1.0,충전식이라조금귀찬ㄹ지만 음질갠찬구 조으네요,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-160257281814633265.jpeg/1440/none


In [26]:
for i in range(len(que)):
    question_top5, review_top5 = matching_system(str(que['product_id'][i]), [que['question'][i]])
    if i==0:
        qna_df = question_top5
        review_df = review_top5
    else:
        qna_df = pd.concat([qna_df, question_top5])
        review_df = pd.concat([review_df, review_top5])
    print(i)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29


In [27]:
qna_df.shape, review_df.shape

((150, 4), (143, 7))

In [29]:
qna_df

Unnamed: 0,input_question,score,question,answer
0,환불은 언제 처리되나요?,1.0,환불 문의요,안녕하세요 고객님 먼데이하우스입니다.\r\n유선상 연락드렸습니다.\r\n감사합니다.(3)
1,환불은 언제 처리되나요?,1.0,환불 하고 싶은데 문의글 남긴 후에 편도로 택배 보내도 되나요,"안녕하세요 한빛카페트입니다!\r\n오늘의집 고객센터로 반품접수 부탁드리며,\r\n반품접수내역 확인되시면 반품택배비 입금안내후 택배사 회수접수해드립니다.\r\n단순변심의 경우 반품택배비 6000원 부담되십니다.\r\n감사합니다~"
2,환불은 언제 처리되나요?,1.0,환불처리언제되나요,"안녕하세요? 고객님~\r\n반품 제품 아직 입고 되지 않았습니다.\r\n확인해보니, 미집화로 확인되어 다시 회수 넣어드렸습니다.\r\n그리고 반품배송비 문자는 미리 안내드리도록 하겠습니다.\r\n\r\n감사합니다."
3,환불은 언제 처리되나요?,1.0,환불처리 언제 되나요??!,안녕하세요 고객님 답변 늦어 죄송합니다 \r\n고객님께서 반품 하신 상품 회수>물류사 입고 확인 되면 쇼핑몰 측 환불 승인처리 도와드릴 예정입니다 \r\n업체측으로 반품 입고 되었는지 여부 확인 중에 있습니다 \r\n입고 확인 되는대로 빠른 환불 승인 처리 도와드릴수 있도록 하겠습니다 \r\n조금만 더 기간양해 부탁드리겠습니다\r\n감사합니다ㅜㅜ
4,환불은 언제 처리되나요?,1.0,"환불처리된게 배송온지 일주일됬는데\n왜 아직도안가져가시나요.,. 문의남겨서\n택배사에 전달한다고하셨는데",안녕하세요 고객님.\r\n현재 택배사 물량이 많아 배송/회수가 지연되고있습니다.ㅠㅠ\r\n또한 빠른 회수 다시한번 요청드리도록 하겠습니다.\r\n감사합니다.
0,얼룩이 잘 생기나요?,1.0,얼룩이 져서 왔는데 교환할려고하면 제가 배송비를 내야되나요???,안녕하세요. 상품 불량으로 이용에 불편을 드려 죄송합니다. 해당 반품 건 불량으로 확인되어 무상 진행됩니다.\r\n교환 원하실 경우 070-4166-8023으로 연락 부탁드립니다.
1,얼룩이 잘 생기나요?,1.0,얼룩 있어서 교환하고 싶어서 카톡 타카타카 플러스 친구로 얼룩 사진 보내도 카톡 확인도 없고 답변도 없네요. 빠른 일처리 부탁드릴게요.,안녕하세요 타카타카입니다. 문의주신 상품 내일~월요일 정도 기사님 방문하셔서 수거될 수 있도록 수거접수 바로 도움드렸습니다. 기사님 방문하시면 상품 전달 부탁드리구요. 상품 검수작업후에 출고 바로 도움드리겠습니다.감사합니다.
2,얼룩이 잘 생기나요?,1.0,얼마전에 제품이상으로 (못이 원목안에서 부러졌음...뺄수도없고 하...) \n문의드렸었는데요 교환문의 주시라 하셨는데 제가 제품 구매확정을 시켜놔서 교환도 못하네요... 어떻게 해야할지 말씀 부탁드려요.,안녕하세요 고객님 먼데이하우스입니다.\r\n우선 불편을 드려 죄송합니다.\r\n번거로우시더라도 오늘의집 사이트내 고객센터에서 사진과 함께 교환신청 해주시면 담당부서에서 \r\n교환여부 확인후 빠르게 진행 도와드리겠습니다. 감사합니다.(2)\r\n
3,얼룩이 잘 생기나요?,1.0,얼마전 하부장 설치를 받았습니다.\n신발장 교체도 진행하고싶은데 키큰장일경우에 도어 개당가격 궁금하고 상담비가 또 발생하는지도 궁금합니다.\n손잡이는 별도로 구입해둔걸로 달아주실수 있는지도 문의드립니다.,상담원통해서 연락주시면 빠르게 답변 받으수있습니다.
4,얼룩이 잘 생기나요?,1.0,얼마전에 구매해서 사용하다가 궁금한게 있어서요..\n스위치말고 본체 바닥에 손을 대면 미세하게 불이 켜지는데 터치 기능이 있는건가요?\n,안녕하세요 고객님 올루미입니다.\r\n고객님 불편을드려 죄송합니다.\r\n터치 기능은 오로라 단 스탠드에 없습니다.\r\n카카오톡> 올루미 친구 추가 후 동영상 부분 성함 연락처와 함께 보내주시면 확인 후 추가 안내도와드리겠습니다. 감사합니다.


In [30]:
review_df

Unnamed: 0,prod_id,prod_name,input_question,score,comment,praise_count,image_url
0,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,환불은 언제 처리되나요?,1.0,환불해주세요 나사 돌리자마자 쩍 소리가 나더니\n부러졌습니다,1,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-160336975126467823.jpeg/1440/none
1,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,환불은 언제 처리되나요?,0.989417,이걸 돈 받고 팔다니 신기하다 신기해,2,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1562998158_yQLCHArf2.jpeg/1440/none
2,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,환불은 언제 처리되나요?,0.989417,돈아깝다는 생각 하나도 안들고 엄청 예뻐요ㅎㅎ,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1560936223_arTdjj1PF.jpeg/1440/none
0,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,얼룩이 잘 생기나요?,1.0,얼마나튼튼하면 조립할때 나사완전 빡세욬ㅋ 그래도 튼튼해서 좋아요,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1584091756_19437.jpeg/1440/none
1,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,얼룩이 잘 생기나요?,1.0,"얼핏보기에만 이쁜, 가루날리는, 딱 제값하는 협탁",0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1537278870_MWS3ohd9c.jpeg/1440/none
2,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,얼룩이 잘 생기나요?,1.0,얼른 조립해서 사용해보고 싶네요~ 맘에들어요,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1530965881_6.jpeg/1440/none
3,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,얼룩이 잘 생기나요?,0.994129,깔끄미 합니다 ! 근데 조립할때 좀 땀흘렸어요!,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1565677113_vpG.jpeg/1440/none
4,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,얼룩이 잘 생기나요?,0.994129,깔끙한 디자인이라 어디에다가 놔도 잘어울려요!,0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1583640572_VfC.jpeg/1440/none
0,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,수도권 외 지역은 배송비가 추가로 드나요?,1.0,이뽀요 ㅋ수납도마니되고 디자인도 이뻐염,1,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots-1574778823_BF7PmqX.jpeg/1440/none
1,388715,[쿠폰할인] 순수원목 A사이드테이블 3colors,수도권 외 지역은 배송비가 추가로 드나요?,1.0,"수평 맞췄는데도 길이 안맞아서 조립하다가 부셔졌어요 고객센터는 전화 연결도 안되고요, 그냥 쓰겠습니다",0,https://image.ohou.se/image/resize/bucketplace-v2-development/uploads-cards-snapshots1589455748_364213.jpeg/1440/none


In [28]:
qna_df.to_csv(data_path+'similar_question_30.csv', index=False)
review_df.to_csv(data_path+'similar_review_30.csv', index=False)