In [1]:
import pandas as pd
import numpy as np

In [2]:
##### 데이터 전처리 #####

df = pd.read_csv('pill.csv')
df.drop(columns=['Unnamed: 0', 'itemSeq', 'itemImage', 'openDe', 'updateDe'], inplace=True)

df.dropna(subset=['efcyQesitm'], inplace=True)

PILLS = df['itemName'].values.tolist()

In [3]:
cols = ['atpnWarnQesitm', 'atpnQesitm', 'intrcQesitm']

df = df.fillna(' ')
df['warn']=df[cols].apply(lambda row:' '.join(row.values.astype(str)), axis=1)
df.drop(columns=cols, inplace=True)

KEYWORDS = {0:['회사', '제조사'],
            1:['이름', '제품명'],
            2:['효과', '효능', '약효'],
            3:['용법', '복용', '얼마나', '언제', '적정'],
            4:['부작용'],
            5:['보관'],
            6:['주의', '경고', '유의'],}

In [4]:
##### 유틸리티 함수 #####

# 약 이름에 따라 알맞는 row index를 반환
def getRIndex(pill):
    return df.index[df['itemName'] == pill][0]

# 제시된 키워드에 따라 알맞는 column index를 반환
def getCIndex(keyword):
    for k, v in KEYWORDS.items():
        if keyword in v:
            return k
    return -1

# 약 이름과 키워드에 따라 알맞는 data를 반환
def getData(pill, keyword):
    ridx = getRIndex(pill)
    cidx = getCIndex(keyword)
    return df.iat[ridx, cidx]

def text2list(text):
    words = text.split()
    
    for i in range(len(words)):
        if words[i].strip()[-1] in '은는이가을를의':
            words[i] = words[i][:-1]
    
    return words

In [5]:
##### 주요 기능 함수 #####

# 제시된 증상에 맞는 약 이름 list를 반환
def whichPill(fac):
    pills = []
    for i in range(len(df)):
        efcy = df.iat[i, 2]
        if fac in efcy:
            pills.append(df.iat[i, 1])
    return pills

# 입력 텍스트에 응답 키워드가 들어있는지 확인하여 키워드를 반환
# Return -1 for 키워드 없음
# Return 0 for 키워드 다수
# Return 키워드 for 키워드 하나
def text2key(text):
    cnt = 0
    words = []
    for k, v in KEYWORDS.items():
        for keyword in v:
            if keyword in text:
                cnt += 1
                words.append(keyword)
                break
    
    if cnt == 0:
        return -1
    if cnt == 1:
        return words[0]
    return 0

# 입력 텍스트에 약 이름이 들어있는지 확인하여 약 이름을 반환
# Return -1 for 약 이름 없음
# Return 0 for 약 이름 다수
# Return 약 이름 for 약 이름 하나
def text2pill(text):
    cnt = 0
    pills = []
    
    words = text2list(text)
    
    for item in words:
        for pill in PILLS:
            if item in pill:
                cnt += 1
                pills.append(item)
    
    if cnt == 0:
        return -1
    if cnt == 1:
        return pills[0]
    return 0

In [6]:
##### 초기 메시지 #####

def firstMessage():
    res = """안녕하세요? 약 도우미 챗봇입니다.
약의 보관법, 복용방법, 부작용 등 특정 약에 대해 궁금한 사항부터
특정 증상으로 아플 때 어떠한 약의 도움을 받을 수 있는지,
약에 관해 궁금한 사항은 무엇이든 물어봐 주세요.

예시 1) 약 "냠냠정"의 보관법이 궁금할 때: (약 이름, 궁금한 사항)
    => 냠냠정의 보관법은 뭐야?
    => 냠냠정 보관법
    => 냠냠정 어떻게 보관해야 해? 등
    
예시 2) 배 아플 때 어떤 약을 사야 하는지 궁금할 때: (증상)
    => 복통
    => 복통약 알려줘
    => 복통에 먹는 약 등"""
    
    return res

In [7]:
##### main격 함수 #####

def respond(text):
    keyword = text2key(text)
    pill = text2pill(text)
    if (keyword == -1 or pill == -1):
        res = "무슨 말인지 모르겠어요."
        return res
    elif (keyword == 0 or pill == 0):
        res = "한 번에 하나씩 질문해 주세요."
        return res
    return getData(pill, keyword)

In [8]:
# TEST CODE
    
text1 = '안녕하세요, 아네모정의 보관은 어떻게 하나요?'
text2 = '이지엔 보관방법'
text3 = '안녕하세요'
text4 = '아네모정 보관방법 제조사'

# print(firstMessage())

# print(respond(text1))
print(text2pill(text1))
print(text2pill(text2))
# print(respond(text2))
# print(respond(text3))
# print(respond(text4))
# print(whichPill('편두통'))

아네모정
0
