In [2]:
import gradio as gr
import pandas as pd
from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.llms import Ollama
from langchain.chains import RetrievalQA
from langchain.schema import Document
from sentence_transformers import SentenceTransformer
from huggingface_hub import HfApi

  from .autonotebook import tqdm as notebook_tqdm





In [3]:
# 데이터 로드
csv_file_path_hum = "./dataset/서울시_병원.csv"
csv_file_path_ani = "./dataset/서울시_동물병원.csv"
csv_file_path_post = "./dataset/서울시_산후조리업.csv"
csv_file_path_pharm = "./dataset/서울시_약국.csv"

data_hum = pd.read_csv(csv_file_path_hum, encoding="cp949")
data_ani = pd.read_csv(csv_file_path_ani, encoding="cp949")
data_post = pd.read_csv(csv_file_path_post, encoding="cp949")
data_pharm = pd.read_csv(csv_file_path_pharm, encoding="cp949")

In [4]:
# 도로명 주소 없을 시 지번주소로 대체, 둘 다 없으면 '주소 정보 없음'
data_hum["주소"] = data_hum.apply(
    lambda row: row["도로명주소"]
    if pd.notnull(row["도로명주소"])
    else (row["지번주소"] if pd.notnull(row["지번주소"]) else "주소 정보 없음"),
    axis=1,
)

data_ani["주소"] = data_ani.apply(
    lambda row: row["도로명주소"]
    if pd.notnull(row["도로명주소"])
    else (row["지번주소"] if pd.notnull(row["지번주소"]) else "주소 정보 없음"),
    axis=1,
)

data_post["주소"] = data_post.apply(
    lambda row: row["도로명주소"]
    if pd.notnull(row["도로명주소"])
    else (row["지번주소"] if pd.notnull(row["지번주소"]) else "주소 정보 없음"),
    axis=1,
)

data_pharm["주소"] = data_pharm.apply(
    lambda row: row["도로명주소"]
    if pd.notnull(row["도로명주소"])
    else (row["지번주소"] if pd.notnull(row["지번주소"]) else "주소 정보 없음"),
    axis=1,
)



In [5]:
# 영업상태명 처리, 폐업시 폐업일자, 휴업시 휴업시작일자
data_hum['상태'] = data_hum.apply(
    lambda row: "영업중"
    if row["영업상태명"] == "영업/정상"
    else (
        f"폐업중입니다. 폐업일자 : {row['폐업일자']}"
        if row["영업상태명"] == "폐업"
        else (
            f"휴업중입니다. 휴업시작일자 : {row['휴업시작일자']}"
            if row["영업상태명"] == "휴업"
            else "상태 미확인"
        )
    ),
    axis=1,
)

data_ani['상태'] = data_ani.apply(
    lambda row: "영업중"
    if row["영업상태명"] == "영업/정상"
    else (
        f"폐업중입니다. 폐업일자 : {row['폐업일자']}"
        if row["영업상태명"] == "폐업"
        else (
            f"휴업중입니다. 휴업시작일자 : {row['휴업시작일자']}"
            if row["영업상태명"] == "휴업"
            else "상태 미확인"
        )
    ),
    axis=1,
)

data_post['상태'] = data_post.apply(
    lambda row: "영업중"
    if row["영업상태명"] == "영업/정상"
    else (
        f"폐업중입니다. 폐업일자 : {row['폐업일자']}"
        if row["영업상태명"] == "폐업"
        else (
            f"휴업중입니다. 휴업시작일자 : {row['휴업시작일자']}"
            if row["영업상태명"] == "휴업"
            else "상태 미확인"
        )
    ),
    axis=1,
)

data_pharm['상태'] = data_pharm.apply(
    lambda row: "영업중"
    if row["영업상태명"] == "영업/정상"
    else (
        f"폐업중입니다. 폐업일자 : {row['폐업일자']}"
        if row["영업상태명"] == "폐업"
        else (
            f"휴업중입니다. 휴업시작일자 : {row['휴업시작일자']}"
            if row["영업상태명"] == "휴업"
            else "상태 미확인"
        )
    ),
    axis=1,
)

In [6]:
# 'info' 열 생성
col_to_use = ["상태", "전화번호", "주소", "사업장명", "데이터갱신일자"]

data_hum["info"] = data_hum[["상태", "전화번호", "주소", "사업장명", "데이터갱신일자", "업태구분명"]].apply(
    lambda row: " ".join(row.astype(str)), axis=1
)
data_ani["info"] = data_ani[col_to_use].apply(lambda row: " ".join(row.astype(str)), axis=1)
data_post["info"] = data_post[col_to_use].apply(lambda row: " ".join(row.astype(str)), axis=1)
data_pharm["info"] = data_pharm[col_to_use].apply(lambda row: " ".join(row.astype(str)), axis=1)


In [7]:
# Document 객체로 변환
documents_hum = [
    Document(
        page_content=row["info"],
        metadata={
            "병원명": row["사업장명"],
            "주소": row["주소"],
            "전화번호": row["전화번호"],
            "진료과목": row.get("진료과목내용명", "N/A"),
        },
    )
    for _, row in data_hum.iterrows()
]

documents_ani = [
    Document(
        page_content=row["info"],
        metadata={
            "병원명": row["사업장명"],
            "주소": row["주소"],
            "전화번호": row["전화번호"],
            "진료과목": "N/A",  # 동물병원 데이터는 진료과목 없음
        },
    )
    for _, row in data_ani.iterrows()
]

documents_post = [
    Document(
        page_content=row["info"],
        metadata={
            "병원명": row["사업장명"],
            "주소": row["주소"],
            "전화번호": row["전화번호"],
            "진료과목": "N/A",  # 동물병원 데이터는 진료과목 없음
        },
    )
    for _, row in data_post.iterrows()
]

documents_pharm = [
    Document(
        page_content=row["info"],
        metadata={
            "병원명": row["사업장명"],
            "주소": row["주소"],
            "전화번호": row["전화번호"],
            "진료과목": "N/A",  # 동물병원 데이터는 진료과목 없음
        },
    )
    for _, row in data_pharm.iterrows()
]

In [8]:
# # 벡터 임베딩 생성
# token = "<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>"
# embeddings = SentenceTransformer("jhgan/ko-sroberta-multitask", use_auth_token=token)


# # 각각의 documents에 대해 임베딩을 생성합니다.
# embeddings_hum = embeddings.encode([doc.page_content for doc in documents_hum])
# embeddings_ani = embeddings.encode([doc.page_content for doc in documents_ani])
# embeddings_post = embeddings.encode([doc.page_content for doc in documents_post])
# embeddings_pharm = embeddings.encode([doc.page_content for doc in documents_pharm])

In [9]:
# HuggingFaceEmbeddings 사용하여 임베딩 객체 생성
embeddings = HuggingFaceEmbeddings(model_name="jhgan/ko-sroberta-multitask")


  embeddings = HuggingFaceEmbeddings(model_name="jhgan/ko-sroberta-multitask")


In [11]:
vectorstore_hum = FAISS.from_documents(documents_hum, embeddings)
vectorstore_ani = FAISS.from_documents(documents_ani, embeddings)
vectorstore_post = FAISS.from_documents(documents_post, embeddings)
vectorstore_pharm = FAISS.from_documents(documents_pharm, embeddings)

In [12]:
# Ollama Gemma2 모델 초기화
llm = Ollama(model="gemma2", base_url="http://localhost:11434")

  llm = Ollama(model="gemma2", base_url="http://localhost:11434")


In [13]:
# 검색기(retriever) 설정
retriever_hum = vectorstore_hum.as_retriever()
retriever_ani = vectorstore_ani.as_retriever()
retriever_post = vectorstore_post.as_retriever()
retriever_pharm = vectorstore_pharm.as_retriever()

In [14]:
# RAG 체인 설정
qa_chain_hum = RetrievalQA.from_chain_type(llm=llm, retriever=retriever_hum)
qa_chain_ani = RetrievalQA.from_chain_type(llm=llm, retriever=retriever_ani)
qa_chain_post = RetrievalQA.from_chain_type(llm=llm, retriever=retriever_post)
qa_chain_pharm = RetrievalQA.from_chain_type(llm=llm, retriever=retriever_pharm)

In [None]:
class EnhancedAnswerGenerator:
    """향상된 답변 쿼리 생성 클래스"""

    def __init__(self):
        

In [15]:
# Gradio 함수 정의
def human_hospital_bot(query):
    response = qa_chain_hum.run(query)  # RAG 체인 사용
    return response


def animal_hospital_bot(query):
    response = qa_chain_ani.run(query) 
    return response

def postpartum_hospital_bot(query):
    response = qa_chain_post.run(query) 
    return response

def pharmacy_hospital_bot(query):
    response = qa_chain_pharm.run(query) 
    return response

In [19]:
# Gradio 인터페이스
with gr.Blocks() as app:
    gr.Markdown(
        "## 🏥 병원 정보 챗봇"
    )  # 챗봇을 좀 더 직관적으로 만들기 위해 이모지 사용

    with gr.Tabs():
        with gr.Tab("👨‍⚕️ 병원"):
            gr.Markdown("### 사람 병원 정보를 검색해보세요!")
            human_query = gr.Textbox(label="질문 입력", placeholder="예: 요양병원은 어디있나요?")
            human_response = gr.Textbox(label="답변")
            human_search_btn = gr.Button("검색")
            human_search_btn.click(human_hospital_bot, inputs=[human_query], outputs=[human_response])

        with gr.Tab("🐶 동물 병원"):
            gr.Markdown("### 동물 병원 정보를 검색해보세요!")
            animal_query = gr.Textbox(label="질문 입력", placeholder="예: 강동구에 있는 동물병원 리스트를 뽑아줘")
            animal_response = gr.Textbox(label="답변")
            animal_search_btn = gr.Button("검색")
            animal_search_btn.click(animal_hospital_bot, inputs=[animal_query], outputs=[animal_response])

        with gr.Tab("👶 산후조리원"):
            gr.Markdown("### 산후조리원 정보를 검색해보세요!")
            post_query = gr.Textbox(label="질문 입력", placeholder="예: 구로구에 있는 산후조리원 중 영업중인 산후조리원은 어디에 있어?")
            post_response = gr.Textbox(label="답변")
            post_search_btn = gr.Button("검색")
            post_search_btn.click(postpartum_hospital_bot, inputs=[post_query], outputs=[post_response])
            
        with gr.Tab("💊 약국"):
            gr.Markdown("### 약국 정보를 검색해보세요!")
            pharm_query = gr.Textbox(label="질문 입력", placeholder="예: 호호약국의 전화번호는?")
            pharm_response = gr.Textbox(label="답변")
            pharm_search_btn = gr.Button("검색")
            pharm_search_btn.click(pharmacy_hospital_bot, inputs=[pharm_query], outputs=[pharm_response])    

In [20]:
# 앱 실행
app.launch(share=True)

* Running on local URL:  http://127.0.0.1:7860
* Running on public URL: https://8957a32178f493bb00.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [21]:
app.close()

Closing server running on port: 7860
