#### DB접속 챗봇 예제(Gradio 사용)

In [1]:
import gradio as gr
import pandas as pd
from sqlalchemy import create_engine, text
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from langchain.llms import Ollama
from langchain.callbacks.manager import CallbackManager # 다양한 이벤트에 대한 콜백을 관리하는 클래스
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler  # 텍스트 생성되는 대로 바로 출력
import re  # 텍스트 패턴을 정의 (텍스트를 검색, 치환, 분리)
from typing import Dict, Any  # 타입을 명시적으로 지정하여 코드의 가독성과 안정성을 높임
import json

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# DB 연결 설정
DB_URL = "mysql+pymysql://root:dhforkwk96$@localhost:3306/test"
engine = create_engine(DB_URL)

In [3]:
class EnhancedQueryGenerator:
    """향상된 SQL 쿼리 생성 클래스"""

    def __init__(self):
        self.query_template = """
        당신은 한국어를 잘하고 MySQL 데이터베이스의 쿼리를 생성하는 전문가입니다.
        데이터베이스 스키마 정보:
        {schema_info}

        이전 피드백 정보:
        {feedback_info}

        위 정보를 바탕으로 다음 질문에 대한 MySQL 쿼리를 생성해주세요.
        질문: {question}

        규칙:
        1. 순수한 SQL 쿼리만 작성하세요
        2. 컬럼의 실제 값을 기준으로 쿼리를 작성하세요
        3. 설명이나 주석을 포함하지 마세요
        4. 쿼리는 SELECT 문으로 시작하고 세미콜론(;)으로 끝나야 합니다
        5. WHERE 절에서는 정확한 값 매칭을 위해 = 연산자를 사용하세요
        6. 유사 검색이 필요한 경우 LIKE '%키워드%' 를 사용하세요
        7. 관련된 모든 결과를 찾기 위해 적절히 OR 조건을 활용하세요
        """

        self.answer_template = """
        다음 정보를 바탕으로 사용자의 질문에 대한 답변을 생성해주세요:

        원래 질문: {question}
        실행된 쿼리: {query}
        쿼리 결과: {result}

        규칙:
        1. 결과를 자연스러운 한국어로 설명해주세요
        2. 숫자 데이터가 있다면 적절한 단위와 함께 표현해주세요
        3. 결과가 없다면 그 이유를 설명해주세요
        4. 전문적인 용어는 쉽게 풀어서 설명해주세요
        """

        # Gemma2 모델 초기화
        callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])
        self.llm = Ollama(
            model="gemma2",
            temperature=0,
            callback_manager=callback_manager
        )

        # 프롬프트 템플릿 설정
        self.query_prompt = ChatPromptTemplate.from_template(self.query_template)
        self.answer_prompt = ChatPromptTemplate.from_template(self.answer_template)

        # Chain 설정
        self.query_chain = LLMChain(llm=self.llm, prompt=self.query_prompt)
        self.answer_chain = LLMChain(llm=self.llm, prompt=self.answer_prompt)

    def generate_query(self, question: str, schema_info: str, feedback_info: str = "") -> str:
        """질문에 대한 SQL 쿼리를 생성합니다."""
        response = self.query_chain.run(
            question=question,
            schema_info=schema_info,
            feedback_info=feedback_info
        )
        return self.extract_sql_query(response)

    def generate_answer(self, question: str, query: str, result: Any) -> str:
        """쿼리 결과를 바탕으로 자연어 답변을 생성합니다."""
        result_str = str(result) if isinstance(result, pd.DataFrame) else json.dumps(result, ensure_ascii=False)
        response = self.answer_chain.run(
            question=question,
            query=query,
            result=result_str
        )
        return response.strip()

    @staticmethod  # 메서드가 클래스의 인스턴스 없이도 호출
    def extract_sql_query(response: str) -> str:
        """응답에서 SQL 쿼리를 추출합니다."""
        response = response.replace('```sql', '').replace('```', '').strip()
        match = re.search(r'SELECT.*?;', response, re.DOTALL | re.IGNORECASE)
        return match.group(0).strip() if match else response.strip()

# 쿼리 결과 반환
def get_schema_info():
    """데이터베이스 스키마 정보를 가져옵니다."""
    with engine.connect() as conn:
        tables = pd.read_sql("SHOW TABLES", conn)
        schema_info = []

        for table in tables.iloc[:, 0]:
            columns = pd.read_sql(f"DESCRIBE {table}", conn)
            schema_info.append(f"테이블: {table}")
            schema_info.append("컬럼:")
            for _, row in columns.iterrows():
                schema_info.append(f"- {row['Field']} ({row['Type']})")
            schema_info.append("")

        return "\n".join(schema_info)

def execute_query(query):
    """SQL 쿼리를 실행하고 결과를 반환합니다."""
    try:
        with engine.connect() as conn:
            result = pd.read_sql(query, conn)
            return result
    except Exception as e:
        return f"쿼리 실행 중 오류 발생: {str(e)}"

def process_question(question):
    """질문을 처리하고 결과를 반환합니다."""
    schema_info = get_schema_info()
    query_generator = EnhancedQueryGenerator()

    # 쿼리 생성
    query = query_generator.generate_query(question, schema_info)

    # 쿼리 실행
    result = execute_query(query)

    # 답변 생성
    answer = query_generator.generate_answer(question, query, result)

    return query, result, answer

In [4]:
# Gradio 인터페이스 생성
def create_interface():
    with gr.Blocks() as demo:
        gr.Markdown("# DB 문의 챗봇 (Gemma2 기반)")

        with gr.Row():
            question_input = gr.Textbox(
                label="질문을 입력하세요",
                placeholder="데이터베이스에 대해 궁금한 점을 물어보세요..."
            )

        with gr.Row():
            submit_btn = gr.Button("질문하기")

        with gr.Row():
            query_output = gr.Textbox(label="생성된 SQL 쿼리")

        with gr.Row():
            with gr.Column():
                result_output = gr.Dataframe(label="쿼리 실행 결과")

        with gr.Row():
            answer_output = gr.Textbox(
                label="AI 답변",
                lines=5
            )

        submit_btn.click(
            fn=process_question,
            inputs=[question_input],
            outputs=[query_output, result_output, answer_output]
        )

    return demo

In [5]:
# 인터페이스 실행
if __name__ == "__main__":
    demo = create_interface()
    demo.launch(server_port=7861, server_name="0.0.0.0", debug=True)

* Running on local URL:  http://0.0.0.0:7861

To create a public link, set `share=True` in `launch()`.


  self.llm = Ollama(
  self.llm = Ollama(
  self.query_chain = LLMChain(llm=self.llm, prompt=self.query_prompt)
  response = self.query_chain.run(


SELECT * 
FROM elec_forecast
WHERE Date = '2025-01-01';  
2025년 1월 1일의 발전량 예측은 **18,903.64 kW** 입니다.  


* 'elec_forecast'라는 테이블에서 2025년 1월 1일 날짜에 해당하는 데이터를 찾아서 예측된 발전량을 확인했습니다. 
Keyboard interruption in main thread... closing server.


In [6]:
demo.close()

Closing server running on port: 7861
