## 챗봇 예제(역할 부여)

In [None]:
# 사전 설치 : pip install ollama
import ollama

In [None]:
# 챗봇의 기본적 질문, 답변 역할
def ask_gemma(question):
    # ollama를 사용하여 모델로부터 응답 생성
    chatbot_role = "너는 전문 심리 상담가야. 질문에 대한 답은 3줄 이내로 짧게해줘."
    response = ollama.chat(model='gemma2', messages=[
        {"role": "system", "content": chatbot_role},  # 챗봇의 기본 역할 부여
        {"role": "user", "content": question}, # 질문
    ])

    return response['message']['content']

In [None]:
question = "행복하기 위해 어떻게 하면 좋을까?"
response = ask_gemma(question)
print(response)


## 챗봇 예제(Gradio 사용)

In [None]:
# 사전 설치 : pip install gradio
from langchain_community.chat_models import ChatOllama
from langchain.schema import HumanMessage, AIMessage   # HumanMessage: 사용자가 보낸 메시지, AIMessage : LLM의 메시지
import gradio as gr

In [None]:
# ChatOllama 모델 초기화
model = ChatOllama(model="gemma2", temperature=0.7, verbose=False)    # temperture가 낮을수록 거의 동일답변, 높을수록 창의적인 답변

In [None]:
# 채팅 기록을 포함하여 응답을 생성하는 함수
def chat(message, history):
    # 이전 대화 기록을 ChatOllama 형식으로 변환
    chat_history = []
    for human, ai in history:
        chat_history.append(HumanMessage(content=human))
        chat_history.append(AIMessage(content=ai))

    # 현재 메시지 추가
    chat_history.append(HumanMessage(content=message))

    # 모델을 사용하여 응답 생성
    response = model.invoke(chat_history)

    return response.content

In [None]:
# Gradio 인터페이스 설정
demo = gr.ChatInterface(
    fn=chat,
    examples=[
        "안녕하세요!",
        "인공지능에 대해 설명해주세요.",
        "파이썬의 장점은 무엇인가요?"
    ],
    title="AI 챗봇",
    description="질문을 입력하면 AI가 답변합니다."
)

In [None]:
# 서버 실행
demo.launch(server_port=7861, server_name="0.0.0.0")

In [None]:
demo.close()

## 챗봇 예제(Gradio + csv 사용)

In [None]:
import pandas as pd
from langchain_community.chat_models import ChatOllama
from langchain.schema import HumanMessage, AIMessage   # HumanMessage: 사용자가 보낸 메시지, AIMessage : LLM의 메시지
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS
from langchain.text_splitter import CharacterTextSplitter  # 특정 문자(예: 줄바꿈, 공백)를 기준으로 텍스트를 분할하는 기능을 제공
from langchain.chains import ConversationalRetrievalChain  # 질문과 관련된 정보 검색, 이전 대화정보도 같이 LLM에 제공, 답변생성
import gradio as gr

In [None]:
# CSV 파일 로드
df = pd.read_csv("./dataset/indata_kor.csv", encoding='CP949')

In [None]:
# 텍스트 분할
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200) # 텍스트 조각 최대 1000자, 텍스트 조각 사이에 200자만큼의 중복을 허용(문맥 유지)
texts = text_splitter.split_text("\n".join(df.to_string()))   # 문자열들을 줄바꿈 문자(\n)를 기준으로 연결

In [None]:
# 임베딩 모델 초기화
# embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/distiluse-base-multilingual-cased-v2")
# 모델 이름 : 조직이름(sentence-transformers) 다양한 작업 가능(all)-MS사 경령화 트랜스포머모델(MiniLM)-모델의 레이어수(L6)-모델이 버전(v2)
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

In [None]:
# 벡터 데이터베이스 생성
vectorstore = FAISS.from_texts(texts, embeddings)  # from_texts : 임베딩으로 변환된 벡터를 FAISS 인덱스에 저장

In [None]:
# ChatOllama 모델 초기화
llm = ChatOllama(model="gemma2", tempeature=0.1)   # temperture가 낮을수록 거의 동일답변, 높을수록 창의적인 답변

In [None]:
qa_chain = ConversationalRetrievalChain.from_llm(
    llm,
    vectorstore.as_retriever(search_kwargs={"k":1}),  # 가장 관련성 높은 1개의 문서만 검색
    return_source_documents=True,   # 참고한 소스 문서 정보 반환 여부
    verbose=False   # 체인의 실행 과정 출력 여부
)

In [None]:
# 채팅 함수 정의
def chat(message, history):
    # 이전 대화 기록을 ConversationalRetrievalChain 형식으로 변환
    chat_history = [(human, ai) for human, ai in history]

    # 모델을 사용하여 응답 생성
    response = qa_chain({"question": message, "chat_history": chat_history})

    # 소스 문서 정보 추출
    sources = set([doc.metadata.get('source', 'Unknown') for doc in response['source_documents']])
    source_info = f"\n\n참고 출처: {', '.join(sources)}" if sources else ""

    return response['answer'] + source_info

In [None]:
# Gradio 인터페이스 설정
demo = gr.ChatInterface(
    fn=chat,
    examples=[
        "한국폴리텍대학 스마트금융과 면접시에는 어떤걸 준비하고 가면 될까요?",
        "스마트금융과에 대해 설명해주세요",
        "한국폴리텍대한 추천할만한 학과 하나를 소개해주세요."
    ],
    title="대학 정보 AI 챗봇",
    description="스마트금융과에 대한 질문을 입력하면 AI가 CSV데이터를 참고하여 한글로 답변합니다."
)

In [None]:
# 서버 실행
demo.launch(server_port=7861, server_name="0.0.0.0")

In [None]:
demo.close()

## 챗봇 예제(인터넷 URL정보 요약하기 + TAB추가)

In [None]:
import gradio as gr
import bs4
from langchain.text_splitter import RecursiveCharacterTextSplitter  # 텍스트를 분할하는 기준 제공
from langchain_community.document_loaders import WebBaseLoader    # 웹페이지의 콘텐츠를 불러오는(로드하는) 기능을 제공
from langchain.vectorstores import FAISS
from langchain_community.embeddings import OllamaEmbeddings
import ollama

In [None]:
# 텍스트 콘텐츠를 추출하여, 줄바꿈(\n\n)으로 구분된 단일 문자열로 결합

def load_and_retrieve_docs(url):
    loader = WebBaseLoader(
        web_paths=(url,),
        bs_kwargs=dict()
    )

    docs = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
    splits = text_splitter.split_documents(docs)
    embeddings = OllamaEmbeddings(model="gemma2")

    # vectorstore = Chroma.from_documents(documents=splits, embedding=embeddings)
    vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)

    return vectorstore.as_retriever()

In [None]:
# Function to format documents

def format_docs(docs):

    return "\n\n".join(doc.page_content for doc in docs)

In [None]:
# RAG 시스템을 구현하여 주어진 URL의 웹페이지 콘텐츠를 기반으로 사용자의 질문에 답변을 생성하는 역할

def rag_chain(url, question):

    retriever = load_and_retrieve_docs(url)

    retrieved_docs = retriever.invoke(question)

    formatted_context = format_docs(retrieved_docs)

    formatted_prompt = f"Question: {question}\n\nContext: {formatted_context}"

    response = ollama.chat(model='gemma2', messages=[{'role': 'user', 'content': formatted_prompt}])

    return response['message']['content']

In [None]:
# Gradio interface

# iface = gr.Interface(

#     fn=rag_chain,

#     inputs=["text", "text"],

#     outputs="text",

#     title="RAG Chain Question Answering",

#     description="Enter a URL and a query to get answers from the RAG chain."

# )

In [None]:
# Gradio Tabbed Interface
with gr.Blocks() as iface:
    # Tab for Question and Answer
    with gr.Tab("질문과 답변"):
        gr.Interface(
            fn=rag_chain,
            inputs=["text", "text"],
            outputs="text",
            title="RAG Chain Question Answering",
            description="URL과 질문을 입력하면 RAG 체인에서 답변을 받으실 수 있습니다."
        )

    # Tab for Visualization (Word Cloud)
    with gr.Tab("시각화 (워드클라우드)"):
        gr.Markdown("이 탭은 시각화를 위한 공간입니다. 워드클라우드 기능이 여기에 추가될 예정입니다.")

In [None]:
# 디버그 모드로 Gradio 인터페이스 실행
iface.launch(server_port=7861, server_name="0.0.0.0", debug=True)

In [None]:
iface.close()

## 챗봇 예제(STT:음성을 텍스트로 전환)

In [None]:
# 사전 설치 : pip install openai-whisper
# ffmpeg 사전 설치 및 환경변수 path 설정(경로/bin)
# 코랩 audio에서 테스트할 샘플 오디오 파일 다운
import os
from dotenv import load_dotenv  # 환경변수 로드가 필요한 경우
import whisper
import gradio as gr

In [None]:
# .env 파일에서 환경 변수 로드 (필요한 경우)
# load_dotenv()

In [None]:
# ffmpeg 경로 명시적 설정
# os.environ["FFMPEG_BINARY"] = "C:/aiproject/ffmpeg/bin/ffmpeg.exe"
os.environ["PATH"] += os.pathsep + r"C:\aiproject\ffmpeg\bin"
os.environ["FFMPEG_BINARY"] = r"C:\aiproject\ffmpeg\bin\ffmpeg.exe"

In [None]:
def transcribe_audio(audio_path):
    # Whisper 모델 로드
    model = whisper.load_model("base")

    # 오디오 파일 전사
    result = model.transcribe(audio_path)

    # 전사된 텍스트 반환
    return result["text"]

In [None]:
def process_audio(audio):
    if audio is None:
        return "오디오 파일을 업로드해주세요."
    try:
        transcribed_text = transcribe_audio(audio)
        return transcribed_text
    except Exception as e:
        return f"오류가 발생했습니다: {str(e)}"

In [None]:
# Gradio 인터페이스 생성
iface = gr.Interface(
    fn=process_audio,
    inputs=gr.Audio(type="filepath", label="MP3 파일 업로드"),
    outputs="text",
    title = "MP3 to Text Converter",
    description="MP3 파일을 업로드하면 텍스트로 변환합니다."
)

In [None]:
# 디버그 모드로 Gradio 인터페이스 실행
iface.launch(server_port=7861, server_name="0.0.0.0", debug=True)

In [None]:
iface.close()

## 챗봇 예제(TTS:텍스트를 음성변환)

In [None]:
# 사전 설치 : pip install gtts
import gradio as gr
from gtts import gTTS
import os
import tempfile

In [None]:
def text_to_speech(text, lang='ko'):
    # 임시 파일 생성
    with tempfile.NamedTemporaryFile(delete=False, suffix='.mp3') as fp:
        temp_filename = fp.name

    # TTS 변환
    tts = gTTS(text=text, lang=lang)
    tts.save(temp_filename)
    return temp_filename

In [None]:
def process_tts(text, lang):
    if not text:
        return None, "텍스트를 입력해주세요."
    try:
        audio_file = text_to_speech(text, lang)
        return audio_file, "변환이 완료되었습니다. 아래에서 재생 또는 다운로드할 수 있습니다."
    except Exception as e:
        return None, f"오류가 발생했습니다: {str(e)}"

In [None]:
# Gradion 인터페이스 생성
iface = gr.Interface(
    fn=process_tts,
    inputs=[
        gr.Textbox(lines=5, label="텍스트 입력"),
        gr.Dropdown(choices=['ko', 'en', 'ja', 'zh-cn'], label="언어 선택", value='ko')
    ],
    outputs=[
        gr.Audio(label="생성된 오디오"),
        gr.Textbox(label="상태 메시지")
    ],
    title = "Text to Speech Converter",
    description="텍스트를 입력하연 MP3 파일로 변환합니다."
)

In [None]:
# 디버그 모드로 Gradio 인터페이스 실행
iface.launch(server_port=7861, server_name="0.0.0.0", debug=True)

In [None]:
iface.close()

## 이미지 분류 예제(Gradio 사용)

In [None]:
# 사전설치 : pip install pillow
import gradio as gr
import tensorflow as tf
import numpy as np
from PIL import Image
import requests  # URL에서 데이터를 가져오기 위해 HTTP 요청을 보내는 라이브러리
from io import BytesIO #  메모리에서 바이트 데이터를 저장하고 읽는 기능

In [None]:
# TensorFlow MobileNetV2 모델 로드
model = tf.keras.applications.MobileNetV2(weights="imagenet")  # 사전 훈련된 ImageNet 가중치를 사용

In [None]:
def predict_image(image_url):
    try:
        # URL에서 이미지 가져오기
        response = requests.get(image_url)
        image = Image.open(BytesIO(response.content)).resize((224, 224))  # BytesIO 사용하여 이미지 열기

        # 이미지를 배열로 변환
        image_array = tf.keras.preprocessing.image.img_to_array(image) # 이미지를 숫자 배열로 전환
        image_array = tf.expand_dims(image_array, axis=0)  # 모델이 한 번에 여러 이미지를 처리할 수 있게 "배치"라는 차원을 추가
        image_array = tf.keras.applications.mobilenet_v2.preprocess_input(image_array)  # 이미지 픽셀 값을 모델이 학습할 때 사용했던 범위로 조정 스케일링

        # 예측 수행
        predictions = model.predict(image_array)  # 이미지를 분류하여 1000개 클래스에 대한 확률을 출력
        decoded_predictions = tf.keras.applications.mobilenet_v2.decode_predictions(predictions, top=3)[0]  # 상위 3개 예측 결과 반환

        # Gradio Label 컴포넌트에 맞게 결과 형식 변경
        # 예: {"pizza": 0.95, "burger": 0.03, "salad": 0.02} 형식으로 반환
        result = {label: float(prob) for (_, label, prob) in decoded_predictions}
        return result

    except Exception as e:
        return {"error": 1.0}  # 에러 발생 시 기본값 반환

In [None]:
# Gradio 인터페이스 생성
iface = gr.Interface(
    fn=predict_image,
    inputs=gr.Textbox(label="이미지 URL 입력"),
    outputs=gr.Label(num_top_classes=3, label="예측 결과"),
    title="음식 이미지 분류",
    description="이미지 URL을 입력하면 상위 3개의 예측 결과를 확률과 함께 표시합니다."
)

In [None]:
# 인터페이스 실행
iface.launch(server_port=7861, server_name="0.0.0.0", debug=True)

# 예시 이미지 URL : https://health.chosun.com/site/data/img_dir/2024/04/19/2024041901914_0.jpg

In [None]:
iface.close()

## 이미지 분류 예제(Gradio + gemma2 사용)

In [None]:
import gradio as gr
import tensorflow as tf
import numpy as np
from PIL import Image
import requests
from io import BytesIO
from langchain_community.chat_models import ChatOllama

In [None]:
# TensorFlow MobileNetV2 모델 로드
model = tf.keras.applications.MobileNetV2(weights="imagenet")  # 사전 훈련된 가중치를 사용

In [None]:
OLLAMA_SERVER = "http://localhost:11434"  # 로컬 서버 주소
MODEL_NAME = "gemma2"  # 사용하려는 Ollama 모델 이름

In [None]:
# Ollama를 사용해 음식 설명 생성
def get_food_description_with_langchain(food_name):
    """
    LangChain ChatOllama를 사용하여 음식 설명 생성
    """
    try:
        chat = ChatOllama(base_url=OLLAMA_SERVER, model=MODEL_NAME)
        prompt = f"{food_name}에 대해 특징, 효능, 요리 레시피 설명해줘.설명은 한국어로 해줘."
        response = chat.predict(prompt)
        return response
    except Exception as e:
        return f"Failed to retrieve description: {e}"

In [None]:
# 이미지 예측 함수
def predict_image_with_description(image_url):
    """
    이미지 URL을 받아 음식 예측과 Ollama 설명을 반환
    """
    try:
        # URL에서 이미지 가져오기
        response = requests.get(image_url)
        image = Image.open(BytesIO(response.content)).resize((224, 224))  # BytesIO 사용하여 이미지 열기

        # 이미지를 배열로 변환
        image_array = tf.keras.preprocessing.image.img_to_array(image)  # 이미지를 숫자 배열로 전환
        image_array = tf.expand_dims(image_array, axis=0)  # 모델이 한 번에 여러 이미지를 처리할 수 있게 "배치"라는 차원을 추가
        image_array = tf.keras.applications.mobilenet_v2.preprocess_input(image_array)  # 이미지 픽셀 값을 모델이 학습할 때 사용했던 범위로 조정 전처리

        # 예측 수행
        predictions = model.predict(image_array)
        decoded_predictions = tf.keras.applications.mobilenet_v2.decode_predictions(predictions, top=3)[0]  # 상위 3개 예측 결과 반환

        # 예측 결과 형식화
        result = {label: float(prob) for (_, label, prob) in decoded_predictions} # 예측 결과를 Gradio의 Label 컴포넌트가 요구하는 형식으로 변환

        # 가장 높은 확률의 예측값으로 Ollama 설명 생성
        top_food = decoded_predictions[0][1]  # 가장 확률이 높은 음식 이름
        description = get_food_description_with_langchain(top_food)

        return result, description  # 예측 결과와 Ollama 설명 반환

    except Exception as e:
        return {"error": 1.0}, f"Error: {e}"  # 에러 발생 시 기본값 반환

In [None]:
# Gradio 인터페이스 생성
iface = gr.Interface(
    fn=predict_image_with_description,
    inputs=gr.Textbox(label="이미지 URL 입력"),
    outputs=[
        gr.Label(num_top_classes=3, label="예측 결과"),  # 상위 3개 예측 결과
        gr.Textbox(label="음식 설명", interactive=False)  # Ollama로 생성한 설명 출력
    ],
    title="음식 이미지 분류 및 설명 생성기",
    description="이미지 URL을 입력하면 음식 분류 결과와 설명을 제공합니다."
)

In [None]:
# 인터페이스 실행
iface.launch(server_port=7861, server_name="0.0.0.0", debug=True)

In [None]:
iface.close()

## DB접속 챗봇 예제(Gradio 사용)

In [None]:
import gradio as gr
import pandas as pd
from sqlalchemy import create_engine, text
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from langchain.llms import Ollama
from langchain.callbacks.manager import CallbackManager # 다양한 이벤트에 대한 콜백을 관리하는 클래스
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler  # 텍스트 생성되는 대로 바로 출력
import re  # 텍스트 패턴을 정의 (텍스트를 검색, 치환, 분리)
from typing import Dict, Any  # 타입을 명시적으로 지정하여 코드의 가독성과 안정성을 높임
import json

In [None]:
# DB 연결 설정
DB_URL = "mysql+pymysql://root:비밀번호@localhost:3306/test"
engine = create_engine(DB_URL)

In [None]:
class EnhancedQueryGenerator:
    """향상된 SQL 쿼리 생성 클래스"""

    def __init__(self):
        self.query_template = """
        당신은 한국어를 잘하고 MySQL 데이터베이스의 쿼리를 생성하는 전문가입니다.
        데이터베이스 스키마 정보:
        {schema_info}

        이전 피드백 정보:
        {feedback_info}

        위 정보를 바탕으로 다음 질문에 대한 MySQL 쿼리를 생성해주세요.
        질문: {question}

        규칙:
        1. 순수한 SQL 쿼리만 작성하세요
        2. 컬럼의 실제 값을 기준으로 쿼리를 작성하세요
        3. 설명이나 주석을 포함하지 마세요
        4. 쿼리는 SELECT 문으로 시작하고 세미콜론(;)으로 끝나야 합니다
        5. WHERE 절에서는 정확한 값 매칭을 위해 = 연산자를 사용하세요
        6. 유사 검색이 필요한 경우 LIKE '%키워드%' 를 사용하세요
        7. 관련된 모든 결과를 찾기 위해 적절히 OR 조건을 활용하세요
        """

        self.answer_template = """
        다음 정보를 바탕으로 사용자의 질문에 대한 답변을 생성해주세요:

        원래 질문: {question}
        실행된 쿼리: {query}
        쿼리 결과: {result}

        규칙:
        1. 결과를 자연스러운 한국어로 설명해주세요
        2. 숫자 데이터가 있다면 적절한 단위와 함께 표현해주세요
        3. 결과가 없다면 그 이유를 설명해주세요
        4. 전문적인 용어는 쉽게 풀어서 설명해주세요
        """

        # Gemma2 모델 초기화
        callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])
        self.llm = Ollama(
            model="gemma2",
            temperature=0,
            callback_manager=callback_manager
        )

        # 프롬프트 템플릿 설정
        self.query_prompt = ChatPromptTemplate.from_template(self.query_template)
        self.answer_prompt = ChatPromptTemplate.from_template(self.answer_template)

        # Chain 설정
        self.query_chain = LLMChain(llm=self.llm, prompt=self.query_prompt)
        self.answer_chain = LLMChain(llm=self.llm, prompt=self.answer_prompt)

    def generate_query(self, question: str, schema_info: str, feedback_info: str = "") -> str:
        """질문에 대한 SQL 쿼리를 생성합니다."""
        response = self.query_chain.run(
            question=question,
            schema_info=schema_info,
            feedback_info=feedback_info
        )
        return self.extract_sql_query(response)

    def generate_answer(self, question: str, query: str, result: Any) -> str:
        """쿼리 결과를 바탕으로 자연어 답변을 생성합니다."""
        result_str = str(result) if isinstance(result, pd.DataFrame) else json.dumps(result, ensure_ascii=False)
        response = self.answer_chain.run(
            question=question,
            query=query,
            result=result_str
        )
        return response.strip()

    @staticmethod  # 메서드가 클래스의 인스턴스 없이도 호출
    def extract_sql_query(response: str) -> str:
        """응답에서 SQL 쿼리를 추출합니다."""
        response = response.replace('```sql', '').replace('```', '').strip()
        match = re.search(r'SELECT.*?;', response, re.DOTALL | re.IGNORECASE)
        return match.group(0).strip() if match else response.strip()

# 쿼리 결과 반환
def get_schema_info():
    """데이터베이스 스키마 정보를 가져옵니다."""
    with engine.connect() as conn:
        tables = pd.read_sql("SHOW TABLES", conn)
        schema_info = []

        for table in tables.iloc[:, 0]:
            columns = pd.read_sql(f"DESCRIBE {table}", conn)
            schema_info.append(f"테이블: {table}")
            schema_info.append("컬럼:")
            for _, row in columns.iterrows():
                schema_info.append(f"- {row['Field']} ({row['Type']})")
            schema_info.append("")

        return "\n".join(schema_info)

def execute_query(query):
    """SQL 쿼리를 실행하고 결과를 반환합니다."""
    try:
        with engine.connect() as conn:
            result = pd.read_sql(query, conn)
            return result
    except Exception as e:
        return f"쿼리 실행 중 오류 발생: {str(e)}"

def process_question(question):
    """질문을 처리하고 결과를 반환합니다."""
    schema_info = get_schema_info()
    query_generator = EnhancedQueryGenerator()

    # 쿼리 생성
    query = query_generator.generate_query(question, schema_info)

    # 쿼리 실행
    result = execute_query(query)

    # 답변 생성
    answer = query_generator.generate_answer(question, query, result)

    return query, result, answer

In [None]:
# Gradio 인터페이스 생성
def create_interface():
    with gr.Blocks() as demo:
        gr.Markdown("# DB 문의 챗봇 (Gemma2 기반)")

        with gr.Row():
            question_input = gr.Textbox(
                label="질문을 입력하세요",
                placeholder="데이터베이스에 대해 궁금한 점을 물어보세요..."
            )

        with gr.Row():
            submit_btn = gr.Button("질문하기")

        with gr.Row():
            query_output = gr.Textbox(label="생성된 SQL 쿼리")

        with gr.Row():
            with gr.Column():
                result_output = gr.Dataframe(label="쿼리 실행 결과")

        with gr.Row():
            answer_output = gr.Textbox(
                label="AI 답변",
                lines=5
            )

        submit_btn.click(
            fn=process_question,
            inputs=[question_input],
            outputs=[query_output, result_output, answer_output]
        )

    return demo

In [None]:
# 인터페이스 실행
if __name__ == "__main__":
    demo = create_interface()
    demo.launch(server_port=7861, server_name="0.0.0.0", debug=True)

In [None]:
demo.close()

## 자기소개서 도우미 챗봇 예제(Gradio)

In [None]:
# 사전 설치 : pip install fpdf
import os
import gradio as gr
from langchain.llms import Ollama
from langchain.chains import LLMChain, SimpleSequentialChain
from langchain.prompts import PromptTemplate
from fpdf import FPDF

In [None]:
# Ollama 설정 (Gemma2 모델 사용)
os.environ["OLLAMA_API_BASE"] = "http://localhost:11434"  # Ollama 서버 주소
ollama_model = Ollama(model="gemma2")

In [None]:
# 다양한 템플릿 설정
TEMPLATES = {
    "취업": "다음 키워드와 예시를 바탕으로, 취업 지원을 위한 자기소개서를 작성하세요.",
    "대학원": "제공된 키워드를 사용하여, 대학원 지원을 위한 자기소개서를 초안 작성하세요.",
    "봉사활동": "주어진 키워드를 활용하여, 봉사활동 경험과 동기를 강조하는 자기소개서를 작성하세요."
}

In [None]:
# 언어 지원: 한국어, 영어, 일본어
LANGUAGES = {
    "한국어": "Please write the response in Korean.",
    "영어": "Please write the response in English.",
    "일본어": "Please write the response in Japanese."
}

In [None]:
# 자동 키워드 추천 함수
def recommend_keywords(purpose):
    if purpose == "취업":
        return "책임감, 팀워크, 문제 해결 능력"
    elif purpose == "대학원":
        return "연구 열정, 창의력, 학업 성취도"
    elif purpose == "봉사활동":
        return "사회적 책임감, 희생정신, 리더십"
    else:
        return ""

In [None]:
# 자기소개서 작성 함수
def generate_statement(purpose, language, keywords, example_sentence=None):
    if purpose not in TEMPLATES:
        return "지원 목적을 올바르게 선택해주세요."
    if language not in LANGUAGES:
        return "언어를 올바르게 선택해주세요."

    # 템플릿 생성
    template = TEMPLATES[purpose] + "\n\nKeywords: {keywords}\n" + LANGUAGES[language]
    if example_sentence:
        template += f"\n\nExample sentence: {example_sentence}"

    prompt = PromptTemplate(input_variables=["keywords"], template=template)
    chain = LLMChain(llm=ollama_model, prompt=prompt)
    response = chain.run({"keywords": keywords})
    return response

In [None]:
# PDF 저장 함수
def save_to_pdf(statement, filename="personal_statement.pdf"):
    pdf = FPDF()
    pdf.add_page()  # pdf 문서에 새로운 페이지 추가
    pdf.add_font('MalgunGothic', '', r'C:\Windows\Fonts\malgun.ttf', uni=True)  # '맑은 고딕' 폰트 경로 설정
    pdf.set_font('MalgunGothic', size=12)  # 폰트 설정
    pdf.multi_cell(0, 10, statement) # PDF 문서에 텍스트를 추가, 셀의너비(0), 셀의 높이(10)
    pdf.output(filename) # PDF 문서를 파일로 저장
    return f"✔️ PDF 저장 완료: {filename}"

In [None]:
# Gradio 인터페이스
def chatbot_interface(purpose, language, keywords, example_sentence=None, save_pdf=False):
    statement = generate_statement(purpose, language, keywords, example_sentence)
    if save_pdf:
        save_to_pdf(statement)
    return statement

In [None]:
with gr.Blocks() as demo:
    gr.Markdown("# 📝 다목적 자기소개서 작성 도우미")
    gr.Markdown("키워드와 추천 문장을 활용하여 취업, 대학원, 봉사활동 자기소개서를 생성하고 PDF로 저장하세요!")

    # 입력 영역
    with gr.Row():
        purpose_input = gr.Dropdown(label="지원 목적", choices=["취업", "대학원", "봉사활동"], value="취업")
        language_input = gr.Dropdown(label="언어 선택", choices=["한국어", "영어", "일본어"], value="한국어")

    recommended_keywords = gr.Textbox(label="추천 키워드", interactive=False)
    recommend_btn = gr.Button("키워드 추천")
    recommend_btn.click(recommend_keywords, inputs=[purpose_input], outputs=[recommended_keywords])

    with gr.Row():
        keywords_input = gr.Textbox(label="사용자 키워드 입력", placeholder="예: 책임감, 팀워크, 문제 해결 능력")
        example_sentence_input = gr.Textbox(
            label="추천 문장 (선택 사항)",
            placeholder="예: '저는 도전을 두려워하지 않고 성공적으로 프로젝트를 완수했습니다.'"
        )

    save_pdf_toggle = gr.Checkbox(label="PDF로 저장", value=False)

    # 출력 영역
    output = gr.Textbox(label="작성된 자기소개서", lines=6)
    submit_btn = gr.Button("작성하기")
    submit_btn.click(
        fn=chatbot_interface,
        inputs=[purpose_input, language_input, keywords_input, example_sentence_input, save_pdf_toggle],
        outputs=[output]
    )

In [None]:
# 실행
demo.launch()

In [None]:
# 종료(자원회수)
demo.close()