In [100]:
import gradio as gr
import os
import matplotlib.pyplot as plt
import speech_recognition as sr
import pymysql
from langchain_community.chat_models import ChatOllama
from langchain.schema import HumanMessage, AIMessage
from wordcloud import WordCloud
from pydub import AudioSegment
from transformers import BlipProcessor, BlipForConditionalGeneration
from deep_translator import GoogleTranslator
from transformers import pipeline


In [84]:
#모델 초기화
model = ChatOllama(model="gemma2", temperature= 0.7, verbose= False)

In [85]:
#번역 함수
def translate_to_korean(text):
    translated = GoogleTranslator(source='en', target="ko").translate(text)
    return translated

In [86]:
# 이미지 설명 생성 함수
def generate_image_description(image):
    processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
    model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")

    inputs = processor(images=image, return_tensors="pt")
    outputs = model.generate(**inputs)
    caption = processor.decode(outputs[0], skip_special_tokens=True)
    return caption

In [87]:
def analyze_image(image):
    """
    이미지를 입력받아 설명을 생성하고 한국어로 번역하는 함수
    """
    if image is None:
        return "이미지를 업로드해주세요."
    
    try:
        # 이미지 설명 생성
        description = generate_image_description(image)
        
        # 설명을 한국어로 번역
        translated_description = translate_to_korean(description)
        
        return translated_description
    except Exception as e:
        return f"이미지 분석에 실패했습니다: {str(e)}"


In [88]:
#챗봇
def chat(message, history):
    chat_history = []
    for human, ai in history:
        chat_history.append(HumanMessage(content=human))
        chat_history.append(AIMessage(content=ai))
    
    if message:
        chat_history.append(HumanMessage(content=message))
        response = model.invoke(chat_history)
        
             # 반환값이 AIMessage인 경우 문자열로 변환
        if hasattr(response, "content"):
            return response.content  # 문자열 반환
        else:
            return str(response)  # 예상치 못한 경우 문자열로 변환
    
    return "메시지를 입력해주세요."
        
    # chat_history.append(HumanMessage(content=message))
    # response = model.invoke(chat_history)
        
    # return response
    #위코드는 반환되면서 객체로 반환 그래서 에러나는거였음

In [89]:
def generate_wordcloud(uploaded_file):
    if uploaded_file is not None:
        try:
            file_path = uploaded_file.name
            with open(file_path, 'r', encoding='utf-8') as file:
                text = file.read()
        except Exception as e:
            return f"파일 처리 중 오류: {e}", None
    else:
        return "텍스트 파일을 업로드해주세요.", None

    if not text.strip():
        return "텍스트 파일이 비어 있습니다.", None

    # 워드 클라우드 생성
    wordcloud = WordCloud(
        font_path='C:/Windows/Fonts/malgun.ttf',  # 한글 폰트 경로
        background_color='white',
        width=800,
        height=600,
        max_words=200
    ).generate(text)

    # 이미지를 로컬 파일로 저장
    output_path = "wordcloud.png"
    plt.figure(figsize=(10, 5))
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.tight_layout()
    plt.savefig(output_path)
    plt.close()
    # os.remove(output_path)

    return "워드 클라우드가 성공적으로 생성되었습니다.", output_path

def clean_up_image(image_path):
    """이미지 파일 삭제"""
    if os.path.exists(image_path):
        os.remove(image_path)


In [90]:
def transcribe_audio(uploaded_audio):
    if uploaded_audio is None:
        return "오디오 파일을 업로드해주세요."

    # SpeechRecognition을 사용하여 음성 텍스트 변환
    recognizer = sr.Recognizer()
    try:
        # 업로드된 오디오 파일 경로 가져오기
        audio_path = uploaded_audio.name
     
             # WAV로 변환
        audio = AudioSegment.from_file(audio_path)
        wav_path = "temp.wav"
        audio.export(wav_path, format="wav")
        print("[DEBUG] 파일이 WAV 형식으로 변환되었습니다.")

        # SpeechRecognition으로 변환
        recognizer = sr.Recognizer()
        with sr.AudioFile(wav_path) as source:
            audio_data = recognizer.record(source)
            text = recognizer.recognize_google(audio_data, language="ko-KR")
        
        # 변환 후 임시 파일 삭제
        os.remove(wav_path)
        return text
    except sr.UnknownValueError:
        return "음성을 인식할 수 없습니다."
    except sr.RequestError as e:
        return f"STT 서비스에 문제가 발생했습니다: {e}"

In [98]:
# #mysql DB연결 설정
# def connect_to_db():
#     connection = pymysql.connect(
#         host="localhost",
#         user="root",
#         password="1234",
#         database="test",
#         charset="utf8mb4",
#         cursorclass=pymysql.cursors.DictCursor  # 결과를 딕셔너리 형태로 반환
#     )
#     return connection

In [99]:
# def execute_query(query):
#     connection = connect_to_db()
#     try:
#         with connection.cursor() as cursor:
#             cursor.execute(query)
#             results = cursor.fetchall()
#         return results
#     finally:
#         connection.close()

In [103]:
# # 허깅페이스 text-to-sql 모델 로드
# text_to_sql = pipeline("text2sql", model="microsoft/table-transformer-text-to-sql")

# def natural_language_to_sql(natural_language, table_schema):
#     #자연어 질문을 sql 쿼리로 변환
#     # 모델에 테이블 스키마와 질문 제공
#     input_text = f"""
#     테이블 스키마: {table_schema}
#     질문: "{natural_language}"
#     """
#     result = text_to_sql(input_text)
#     return result[0]['generated_text']

KeyError: "Unknown task text2sql, available tasks are ['audio-classification', 'automatic-speech-recognition', 'depth-estimation', 'document-question-answering', 'feature-extraction', 'fill-mask', 'image-classification', 'image-feature-extraction', 'image-segmentation', 'image-text-to-text', 'image-to-image', 'image-to-text', 'mask-generation', 'ner', 'object-detection', 'question-answering', 'sentiment-analysis', 'summarization', 'table-question-answering', 'text-classification', 'text-generation', 'text-to-audio', 'text-to-speech', 'text2text-generation', 'token-classification', 'translation', 'video-classification', 'visual-question-answering', 'vqa', 'zero-shot-audio-classification', 'zero-shot-classification', 'zero-shot-image-classification', 'zero-shot-object-detection', 'translation_XX_to_YY']"

In [91]:
#탭공간
with gr.Blocks() as iface:
    with gr.Tab("무물보"):
        demo = gr.ChatInterface(
            fn = chat,
            examples=[
                "안녕하세요!",
                "오늘의 저녁을 추천해주세요",
                "대한민국 인원은 몇명인가요?"
            ],
            title = "AI챗봇",
            description="무엇이든 물어보세요!"
        )
        
    with gr.Tab("이미지 분석"):
        with gr.Row():
            image_input = gr.Image(type="pil", label="이미지를 업로드해주세요")
            
        submit_button = gr.Button("분석")
        output_text = gr.Textbox(lines=5, label="결과")
        
        submit_button.click(
            fn=analyze_image,
            inputs=[image_input],
            outputs=output_text,
        )
        
    with gr.Tab("wordCloud"):
        gr.Markdown("텍스트를 입력하거나 파일을 업로드 해주세요")
        
        upload_file = gr.File(label="파일 업로드", file_types=['.txt'])
        output_image = gr.Image(label="워드 클라우드 결과")
        output_massage = gr.Textbox(label="결과 메세지", interactive=False)
        generate_btn = gr.Button("결과 생성")
    
        generate_btn.click(
            fn=generate_wordcloud,
            inputs=[upload_file],
            outputs=[output_massage,output_image],
        )
        
        generate_btn.click(
            fn=lambda upload_file: clean_up_image("wordcloud.png"),
            inputs=[upload_file],
            outputs=[],
        )
        
    with gr.Tab("음성 텍스트 반환"):
        gr.Markdown("MP3파일을 업로드 해주세요")
        audio_file = gr.File(label="오디오 파일 업로드", file_types=[".wav",".mp3"])
        output_text = gr.Textbox(label="변환된 텍스트")
        transcribe_btn = gr.Button("반환 시작")
        
        transcribe_btn.click(
            fn = transcribe_audio,
            inputs= [audio_file],
            outputs=[output_text]
        )
        



In [92]:
iface.launch(server_port=7989, server_name="0.0.0.0")

* Running on local URL:  http://0.0.0.0:7989

To create a public link, set `share=True` in `launch()`.




In [93]:
# iface.close()

[DEBUG] 파일이 WAV 형식으로 변환되었습니다.
[DEBUG] 파일이 WAV 형식으로 변환되었습니다.
