In [11]:
os.environ["OPENAI_API_KEY"]='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'

In [13]:

import gradio as gr
import openai
import fitz  # PyMuPDF
import os
import arxiv
import time
from langchain.document_loaders import PyPDFLoader
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain import hub
from langchain.schema.runnable import RunnablePassthrough


# Module 1: 발표 검사
def transcribe_audio(file_path):
    audio_file = open(file_path, "rb")
    response = openai.Audio.transcribe("whisper-1", file=audio_file)
    return response['text']

def extract_text_from_pdf(pdf_path):
    document = fitz.open(pdf_path)
    text = ""
    for page_num in range(len(document)):
        page = document.load_page(page_num)
        text += page.get_text()
    return text

def generate_feedback_or_questions(pdf_text, presentation_text, task):
    if '피드백' in task or 'feedback' in task:
        prompt = f"""
        아래는 논문 PDF에서 추출한 텍스트와 발표자의 음성 파일을 텍스트로 변환한 내용입니다. 두 텍스트를 비교하여, 문맥의 일관성, 주요 주제의 정확성, 그리고 발표의 명확성에 대해 피드백을 제공해 주세요. 또한, 발표자가 개선할 수 있는 부분에 대한 제언도 포함해 주세요. 모든 피드백은 한국어로 작성해 주세요.

        논문 PDF 텍스트:
        {pdf_text}

        발표 텍스트:
        {presentation_text}

        피드백:
        """
    elif '질문' in task or 'question' in task:
        prompt = f"""
        아래는 논문 PDF에서 추출한 텍스트와 발표자의 음성 파일을 텍스트로 변환한 내용입니다. 두 텍스트를 비교하여, 발표 내용을 기반으로 예상 질문을 5개 작성해 주세요. 모든 질문은 한국어로 작성해 주세요.

        논문 PDF 텍스트:
        {pdf_text}

        발표 텍스트:
        {presentation_text}

        예상 질문:
        """
    else:
        return "적절한 작업을 선택하지 않았습니다. '피드백' 또는 '질문'을 포함하는 작업을 입력하세요."

    response = openai.Completion.create(
        model="gpt-3.5-turbo-instruct",
        prompt=prompt,
        max_tokens=1000,
        temperature=0.7,
        n=1,
        stop=None
    )
    return response.choices[0].text

state = {"audio_path": None, "pdf_path": None, "pdf_text": None, "presentation_text": None, "task": None, "saved_files": []}

def upload_files(audio, pdf):
    try:
        state["audio_path"] = audio
        state["pdf_path"] = pdf
        state["pdf_text"] = extract_text_from_pdf(pdf)
        state["presentation_text"] = transcribe_audio(audio)
        return "파일 업로드가 완료되었습니다. 피드백을 원하시면 '피드백', 예상 질문을 원하시면 '질문'이라고 입력하세요."
    except Exception as e:
        return f"파일 업로드 중 오류가 발생했습니다: {e}"

def set_task(task):
    state["task"] = task
    return handle_task(task)

def handle_task(task):
    if state["audio_path"] and state["pdf_path"] and state["pdf_text"] and state["presentation_text"]:
        result = generate_feedback_or_questions(state["pdf_text"], state["presentation_text"], task)
        return result
    else:
        return "먼저 오디오 파일과 PDF 파일을 업로드해 주세요."

# Module 2: 논문 검색
def download_papers_between_years(query, start_year, end_year, num_papers=10):
    dirpath = "./arxiv_papers"
    if not os.path.exists(dirpath):
        os.makedirs(dirpath)
    
    search_query = f"{query} AND submittedDate:[{start_year}-01-01 TO {end_year}-12-31]"
    
    client = arxiv.Client()
    search = arxiv.Search(
        query=search_query,
        max_results=num_papers,
        sort_order=arxiv.SortOrder.Descending
    )
    
    saved_files = []
    
    for result in client.results(search):
        while True:
            try:
                title = result.title.replace(' ', '_')
                filename = f"{result.get_short_id()}.{title}.pdf"
                result.download_pdf(dirpath=dirpath, filename=filename)
                saved_files.append(filename)
                print(f"-> Paper id {result.get_short_id()} with title '{result.title}' is downloaded as {filename}.")
                break
            except (FileNotFoundError, ConnectionResetError) as e:
                print("Error occurred:", e)
                time.sleep(5)
    
    state["saved_files"] = saved_files
    return saved_files

def open_pdf(file_name):
    dirpath = "./arxiv_papers"
    file_path = os.path.join(dirpath, file_name)
    os.system(f'start {file_path}')

def query_rag_model(file_name, question):
    dirpath = "./arxiv_papers"
    file_path = os.path.join(dirpath, file_name)

    loader = PyPDFLoader(file_path)
    documents = loader.load()

    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
    docs = text_splitter.split_documents(documents)

    vectorstore = Chroma.from_documents(
        documents=docs, 
        embedding=OpenAIEmbeddings()
    )

    retriever = vectorstore.as_retriever()
    rag_prompt = hub.pull("rlm/rag-prompt")

    llm = ChatOpenAI(model_name="gpt-3.5-turbo-0125", temperature=0.7)

    rag_chain = (
        {"context": retriever, "question": RunnablePassthrough()} 
        | rag_prompt 
        | llm 
    )

    response = rag_chain.invoke(question)
    return response.content

def download_interface(query, start_year, end_year, num_papers):
    saved_files = download_papers_between_years(query, start_year, end_year, num_papers)
    return gr.update(choices=saved_files), "논문이 다운로드 되었습니다."

def open_pdf_and_chat_interface(selected_file, question):
    if selected_file and not question:
        open_pdf(selected_file)
        return f"{selected_file} 파일을 열고 있습니다...", ""
    elif selected_file and question:
        response = query_rag_model(selected_file, question)
        result = ''.join(filter(None, response))
        return "", result
    else:
        return "파일을 선택하고 질문을 입력하세요.", ""

def reset_interface():
    state["saved_files"] = []
    return gr.update(visible=False), gr.update(visible=False), "", "안녕하세요, 연구자를 위한 챗봇 리서처입니다. 발표 검사와 논문 검색 중 어느 모듈을 사용하실래요?", gr.update(choices=[])

# Combined Interface
with gr.Blocks() as iface:
    with gr.Row():
        gr.Markdown("## 연구자를 위한 챗봇 리서처")

    with gr.Row():
        chatbox = gr.Textbox(label="챗봇", placeholder="발표 검사 또는 논문 검색을 입력하세요")
        chat_button = gr.Button("전송")
    
    output_text = gr.Textbox(label="출력")

    with gr.Row(visible=False) as module_1:
        with gr.Column():
            gr.Markdown("### 발표 피드백 및 질문 생성기")
            audio_input = gr.Audio(type="filepath", label="발표 녹음")
            pdf_input = gr.File(label="PDF 파일 업로드")
            upload_button = gr.Button("파일 업로드")
            upload_button.click(upload_files, inputs=[audio_input, pdf_input], outputs=output_text)
            task_input = gr.Textbox(label="작업 입력", placeholder="피드백 또는 질문")
            task_button = gr.Button("작업 전송")
            task_button.click(set_task, inputs=task_input, outputs=output_text)

    with gr.Row(visible=False) as module_2:
        with gr.Column():
            gr.Markdown("### 논문 검색 및 챗봇")
            query_input = gr.Textbox(label="검색 쿼리 입력")
            start_year_input = gr.Number(label="시작 연도")
            end_year_input = gr.Number(label="종료 연도")
            num_papers_input = gr.Number(label="논문 수")
            download_button = gr.Button("논문 다운로드")
            saved_files_dropdown = gr.Dropdown(label="저장된 논문 선택", choices=[])
            download_button.click(download_interface, inputs=[query_input, start_year_input, end_year_input, num_papers_input], outputs=[saved_files_dropdown, output_text])

            question_input = gr.Textbox(label="질문 입력", placeholder="예: vqa의 방법론을 알려줘")
            query_button = gr.Button("질문 전송")
            query_button.click(open_pdf_and_chat_interface, inputs=[saved_files_dropdown, question_input], outputs=[output_text, output_text])

    reset_button = gr.Button("초기화")

    def chatbot_response(input_text):
        if "발표 검사" in input_text:
            return "발표 검사 모듈을 선택하셨습니다. 파일을 업로드하고 작업을 입력하세요.", gr.update(visible=True), gr.update(visible=False)
        elif "논문 검색" in input_text:
            return "논문 검색 모듈을 선택하셨습니다. 검색 쿼리와 조건을 입력하세요.", gr.update(visible=False), gr.update(visible=True)
        else:
            return "유효한 명령을 입력하세요: 발표 검사 또는 논문 검색.", gr.update(visible=False), gr.update(visible=False)

    chat_button.click(chatbot_response, inputs=chatbox, outputs=[output_text, module_1, module_2])
    reset_button.click(reset_interface, inputs=[], outputs=[module_1, module_2, chatbox, output_text, saved_files_dropdown])

iface.launch()


Running on local URL:  http://127.0.0.1:7870

To create a public link, set `share=True` in `launch()`.




-> Paper id 2306.04938v1 with title 'Knowledge Detection by Relevant Question and Image Attributes in Visual Question Answering' is downloaded as 2306.04938v1.Knowledge_Detection_by_Relevant_Question_and_Image_Attributes_in_Visual_Question_Answering.pdf.
-> Paper id 2308.11662v2 with title 'VQA Therapy: Exploring Answer Differences by Visually Grounding Answers' is downloaded as 2308.11662v2.VQA_Therapy:_Exploring_Answer_Differences_by_Visually_Grounding_Answers.pdf.
-> Paper id 2304.01647v1 with title 'SC-ML: Self-supervised Counterfactual Metric Learning for Debiased Visual Question Answering' is downloaded as 2304.01647v1.SC-ML:_Self-supervised_Counterfactual_Metric_Learning_for_Debiased_Visual_Question_Answering.pdf.
-> Paper id 2306.06622v2 with title 'Weakly Supervised Visual Question Answer Generation' is downloaded as 2306.06622v2.Weakly_Supervised_Visual_Question_Answer_Generation.pdf.


In [18]:

import gradio as gr
import openai
import fitz  # PyMuPDF
import os
import arxiv
import time
from langchain.document_loaders import PyPDFLoader
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain import hub
from langchain.schema.runnable import RunnablePassthrough


# Module 1: 발표 검사
def transcribe_audio(file_path):
    audio_file = open(file_path, "rb")
    response = openai.Audio.transcribe("whisper-1", file=audio_file)
    return response['text']

def extract_text_from_pdf(pdf_path):
    document = fitz.open(pdf_path)
    text = ""
    for page_num in range(len(document)):
        page = document.load_page(page_num)
        text += page.get_text()
    return text

def generate_feedback_or_questions(pdf_text, presentation_text, task):
    if '피드백' in task or 'feedback' in task:
        prompt = f"""
        아래는 논문 PDF에서 추출한 텍스트와 발표자의 음성 파일을 텍스트로 변환한 내용입니다. 두 텍스트를 비교하여, 문맥의 일관성, 주요 주제의 정확성, 그리고 발표의 명확성에 대해 피드백을 제공해 주세요. 또한, 발표자가 개선할 수 있는 부분에 대한 제언도 포함해 주세요. 모든 피드백은 한국어로 작성해 주세요.

        논문 PDF 텍스트:
        {pdf_text}

        발표 텍스트:
        {presentation_text}

        피드백:
        """
    elif '질문' in task or 'question' in task:
        prompt = f"""
        아래는 논문 PDF에서 추출한 텍스트와 발표자의 음성 파일을 텍스트로 변환한 내용입니다. 두 텍스트를 비교하여, 발표 내용을 기반으로 예상 질문을 5개 작성해 주세요. 모든 질문은 한국어로 작성해 주세요.

        논문 PDF 텍스트:
        {pdf_text}

        발표 텍스트:
        {presentation_text}

        예상 질문:
        """
    else:
        return "적절한 작업을 선택하지 않았습니다. '피드백' 또는 '질문'을 포함하는 작업을 입력하세요."

    response = openai.Completion.create(
        model="gpt-3.5-turbo-instruct",
        prompt=prompt,
        max_tokens=1000,
        temperature=0.7,
        n=1,
        stop=None
    )
    return response.choices[0].text

state = {"audio_path": None, "pdf_path": None, "pdf_text": None, "presentation_text": None, "task": None, "saved_files": []}

def upload_files(audio, pdf):
    try:
        state["audio_path"] = audio
        state["pdf_path"] = pdf
        state["pdf_text"] = extract_text_from_pdf(pdf)
        state["presentation_text"] = transcribe_audio(audio)
        return "파일 업로드가 완료되었습니다. 피드백을 원하시면 '피드백', 예상 질문을 원하시면 '질문'이라고 입력하세요."
    except Exception as e:
        return f"파일 업로드 중 오류가 발생했습니다: {e}"

def set_task(task):
    state["task"] = task
    return handle_task(task)

def handle_task(task):
    if state["audio_path"] and state["pdf_path"] and state["pdf_text"] and state["presentation_text"]:
        result = generate_feedback_or_questions(state["pdf_text"], state["presentation_text"], task)
        return result
    else:
        return "먼저 오디오 파일과 PDF 파일을 업로드해 주세요."

# Module 2: 논문 검색
def download_papers_between_years(query, start_year, end_year, num_papers=10):
    dirpath = "./arxiv_papers"
    if not os.path.exists(dirpath):
        os.makedirs(dirpath)
    
    search_query = f"{query} AND submittedDate:[{start_year}-01-01 TO {end_year}-12-31]"
    
    client = arxiv.Client()
    search = arxiv.Search(
        query=search_query,
        max_results=num_papers,
        sort_order=arxiv.SortOrder.Descending
    )
    
    saved_files = []
    
    for result in client.results(search):
        while True:
            try:
                title = result.title.replace(' ', '_')
                filename = f"{result.get_short_id()}.{title}.pdf"
                result.download_pdf(dirpath=dirpath, filename=filename)
                saved_files.append(filename)
                print(f"-> Paper id {result.get_short_id()} with title '{result.title}' is downloaded as {filename}.")
                break
            except (FileNotFoundError, ConnectionResetError) as e:
                print("Error occurred:", e)
                time.sleep(5)
    
    state["saved_files"] = saved_files
    return saved_files

def open_pdf(file_name):
    dirpath = "./arxiv_papers"
    file_path = os.path.join(dirpath, file_name)
    os.system(f'start {file_path}')

def query_rag_model(file_name, question):
    dirpath = "./arxiv_papers"
    file_path = os.path.join(dirpath, file_name)

    loader = PyPDFLoader(file_path)
    documents = loader.load()

    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
    docs = text_splitter.split_documents(documents)

    vectorstore = Chroma.from_documents(
        documents=docs, 
        embedding=OpenAIEmbeddings()
    )

    retriever = vectorstore.as_retriever()
    rag_prompt = hub.pull("rlm/rag-prompt")

    llm = ChatOpenAI(model_name="gpt-3.5-turbo-0125", temperature=0.7)

    rag_chain = (
        {"context": retriever, "question": RunnablePassthrough()} 
        | rag_prompt 
        | llm 
    )

    response = rag_chain.invoke(question)
    return response.content

def download_interface(query, start_year, end_year, num_papers):
    saved_files = download_papers_between_years(query, start_year, end_year, num_papers)
    return gr.update(choices=saved_files), "논문이 다운로드 되었습니다."

def open_pdf_and_chat_interface(selected_file, question):
    if selected_file and not question:
        open_pdf(selected_file)
        return f"{selected_file} 파일을 열고 있습니다...", ""
    elif selected_file and question:
        response = query_rag_model(selected_file, question)
        result = ''.join(filter(None, response))
        return "", result
    else:
        return "파일을 선택하고 질문을 입력하세요.", ""

def reset_interface():
    state["saved_files"] = []
    return gr.update(visible=False), gr.update(visible=False), "", "안녕하세요, 연구자를 위한 챗봇 리서처입니다. 발표 검사와 논문 검색 중 어느 모듈을 사용하실래요?", gr.update(choices=[])

# Combined Interface
with gr.Blocks() as iface:
    with gr.Row():
        gr.Markdown("## 연구자를 위한 챗봇 리서처")

    with gr.Row():
        chatbox = gr.Textbox(label="챗봇", placeholder="발표 검사 또는 논문 검색을 입력하세요")
        chat_button = gr.Button("전송")
    
    output_text = gr.Textbox(label="출력")

    with gr.Row(visible=False) as module_1:
        with gr.Column():
            gr.Markdown("### 발표 피드백 및 질문 생성기")
            audio_input = gr.Audio(type="filepath", label="발표 녹음")
            pdf_input = gr.File(label="PDF 파일 업로드")
            upload_button = gr.Button("파일 업로드")
            upload_button.click(upload_files, inputs=[audio_input, pdf_input], outputs=output_text)
            task_input = gr.Textbox(label="작업 입력", placeholder="피드백 또는 질문")
            task_button = gr.Button("작업 전송")
            task_button.click(set_task, inputs=task_input, outputs=output_text)

    with gr.Row(visible=False) as module_2:
        with gr.Column():
            gr.Markdown("### 논문 검색 및 챗봇")
            query_input = gr.Textbox(label="검색 쿼리 입력")
            start_year_input = gr.Number(label="시작 연도")
            end_year_input = gr.Number(label="종료 연도")
            num_papers_input = gr.Number(label="논문 수")
            download_button = gr.Button("논문 다운로드")
            saved_files_dropdown = gr.Dropdown(label="저장된 논문 선택", choices=[])
            download_button.click(download_interface, inputs=[query_input, start_year_input, end_year_input, num_papers_input], outputs=[saved_files_dropdown, output_text])

            question_input = gr.Textbox(label="질문 입력", placeholder="예: vqa의 방법론을 알려줘")
            query_button = gr.Button("질문 전송")
            query_button.click(open_pdf_and_chat_interface, inputs=[saved_files_dropdown, question_input], outputs=[output_text, output_text])

    reset_button = gr.Button("초기화")

    def chatbot_response(input_text):
        if "발표 검사" in input_text:
            return "발표 검사 모듈을 선택하셨습니다. 파일을 업로드하고 작업을 입력하세요.", gr.update(visible=True), gr.update(visible=False)
        elif "논문 검색" in input_text:
            return "논문 검색 모듈을 선택하셨습니다. 검색 쿼리와 조건을 입력하세요.", gr.update(visible=False), gr.update(visible=True)
        else:
            return "유효한 명령을 입력하세요: 발표 검사 또는 논문 검색.", gr.update(visible=False), gr.update(visible=False)

    chat_button.click(chatbot_response, inputs=chatbox, outputs=[output_text, module_1, module_2])
    reset_button.click(reset_interface, inputs=[], outputs=[module_1, module_2, chatbox, output_text, saved_files_dropdown])

iface.launch()


Running on local URL:  http://127.0.0.1:7873

To create a public link, set `share=True` in `launch()`.


