# Gemini + Langchain Practice 

In [210]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
# !pip install python-dotenv
# !pip install -U --quiet langchain-google-genai
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [203]:
import os
from glob import glob
#!pip install pymupdf
from langchain_community.document_loaders import TextLoader
from langchain.document_loaders import DirectoryLoader
from langchain.document_loaders.pdf import PyMuPDFLoader
from langchain.document_loaders.xml import UnstructuredXMLLoader
from langchain.document_loaders.csv_loader import CSVLoader


data_path="data"

loaders = {
    '.pdf': PyMuPDFLoader,
    '.xml': UnstructuredXMLLoader,
    '.txt': TextLoader,
    '.csv': CSVLoader,
}

In [204]:
# Define a function to create a DirectoryLoader for a specific file type
def create_directory_loader(file_type, directory_path):
    return DirectoryLoader(
        path=directory_path,
        glob=f"**/*{file_type}",
        loader_cls=loaders[file_type],
    )

In [185]:
pdf_loader = create_directory_loader('.pdf', data_path)
xml_loader = create_directory_loader('.xml', data_path)
txt_loader = create_directory_loader('.txt', data_path)
csv_loader = create_directory_loader('.csv', data_path)

# Load the files
pdf_documents = pdf_loader.load()
xml_documents = xml_loader.load()
txt_documents = txt_loader.load()
csv_documents = csv_loader.load()

documents= txt_documents+pdf_documents + xml_documents + csv_documents
documents[0]

Document(page_content='\ufeff1\t알비던전\n2\t티르 코네일\n3\t키아던전\n4\t두갈드 아일\n5\t라비던전\n6\t던바튼\n7\t마스던전\n8\t피오드던전\n9\t가이레흐\n10\t반호르\n11\t이멘 마하\n12\t케오 섬\n13\t코일던전\n14\t라데카\n15\t페카던전\n16\t켈라 베이스 캠프 마나터널\n17\t카이피 협곡 마나터널\n18\t메이즈 평원 북쪽 마나터널\n19\t메이즈 평원 북동쪽 마나터널\n20\t무유 사막 남쪽 마나터널\n21\t카루 숲 북쪽 마나터널\n22\t카루 숲 남쪽 마나터널\n23\t케안 항구\n24\t필리아 지역\n25\t에란스 협곡 지역\n26\t나레스 고원 지역\n27\t론가 사막 동쪽 지역\n28\t루페스 사막 지역\n29\t론가 사막 남쪽 지역\n30\t론가 사막 북쪽 지역\n31\t실바 숲 마나터널\n32\t셀라 해안 마나터널\n33\t발레스 마나터널\n34\t바르바 분지 마나터널\n35\t루나이 계곡 마나터널\n36\t코르 마을 마나터널\n37\t판타이 늪 동쪽 마나터널\n38\t케나이 사바나 마나터널\n39\t훼손된 랍파마을 마나터널\n40\t라테르 고산지대 마나터널\n41\t헤르바 밀림 마나터널\n42\t훼손된 에르케 폭포 마나터널\n43\t훼손된 에르케 폭포 마나터널\n44\t칼리다 마나터널\n45\t라스파 마나터널\n46\t페라 마나터널\n47\t레네스 마나터널\n48\t탈틴\n49\t타라\n50\t화산 온천 마나터널\n51\t아발론 경계지\n52\t세계수\n53\t잊혀진 해변\n54\t베그 절벽\n55\t쇠락의 늪\n56\t검은 자갈 해안\n57\t켈라항구 마나 터널\n58\t지하 터널 마나 터널\n59\t사람 문양 마나 터널\n60\t카이피 협곡 마나 터널\n61\t태양 문양 마나 터널\n62\t루트라 강 마나 터널\n63\t용뼈 무덤 마나 터널\n64\t새문양 마나 터널\n65\t라노 해변 야금지 마나 터널\n66\t뱀 문양 마나 터널\n67\t나무 문양 마나 터널\n6

In [205]:
from langchain.text_splitter import CharacterTextSplitter
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=10)
# 로드된 문서를 분할합니다.
texts = text_splitter.split_documents(documents)
texts[2]

Document(page_content='에 일부 연재만화가들은 동인 행사에서 판매되는 자신의 동인지 혹은 회지를 연재만화 내에 홍보\n하기도 했고, 개중에는 양이나 질이 매우 떨어지는 연재만화를 올리고 자신의 부스를 홍보하는 광\n고글을 올려 논란이 되었고 비난까지 받기도 했다. 나중엔 아예 코믹월드 시기가 다가올때만 홍보\n만화를 올리기도 하였다. 실질적으로 연재만화를 보던 유저들이 폭발하게된 진짜 이유. 자신의 사\n적이익을 위해 홍보용도로 전락해버린것을 비난하였다.\n당시 연재만화는 웹툰 시장이 존재하지 않던 시기였던 만큼 친목질의 영향이 매우 강해 빠들의 쉴\n드로 쉬쉬 하는 분위기였으나 참다못한 유저가 코믹월드가 다가오면 만화를 올리는척 자신의 부\n스를 홍보하는 행태를 비난하는 댓글을 달자 빠들의 분위기에 위축되어있던 사람들의 울분이 폭\n발하고 동참하기 시작하면서 두 패로 나뉘어서 댓글란은 전쟁터가 되었었다.\n이런 상황 속에서 2007년 1월에 연재만화가 \'도바\'[* 대원씨아이에서 TRUMP!를 출간하고 네이\n버 웹툰에서 부토를 연재한 만화가 정현주다.]가 코믹월드 출전 광고 관련 비난에 오랫동안 심하\n게 시달리다가 결국 연재를 접게 되었다. 당시 도바가 연재작가중 동인활동에 대한 영향력이 매우 \n커서 도바와 관계가 있던 연재작가들이 대거 빠져나가는 사태로 번졌다.\n도바를 비롯한 연재작가의 변명 중 하나로 "원고를 입고하고 코믹월드가 열리는 그 사이의 기간 \n외에 연재 만화를 그릴 형편이 되지 않는다, 연재만화에 정해진 질과 양 같은 것은 없으며 연재만\n화 역시 의무적인 것이 아니다며 어쩔 수 없는 사정이 있다"고 하는데 이는 스스로 의무와 책임을 \n져버린 아마추어라고 인정하는 셈이다. 그렇기에 이런 변명은 연재만화 게시판에 있기에 부적절\n한 성의 없는 땜빵 만화와 그 목적이 자신들이 이익을 내는 동인행사와 관련된 광고와 홍보라는 \n점을 들어 연재만화가로서의 자격과 불성실함, 그리고 도를 넘어선 지나친 영리 추구라는 비판으\

In [206]:
#!pip install faiss-cpu
from langchain_community.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings

hf_embedding = HuggingFaceEmbeddings(
    # api_key="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",
     model_name="sentence-transformers/all-MiniLM-l6-v2",
)
embeddings = hf_embedding
# 분할된 텍스트와 임베딩을 사용하여 FAISS 벡터 데이터베이스를 생성합니다.
db = FAISS.from_documents(texts, embeddings)

retriever = db.as_retriever(search_type="mmr",
                              earch_kwargs={'k':3, 'fetch_k': 10})

# retriever.get_relevant_documents("밤스티드 테러")

In [207]:
from langchain.prompts import ChatPromptTemplate
from langchain.schema.runnable import RunnableMap
from langchain_google_genai import ChatGoogleGenerativeAI

template = """
Answer the question as korean based only on the following context:
{context}

Question: {question}
"""

prompt = ChatPromptTemplate.from_template(template)

In [208]:
gemini = ChatGoogleGenerativeAI(model="gemini-1.5-pro-latest", temperature = 0, max_length = 300,)

chain = RunnableMap({
    "context": lambda x: retriever.get_relevant_documents(x['question']),
    "question": lambda x: x['question']
}) | prompt | gemini

In [209]:
print(chain.invoke({'question': " 문게이트 목록"}).content)
# print(chain.invoke({'question': "기타 곱 연산 대미지는 어떤 것들이 있나요?"}).content)
# print(chain.invoke({'question': "블레이즈의 대미지는 어떻게 계산 되나요?"}).content)

## 마비노기 문게이트 목록

아래는 마비노기 세계에 존재하는 다양한 지역으로 이동할 수 있는 문게이트 목록입니다. 

**울라 대륙**

*   티르 코네일
*   던바튼
*   반호르
*   이멘 마하
*   탈틴
*   타라

**이리아 대륙**

*   필리아
*   코르
*   카루 숲
*   콘누스

**기타 지역**

*   아발론
*   벨바스트 섬
*   피시스

**던전**

*   알비 던전
*   바리 던전
*   룬다 던전
*   피오드 던전
*   그림자 세계 던전
*   테흐 두인 던전

**그 외**

*   각종 그림자 미션, 퀘스트 지역
*   하우징, 길드홀

**참고:** 이 목록은 게임 내 모든 문게이트를 포함하지 않을 수 있습니다. 또한, 일부 문게이트는 특정 조건을 충족해야만 사용할 수 있습니다. 
