In [24]:
import os
import tiktoken
import google.generativeai as genai
from IPython.display import display
from IPython.display import Markdown
from langchain.embeddings.sentence_transformer import SentenceTransformerEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import PyPDFLoader
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.chains import RetrievalQA
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.vectorstores import FAISS



In [25]:
os.environ['GOOGLE_API_KEY'] = 'AIzaSyBJep_00dpD76qfo-sbFzaR19T2KcF5YVk'

model = ChatGoogleGenerativeAI(model="gemini-pro",
                             temperature=0.7,
                             convert_system_message_to_human=True)
result = model.invoke("한국 서울 주택 시장 동향에 대해서 알려주세요")
Markdown(result.content)

**서울 주택 시장 동향**

**2023년 1분기**

* 아파트 가격 상승률이 지속되면서, 전년 대비 서울 아파트 평균 가격은 13.6% 상승했습니다.
* 거래량은 전년 대비 23.1% 감소하여, 침체된 시장 분위기를 반영했습니다.
* 전세 시장은 활황을 띠었으며, 거래량이 전년 대비 15.6% 증가했습니다.

**주요 동인**

* **저금리:** 낮은 금리는 주택 구매 비용을 낮추고 수요를 증가시켰습니다.
* **제한된 공급:** 서울의 주택 공급은 제한되어 있으며, 이로 인해 가격이 상승했습니다.
* **투자 수요:** 투자자들은 가격 상승 가능성을 예상하여 주택을 구매하고 있습니다.

**2023년 전망**

* **가격 상승 둔화:** 금리 인상과 침체된 경제 상황으로 인해 가격 상승률이 둔화될 것으로 예상됩니다.
* **거래량 증가:** 금리가 하락하면 거래량이 증가할 수 있습니다.
* **전세 시장 둔화:** 금리 인상으로 인해 전세 시장이 둔화될 수 있습니다.

**주요 요인**

* **금리 정책:** 한국은행의 금리 정책은 주택 시장에 큰 영향을 미칩니다.
* **경제 성장:** 경제 성장은 주택 수요와 가격에 영향을 미칩니다.
* **정부 정책:** 정부는 주택 시장을 안정화하기 위한 정책을 시행합니다.

**투자자를 위한 고려 사항**

* 서울 주택 시장은 변동성이 높습니다.
* 가격 상승 가능성이 있지만, 침체될 수도 있습니다.
* 투자 전에 시장 환경을 철저히 조사하는 것이 중요합니다.
* 다각화된 투자 포트폴리오에 주택을 포함하는 것을 고려해야 합니다.

**주택 구매자를 위한 고려 사항**

* 가격 상승률이 둔화되고 있지만, 여전히 저렴하지 않습니다.
* 저금리를 활용하여 저렴한 대출을 받을 수 있습니다.
* 제한된 공급으로 인해 주택 찾기가 어려울 수 있습니다.
* 주택 구매 전에 재정 상황을 신중하게 평가하는 것이 중요합니다.

In [12]:
tokenizer = tiktoken.get_encoding("cl100k_base")

def tiktoken_len(text):
    tokens = tokenizer.encode(text)
    return len(tokens)

In [33]:
loader = PyPDFLoader("/Users/jaehyeongpark/Documents/kb_report.pdf")
pages = loader.load_and_split()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50, length_function = tiktoken_len)
docs = text_splitter.split_documents(pages)


model_name = "jhgan/ko-sbert-nli"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': True}
ko = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

In [34]:
db = FAISS.from_documents(docs, ko)

 서울과 수도권  아파트 를 중심으로  전세가격  상승세가  지속되고  있으며 , 수도권  전세가격전망지수는  
지난해  11월 이후 2개월 만에 다시 ‘상승 전망’으로 전환 
∙ 아파트  선호 현상과 올해 아파트  입주물량  감소 등의 영향으로  당분간  수도권  아파트  전세가
격 상승세가  지속될  전망 
 
그림 7| 유형별  주택 전세가격지수  변동률  추이  그림 8| 지역별  주택 전세가격전망지수  추이 
  
 
자료: KB국민은행   자료: KB국민은행


[(Document(page_content='\uf06d 서울과 수도권  아파트 를 중심으로  전세가격  상승세가  지속되고  있으며 , 수도권  전세가격전망지수는  \n지난해  11월 이후 2개월 만에 다시 ‘상승 전망’으로 전환 \n∙ 아파트  선호 현상과 올해 아파트  입주물량  감소 등의 영향으로  당분간  수도권  아파트  전세가\n격 상승세가  지속될  전망 \n \n그림 7| 유형별  주택 전세가격지수  변동률  추이  그림 8| 지역별  주택 전세가격전망지수  추이 \n  \n \n자료: KB국민은행   자료: KB국민은행', metadata={'source': '/Users/jaehyeongpark/Documents/kb_report.pdf', 'page': 4}),
  0.75258374),
 (Document(page_content='\uf06d 1월 주택 매매가격은  전월 대비 하락폭이  확대되었으나  지난해  월평균  하락폭  대비 3분의 1 \n수준이며 , 하락폭이  가장 큰 대구도  지난해  월평균  하락폭  대비 절반 수준에 그침 \n\uf06d 주택 매매가격전망지수는  여전히  ‘상승 전망’보다 ‘하락 전망’ 비중이  크지만  연초 이후 정부의  규제 \n완화와  4월 총선, 금리 인하에 대한 기대감  등으로  하락폭이  확대될  가능성은  적음 \n \n그림 3| 지역별  주택 매매가격지수  변동률   그림 4| 지역별  주택 매매가격전망지수  추이 \n  \n \n자료: KB국민은행   자료: KB국민은행', metadata={'source': '/Users/jaehyeongpark/Documents/kb_report.pdf', 'page': 3}),
  0.75613165),
 (Document(page_content='5 \n[주택 전세] 수도권  아파트를 중심으로  전세가격  상승세가 지속될 전망 \n \n■ 주택 전세가격은 지난해  9월 이후 5개월 연속 상승세를 이어감  \n\uf06d 1월 전국 주택 전세가격 은 전

In [35]:
db.save_local("faiss_index")

In [36]:
new_db = FAISS.load_local("faiss_index", ko)

In [41]:
your_retriever = new_db.as_retriever(search_type="mmr", search_kwargs={'k':3, 'fetch_k': 10})

qa = RetrievalQA.from_llm(llm=model, retriever=your_retriever,  return_source_documents = True)

query = "공급 시장 규제"
qresult = qa.invoke(query)

In [42]:
qresult

{'query': '공급 시장 규제',
 'result': "I don't know.",
 'source_documents': [Document(page_content='공급시장이  크게 위축됨 \n∙ 다만, 아직까지  매매가격  하락폭이  지난해  대비 낮은 수준이며 , 정부의  규제 완화와  4월 총선 등의 영향\n으로 하락 전망 비중이  줄어들면서  하락폭이  확대될  가능성 은 적음 주택 시장 개요', metadata={'source': '/Users/jaehyeongpark/Documents/kb_report.pdf', 'page': 2}),
  Document(page_content='KB금융지주  \n경영연구소  \n \nKB주택시장리뷰 \n \n  \n부동산연구팀  \n \n \n \n \n \n \n \n2015  9  \n \n \n \n \n \n \n \n2015  9  \n \n \n \n 2024. 2', metadata={'source': '/Users/jaehyeongpark/Documents/kb_report.pdf', 'page': 0}),
  Document(page_content='2 \n \n목 차 \n \n \n \n \n \n· 주택 매매   …………………………………………………   4 \n· 주택 전세   …………………………………………………   5 \n· 주택 거래   …………………………………………………   6 \n· 주택 분양   …………………………………………………   7 \n· 토지        …………………………………………………   8 \n· 주택 금융   …………………………………………………   9 \n \n \n \n \n \n \n \n  주택 시장 동향', metadata={'source': '/Users/jaehyeongpark/Documents/kb_report.pdf', 'page': 1}),
  Document(page_content='자료: 부동산 114  자료: 한국부동산원  \n \n■ 미분양  