## 환경변수 로드

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## 문서 로드

- 글로벌 EV 시장 동향 및 전망(IEA) 에너지경제연구원 2024.07.15

- 출처: https://eiec.kdi.re.kr/policy/domesticView.do?ac=0000186196&pg=&pp=&search_txt=&issus=&type=&depth1=

In [2]:
from langchain_community.document_loaders import PyMuPDFLoader

pdf_filepath = "./data/[24-13-포커스-1] 글로벌 EV 시장 동향 및 전망(IEA).pdf"
loader = PyMuPDFLoader(pdf_filepath, extract_images=True)
docs = loader.load()
len(docs)

9

In [3]:
docs[0].page_content

'   세계 에너지시장 인사이트 제24-13호 2024.7.1.  1\n글로벌 EV 시장 동향 및 전망(IEA)1)\n재생에너지정책연구실 장연재 부연구위원(yjchang@keei.re.kr) \n▶2023년 전기차 판매량은 전년 대비 35% 증가한 약 1,400만 대에 달해, 전 세계 전기차 보유량이 2018년 \n대비 6배 이상 증가한 약 4,000만 대에 이름.\n▶전기차 충전 인프라는 인구 밀집 지역을 제외하면 가정용 충전이 일반적이며, 공용 충전설비 설치가 40% \n이상 증가하고 급속 충전시설은 55% 성장한 것으로 나타남.\n▶2023년 약 4,500만 대였던 전기차 보유량은 2035년 5억 대를 초과할 전망이며, 전 세계 주요 지역의 \n전기차 판매 비중이 확대되어 2030년 40-60%, 2035년 50-90% 차지 예상\n▶2030년까지 전 세계 공용 충전기 숫자는 약 1,500만 개로 증가할 것으로 예상되며, 가정용 충전기는 \n2023년 2,700만 기에서 2035년에 2억 7천만 기를 넘어설 것으로 전망됨.\n1. 세계 전기차 시장 현황\n▣전기차 판매 비중 증가\n¡ 2023년 세계 전기차 판매량은 약 1,400만 대로서 전년 대비 35% 증가하였으며, \n운행 중인 전기차는 2018년 대비 6배 이상 늘어난 4,000만 대에 이름.\n‒ 전기차는 2023년에 전 세계 자동차 판매의 약 18%를 차지했으며, 이는 2022년의 \n14%와 2018년의 2%에 비해 크게 증가한 수치임.\n¡ 2023년 전기차의 자동차 판매 점유율을 지역별로 보면 중국 60%, 유럽 25%, \n미국 10% 순으로 나타남. \n‒ 중국은 810만 대의 신규 전기차가 등록되었고, 이는 전년 대비 35% 증가한 \n수치임.\n･\n중국의 내연기관차 시장은 8% 축소되었으나, 전기차 판매 증가로 전체 자동차 \n시장은 5% 성장함. \n･\n2023년에 세계 자동차 수출국 중 중국이 1위를 차지했으며, 400만 대 이상의 \n자동차 수출 중에서 120만 대가 전기

In [4]:
docs[0].metadata

{'source': './data/[24-13-포커스-1] 글로벌 EV 시장 동향 및 전망(IEA).pdf',
 'file_path': './data/[24-13-포커스-1] 글로벌 EV 시장 동향 및 전망(IEA).pdf',
 'page': 0,
 'total_pages': 9,
 'format': 'PDF 1.4',
 'title': '',
 'author': 'comdr',
 'subject': '',
 'keywords': '',
 'creator': 'Hancom PDF 1.3.0.545',
 'producer': 'Hancom PDF 1.3.0.545',
 'creationDate': "D:20240701134418+09'00'",
 'modDate': "D:20240701134418+09'00'",
 'trapped': ''}

## Embedding 성능 비교

In [5]:
from langchain_ollama import OllamaEmbeddings

nomic_embeddings = OllamaEmbeddings(model="nomic-embed-text")
bge_embeddings = OllamaEmbeddings(model="bge-m3")

In [6]:
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity


sentences = [
    "안녕하세요, 오늘은 날씨가 좋습니다.",
    "날씨가 맑아서 기분이 좋아요.",
    "오늘 점심으로 김치찌개를 먹었습니다.",
    "한국의 전통 음식 중 하나는 김치입니다."
]

# 각 모델로 임베딩 생성
nomic_embeds = [nomic_embeddings.embed_query(sent) for sent in sentences]
bge_embeds = [bge_embeddings.embed_query(sent) for sent in sentences]

# 코사인 유사도 계산 함수
def calculate_similarities(embeds):
    return cosine_similarity(embeds)

# 각 모델의 유사도 행렬 계산
nomic_similarities = calculate_similarities(nomic_embeds)
bge_similarities = calculate_similarities(bge_embeds)

# 유사도 비교
for i in range(len(sentences)):
    for j in range(i+1, len(sentences)):
        print(f"\n문장 {i+1}과 문장 {j+1}의 유사도 비교:")
        print(f"Nomic-embed-text: {nomic_similarities[i][j]:.4f}")
        print(f"BGE-M3: {bge_similarities[i][j]:.4f}")


문장 1과 문장 2의 유사도 비교:
Nomic-embed-text: 0.8811
BGE-M3: 0.8656

문장 1과 문장 3의 유사도 비교:
Nomic-embed-text: 0.8402
BGE-M3: 0.5945

문장 1과 문장 4의 유사도 비교:
Nomic-embed-text: 0.8051
BGE-M3: 0.4425

문장 2과 문장 3의 유사도 비교:
Nomic-embed-text: 0.8227
BGE-M3: 0.5376

문장 2과 문장 4의 유사도 비교:
Nomic-embed-text: 0.8194
BGE-M3: 0.4128

문장 3과 문장 4의 유사도 비교:
Nomic-embed-text: 0.8227
BGE-M3: 0.6682


## Chunking

`(1) 재귀적 분할`

In [7]:
# 문서를 문장 단위로 분리
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    separators=["\n\n", "\n"],
    chunk_size=500,
    chunk_overlap=100,
)

text_chunks = text_splitter.split_documents(docs)
len(text_chunks)

29

In [8]:
# chunk 0
print(text_chunks[0].page_content)

세계 에너지시장 인사이트 제24-13호 2024.7.1.  1
글로벌 EV 시장 동향 및 전망(IEA)1)
재생에너지정책연구실 장연재 부연구위원(yjchang@keei.re.kr) 
▶2023년 전기차 판매량은 전년 대비 35% 증가한 약 1,400만 대에 달해, 전 세계 전기차 보유량이 2018년 
대비 6배 이상 증가한 약 4,000만 대에 이름.
▶전기차 충전 인프라는 인구 밀집 지역을 제외하면 가정용 충전이 일반적이며, 공용 충전설비 설치가 40% 
이상 증가하고 급속 충전시설은 55% 성장한 것으로 나타남.
▶2023년 약 4,500만 대였던 전기차 보유량은 2035년 5억 대를 초과할 전망이며, 전 세계 주요 지역의 
전기차 판매 비중이 확대되어 2030년 40-60%, 2035년 50-90% 차지 예상
▶2030년까지 전 세계 공용 충전기 숫자는 약 1,500만 개로 증가할 것으로 예상되며, 가정용 충전기는


In [9]:
# chunk 1
print(text_chunks[1].page_content)

▶2030년까지 전 세계 공용 충전기 숫자는 약 1,500만 개로 증가할 것으로 예상되며, 가정용 충전기는 
2023년 2,700만 기에서 2035년에 2억 7천만 기를 넘어설 것으로 전망됨.
1. 세계 전기차 시장 현황
▣전기차 판매 비중 증가
¡ 2023년 세계 전기차 판매량은 약 1,400만 대로서 전년 대비 35% 증가하였으며, 
운행 중인 전기차는 2018년 대비 6배 이상 늘어난 4,000만 대에 이름.
‒ 전기차는 2023년에 전 세계 자동차 판매의 약 18%를 차지했으며, 이는 2022년의 
14%와 2018년의 2%에 비해 크게 증가한 수치임.
¡ 2023년 전기차의 자동차 판매 점유율을 지역별로 보면 중국 60%, 유럽 25%, 
미국 10% 순으로 나타남. 
‒ 중국은 810만 대의 신규 전기차가 등록되었고, 이는 전년 대비 35% 증가한 
수치임.
･
중국의 내연기관차 시장은 8% 축소되었으나, 전기차 판매 증가로 전체 자동차 
시장은 5% 성장함. 
･


`(2) 의미적 분할`

In [10]:
# 문서 분할 
from langchain_experimental.text_splitter import SemanticChunker

semantic_splitter = SemanticChunker(embeddings=bge_embeddings)
semantic_chunks = semantic_splitter.split_documents(text_chunks)

print(f"생성된 청크 수: {len(semantic_chunks)}")

생성된 청크 수: 43


In [11]:
# chunk 0
print(semantic_chunks[0].page_content)

세계 에너지시장 인사이트 제24-13호 2024.7.1. 1
글로벌 EV 시장 동향 및 전망(IEA)1)
재생에너지정책연구실 장연재 부연구위원(yjchang@keei.re.kr) 
▶2023년 전기차 판매량은 전년 대비 35% 증가한 약 1,400만 대에 달해, 전 세계 전기차 보유량이 2018년 
대비 6배 이상 증가한 약 4,000만 대에 이름. ▶전기차 충전 인프라는 인구 밀집 지역을 제외하면 가정용 충전이 일반적이며, 공용 충전설비 설치가 40% 
이상 증가하고 급속 충전시설은 55% 성장한 것으로 나타남.


In [12]:
# chunk 1
print(semantic_chunks[1].page_content)

▶2023년 약 4,500만 대였던 전기차 보유량은 2035년 5억 대를 초과할 전망이며, 전 세계 주요 지역의 
전기차 판매 비중이 확대되어 2030년 40-60%, 2035년 50-90% 차지 예상
▶2030년까지 전 세계 공용 충전기 숫자는 약 1,500만 개로 증가할 것으로 예상되며, 가정용 충전기는


In [13]:
# chunk 2
print(semantic_chunks[2].page_content)

▶2030년까지 전 세계 공용 충전기 숫자는 약 1,500만 개로 증가할 것으로 예상되며, 가정용 충전기는 
2023년 2,700만 기에서 2035년에 2억 7천만 기를 넘어설 것으로 전망됨. 1. 세계 전기차 시장 현황
▣전기차 판매 비중 증가
¡ 2023년 세계 전기차 판매량은 약 1,400만 대로서 전년 대비 35% 증가하였으며, 
운행 중인 전기차는 2018년 대비 6배 이상 늘어난 4,000만 대에 이름. ‒ 전기차는 2023년에 전 세계 자동차 판매의 약 18%를 차지했으며, 이는 2022년의 
14%와 2018년의 2%에 비해 크게 증가한 수치임. ¡ 2023년 전기차의 자동차 판매 점유율을 지역별로 보면 중국 60%, 유럽 25%, 
미국 10% 순으로 나타남. ‒ 중국은 810만 대의 신규 전기차가 등록되었고, 이는 전년 대비 35% 증가한 
수치임. ･
중국의 내연기관차 시장은 8% 축소되었으나, 전기차 판매 증가로 전체 자동차 
시장은 5% 성장함.


## Indexing

In [14]:
from langchain_chroma import Chroma

vectorstore = Chroma.from_documents(semantic_chunks, bge_embeddings)

In [15]:
# 구체적인 사실 관계에 대한 질문 
query = "중국 전기차 시장에서 중소형 모델의 판매 비중은 얼마인가요?"

# 가장 유사도가 높은 문장을 하나만 추출
retriever = vectorstore.as_retriever(search_kwargs={'k': 2})

results = retriever.invoke(query)
print(len(results))
print()

for doc in results:
    print(doc.page_content)
    print("-"*100)

2

2  세계 에너지시장 인사이트 제24-13호 2024.7.1. 자료 : IEA(2024), Global EV Outlook 2024
< 세계 전기자동차 누적 판매 추이(2010~2023년) >
¡ 2023년 시판 중인 자동차 모델 종류는 전년 대비 15% 증가한 590종에 달했으며, 
그 중 60% 이상이 SUV 또는 대형 차량으로 나타남. ‒ 전기차 시장에서 소형 및 중형 모델의 비중이 감소하는 추세이며 미국에서는 
소형 및 중형 전기차 모델이 전기차 판매의 25%를, 유럽에서는 40%, 중국에서는 
50%를 차지한 것으로 나타남. ‒ 이와 같은 대형 EV 모델의 종류 및 구매 증가 추세는 자동차 제조업체의 
수익성과 소비자의 선호 및 배출 규제 등이 반영된 것으로 분석되고 있음.
----------------------------------------------------------------------------------------------------
･
중국의 내연기관차 시장은 8% 축소되었으나, 전기차 판매 증가로 전체 자동차 
시장은 5% 성장함. ･
2023년에 세계 자동차 수출국 중 중국이 1위를 차지했으며, 400만 대 이상의 
자동차 수출 중에서 120만 대가 전기차로, 전기차 수출량이 80% 증가
‒ 유럽은 독일, 프랑스, 영국이 전기차 시장의 성장을 주도했으며, 2023년 기준 
320만 대의 신규 전기차 등록으로 2022년 대비 20% 증가
‒ 미국은 140만 대의 전기차가 신규 등록되어 전년 대비 40% 증가하였으며, 인플
레이션 감축법(IRA)에 따른 세액 공제 제도와 주요 모델의 가격 인하가 성장세를 
촉진한 것으로 파악됨. 1) 본고는 IEA의 “Global EV Outlook 2024” 보고서를 요약 정리한 것임. “2023년 글로벌 
전기차 판매량은 
35% 급증한 
1,400만 대를 
기록했으며, 중국, 
유럽, 미국이 
성장을 주도”
WORLD ENERGY MARKETINSIGHT
------------------

In [16]:
# 추론이 필요한 질문
query = "중소형 전기차 모델이 가장 많은 판매량을 차지하는 지역은 어디인가요?"

# 가장 유사도가 높은 문장을 하나만 추출
retriever = vectorstore.as_retriever(search_kwargs={'k': 2})

results = retriever.invoke(query)
print(len(results))
print()

for doc in results:
    print(doc.page_content)
    print("-"*100)

2

2  세계 에너지시장 인사이트 제24-13호 2024.7.1. 자료 : IEA(2024), Global EV Outlook 2024
< 세계 전기자동차 누적 판매 추이(2010~2023년) >
¡ 2023년 시판 중인 자동차 모델 종류는 전년 대비 15% 증가한 590종에 달했으며, 
그 중 60% 이상이 SUV 또는 대형 차량으로 나타남. ‒ 전기차 시장에서 소형 및 중형 모델의 비중이 감소하는 추세이며 미국에서는 
소형 및 중형 전기차 모델이 전기차 판매의 25%를, 유럽에서는 40%, 중국에서는 
50%를 차지한 것으로 나타남. ‒ 이와 같은 대형 EV 모델의 종류 및 구매 증가 추세는 자동차 제조업체의 
수익성과 소비자의 선호 및 배출 규제 등이 반영된 것으로 분석되고 있음.
----------------------------------------------------------------------------------------------------
8  세계 에너지시장 인사이트 제24-13호 2024.7.1. ¡ 유럽의 STEPS 시나리오는 중소형 전기차(LDV)의 판매 비율이 2030년에 60%, 
2035년에 85%에 도달할 것으로 예상하며 APS 시나리오는 2030년에 60%, 
2035년에 90%를 초과할 것으로 전망
‒ 영국은 2023년 차량 배출 거래 제도 명령을 통과시키면서 2024년 22%에서 
2030년 80%로 제로 배출 차량(ZEV) 판매 목표를 설정
‒ EU는 2035년까지 경차 및 밴의 무탄소배출 차량의 판매 비율을 100%로 설정
¡ 미국의 중소형 전기차의 판매 비율은 STEPS와 APS 시나리오 하에서 모두 2030년에 
55%, 2035년에 70%에 도달할 것으로 예상됨.
----------------------------------------------------------------------------------------------------


## RAG Chain

`(1) Gemma2 활용`

In [17]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_ollama import ChatOllama


llm = ChatOllama(
    model = "gemma2",
    temperature = 0.2,
    num_predict = 250,
)


# Prompt
template = '''Answer the question based only on the following context.

[Context]
{context}

[Question]
{question}

[Answer (in Korean)]
'''

prompt = ChatPromptTemplate.from_template(template)


def format_docs(docs):
    return '\n\n'.join([d.page_content for d in docs])

# RAG Chain 연결
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Chain 실행
query = "중국 전기차 시장에서 중소형 모델의 판매 비중은 얼마인가요?"
rag_chain.invoke(query)

'중국 전기차 시장에서 소형 및 중형 모델의 비중은 50%입니다. \n\n\n'

In [18]:
query = "중소형 전기차 모델이 가장 많은 판매량을 차지하는 지역은 어디인가요?"
rag_chain.invoke(query)

'중국입니다. \n\n\n'

In [19]:
from langchain_groq import ChatGroq

llm = ChatGroq(
    model="gemma2-9b-it",
    temperature=0.2,
    max_retries=2,
)

# RAG Chain 연결
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Chain 실행
query = "글로벌 전기차 산업이 어떻게 재편되고 있나요?"
rag_chain.invoke(query)

'글로벌 전기차 산업은 중국, 유럽, 미국을 중심으로 성장하고 있습니다. 중국은 전기차 수출량이 80% 증가하며 세계 1위 수출국으로서 주도적인 역할을 하고 있습니다. 유럽은 독일, 프랑스, 영국 등에서 전기차 시장 성장을 이끌고 있으며, 미국은 인플레이션 감축법에 따른 세액 공제 제도와 주요 모델 가격 인하로 인해 전기차 판매량이 40% 증가했습니다. 전 세계 전기차 보유량은 2018년 대비 6배 이상 증가한 4,000만 대에 달하며, 충전 인프라 또한 가정용 충전과 공용 충전설비, 급속 충전시설 등 다양한 형태로 확대되고 있습니다. \n\n\n'

`(2) Qwen 2.5 활용`

In [20]:
llm = ChatOllama(
    model = "qwen2.5",
    temperature = 0.2,
    num_predict = 250,
)

In [21]:
# RAG Chain 연결
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Chain 실행
query = "중국 전기차 시장에서 중소형 모델의 판매 비중은 얼마인가요?"
rag_chain.invoke(query)

'중국에서는 소형 및 중형 전기차 모델이 전기차 판매의 50%를 차지한 것으로 나타났습니다.'

In [22]:
query = "중소형 전기차 모델이 가장 많은 판매량을 차지하는 지역은 어디인가요?"
rag_chain.invoke(query)

'중소형 전기차 모델이 가장 많은 판매량을 차지하는 지역은 유럽으로 나타났습니다. 2030년에 유럽에서는 중소형 전기차(LDV)의 판매 비율이 60%로 예상되었으며, 2035년에는 85%까지 증가할 것으로 전망되었습니다.'

In [23]:
query = "글로벌 전기차 산업이 어떻게 재편되고 있나요?"
rag_chain.invoke(query)

'글로벌 전기차 산업은 다양한 지역에서의 판매 증가와 함께 재편되고 있습니다. 특히, 중국과 유럽, 미국 등 주요 시장에서 뚜렷한 성장을 보이고 있습니다.\n\n1. **중국**: 2023년 중국의 내연기관차 시장이 8% 축소되었음에도 불구하고 전기차 판매 증가로 전체 자동차 시장은 5% 성장하였습니다. 또한, 중국은 세계 최대의 전기차 수출국으로, 400만 대 이상의 자동차 중 120만 대가 전기차였으며, 이는 전년도에 비해 80% 증가한 수치입니다.\n\n2. **유럽**: 독일, 프랑스, 영국이 주도하여 전기차 시장 성장을 촉진하였고, 2023년 기준 신규 등록된 전기차는 320만 대로 이전 해에 비해 20% 증가하였습니다.\n\n3. **미국**: 미국은 14'