## 환경 설정

In [1]:
# API 키를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API 키 정보 로드
load_dotenv()

True

In [None]:
# LangSmith 추적을 설정합니다. https://smith.langchain.com
# !pip install -qU langchain-teddynote
from langchain_teddynote import logging

# 프로젝트 이름을 입력합니다.
logging.langsmith("ChatOllama")

LangSmith 추적을 시작합니다.
[프로젝트명]
ChatOllama


## Ollama 모델 사용

한국어 잘하는 Open 모델 

**참고**

각 모델의 라이센스를 반드시 확인 후 사용해주세요.

- EXAONE-3.5 모델(gguf): https://huggingface.co/LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct-GGUF
- gemma2-27b: https://ollama.com/library/gemma2:27b
- EEVE-Korean-10.8B(gguf): https://huggingface.co/teddylee777/EEVE-Korean-Instruct-10.8B-v1.0-gguf
- Qwen2.5-7B-Instruct-kowiki-qa-context(gguf): https://huggingface.co/teddylee777/Qwen2.5-7B-Instruct-kowiki-qa-gguf

In [4]:
from langchain_ollama import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_teddynote.messages import stream_response

# Ollama 모델 지정
llm = ChatOllama(
    model="exaone",
    temperature=0,
)

# 프롬프트 정의
prompt = ChatPromptTemplate.from_template("{topic} 에 대하여 간략히 설명해 줘.")

# 체인 생성
chain = prompt | llm | StrOutputParser()

# 스트림 출력
answer = chain.stream({"topic": "deep learning"})
stream_response(answer)

딥 러닝(Deep Learning)은 인공지능(AI)의 한 분야로, 인공 신경망(Artificial Neural Networks)을 기반으로 하는 머신 러닝 기법입니다. 주요 특징과 개념은 다음과 같습니다:

1. **다층 신경망 구조**: 딥 러닝은 여러 층(layer)으로 구성된 복잡한 신경망을 사용합니다. 이러한 다층 구조를 통해 데이터의 고차원적 특징을 자동으로 학습하고 추출할 수 있습니다. 일반적으로 입력층, 은닉층(hidden layers), 출력층으로 구성됩니다.

2. **자동 특징 추출**: 전통적인 머신 러닝 방법에서는 특징 공학(feature engineering)이 필요했습니다. 즉, 전문가가 데이터에서 중요한 특징을 수동으로 추출해야 했습니다. 하지만 딥 러닝은 이러한 과정을 자동화하여, 데이터에서 직접 중요한 특징을 학습합니다.

3. **대규모 데이터 활용**: 딥 러닝 모델은 대량의 데이터를 통해 훈련됩니다. 데이터의 양이 많을수록 모델의 성능이 향상되는 경향이 있습니다. 이는 빅 데이터 시대에 특히 유리한 특징입니다.

4. **응용 분야**:
   - **이미지 인식 및 분류**: 컴퓨터 비전 분야에서 이미지나 비디오 분석에 널리 사용됩니다 (예: 얼굴 인식, 객체 검출).
   - **자연어 처리(NLP)**: 텍스트 분석, 번역, 챗봇, 감성 분석 등에 활용됩니다.
   - **음성 인식**: 음성 명령 인식, 자동 음성 응답 시스템 등에 사용됩니다.
   - **추천 시스템**: 온라인 쇼핑, 스트리밍 서비스 등에서 사용자 맞춤형 추천을 제공합니다.

5. **알고리즘 예시**:
   - **컨볼루션 신경망 (CNN, Convolutional Neural Networks)**: 주로 이미지 및 비디오 데이터 처리에 사용됩니다.
   - **순환 신경망 (RNN, Recurrent Neural Networks)**: 시계열 데이터나 순차적인 데이터 처리에 적합합니다 (예: 언어 모델링).
   - **전결합 신경망 (Full

In [6]:
# gemma2-27b
llm = ChatOllama(
    model="gemma2:27b",
    temperature=0,
)

# 주제를 기반으로 짧은 농담을 요청하는 프롬프트 템플릿을 생성합니다.
prompt = ChatPromptTemplate.from_template(
    "Answer the following question in Korean.\n\nQuestion: {question}\n\nAnswer:"
)

# LangChain 표현식 언어 체인 구문을 사용합니다.
chain = prompt | llm | StrOutputParser()

# 체인 실행
answer = chain.stream({"question": "python 코드로 피보나치 수열을 구현해보세요."})
stream_response(answer)

```python
def fibonacci(n):
  if n <= 1:
    return n
  else:
    return fibonacci(n-1) + fibonacci(n-2)

# 원하는 항까지 피보나치 수열 출력
for i in range(10):
  print(fibonacci(i))
```

**설명:**

* 이 코드는 재귀 함수 `fibonacci(n)`을 사용하여 피보나치 수열을 구현합니다. 
* `n`이 1 이하일 경우, `n`을 그대로 반환합니다.
* `n`이 2 이상일 경우, `fibonacci(n-1)`과 `fibonacci(n-2)`의 합을 반환하여 피보나치 수열의 다음 항을 계산합니다.
* `for` 루프를 사용하여 0부터 9까지의 인덱스에 대한 피보나치 수를 출력합니다.





## OllamaEmbeddings 사용

링크: https://ollama.com/library/bge-m3

명령어

`ollama pull bge-m3`

In [7]:
from langchain_ollama import OllamaEmbeddings

# 임베딩 설정
embeddings = OllamaEmbeddings(
    model="bge-m3",
)

### 코사인 유사도 계산

In [8]:
sentence1 = "안녕하세요? 반갑습니다."
sentence2 = "안녕하세요? 반갑습니다!"
sentence3 = "안녕하세요? 만나서 반가워요."
sentence4 = "Hi, nice to meet you."
sentence5 = "I like to eat apples."

유사도 계산을 위한 임베딩을 수행합니다.

In [9]:
from sklearn.metrics.pairwise import cosine_similarity

sentences = [sentence1, sentence2, sentence3, sentence4, sentence5]
embedded_sentences = embeddings.embed_documents(sentences)

In [10]:
def similarity(a, b):
    return cosine_similarity([a], [b])[0][0]

유사도 계산 결과는 다음과 같습니다.

In [11]:
# sentence1 = "안녕하세요? 반갑습니다."
# sentence2 = "안녕하세요? 반갑습니다!"
# sentence3 = "안녕하세요? 만나서 반가워요."
# sentence4 = "Hi, nice to meet you."
# sentence5 = "I like to eat apples."

for i, sentence in enumerate(embedded_sentences):
    for j, other_sentence in enumerate(embedded_sentences):
        if i < j:
            print(
                f"[유사도 {similarity(sentence, other_sentence):.4f}] {sentences[i]} \t <=====> \t {sentences[j]}"
            )

[유사도 0.9801] 안녕하세요? 반갑습니다. 	 <=====> 	 안녕하세요? 반갑습니다!
[유사도 0.9402] 안녕하세요? 반갑습니다. 	 <=====> 	 안녕하세요? 만나서 반가워요.
[유사도 0.8567] 안녕하세요? 반갑습니다. 	 <=====> 	 Hi, nice to meet you.
[유사도 0.5514] 안녕하세요? 반갑습니다. 	 <=====> 	 I like to eat apples.
[유사도 0.9207] 안녕하세요? 반갑습니다! 	 <=====> 	 안녕하세요? 만나서 반가워요.
[유사도 0.8387] 안녕하세요? 반갑습니다! 	 <=====> 	 Hi, nice to meet you.
[유사도 0.5309] 안녕하세요? 반갑습니다! 	 <=====> 	 I like to eat apples.
[유사도 0.9253] 안녕하세요? 만나서 반가워요. 	 <=====> 	 Hi, nice to meet you.
[유사도 0.5609] 안녕하세요? 만나서 반가워요. 	 <=====> 	 I like to eat apples.
[유사도 0.5952] Hi, nice to meet you. 	 <=====> 	 I like to eat apples.


**실습에 활용한 문서**

소프트웨어정책연구소(SPRi) - 2023년 12월호

- 저자: 유재흥(AI정책연구실 책임연구원), 이지수(AI정책연구실 위촉연구원)
- 링크: https://spri.kr/posts/view/23669
- 파일명: `SPRI_AI_Brief_2023년12월호_F.pdf`

_실습을 위해 다운로드 받은 파일을 `data` 폴더로 복사해 주시기 바랍니다_


In [12]:
from langchain_community.document_loaders import PDFPlumberLoader
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama import ChatOllama, OllamaEmbeddings
from langchain_teddynote.messages import stream_response

# 문서 로드
loader = PDFPlumberLoader("data/SPRI_AI_Brief_2023년12월호_F.pdf")

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=50)
split_docs = loader.load_and_split(text_splitter)

# 임베딩 설정
embeddings = OllamaEmbeddings(
    model="bge-m3",
)

# 벡터스토어 생성
vectorstore = FAISS.from_documents(documents=split_docs, embedding=embeddings)

# 검색기 생성
retriever = vectorstore.as_retriever(search_kwargs={"k": 10})

# 프롬프트 로드
prompt = ChatPromptTemplate.from_template(
    """You are an assistant for question-answering tasks. 
Use the following pieces of retrieved context to answer the question. 
If you don't know the answer, just say that you don't know. 
Answer in Korean.

Please follow these instructions:

1. Analyze the content of the source documents: 
2. The name of each source document is at the start of the document, with the <document> tag.

-----

Output format should be like this:

(Your comprehensive answer to the question)

**Source**
- [1] Document source with page number
- [2] Document source with page number
(...)

-----

### Here is the context that you can use to answer the question:

#Context: 
{context}

### Here is user's question:

{question}

Your answer to the question:

### Answer:"""
)


def format_docs(docs):
    return "\n\n".join(
        f"<document><content>{doc.page_content}</content><page>{doc.metadata['page']}</page><source>{doc.metadata['source']}</source></document>"
        for doc in docs
    )


# Ollama 모델 지정
llm = ChatOllama(
    model="exaone",
    temperature=0,
)

# 체인 생성
chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

ValueError: File path data/SPRI_AI_Brief_2023년12월호_F.pdf is not a valid file or url

In [None]:
question = "삼성전자가 개발한 생성형 AI 의 이름은?"

# 체인 실행
response = chain.stream(question)
# 스트림 출력
stream_response(response)