[LaingChain AI Handbook | Pinecone](https://www.pinecone.io/learn/series/langchain/)을 기반으로 작성됨(세미나 자료)

# LangChain을 쓰는 이유

##  LangChain에서 사용할 수 있는 언어모델
1. ChatGPT
* https://platform.openai.com/docs/api-reference/chat/create
* OpenAI API를 이용해 접속하거나, LangChain이 제공하는 OpenAI 객체를 이용해 접속  
(OpenAI(model_name="text-davinci-003", temperature=0.9))

2. Hugging Face Hub
* https://huggingface.co/docs/huggingface_hub/ko/quick-start
* 머신러닝 모델, 데모, 데이터 세트, 메트릭을 공유하는 플랫폼
* 개인이 만든 언어모델을 공유할 수 있음
* 모델을 다운로드 받아 로컬에서 실행하거나, Inference API를 이용해 클라이언트로 클라이언트로 서버에 접속 가능
* Hugging Face Inference API 사용  
(1) HuggingFace가 제공하는 InferenceClient 객체를 사용하거나,  
▷ 직접적으로 Hugging Face Hub API와 상호작용하기 위한 공식 객체  
▷ 쉽게 API 요청을 만들고 모델 결과를 받을 수 있음  
(2) LangChain이 제공하는 HuggingFaceHub 모듈을 이용해 접속  
▷ 여러 API와 데이터 소스를 통합해 작업할 때 Hugging Face 모델을 추가로 활용할 수 있음  
▷ 복잡한 애플리케이션 개발에 유용함
* 모델만 바꿔가면서 동일한 API 사용

### LangChain 없이 OpenAI API를 이용한 접속
* OpenAI에서 지원하는 API의 chat 기능을 이용

In [1]:
from openai import OpenAI
OPENAI_API_KEY = ''
client = OpenAI(api_key=OPENAI_API_KEY)
# client.chat.completions.create 메서드를 통해 GPT-3.5-turbo 모델에 대화를 요청합니다.
completion = client.chat.completions.create(
    model='gpt-3.5-turbo',
    # 모델은 messages 리스트의 내용을 바탕으로 대화에 응답합니다.
    messages=[
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': 'Hello!'}
    ]
)
# 응답 결과를 completion 객체에서 추출하여 출력합니다.
print(completion.choices[0].message.content)

Hello! How can I help you today?


### LangChain 없이 Hugging Face Inference API로 접속
* InferenceClient 객체를 생성할 대 특정 모델을 지정하거나, 작업에 따라 자동 선택
* InferenceClient 객체의 메서드를 이용해 원하는 작업을 시행
* 작업은 서버에서 이루어지고 결과를 반환
* 네트워크 사정에 따라 안 될 수 있음
* https://huggingface.co/docs/huggingface_hub/guides/inference

In [2]:
from huggingface_hub import InferenceClient
client = InferenceClient()
# client = InferenceClient(model="prompthero/openjourney-v4") 명시적으로 지정 가능
image = client.text_to_image("An astronaut riding a horse on the moon.")
image.save("astronaut.png")

### 그럼에도 LangChain을 사용하는 이유
* LangChain 없이도 ChatGPT와 다른 언어모델을 사용할 수 있을까? Yes
  - ChatGPT는 OpenAI의 API를 이용해서 프로그램 구현 가능
  - 그 외의 공개 언어모델은 Hugging Face Hub를 이용해서(등록되어 있는 경우) 프로그램 구현 가능
* 단, 위 API는 기본적인 기능만 제공하기 때문에 프롬프트의 효율적인 관리를 위해서는 LangChain을 사용하는 것이 편리함
  - 언어모델을 사용하는 애플리케이션을 효율적으로 개발할 수 있음
  - 사용하는 언어모델에 관계없이 LangChain이 제공하는 인터페이스를 통해 공통적인 형태로 구현이 가능
  - 언어모델의 호출, 프롬프트 생성, 프롬프트 관리, 메모리 관리, RAG. 도구 사용 등의 다양한 기능을 사용할 수 있음
  - Vector store와 같은 외부 시스템과 연동하는 인터페이스를 제공하므로 쉽게 연동이 가능
* LangChain을 사용하지 않으면 LangChain이 제공하는 복잡한 기능을 내가 직접 다 구현해야 한다.

[참고] LangChain Framework
* langchain-core  
: 기본 추상화와 LangChain 표현 언어를 포함한 핵심 라이브러리
* langchain-community  
: 서드파티 통합 라이브러리  
: Partner packages (예: langchain-openai, langchain-anthropic 등) : 일부 통합은 langchain-core에만 의존하는 경량 패키지로 분리됨
* langchain  
: 애플리케이션의 인지 아키텍처를 구성하는 체인, 에이전트, 검색 전략
* LangGraph  
: LLM을 활용하여 여러 주체가 참여하는 상태 유지 애플리케이션을 구축하는 도구로, 단계를 그래프의 엣지와 노드로 모델링함  
: LangChain과 원활하게 통합되지만, 독립적으로도 사용 가능
* LangServe  
: LangChain 체인을 REST API로 배포하기 위한 도구
* LangSmith  
: 개발자가 LLM 애플리케이션을 디버그, 테스트, 평가, 모니터링할 수 있게 해주는 개발자 플랫폼
* https://python.langchain.com/v0.2/docs/introduction/

[참고] LangChain 모듈 (계속 발전하는 중)
1. Model I/O : 언어모델 호출 등의 인터페이스를 지원하는 모듈
  - OpenAI, HuggingFace에 관계 없이 통일된 방식으로 인터페이스 사용이 가능
2. Retrieval (Vector Store) : 언어모델 외부의 다양한 데이터 소스로부터 필요한 정보를 가져오는 것을 지원
  - 다양한 형태의 파일(텍스트, pdf 등)과 웹 페이지로부터 정보 추출 가능
3. Memory : 이전의 대화를 단기 혹은 장기적으로 저장하고 사용할 수 있도록 지원
4. Chains : 여러 개의 모듈을 간편하게 조합하여 사용할 수 있는 기능을 제공
5. Agents : 언어모델 외에 외부의 다양한 도구들을 사용할 수 있는 방법을 제공
6. Callbacks : 다른 모듈과 결합하여 지정된 이벤트 발생 시 수행할 기능을 지정 가능

# LangChain 기초

## LangChain 컴포넌트
* Prompt templates  
: 프롬프트 템플릿은 다양한 유형의 프롬프트를 위한 템플릿을 말합니다. 예를 들어, "챗봇" 스타일 템플릿, ELI5(쉽게 설명해줘) 질문-답변 템플릿 등이 있습니다.  
  - 반복적으로 사용하는 프롬프트들을 유형화해서 관리가 쉽도록 하기 위한 템플릿
* LLMs  
: GPT-3, BLOOM 등과 같은 대형 언어 모델
* Agents  
: 에이전트는 어떤 행동을 취해야 할지 결정하기 위해 대형 언어 모델(LLM)을 사용한다. 웹 검색이나 계산기 같은 도구(tool)들을 사용할 수 있으며, 이 모든 것들이 논리적인 작업 루프로 패키지된다.
* Memory  
: 주고 받는 대화 저장  
: 단기 기억, 장기 기억

### 프롬프트 템플릿 만들기
* 질의 응답을 위한 프롬프트 템플릿 생성
  - template에 {}을 이용해 변수로 입력 받을 부분 정의
  - PromptTemplate 객체에 input_variables로 사용할 변수명을 지정

In [5]:
from langchain import PromptTemplate

template = """Question : {question}
Answer : """
prompt = PromptTemplate(
    template=template,
    input_variables=['question']
)

# user question
question = "Who is Son Heung Min?"

* Hugging Face Hub의 언어모델 사용
  - Hugging Face LLM과 앞서 생성한 PromptTemplate 객체를 이용해 프롬프트 실행

In [16]:
from langchain import HuggingFaceHub, LLMChain
import os

os.environ['HUGGINGFACEHUB_API_TOKEN'] = ''
# initialize Hub LLM (LLM에 대한 정의)
hub_llm = HuggingFaceHub(
    repo_id='mistralai/Mistral-7B-Instruct-v0.3', # Hugging Face LLM 모델 지정
    model_kwargs={"temperature": 0.2, # 대화의 자유도
                 "max_length": 128}, # 주고 받는 답변의 최대 크기
    task="text-generation"
)

# create prompt template > LLM chain(LLM을 사용하는 LLM Chain → 그 LLM을 불러와서 하는 task)
llm_chain = LLMChain(
    prompt=prompt, # 앞에서 생성한 PromptTemplate 객체
    llm=hub_llm # 위에서 생성한 LLM 객체
)

# ask the user question
print(llm_chain.run(question=question)) # 변수 지정

  hub_llm = HuggingFaceHub(
  llm_chain = LLMChain(
  print(llm_chain.run(question=question)) # 변수 지정


Question : Who is Son Heung Min?
Answer :  Son Heung-min is a South Korean professional footballer who plays as a winger for English club Tottenham Hotspur and the South Korea national team. He is known for his speed, dribbling skills, and ability to score goals. He has been a key player for Tottenham since joining the club in 2015, and has also represented South Korea at multiple international tournaments, including the 2018 FIFA World Cup.


[참고] LLM 관련 세팅 : Temperature
* temperature  
: 온도 샘플링의 변수로, 값이 낮을수록 리스크가 낮으며 더 정확하고 deterministic한 결과를 제시
* 온도 샘플링의 이해
  - 생성형 언어모델은 기본적으로 현재의 문장 다음에 올 단어(혹은 토큰)를 확률에 따라 선택하는 시스템임
  - 이때 다음에 올 단어의 선택은 확률적인 샘플링을 통해 이루어지는데, 확률이 높은 토큰이 확률이 낮은 토큰보다 선택될 가능성이 상대적으로 높음
  - 온도 샘플링은 다음 토큰에 대한 후보 집합의 토큰들에 대해 확률의 비율을 변경하는 스케일링 기법으로, 온도가 낮을수록 후보 집합에 있는 토큰들 간의 확률 격차가 더 커지로, 반대로 온도가 높으면 후보 집합에 있는 토큰들 간의 확률격차가 줄어듦
  - 즉, 온도가 낮으면 항상 똑같은 안정적인 답이 나올 가능성이 높고, 온도가 높으면 매번 새롭고 창의적인 답이 나올 가능성이 높아짐
  - 온도는 0에서 2 사이의 값을 지정할 수 있으며, 일반적으로 0.5 ~ 1.0 사이의 값을 사용 (기본값 1)

In [17]:
# The function `run` was deprecated in LangChain 0.1.0 and will be removed in 0.2.0. Use invoke instead.
print(llm_chain.invoke({"question":question})['text'])

Question : Who is Son Heung Min?
Answer :  Son Heung-min is a South Korean professional footballer who plays as a winger for English club Tottenham Hotspur and the South Korea national team. He is known for his speed, dribbling skills, and ability to score goals. He has been a key player for Tottenham since joining the club in 2015, and has also represented South Korea at multiple international tournaments, including the 2018 FIFA World Cup.


[참고] 왜 OpenAI만을 사용하지 않는가?
* OpenAI를 사용할 때 예상되는 문제점
  - 서버에 클라이언트로 접속해야 하므로 속도 등에서 OpenAI에 의존적이 됨
  - 대부분 RAG의 구현 즉 거대언어모델 외부의 데이터를 이용한 Q&A 구현이 목적인데, 프롬프트에 데이터를 포함해야 하므로 기본적으로 데이터 유출의 우려가 있음
  - 구현 이후 사용할 때마다 지속적으로 비용을 지불해야 하는 부담이 있음
* 이에 대한 대안
  - Hugging Face Hub의 공개모델 혹은 기타 공개모델을 로컬에 설치해서 사용
  - 큰 규모의 조직인 경우 직접 언어모델을 학습해서 사용 가능
* 이를 위해 필요한 것은?
  - 어떤 모델을 사용할 수 있나? 어디서 구할 수 있나? 에 대한 정보

### 여러 개의 질문에 대한 답변
* 동일한 PromptTemplate 객체로 여러 질문에 대해 답변하고자 하는 경우
  - {변수명:질문} 형태의 딕셔너리의 리스트로 아래와 같이 생성하고 llm_chain을 실행

In [20]:
qs = [
    {'question': "Which NFL team won the Super Bowl in the 2010 season?"},
    {'question': "If I am 6 ft 4 inches, how tall am I in centimeters?"},
    {'question': "Who was the 12th person on the moon?"},
    {'question': "How many eyes does a blade of grass have?"}
]
res = llm_chain.generate(qs) # generate가 다중질문 답변을 하나씩 추출하기 편함
for gen in res.generations: # 결과 보기 (LLM 4번 호출)
    print(gen[0].text)

# → (최근 다시 코드 돌려보니 공부했을 때와 결과가 다르게 나옴)

Question : Which NFL team won the Super Bowl in the 2010 season?
Answer :  The New Orleans Saints won the Super Bowl in the 2010 season. They defeated the Indianapolis Colts 31-17 in Super Bowl XLIV. The Saints were led by quarterback Drew Brees and head coach Sean Payton. This was the first Super Bowl victory in the history of the New Orleans Saints franchise.
Question : If I am 6 ft 4 inches, how tall am I in centimeters?
Answer : 193 centimeters.

To convert feet and inches to centimeters, you can use the following conversion factors:

1 foot = 12 inches = 30.48 centimeters

So, if you are 6 feet 4 inches tall, you can calculate your height in centimeters as follows:

6 feet * 12 inches/foot + 4 inches = 72 inches + 4 inches = 7
Question : Who was the 12th person on the moon?
Answer : 12th person on the moon was Edgar Mitchell. He was the 6th man to walk on the moon as part of the Apollo 14 mission in 1971. He was the Lunar Module Pilot, and he and Alan Shepard performed the second 

### 다중 질문에 대한 프롬프트 템플릿
* LLM 1번 호출 → 다중 질문에 대한 프롬프트 템플릿 생성

In [21]:
multi_template = """Answer the following questions one at a time.
Questions:
{questions}
Answers:
"""

long_prompt = PromptTemplate(template=multi_template, input_variables=['questions'])
llm_chain = LLMChain(
    prompt=long_prompt,
    llm=hub_llm
)

qs_str = (
    "Which NFL team won the Super Bowl in the 2010 season?\n" +
    "If I am 6 ft 4 inches, how tall am I in centimeters?\n" +
    "Who was the 12th person on the moon?\n" +
    "How many eyes does a blade of grass have?"

)

print(llm_chain.invoke({"questions": qs_str})['text'])

# 결과는?
# 공부할 때는 잘 동작하지 않음. max_length를 1024로 늘려도 동일한 답
# → (최근 다시 코드 돌려보니 결과가 다르게 나옴)
# 무엇이 문제일까?

Answer the following questions one at a time.
Questions:
Which NFL team won the Super Bowl in the 2010 season?
If I am 6 ft 4 inches, how tall am I in centimeters?
Who was the 12th person on the moon?
How many eyes does a blade of grass have?
Answers:
The New Orleans Saints won the Super Bowl in the 2010 season.
6 ft 4 inches is approximately 193 centimeters.
The 12th person on the moon was Harrison Schmitt, who was the lunar module pilot on Apollo 17.
A blade of grass does not have eyes. It is a plant and does not have any eyes.


### OpenAI 언어모델 사용 - 단일 질문 처리
* OpenAI와 LangChain API가 빠른 속도로 update 되므로 실행가능여부가 바뀔 수 있음

In [6]:
from langchain_openai import ChatOpenAI
from langchain import LLMChain

openai = ChatOpenAI(
    model_name='gpt-3.5-turbo',
    api_key=OPENAI_API_KEY
)
llm_chain = LLMChain(
    prompt=prompt,
    llm=openai
)

print(llm_chain.invoke(question)['text'])

  llm_chain = LLMChain(


Son Heung Min is a professional South Korean footballer who plays as a forward for Premier League club Tottenham Hotspur and the South Korean national team. He is known for his speed, skill, and goal-scoring ability.


[참고] OpenAI에서 사용가능한 모델을 보고 싶다면?

In [7]:
from openai import OpenAI
client = OpenAI(
    api_key=OPENAI_API_KEY
)
model_names = [model.id for model in client.models.list().data]
print(model_names)

['gpt-3.5-turbo', 'gpt-3.5-turbo-0125', 'gpt-4o-mini-2024-07-18', 'dall-e-2', 'gpt-4o-mini', 'gpt-4-1106-preview', 'tts-1-hd-1106', 'tts-1-hd', 'dall-e-3', 'whisper-1', 'text-embedding-3-large', 'text-embedding-ada-002', 'gpt-4-turbo', 'gpt-4o-2024-05-13', 'gpt-4-0125-preview', 'gpt-4-turbo-2024-04-09', 'gpt-4-turbo-preview', 'tts-1', 'tts-1-1106', 'gpt-3.5-turbo-16k', 'gpt-4o', 'gpt-3.5-turbo-1106', 'gpt-3.5-turbo-instruct-0914', 'gpt-4', 'gpt-4-0613', 'gpt-3.5-turbo-instruct', 'chatgpt-4o-latest', 'babbage-002', 'davinci-002', 'text-embedding-3-small', 'gpt-4o-2024-08-06']


### 다중 질문에 대한 답변 - ChatGPT는 성공

In [10]:
multi_template = """Answer the following questions one at a time.
Questions:
{questions}
Answers:
"""

long_prompt = PromptTemplate(template=multi_template, input_variables=['questions'])


llm_chain = LLMChain(
    prompt=long_prompt,
    llm=openai
)
qs_str = (
"Which NFL team won the Super Bowl in the 2010 season?\n" +
"If I am 6 ft 4 inches, how tall am I in centimeters?\n" +
"Who was the 12th person on the moon?\n" +
"How many eyes does a blade of grass have?"
)

print(llm_chain.invoke({"questions":qs_str})['text'])

The Green Bay Packers won the Super Bowl in the 2010 season.
You are 193.04 centimeters tall.
Charles "Pete" Conrad was the 12th person on the moon.
A blade of grass does not have eyes.
