# LangChain + HuggingFace

In [1]:
# 필요한 라이브러리 설치
# pip install langchain
# pip install huggingface_hub transformers datasets --user

### Huggingface Token 발급

1. [허깅페이스](https://huggingface.co)에 로그인/회원가입 후 토큰 발급을 신청
    - [토큰 발급](https://huggingface.co/docs/hub/security-tokens)
        - 토큰 발급을 진행합니다. <img src="https://raw.githubusercontent.com/KOO-96/LangChain__Studying/main/image/img4.png" width="50%"> 만약 버튼이 비활성화 상태일 경우 메일 인증이 안되어있는 경우입니다
    - [LLM Key](https://huggingface.co/settings/tokens)를 복사해서 사용합니다.
        <img src="https://raw.githubusercontent.com/KOO-96/LangChain__Studying/main/image/img5.png">
        - Key 찾는 법은 아래에 있습니다.
        <img src="https://raw.githubusercontent.com/KOO-96/LangChain__Studying/main/image/img6.png">

In [2]:
import os
os.environ['HUGGINGFACEHUB_API_TOKEN'] = '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'

### HuggingFaceHub에 배포된 모델 inference

- 추론에 활용할 모델 선택하기
    - [허깅페이스 LLM 리더보드](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)를 통해서 모델 리스트와 성능을 확인하는 방법
    <img src="https://raw.githubusercontent.com/KOO-96/LangChain__Studying/main/image/img7.png" width="70%">
    
- HuggingFaceHub
```
from langchain import LLMChain
from langchain.prompts import PromptTemplate
from langchain.llms import HuggingFaceHub

# HuggingFace Repository ID
repo_id = 'mistralai/Mistral-7B-v0.1'

# 질의내용
question = "Who is Son Heung Min?"

# 템플릿
template = """Question: {question}

Answer: """

# 프롬프트 템플릿 생성
prompt = PromptTemplate(template=template, input_variables=["question"])

# HuggingFaceHub 객체 생성
llm = HuggingFaceHub(
    repo_id=repo_id, 
    model_kwargs={"temperature": 0.2, 
                  "max_length": 128}
)

# LLM Chain 객체 생성
llm_chain = LLMChain(prompt=prompt, llm=llm)

# 실행
print(llm_chain.run(question=question))
```

※ HuggingFace를 사용할때, 용량 확인이 필요합니다!! 추가적으로 토큰 발급받을 때, Write권한으로 하는 것이 불러오기 편합니다.

In [23]:
from langchain import LLMChain
from langchain.prompts import PromptTemplate
from langchain.llms import HuggingFaceHub

import os
os.environ['HUGGINGFACEHUB_API_TOKEN'] = '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'

# HuggingFace Repository ID
repo_id = 'mistralai/Mixtral-8x7B-Instruct-v0.1'

# 질의내용
question = "Who is Son Heung Min?"

# 템플릿
template = """Question: {question}

Answer: """

# 프롬프트 템플릿 생성
prompt = PromptTemplate(template=template, input_variables=["question"])

# HuggingFaceHub 객체 생성
llm = HuggingFaceHub(
    repo_id=repo_id, 
    model_kwargs={"temperature": 0.2, 
                  "max_length": 128}
)

# LLM Chain 객체 생성
llm_chain = LLMChain(prompt=prompt, llm=llm)

# 실행
print(llm_chain.run(question=question))

Question: Who is Son Heung Min?

Answer: 손흥민

Son Heung Min is a South Korean footballer who plays as a forward for Tottenham Hotspur in the English Premier League. He is the first Asian player to score 50 goals in the Premier League and is considered one of the best Asian footballers of all time.

Son Heung Min was born on July 8, 1992, in Chuncheon, South Korea. He started his


- 모델을 직접 다운로드 후 로컬(local)에서 추론
    - 위 방법은 서버에서 선택된 모델을 추론하고 답변을 반환하는 방식입니다.
    - 추론 방식이 간편하게 사용이 가능하지만 성능에 따라 속도가 오래 걸려 Timeout 에러가 발생할 가능성이 있습니다.

#### GPU 서버를 탑재하거나 Colab에서 Gpu 부스트를 받아서 사용이 가능하기도 합니다

In [None]:
import os

# 허깅페이스 모델/토크나이저를 다운로드 받을 경로
os.environ['HF_HOME'] = 'LLM 모델을 다운로드 받을 경로'

In [None]:
from langchain import LLMChain
from langchain.prompts import PromptTemplate
from langchain.llms import HuggingFacePipeline

# HuggingFace Model ID
model_id = 'beomi/llama-2-ko-7b'

# HuggingFacePipeline 객체 생성
llm = HuggingFacePipeline.from_model_id(
    model_id=model_id, 
    device=0,               # -1: CPU(default), 0번 부터는 CUDA 디바이스 번호 지정시 GPU 사용하여 추론
    task="text-generation", # 텍스트 생성
    model_kwargs={"temperature": 0.1, 
                  "max_length": 64},
)

# 템플릿
template = """질문: {question}

답변: """

# 프롬프트 템플릿 생성
prompt = PromptTemplate.from_template(template)

# LLM Chain 객체 생성
llm_chain = LLMChain(prompt=prompt, llm=llm)