In [None]:
# 출처 : https://wikidocs.net/233344
# LangChain 설치 및 업데이트
#!pip install -U langchain langchain-community langchain-experimental langchain-core langchain-openai langsmith langchainhub python-dotenv unstructured chromadb faiss-cpu rank_bm25 python-docx sqlalchemy

In [None]:
# 루트경로에 .env 파일을 만들고, HUGGINGFACEHUB_API_TOKEN='{API_KEY}' 식으로 입력한다.
# API 키를 환경변수로 관리하기 위한 .env설정 파일 로딩
import os
from dotenv import load_dotenv

load_dotenv() # API 키 정보 로드
print(f"[API KEY]\n{os.environ['HUGGINGFACEHUB_API_TOKEN']}")

In [None]:
# huggingface_hub 설치
#!pip install --upgrade --quiet huggingface_hub

In [None]:
# HuggingFaceEndpoint 이용
# => *HuggingFaceEndpoint 는 huggingface_hub 호스팅 서버에서 실행하는 것임.
from langchain_community.llms import HuggingFaceEndpoint
from langchain.chains import LLMChain
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain.prompts import PromptTemplate

# prompt 설정
template = """Please answer the following questions concisely.
QUESTION: {question}

ANSWER: """

prompt = PromptTemplate.from_template(template)


# 사용할 모델의 저장소 ID를 설정합니다.
#repo_id = "mistralai/Mistral-7B-Instruct-v0.2"
#repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
repo_id = "google/gemma-1.1-7b-it"

llm = HuggingFaceEndpoint(
    repo_id=repo_id,  # 모델 저장소 ID를 지정합니다.
    max_new_tokens=512,  # 생성할 최대 토큰 길이를 설정합니다.
    temperature=0.1,  # 샘플링 온도를 설정합니다. 값이 높을수록 더 다양한 출력을 생성합니다.
    callbacks=[StreamingStdOutCallbackHandler()],  # 콜백을 설정합니다.
    streaming=True,  # 스트리밍을 사용합니다.
)

# LLMChain을 초기화하고 프롬프트와 언어 모델을 전달합니다.
llm_chain = LLMChain(prompt=prompt, llm=llm)
# 질문을 전달하여 LLMChain을 실행하고 결과를 출력합니다.
response = llm_chain.invoke(
    {"question": "한국 서울에 방문할만한 곳 5장소만 추천하고 간단히 설명도 해주세요."}
)
#print(response)


In [None]:
# HuggingFaceHub 이용
# *HuggingFaceHub 는 huggingface_hub 호스팅 서버에서 실행하는 것임.
# *로컬에서 실행하는 경우에는 HuggingFacePipeline 이용해야 함.

import os

os.environ["TRANSFORMERS_CACHE"] = "./cache/"
os.environ["HF_HOME"] = "./cache/"

# HuggingFaceHub 는 huggingface_hub 호스팅 서버에서 실행하는 것임.
# 로컬에서 실행하는 경우에는 HuggingFacePipeline 이용해야 함.
from langchain.llms import HuggingFaceHub, HuggingFacePipeline
import warnings

# 경고 메시지 무시
warnings.filterwarnings("ignore")

# HuggingFace Repository ID
repo_id = "google/gemma-1.1-7b-it"


# *호스팅 hub 서버에서 실행함.
# HuggingFaceHub 객체 생성
llm = HuggingFaceHub(
    repo_id=repo_id,
    model_kwargs={"temperature": 0.1, "max_length": 4096},
    task="text-generation",  # 텍스트 생성
)



In [None]:
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

template = """
CONTEXT:
{text}

Q: 위 CONTEXT 내용을 10문장으로 간략히 요약해주세요.
A:
"""

prompt = PromptTemplate.from_template(template)

llm_chain = LLMChain(prompt=prompt, llm=llm)

text = """
경조사 지원 규정
1. 적용대상
계약직 사원을 포함한 임직원(고문 및 용역은 사장이 별도로 결정)
2. 경조사 지원기준
구 분
내 역
휴가(일)
금액(원)
기타
경 사
본인 결혼
자녀 결혼
형제자매결혼
자녀 출산(배우자)
부모 회갑
배우자 부모회갑
부모고희(칠순)
배우자부모고희
5
1
1
10
1
1
1
1
500,000
300,000
100,000
100,000
200,000
200,000
300,000
300,000
화환 지급
화환 지급
1회 분할 사용 가능
조 사
본인 사망
배우자 사망
부모 사망
자녀 사망
배우자 부모 사망
형제자매 사망
조부모/외조부모 사망
-
5
5
5
5
3
3
1,000,000
1,000,000
1,000,000
1,000,000 500,000
300,000
200,000
조화 지급
조화 지급
조화 지급
조화 지급
조화 지급
조화 지급
3. 신청서류
경조금 : 경조금지급신청서 및 증빙서류 1부
휴 가: 휴가원 1부
4. 경조휴가일수
공휴일과 경조사가 중복되었을 경우 휴가일수는 공휴일을 제외하여 계산한다.
5. 결혼퇴직
결혼퇴직의 경우 퇴직 1개월 이내에 결혼할 시에는 위의 기준에 의거하여 지급한다.
6. 기타
경조금 신청 시 휴가 신청도 같이 진행해야 함이 원칙임
특별한 경우 사업부장 합의 시 경조금 신청일 이후 신청 가능(6개월 이내)
분할 사용 불가, 발생일 이전 신청 불가.
부 칙
(시행일) 이 규정은 2007년 9월 14일부터 시행한다.
(개정일) 이 규정은 2012년 1월 1일부터 개정 시행한다.
경조사지원규정 1/1
"""
response = llm_chain.invoke(input=text)

print(response["text"])

In [6]:
# HuggingFacePipeline
# 로컬 GPU 서버에서 실행 하는 경우. 
# => 모델파일을 다운로드 받아야 하므로 huggingface_hub 로그인이 필요함.

# 로컬 폴더 경로 설정
os.environ["TRANSFORMERS_CACHE"] = "./model"
os.environ["HF_HOME"] = "./model"

# => 모델파일을 다운로드 받아야 하므로 huggingface_hub 로그인이 필요함.
from huggingface_hub import notebook_login
notebook_login()


VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

In [None]:
# 출처 : https://wikidocs.net/233804
# HuggingFacePipeline
from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline

# HuggingFace Repository ID
repo_id = "google/gemma-1.1-7b-it"

# 로컬로 다운로드 받아서 실행함.
llm = HuggingFacePipeline.from_model_id(
    model_id=repo_id,
    # 파이프라인에 전달할 추가 인자를 설정합니다. 여기서는 생성할 최대 토큰 수를 512으로 제한합니다.
    pipeline_kwargs={"max_new_tokens": 512},
    task="text-generation",  # 텍스트 생성
)

# chaing 설정 
from langchain.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

template = """Answer the following question in Korean.
#Question: 
{question}

#Answer: """  # 질문과 답변 형식을 정의하는 템플릿
prompt = PromptTemplate.from_template(template)  # 템플릿을 사용하여 프롬프트 객체 생성

# 프롬프트와 언어 모델을 연결하여 체인 생성
chain = prompt | hf | StrOutputParser()

question = "대한민국의 수도는 어디야?"  # 질문 정의

print(
    chain.invoke({"question": question})
)  # 체인을 호출하여 질문에 대한 답변 생성 및 출력