<a href="https://colab.research.google.com/github/UngSangYoon/AI-dol/blob/main/AI_dol.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
#@title Step1. 기본 패키지 설치 (langchian, 구글검색, 위키피디아, VectorStore, HuggingFace Embedding)
!pip install langchain
!pip install google-search-results
!pip install wikipedia
!pip install sentence_transformers # HuggingFace Embedding 사용 위해서 필요
!pip install tiktoken # Summarization 할때 필요
!pip install pypdf
!pip install torch

In [None]:
#@title Step2.Base Model 가져오기 (/kullm-polyglot-12.8b-v2)
MODEL = 'nlpai-lab/kullm-polyglot-12.8b-v2'
MAX_NEW_TOKENS = 128

# bitsandbytes quantization settings (4bit for now)
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

# loads model
tokenizer = AutoTokenizer.from_pretrained(MODEL)
model = AutoModelForCausalLM.from_pretrained(MODEL, quantization_config=bnb_config, device_map='auto')
model.eval()
model.config.use_cache = True

# creates a streamer for the model
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
# creates a huggingface pipeline for langchain
pipe = pipeline(
    'text-generation',
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=MAX_NEW_TOKENS,
    streamer=streamer,
    )
chat = HuggingFacePipeline(pipeline=pipe)


In [None]:
#@title Step2.Base Model 가져오기 (Llama2)
!pip install -q transformers einops accelerate langchain bitsandbytes
!huggingface-cli login
from langchain.llms import HuggingFacePipeline
from transformers import AutoTokenizer
import torch
import warnings
warnings.filterwarnings('ignore')
model="meta-llama/Llama-2-7b-chat-hf"
tokenizer=AutoTokenizer.from_pretrained(model)

pipeline=transformers.pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto",
    max_length=1000,
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id
    )

chat=HuggingFacePipeline(pipeline=pipeline, model_kwargs={'temperature':0})

In [None]:
#@title Step2.Base Model 가져오기 (gpt-3.5-turbo)
!pip install openai
#@title 0. API 키 설정
import os
#@markdown https://platform.openai.com/account/api-keys
OPENAI_API_KEY = "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" #@param {type:"string"}

#@markdown https://huggingface.co/settings/tokens
#@markdown HuggingFace에서 모델 다운로드나 클라우드 모델 사용하기 위해서 필요 (무료)
HUGGINGFACEHUB_API_TOKEN = "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" #@param {type:"string"}

#@markdown https://serpapi.com/manage-api-key
#@markdown 구글 검색하기 위해서 필요 (월 100회 무료)
SERPAPI_API_KEY = "85dd5ecbb6e3eb109e443f647eb2e0df5aa467c1a6ca322778ca5dc84c8688af" #@param {type:"string"}

os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY
os.environ["HUGGINGFACEHUB_API_TOKEN"] = HUGGINGFACEHUB_API_TOKEN
os.environ["SERPAPI_API_KEY"] = SERPAPI_API_KEY

from langchain.chat_models import ChatOpenAI
chat = ChatOpenAI(model_name='gpt-3.5-turbo', temperature=0.9)


In [None]:
#@title Step3.system prompt 만들기
from langchain.prompts import ChatPromptTemplate
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

template = "당신의 이름은 {name}이며, {byline}입니다.\n 당신의 성격: {identity}\n 당신의 행동지침: {behavior}\n" # template for the kullm model
system_message_prompt = SystemMessagePromptTemplate.from_template(template)
human_template="{text}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])


In [None]:
#@title Step4-1.load document
from langchain.document_loaders import WebBaseLoader, TextLoader, DirectoryLoader
from langchain.text_splitter import CharacterTextSplitter

loader = WebBaseLoader(web_path="https://ko.wikipedia.org/wiki/%ED%8E%AD%EC%88%98")
documents = loader.load()

text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# web page 이외에도 pdf, txt문서 등등... load 가능



In [None]:
#@title Step4-2.store document in VectorDB
from langchain.embeddings import HuggingFaceEmbeddings,OpenAIEmbeddings
from langchain.vectorstores import Chroma

embeddings = HuggingFaceEmbeddings()
# embeddings = OpenAIEmbeddings()

db = Chroma.from_documents(docs, embeddings)

retriever = db.as_retriever()


In [None]:
#@title Step5. Chain 만들기
from langchain.chains import LLMChain
chatchain = LLMChain(llm=chat,prompt=chat_prompt)


answer = chatchain.run(
    name="펭수",
    byline="EBS 연습생, 유튜브 크리에이터, 가수",
    identity = "당신은 대한민국에서 사랑받는 대형 펭귄 캐릭터이에요. 당신은 독특하고 재미있는 성격을 가지고 있습니다. 당신은 특이하고 유머러스한 행동으로 자주 시청자들에게 웃음을 선사합니다.",
    behavior = " 당신은 모든 답변을 반말로 합니다. 당신은 문장의 어미로 '~겄네'를 자주 사용합니다.",
    text = "안녕? 지금 뭐하고 있어?")
print(answer)


In [None]:
#@title Step5-1. vectorDB, custom prompt templete 연결
from langchain.chains import RetrievalQA

chain_type_kwargs = {"prompt": chat_prompt}
qa = RetrievalQA.from_chain_type(llm= chat, chain_type="stuff", retriever=retriever, chain_type_kwargs = {"prompt": chat_prompt}
)

qa.run(name="펭수",byline="EBS 연습생, 유튜브 크리에이터, 가수",
              identity = "당신은 대한민국에서 사랑받는 대형 펭귄 캐릭터이에요. 당신의 임무는 유머와 텔레비전 출연을 통해 관객들을 즐겁게 하고 교육하는 거예요. ",
              behavior = "당신은 특이하고 유머러스한 행동으로 자주 시청자들에게 웃음을 선사하는 걸로 알려져 있어요. 당신은 독특하고 재미있는 성격을 가지고 있어, 어린이와 성인 모두에게 사랑받고 있어요.당신은 모든 답변을 반말로 합니다.",
              text = "안녕? 지금 뭐하고 있어?")

ValidationError: ignored

In [None]:
#@title Step6. Memory
from langchain.prompts import (
    ChatPromptTemplate,
    MessagesPlaceholder,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.chains import LLMChain
from langchain.memory import ConversationBufferMemory

prompt = ChatPromptTemplate(
    messages=[
        SystemMessagePromptTemplate.from_template(
            "You are a nice chatbot having a conversation with a human."
        ),
        # The `variable_name` here is what must align with memory
        MessagesPlaceholder(variable_name="chat_history"),
        HumanMessagePromptTemplate.from_template("{question}")
    ]
)
# Notice that we `return_messages=True` to fit into the MessagesPlaceholder
# Notice that `"chat_history"` aligns with the MessagesPlaceholder name.
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
conversation = LLMChain(
    llm=llm,
    prompt=prompt,
    verbose=True,
    memory=memory
)

* ConversationBufferMemory : 대화 기록(기본)
* ConversationBufferWindowMemory : 마지막 n개의 대화만 기억
* Entity Memory : 개체에 대한 정보를 저장
* Conversation Knowledge Graph Memory: 개체의 triple 저장: (sam, 좋아하는 색, 파랑)
* ConversationSummaryMemory : 대화의 요약본을 저장
* ConversationSummaryBufferMemory : 대화 요약본 + 마지막 n토큰 기억
* ConversationTokenBufferMemory : 마지막 n토큰 기억
* VectorStore-Backed Memory : 벡터DB에 정보 저장