# LangChain Basic
#### 2023 초거대 AI

1. 패키지 설치
2. 기본 패키지 설정
3. OpenAI 환경 설정
4. LLM
5. Embedding
6. Prompt Template
7. Chain

In [1]:
%%writefile requirements.txt
openai
langchain
tiktoken
unstructured

Writing requirements.txt


In [2]:
!pip install -r requirements.txt

Collecting openai (from -r requirements.txt (line 1))
  Downloading openai-0.28.0-py3-none-any.whl (76 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m1.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langchain (from -r requirements.txt (line 2))
  Downloading langchain-0.0.292-py3-none-any.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m14.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting tiktoken (from -r requirements.txt (line 3))
  Downloading tiktoken-0.5.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (2.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.0/2.0 MB[0m [31m47.2 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting unstructured (from -r requirements.txt (line 4))
  Downloading unstructured-0.10.15-py3-none-any.whl (1.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.5/1.5 MB[0m [31m71.9 MB/s[0m eta [36m0:00:00[0m
Collectin

In [3]:
# 2. 기본 패키지 설정

import openai
import langchain

print(openai.__version__)
print(langchain.__version__)


0.28.0
0.0.292


In [4]:
# 3. OpenAI 환경설정

import os

# fine-tuning, lagchain 사용시 반드시 환경변수 값 사용!!
os.environ["OPENAI_API_KEY"] = "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"

openai.api_key = os.getenv("OPENAI_API_KEY")


In [5]:
# 4-1. OpenAI LLM(Chat Model 연결)

from langchain.chat_models import ChatOpenAI

chat_llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    temperature=0
)

In [15]:
# 4-2. Chat llm 사용

from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)

messages = [
    SystemMessage(content="한글을 영어로 번역해주고, 한글 발음을 함께 알려주는 보조."),
    HumanMessage(content="피자 정말 맛있네요."),
    AIMessage(content="Questo pizza è davvero delizioso(쿼스토 피짜 에 데리보 델리치오소)"),
    HumanMessage(content="이 와인 정말 맛있내요"),
]

print(messages)

[SystemMessage(content='한글을 영어로 번역해주고, 한글 발음을 함께 알려주는 보조.', additional_kwargs={}), HumanMessage(content='피자 정말 맛있네요.', additional_kwargs={}, example=False), AIMessage(content='Questo pizza è davvero delizioso(쿼스토 피짜 에 데리보 델리치오소)', additional_kwargs={}, example=False), HumanMessage(content='이 와인 정말 맛있내요', additional_kwargs={}, example=False)]


In [16]:
print(chat_llm(messages).content)

This wine is really delicious(디스 와인 이즈 리얼리 딜리셔스)


In [18]:
# 5-1. Embedding 모델 연결

from langchain.embeddings.openai import OpenAIEmbeddings

# 임베딩 모델 생성
embeddings = OpenAIEmbeddings(
    model='text-embedding-ada-002')

In [19]:
# 5-2. 유사도

from numpy import dot
from numpy.linalg import norm

def cos_sim(word1, word2):
    em1 = embeddings.embed_query(word1)
    em2 = embeddings.embed_query(word2)
    return dot(em1, em2)/(norm(em1)*norm(em2))

In [24]:
cos_sim("따까리", "노예")

0.8318750746287968

In [25]:
embeddings.embed_query("강아지")

[-0.004944477528651346,
 -0.013654904909287988,
 0.005942721184407978,
 -0.024078036774991266,
 -0.020165189418282863,
 0.022021454945061955,
 -0.02617468223807964,
 -0.00467405033313404,
 -0.011264461642785766,
 -0.012726772145898442,
 -0.011718512116190773,
 0.016893354604184178,
 -0.006790727612801945,
 0.00014502075883153135,
 -0.004937800411678593,
 0.032504684123148914,
 0.0413987324533669,
 -0.0013730023755799956,
 0.017654556183625998,
 -0.01812196089097651,
 0.007451771971991198,
 -0.00024330102946571364,
 0.0008588568016823495,
 -0.009087689844701811,
 -0.006784050495829192,
 0.012873670581944094,
 0.02550696122757891,
 -0.023730822967117936,
 -0.014916898177927901,
 -0.021206834567193023,
 0.02601442956808848,
 0.0026742246959650354,
 -0.02937974681377334,
 0.001062511896149582,
 -0.004944477528651346,
 0.00845335395340357,
 0.011257784991474283,
 -0.01137797402830638,
 0.010049208658616395,
 -0.002662539392016764,
 0.0016617918756030082,
 -0.004390268903671228,
 0.004480411

In [26]:
# 6. Prompt Template(Zero-shot-learning)

from langchain.prompts import SystemMessagePromptTemplate, HumanMessagePromptTemplate, ChatPromptTemplate

system_template = """
한글 텍스트가 제공됩니다.
당신의 임무는 텍스트를 {output_language} 언어로 번역하는 것입니다.
번역된 문장의 한글 발음을 괄호 안에 함께 제공합니다.
"""

system_message_prompt_template = SystemMessagePromptTemplate.from_template(
    system_template)

human_template = "{input_text}"

human_message_prompt_template = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt_template = ChatPromptTemplate.from_messages(
    [system_message_prompt_template, human_message_prompt_template])


In [28]:
final_prompt = chat_prompt_template.format_prompt(
    output_language="영어",
    input_text="반갑다"
).to_messages()

In [30]:
print(chat_llm(final_prompt).content)

Nice to meet you. (반갑다 [ban-gap-da])


In [33]:
system_template = """
상품의 종류를 알려주면, 해당 상품을 만드는
힙합 한국어 브랜드 이름을 생성하는 인공지능
"""

system_message_prompt_template = SystemMessagePromptTemplate.from_template(
    system_template)

human_template = "{input_text}"

human_message_prompt_template = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt_template = ChatPromptTemplate.from_messages(
    [system_message_prompt_template, human_message_prompt_template])

In [36]:
final_prompt = chat_prompt_template.format_prompt(
    input_text="탈모 샴프"
).to_messages()
print(chat_llm(final_prompt).content)

힙합 한국어 브랜드 이름: 빛나는 머리


In [None]:
final_prompt = chat_prompt_template.format_prompt(output_language="프랑스어",
                          input_text="이 와인은 정말 맛있네요.").to_messages()
print(final_prompt)

In [37]:
# 6-2. Prompt Template : few-shot-learning

from langchain.prompts import FewShotChatMessagePromptTemplate

# fewshot 예시 문장
examples = [
    {"input": "밥 먹었니?", "output": "밥 문나?"},
    {"input": "언제 왔니?", "output": "언제 완노?"},
    {"input": "밖에 덥니?", "output": "밖에 덥나?"},
    {"input": "너 공부가 재밌니?", "output": "니 공부 재밌나?"},
    {"input": "너 어제 어디갔었어?", "output": "니 어제 어데갔었노?"},
    {"input": "너 주말에 뭐해?", "output": "니 주말에 머 하노?"},
    {"input": "조심히 다녀와", "output": "단디 갔다온나"},
    {"input": "이거 뭐하는거야?", "output": "이 뭐꼬?"},
    {"input": "뭐라고한거야?", "output": "뭐라꼬?"},
    {"input": "그만큼이면 충분해", "output": "그마이하믄 대따"},
    {"input": "나 졸려", "output": "잠온다"},
    {"input": "실수없이 해야해", "output": "단디 해라"}
]

# fewshot 예시 문장 템플릿
example_prompt = ChatPromptTemplate.from_messages(
    [
        ("human", "{input}"),
        ("ai", "{output}"),
    ]
)

# fewshot 예시 문장+템플릿 결합
few_shot_prompt = FewShotChatMessagePromptTemplate(
    example_prompt=example_prompt,
    examples=examples,
)

print(few_shot_prompt.format())

Human: 밥 먹었니?
AI: 밥 문나?
Human: 언제 왔니?
AI: 언제 완노?
Human: 밖에 덥니?
AI: 밖에 덥나?
Human: 너 공부가 재밌니?
AI: 니 공부 재밌나?
Human: 너 어제 어디갔었어?
AI: 니 어제 어데갔었노?
Human: 너 주말에 뭐해?
AI: 니 주말에 머 하노?
Human: 조심히 다녀와
AI: 단디 갔다온나
Human: 이거 뭐하는거야?
AI: 이 뭐꼬?
Human: 뭐라고한거야?
AI: 뭐라꼬?
Human: 그만큼이면 충분해
AI: 그마이하믄 대따
Human: 나 졸려
AI: 잠온다
Human: 실수없이 해야해
AI: 단디 해라


In [39]:
# ChatPromptTemplate

system_template= "너는 입력 표준어를 경상도 사투리로 변환해주는 챗봇이야."
system_message_prompt_template = SystemMessagePromptTemplate.from_template(
    system_template)

human_template = "표준어 : {input}"

human_message_prompt_template = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt_template = ChatPromptTemplate.from_messages(
    [system_message_prompt_template, few_shot_prompt, human_message_prompt_template])

final_prompt = chat_prompt_template.format_prompt(
    input="내일 학교 잘 다녀와"
).to_messages()

In [40]:
print(chat_llm(final_prompt).content)

경상도 사투리 : 내일 학교 잘 다녀와라


In [41]:
# 7-1. Chain 연결

from langchain.chains import LLMChain

system_template = """
한글 텍스트가 제공됩니다.
당신의 임무는 텍스트를 {output_language} 언어로 번역하는 것입니다.
번역된 외국어 문장의 한국어 발음을 괄호 안에 함께 제공합니다.
예) 외국어(한글 발음)
"""

system_message_prompt_template = SystemMessagePromptTemplate.from_template(
    system_template)

human_template = "{input_text}"

human_message_prompt_template = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt_template = ChatPromptTemplate.from_messages(
    [system_message_prompt_template, human_message_prompt_template])

chain = LLMChain(llm=chat_llm, prompt=chat_prompt_template)

chain.run(output_language="영어", input_text="어서오세요")

'Welcome (어서오세요)'

In [42]:
#7-2. Chain-Prompt 연결

from langchain import PromptTemplate

template = """"
한글 텍스트 {input_text}가 제공됩니다.
당신의 임무는 텍스트를 {output_language} 언어로 번역하는 것입니다.
번역된 외국어 문장의 한국어 발음을 괄호 안에 함께 제공합니다.
예) 외국어(한글 발음)
"""

translate_prompt = PromptTemplate(
    input_variables=['output_language', 'input_text'],
    template=template
)

chain = LLMChain(llm=chat_llm,
                 prompt=translate_prompt)


In [43]:
chain.run(output_language="영어", input_text="이걸 사고 싶어요")

'"I want to buy this Korean text." (이걸 사고 싶어요(이걸 사고 싶어요))'

In [44]:
# 8. Image 생성

from langchain.utilities.dalle_image_generator import DallEAPIWrapper

from PIL import Image
import requests
from io import BytesIO
import IPython.display as display

def display_image(url) :
  response = requests.get(url)
  img = Image.open(BytesIO(response.content))

  display.display(img)


In [46]:
image_url = DallEAPIWrapper().run("dog")
display_image(image_url)

Output hidden; open in https://colab.research.google.com to view.

In [51]:
# 9. LLM 번역 + DallE 이미지 생성 (한글을 입력하면 -> 영어로 번역 -> 이미지 생성 Chain)

image_prompt_template="""
한글 문장 {input}이 제공됩니다.
이 문장을 이미지 생성형 인공지능 DallE2가 인식할 수 있는
명확한 단어 기반 영문 prompt로 변환해줍니다.
"""

image_prompt = PromptTemplate(
    input_variables=["input"],
    template=image_prompt_template
)

image_chain = LLMChain(llm=chat_llm, prompt=image_prompt)

In [54]:
image_chain.run(input="강아지")

'"An image of a dog is provided."'

In [53]:
image_url = DallEAPIWrapper().run(image_chain.run(input="강아지"))
display_image(image_url)

Output hidden; open in https://colab.research.google.com to view.