# Model I/O

# 準備

In [4]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv

# 環境変数の読み込み
load_dotenv()
os.environ['OPENAI_API_KEY'] = os.environ['API_KEY']

# Language models

### LLM

In [5]:
from langchain_openai import OpenAI

model_name = "gpt-3.5-turbo-instruct"

# モデルの作成
llm = OpenAI(
    model_name=model_name,
    max_tokens=300,
    temperature=1.2)

In [6]:
# 質問の設定
text = "言語モデルを使う上でのポイントは？"

# 言語モデルの呼出
response = llm.invoke(text)

# 結果を表示
print(response)


- 大規模なトレーニングデータを用意することで精度を向上させる
- ダイバーシティがある幅広い単語や表現を収集し、モデルに組み込むことでより自然な表現を生成する
- 単語や文章の出現頻度を考慮することで、コーパス内の単語間の結びつきを学習してより正確な予測を行う
- 文脈を考慮し、単語や文章の出現頻度だけではなく、前後にくる単語や文章も学習することで、より文脈に即した表現を生成する
- 潜在的な意味や文法的な規則などの知識を獲得するために、機械学習アルゴリズムを採用することでより高度な言語モデルを構築する


### Chat Model

In [7]:
from langchain_openai import ChatOpenAI

model_name = "gpt-3.5-turbo-1106"

# モデルの作成
chat_model = ChatOpenAI(
    model_name=model_name,
    max_tokens=300,
    temperature=1.2)

In [8]:
from langchain.schema import HumanMessage

# 質問の設定
text = "言語モデルを使う上でのポイントは？"
messages = [HumanMessage(content=text)]

# 言語モデルの呼出
response = chat_model.invoke(messages)

# 結果を表示（AIMessage型）
print(response)

content='1. データの品質向上: 言語モデルを構築するためには大規模なデータセットが必要です。そのため、データの収集からクリーニングまで、データの品質を向上させることが重要です。\n\n2. ハイパーパラメータの適切な設定: 言語モデルには複数のハイパーパラメータが存在し、それらの適切な設定が重要です。適切なハイパーパラメータを探索するためには、実験を重ねる必要があります。\n\n3. モデルの評価: 言語モデルの品質は正確な評価が必要です。適切な評価指標を選択し、実際の応用環境におけるモデルの性能を適切に評価することが重要です。\n\n4. パフォ'


In [9]:
# 言語モデルからの回答を表示
print(response.content.strip())

1. データの品質向上: 言語モデルを構築するためには大規模なデータセットが必要です。そのため、データの収集からクリーニングまで、データの品質を向上させることが重要です。

2. ハイパーパラメータの適切な設定: 言語モデルには複数のハイパーパラメータが存在し、それらの適切な設定が重要です。適切なハイパーパラメータを探索するためには、実験を重ねる必要があります。

3. モデルの評価: 言語モデルの品質は正確な評価が必要です。適切な評価指標を選択し、実際の応用環境におけるモデルの性能を適切に評価することが重要です。

4. パフォ


### 役割や前提、パラメーターの設定

In [10]:
from langchain.schema import HumanMessage, SystemMessage

# Systemメッセージ
system_message = "あなたは関西人です。大阪弁を使います。"
# ユーザーからの質問
user_message = "おすすめの昼食は何ですか？"

# メッセージ配列の作成
messages = [
  SystemMessage(content=system_message),
  HumanMessage(content=user_message)]

# 言語モデルの呼出
aiMessage = chat_model.invoke(messages)

# 言語モデルからの回答を表示
print(aiMessage.content.strip())

昼飯なら、たこ焼きとお好み焼きがあんまりおすすめやねん。あとはホルモン焼きや串カツもええやろ。関西って美味しいもんいっぱいあるから迷うくらいやで。


In [11]:
# 会話を続ける
response = chat_model.invoke([
  *messages,
  aiMessage,
  HumanMessage(content="それ以外のおすすめは？")])

# 言語モデルからの回答を表示
print(response.content.strip())

他にもおすすめとしましては、うどんやそうめんもええやろう。関西では美味しい和食や洋食もたくさんあるから、食べたいものに合わせて選ぶとええと思うで。


# Prompts

### Prompt templates

In [12]:
from langchain.prompts import PromptTemplate

model_name = "gpt-3.5-turbo-instruct"

# プロンプトテンプレートの作成
template = "{subject}を勉強する方法をステップ・バイ・ステップで教えてください"
prompt = PromptTemplate.from_template(template)
# プロンプト文字列を生成
prompt_string = prompt.format(subject="英語")

# プロンプトの表示
print(type(prompt), "\n", "-"*40)
print(prompt, "\n", "-"*40)
print(prompt_string)

<class 'langchain_core.prompts.prompt.PromptTemplate'> 
 ----------------------------------------
input_variables=['subject'] template='{subject}を勉強する方法をステップ・バイ・ステップで教えてください' 
 ----------------------------------------
英語を勉強する方法をステップ・バイ・ステップで教えてください


In [13]:
# 言語モデルの呼出
response = llm.invoke(prompt_string)

# 結果を表示
print(response)



ステップ1: 目標を設定する
まず最初に、英語を勉強する理由や目的を明確にしましょう。自分の英語のレベルを知り、どのように成長したいか、またはどの程度のレベルを目指すかを決めます。目標を明確にすることでモチベーションを持続させることができます。

ステップ2: 日常的な学習環境を作る
英語を勉強するための環境を整えましょう。英語の本やオーディオブック、映画やテレビ番組などを使用して、身近な環境に英語を取り入れることが重要です。また、英語を話す機会を増やすために、英語クラスや英会話グループなどに参加することも良いでしょう。

ステップ3:


### Chat Prompt

In [14]:
from langchain.prompts.chat import ChatPromptTemplate

template = "あなたは{input_language}から{output_language}に翻訳する優秀な翻訳家です。"
human_template = "{text}"

chat_prompt = ChatPromptTemplate.from_messages([
    ("system", template),
    ("human", human_template),
])

messages = chat_prompt.format_messages(input_language="英語", output_language="日本語", text="I love programming.")

messages

[SystemMessage(content='あなたは英語から日本語に翻訳する優秀な翻訳家です。'),
 HumanMessage(content='I love programming.')]

In [15]:
# 言語モデルの呼出
response = chat_model.invoke(messages)

# 結果を表示（AIMessage型）
print(response)

content='プログラミングが大好きです。'


### Output Parser

In [18]:
from langchain.output_parsers import CommaSeparatedListOutputParser

# Output Parserの作成
output_parser = CommaSeparatedListOutputParser()

In [19]:
# 言語モデルへリクエスト
response = llm.invoke("aで始まる英単語を10個、カンマ区切りで出力してください")

# 結果を表示
print(response)



afoot,adult,amaze,appear,allow,t(this!),apple,arch,attack,all


In [20]:
# 変換
output_parser.parse(response)

['afoot,adult,amaze,appear,allow,t(this!),apple,arch,attack,all']

### Example Selector

In [None]:
from langchain_core.prompts.few_shot import FewShotPromptTemplate
from langchain_core.prompts.prompt import PromptTemplate
from langchain.prompts.example_selector import LengthBasedExampleSelector

# 抽出元のリスト
examples = [
    {"input": "楽しい", "output": "悲しい"},
    {"input": "高い", "output": "低い"},
    {"input": "活発", "output": "緩慢"},
    {"input": "明るい", "output": "暗い"},
    {"input": "心地よい", "output": "気持ち悪い"},
]

# プロンプトテンプレート
example_prompt = PromptTemplate(
    input_variables=["input", "output"],
    template="入力: {input}\n出力: {output}",
)

# Example Selector
example_selector = LengthBasedExampleSelector(
    examples=examples,  # 抽出元リスト
    example_prompt=example_prompt,  # 適用するテンプレート
    max_length=15, # フォーマット後の文字列の長さ
)

# Few-Shotプロンプトテンプレートを作成
dynamic_prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    prefix="すべての入力の対義語を与えます。",
    suffix="入力: {adjective}\n出力:", 
    input_variables=["adjective"],
)

In [None]:
# Few-Shotプロンプトを生成
dynamic_prompt_string = dynamic_prompt.format(adjective="大きい")
print(dynamic_prompt_string)

すべての入力の対義語を与えます。

入力: 楽しい
出力: 悲しい

入力: 高い
出力: 低い

入力: 活発
出力: 緩慢

入力: 大きい
出力:


In [None]:
# 言語モデルへリクエスト
response = llm.invoke(dynamic_prompt_string)

# 結果を表示
print(response)

 小さい
