# Model I/O

# 準備

In [1]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv

# 環境変数の読み込み
load_dotenv()
os.environ['OPENAI_API_KEY'] = os.environ['API_KEY']

# Language models

### LLM

In [2]:
from langchain import OpenAI

model_name = "text-davinci-003"

# プロンプトの設定
prompt = "言語モデルを使う上でのポイントは？"

# モデルの作成
llm = OpenAI(
    model_name=model_name,
    max_tokens=300,
    temperature=1.2)

# 言語モデルへリクエスト
response = llm(prompt)

# 結果を表示
print(response)



1. モデルの型について、自然言語処理の目的やコンテキストに応じた適切なモデルを用いること。

2. モデルのコードについて、モデル設計の効率性や汎用性を高めるために高度なアルゴリズムを用いること。

3. データセットの種類や規模について、関連性を持つような蓄積されたデータでモデルを訓練して得られる正確な結果を得ようとすること。

4. モデルトレーニングを行うときについて、損失関数や正則化項などの各パラメーターを実験的に


### Chat Model

In [3]:
from langchain.chat_models import ChatOpenAI
from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)

model_name = "gpt-3.5-turbo"

# メッセージの設定
message = "言語モデルを使う上でのポイントは？"

# 言語モデルの作成
chat = ChatOpenAI(
    model_name=model_name,
    temperature=1.2,
    max_tokens=300)

# 言語モデルへリクエスト
response = chat.predict_messages([
    HumanMessage(content=message)])

# 結果を表示（AIMessage型で返る）
print(response)


content='言語モデルを使う際のポイントは以下のとおりです。\n\n1. データの準備: 言語モデルを訓練するためには、大量のテキストデータが必要です。データの質と量を向上させるため、言語を対象とした専門的なデータセットを選択することが重要です。\n\n2. モデルの選択: 言語モデルには、RNN（再帰型ニューラルネットワーク）やTransformerなどさまざまなアーキテクチャがあります。対象のタスクや利用目的に合わせて、適切なモデルを選択しましょう。\n\n3. ハイパーパラメータの調整: 言語モデルの性能を最適化するためには、ハイパーパラメータの調整が必要です。学習率やバッチサイズなど、' additional_kwargs={} example=False


In [4]:
# 言語モデルからの回答を表示
print(response.content.strip())

言語モデルを使う際のポイントは以下のとおりです。

1. データの準備: 言語モデルを訓練するためには、大量のテキストデータが必要です。データの質と量を向上させるため、言語を対象とした専門的なデータセットを選択することが重要です。

2. モデルの選択: 言語モデルには、RNN（再帰型ニューラルネットワーク）やTransformerなどさまざまなアーキテクチャがあります。対象のタスクや利用目的に合わせて、適切なモデルを選択しましょう。

3. ハイパーパラメータの調整: 言語モデルの性能を最適化するためには、ハイパーパラメータの調整が必要です。学習率やバッチサイズなど、


### 役割や前提、パラメーターの設定

In [5]:
# 役割を設定
role = "あなたは関西人です。大阪弁を使います。"
# メッセージの設定
message = "おすすめの昼食は何ですか？"

chat = ChatOpenAI(
    model_name=model_name,
    temperature=1.2,
    max_tokens=300)

aiMessage = chat.predict_messages([
    SystemMessage(content=role),
    HumanMessage(content=message)])

# 言語モデルからの回答を表示
print(aiMessage.content)

おおきに！おすすめの昼食は、たこ焼きやお好み焼き、串カツやうどんなんやで！けっこうボリュームがあって、美味しいもんばっかりやで！どれも大阪のソウルフードやから、ぜひ食べてみてや！


In [6]:
# 会話を続ける
response = chat.predict_messages([
    SystemMessage(content=role),
    HumanMessage(content=message),
    aiMessage,
    HumanMessage(content="それ以外のおすすめは？")])

print(response.content)

せやけど、お好み焼きもたこ焼きもうどんも串カツもめっちゃ美味しいもんやで！でも、それ以外でもおすすめの昼食は、味噌カツや焼きそば、てっちり鍋やもんじゃ焼き、お寿司や刺し身なんかもおいしいで！大阪やから、たくさんのお店で様々なグルメが楽しめるで！ゆっくり食べて、関西を満喫してくれや！


# Prompts

### Prompt templates

In [12]:
from langchain import PromptTemplate

model_name = "text-davinci-003"

# プロンプトテンプレートの作成
template = "{subject}を勉強する方法をステップ・バイ・ステップで教えてください"
prompt = PromptTemplate.from_template(template)
# プロンプト文字列を生成
prompt_string = prompt.format(subject="英語")

# プロンプトの表示
print(type(prompt), "\n", "-"*40)
print(prompt, "\n", "-"*40)
print(prompt_string)

<class 'langchain.prompts.prompt.PromptTemplate'> 
 ----------------------------------------
input_variables=['subject'] output_parser=None partial_variables={} template='{subject}を勉強する方法をステップ・バイ・ステップで教えてください' template_format='f-string' validate_template=True 
 ----------------------------------------
英語を勉強する方法をステップ・バイ・ステップで教えてください


In [14]:
# 言語モデルへリクエスト
response = llm(prompt_string)

# 結果を表示
print(response)



1. ゴールとそこに到達するために必要な士気とリスクをおさえる。

2. 英語の能力を客観的に評価するために、検定や短期学習に取り組むなどのさまざまな試みを試みる。

3. 聞くための日常の生活での英語を楽しみ始める。たとえば英語のニュースの刊行物、書籍、あるいはその他の音楽などを聞いてみる。

4. 音声の発音練習をすることを手始めに、しゃべる習慣を身に付けるために英会話クラスなど


### Chat Prompt

In [23]:
from langchain.prompts import (
    ChatPromptTemplate,
    PromptTemplate,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

# システムメッセージ用プロンプトテンプレート
prompt=PromptTemplate(
    template="あなたは{input_language}から{output_language}に翻訳する優秀な翻訳家です。",
    input_variables=["input_language", "output_language"],
)
system_message_prompt = SystemMessagePromptTemplate(prompt=prompt)

# ユーザーメッセージ用プロンプトテンプレート
human_message_prompt = HumanMessagePromptTemplate.from_template("{text}")

# Chatプロンプトの作成
chat_prompt = ChatPromptTemplate.from_messages(
    [system_message_prompt, human_message_prompt])

# チャットメッセージリストの生成
chat_messages = chat_prompt.format_prompt(
    input_language="英語",
    output_language="日本語",
    text="I love programming.").to_messages()

# メッセージリストの表示
print(chat_messages)

[SystemMessage(content='あなたは英語から日本語に翻訳する優秀な翻訳家です。', additional_kwargs={}), HumanMessage(content='I love programming.', additional_kwargs={}, example=False)]


In [24]:
# 言語モデルへリクエスト
response = chat.predict_messages(chat_messages)

# 結果を表示（AIMessage型で返る）
print(response)

content='私はプログラミングが大好きです。' additional_kwargs={} example=False


### Example Selector

In [41]:
from langchain.prompts import PromptTemplate
from langchain.prompts import FewShotPromptTemplate
from langchain.prompts.example_selector import LengthBasedExampleSelector

# 抽出元のリスト
examples = [
    {"input": "楽しい", "output": "悲しい"},
    {"input": "高い", "output": "低い"},
    {"input": "活発", "output": "緩慢"},
    {"input": "明るい", "output": "暗い"},
    {"input": "心地よい", "output": "気持ち悪い"},
]

# プロンプトテンプレート
example_prompt = PromptTemplate(
    input_variables=["input", "output"],
    template="入力: {input}\n出力: {output}",
)

# Example Selector
example_selector = LengthBasedExampleSelector(
    examples=examples,  # 抽出元リスト
    example_prompt=example_prompt,  # 適用するテンプレート
    max_length=15, # フォーマット後の文字列の長さ
)

# Few-Shotプロンプトテンプレートを作成
dynamic_prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    prefix="すべての入力の対義語を与えます。",
    suffix="入力: {adjective}\n出力:", 
    input_variables=["adjective"],
)

In [42]:
# Few-Shotプロンプトを生成
dynamic_prompt_string = dynamic_prompt.format(adjective="大きい")
print(dynamic_prompt_string)

すべての入力の対義語を与えます。

入力: 楽しい
出力: 悲しい

入力: 高い
出力: 低い

入力: 活発
出力: 緩慢

入力: 大きい
出力:


In [43]:
# 言語モデルへリクエスト
response = llm(dynamic_prompt_string)

# 結果を表示
print(response)

 小さい


### Output Parser

In [50]:
from langchain.output_parsers import CommaSeparatedListOutputParser

# Output Parserの作成
output_parser = CommaSeparatedListOutputParser()

In [58]:
# 言語モデルへリクエスト
response = llm("aで始まる英単語を10個、カンマ区切りで出力してください")

# 結果を表示
print(response)



arena, archery, arrested, artery, appearance, apron, archway, arrangement, ambassador, archetype


In [59]:
# 変換
output_parser.parse(response)

['arena',
 'archery',
 'arrested',
 'artery',
 'appearance',
 'apron',
 'archway',
 'arrangement',
 'ambassador',
 'archetype']