# LangChain Hello World
Author: K. T. Lai <br>
Date: 2025/1/9



## Intall LangChain

In [1]:
!pip install langchain --quiet
!pip install langchain_openai --quiet

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m54.2/54.2 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.2/1.2 MB[0m [31m19.2 MB/s[0m eta [36m0:00:00[0m
[?25h

## 輸入 OpenAI keys (兩種方式)

In [2]:
# 使用者輸入Key並存在全域變數 (Blocking)
import getpass
import os

if not os.environ.get("OPENAI_API_KEY"):
  os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")



Enter API key for OpenAI: ··········


In [3]:
# 從Colab中讀取並存取全域變數
from google.colab import userdata

if not os.environ.get("OPENAI_API_KEY"):
  os.environ["OPENAI_API_KEY"] = userdata.get('OPENAI_API_KEY')

## Use ChatOpenAI

In [4]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini")

In [5]:
model.invoke("Hello, world!")

AIMessage(content='Hello! How can I assist you today?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 11, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_bd83329f63', 'finish_reason': 'stop', 'logprobs': None}, id='run-6a31ce74-29a7-49cf-b423-29d3b43aba09-0', usage_metadata={'input_tokens': 11, 'output_tokens': 10, 'total_tokens': 21, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [6]:
ret = model.invoke("用繁體中文自我介紹一下")

In [7]:
ret.pretty_print()


你好！我是AI助手，專門用來回答問題和提供各類資訊。我能夠協助你解決問題、提供建議或是進行各種主題的討論。如果你有任何疑問或需要幫助的地方，隨時可以問我！很高興認識你！


## Streaming Mode (串流模式)

In [8]:
chunks = model.stream("請介紹LangChain")
for chunk in chunks:
    print(chunk.content, end="", flush=True)

LangChain是一個開源框架，旨在幫助開發者構建以語言模型為基礎的應用程序。其核心理念是將大型語言模型（LLMs）與其他資源（如API、數據庫和網絡服務）結合起來，以創建功能強大的應用。

LangChain的主要特性包括：

1. **鏈接組件**：LangChain允許開發者將不同的組件（如輸入處理、上下文管理、結果生成等）鏈接在一起，這樣可以更靈活地構建應用邏輯。

2. **多種來源的整合**：LangChain支持多種不同來源的數據，如文本檔案、API響應、數據庫查詢等，使得開發者可以輕鬆地集成和處理不同的數據來源。

3. **上下文管理**：LangChain提供了一些工具來管理上下文，確保語言模型在生成回應時能夠考慮到先前的對話內容或其他相關信息。

4. **擴展性**：開發者可以根據自己的需求擴展LangChain，添加自定義的功能和邏輯，以滿足特定的使用案例。

5. **多種語言模型的支持**：LangChain支持多種不同的語言模型，這意味著開發者可以根據需求選擇最合適的模型來實現其應用。

LangChain的目的是簡化開發過程中與語言模型互動的複雜性，並提供強大的工具來創建更智能、更具交互性的應用程序。這使得它在自然語言處理、對話系統、自動化和數據分析等領域中具有廣泛的應用潛力。

## Cache(快取) - 儲存以回答過的問題

In [9]:
!pip install langchain_community --quiet

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m31.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m49.5/49.5 kB[0m [31m3.7 MB/s[0m eta [36m0:00:00[0m
[?25h

In [10]:
from langchain.globals import set_llm_cache
from langchain_community.cache import InMemoryCache

set_llm_cache(InMemoryCache())

In [11]:
cache_model = ChatOpenAI(model="gpt-4o-mini", cache=True)

## 比較(有/無)Cache執行時間

In [12]:
%%time
cache_model.invoke("請說個AI笑話")

CPU times: user 26.8 ms, sys: 898 µs, total: 27.7 ms
Wall time: 914 ms


AIMessage(content='當然可以！這是一個AI相關的笑話：\n\n為什麼人工智能從來不需要運動？\n\n因為它們已經有好的演算法來「運行」！', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 42, 'prompt_tokens': 13, 'total_tokens': 55, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-b5520cef-c498-4598-a6b5-0aeaae834279-0', usage_metadata={'input_tokens': 13, 'output_tokens': 42, 'total_tokens': 55, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [13]:
%%time
cache_model.invoke("請說個AI笑話")

CPU times: user 802 µs, sys: 0 ns, total: 802 µs
Wall time: 809 µs


AIMessage(content='當然可以！這是一個AI相關的笑話：\n\n為什麼人工智能從來不需要運動？\n\n因為它們已經有好的演算法來「運行」！', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 42, 'prompt_tokens': 13, 'total_tokens': 55, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-b5520cef-c498-4598-a6b5-0aeaae834279-0', usage_metadata={'input_tokens': 13, 'output_tokens': 42, 'total_tokens': 55, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## 計算模型使用費用

In [14]:
from langchain.callbacks import get_openai_callback

with get_openai_callback() as cb:
    result= cache_model.invoke("簡單介紹LangChain")
    print(result.content)
    print(result.response_metadata['token_usage'])
    print(result.id)
    print(cb)

LangChain 是一個開源框架，旨在幫助開發者構建應用程序，利用大型語言模型（如 OpenAI 的 GPT 系列）進行文本生成、對話系統、數據分析等任務。它的設計重點是使開發者能夠更輕鬆地集成和部署這類模型，並提供了一些有用的工具和功能。

LangChain 的主要特點包括：

1. **模組化設計**：LangChain 提供了不同的組件，例如鏈（chains）、記憶（memory）、代理（agents）等，開發者可以根據需求組合這些組件來實現複雜的應用。

2. **支持多種語言模型**：除了 OpenAI 的模型，LangChain 還支持其他流行的語言模型，這使得用戶可以根據需求選擇最合適的模型。

3. **上下文管理**：LangChain 能夠管理上下文信息，使模型能夠記住之前的對話或資訊，從而提升交互的連貫性。

4. **與外部數據源集成**：LangChain 可以與各種外部數據源（如 API、數據庫等）集成，讓模型能夠在有實時數據的情況下進行推理和生成。

5. **對話流程設計**：開發者可以使用 LangChain 設計複雜的對話流程，並為用戶提供更加自然和流暢的交互體驗。

總之，LangChain 是一個強大且靈活的工具，適合希望充分利用大型語言模型功能的開發者。
{'completion_tokens': 389, 'prompt_tokens': 12, 'total_tokens': 401, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}
run-24e924ce-d205-4531-bc24-e5b5a3a1bc57-0
Tokens Used: 401
	Prompt Tokens: 12
		Prompt Tokens Cached: 0
	Completion Tokens: 389
		Reasoning Tokens: 0
Successful Reque

## Use Google Gemini

[Reference](https://python.langchain.com/docs/integrations/chat/google_generative_ai/)

[Gemini Pricing](https://ai.google.dev/pricing?hl=zh-tw#1_5flash)

In [15]:
%pip install -qU langchain-google-genai

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/41.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m41.5/41.5 kB[0m [31m1.6 MB/s[0m eta [36m0:00:00[0m
[?25h

In [16]:
os.environ["GOOGLE_API_KEY"] = userdata.get("GOOGLE_API_KEY")

In [17]:
from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
    # other params...
)

In [18]:
llm.invoke("說個關於AI的笑話")

AIMessage(content='為什麼AI過馬路？\n\n因為它被程式設計成要到達另一邊！', additional_kwargs={}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'safety_ratings': []}, id='run-9acba676-7774-4b36-9d74-7f8457cac832-0', usage_metadata={'input_tokens': 7, 'output_tokens': 19, 'total_tokens': 26, 'input_token_details': {'cache_read': 0}})

### Safety Settings

In [19]:
from langchain_google_genai import (
    ChatGoogleGenerativeAI,
    HarmBlockThreshold,
    HarmCategory,
)

llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-pro",
    safety_settings={
        HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_NONE,
    },
)