# langchain



In [None]:
!pip install langchain
!pip install openai
!pip install transformers
!pip install pillow
!pip install torch torchvision torchaudio

os：用于处理操作系统级别的操作，如环境变量。  

requests：用于执行HTTP请求，例如下载图片。  

PIL.Image：处理图像的工具。  

transformers：包含模型和处理器，用于图像字幕生成。  

langchain：提供了与OpenAI GPT-3集成和其他功能的工具。

In [None]:
# 导入所需的库
import os
import requests
from PIL import Image
from transformers import BlipProcessor, BlipForConditionalGeneration
from langchain.tools import BaseTool
from langchain import OpenAI
from langchain.agents import initialize_agent, AgentType

指定了使用的模型。  
使用BlipProcessor和BlipForConditionalGeneration来分别处理图像和生成字幕。

In [None]:
# 指定模型
hf_model = "Salesforce/blip-image-captioning-large"

# 初始化处理器和模型
processor = BlipProcessor.from_pretrained(hf_model)
model = BlipForConditionalGeneration.from_pretrained(hf_model)


ImageCapTool类扩展了BaseTool，用于图像字幕生成。  
_run方法用于处理图像和生成字幕。  
_arun方法未实现，因为该工具不支持异步操作。

In [None]:
class ImageCapTool(BaseTool):
   
    name = "Image captioner"
    description = "为图片创作说明文案."

    def _run(self, url: str):
        # 下载图像并将其转换为PIL对象
        image = Image.open(requests.get(url, stream=True).raw).convert('RGB')
        # 预处理图像
        inputs = processor(image, return_tensors="pt")
        # 生成字幕
        out = model.generate(**inputs, max_new_tokens=20)
        # 获取字幕
        caption = processor.decode(out[0], skip_special_tokens=True)
        return caption
    
    def _arun(self, query: str):
        raise NotImplementedError("This tool does not support async")


设置环境变量以存储OpenAI的API密钥。
初始化OpenAI的语言模型，设置温度参数以控制生成文本的创造性。

In [None]:
# 设置OpenAI API密钥
os.environ["OPENAI_API_KEY"] = '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'

# 初始化语言模型
llm = OpenAI(temperature=0.6)


初始化一个包含ImageCapTool的工具列表。
通过initialize_agent函数设置代理，指定了代理类型和语言模型。
使用测试图像URL运行代理，以生成与图片相关的朋友圈文案。

In [None]:
# 初始化工具和代理
tools = [ImageCapTool()]
agent = initialize_agent(
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    tools=tools,
    llm=llm,
    verbose=True,
)

# 测试图像URL
img_url = 'http://img.aiimg.com/uploads/allimg/191126/1-191126232400.jpg'

# 运行代理以生成文案
agent.run(input=f"{img_url}\n根据描述帮我撰写一段发布在微信朋友圈的中文文案")
