# ChatVertexAI

[Google Vertex](https://cloud.google.com/vertex-ai) 是一项服务，提供了 Google Cloud 中可用的所有基础模型，例如 `gemini-1.5-pro`、`gemini-2.0-flash-exp` 等。
它还提供了一些非 Google 的模型，例如 [Anthropic 的 Claude](https://cloud.google.com/vertex-ai/generative-ai/docs/partner-models/use-claude)。


这将帮助你快速上手使用 `ChatVertexAI` [聊天模型](/docs/concepts/chat_models)。如需了解 `ChatVertexAI` 所有功能和配置的详细文档，请参阅 [API 参考](https://api.js.langchain.com/classes/langchain_google_vertexai.ChatVertexAI.html)。

## 概览

### 集成详情

| 类 | 包 | 本地 | 可序列化 | [PY 支持](https://python.langchain.com/docs/integrations/chat/google_vertex_ai_palm) | 包下载量 | 包最新版本 |
| :--- | :--- | :---: | :---: | :---: | :---: | :---: |
| [ChatVertexAI](https://api.js.langchain.com/classes/langchain_google_vertexai.ChatVertexAI.html) | [`@langchain/google-vertexai`](https://www.npmjs.com/package/@langchain/google-vertexai) | ❌ | ✅ | ✅ | ![NPM - 下载量](https://img.shields.io/npm/dm/@langchain/google-vertexai?style=flat-square&label=%20&) | ![NPM - 版本](https://img.shields.io/npm/v/@langchain/google-vertexai?style=flat-square&label=%20&) |

### 模型功能

有关如何使用特定功能的指南，请参阅下表标题中的链接。

| [工具调用](/docs/how_to/tool_calling) | [结构化输出](/docs/how_to/structured_output/) | JSON 模式 | [图像输入](/docs/how_to/multimodal_inputs/) | 音频输入 | 视频输入 | [逐令牌流式传输](/docs/how_to/chat_streaming/) | [令牌使用情况](/docs/how_to/chat_token_usage_tracking/) | [Logprobs](/docs/how_to/logprobs/) |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | 

请注意，虽然支持 logprobs，但 Gemini 对其使用有较为严格的限制。

## 安装配置

LangChain.js 支持两种不同的认证方式，具体取决于你是在 Node.js 环境还是 Web 环境中运行。
它还支持使用任一包通过 Vertex AI Express 模式使用的认证方法。

要访问 `ChatVertexAI` 模型，你需要在你的 Google Cloud Platform (GCP) 账户中设置 Google VertexAI，保存凭证文件，并安装 `@langchain/google-vertexai` 集成包。

### 凭证

前往你的 [GCP 账户](https://console.cloud.google.com/) 并生成一个凭证文件。完成此操作后，设置 `GOOGLE_APPLICATION_CREDENTIALS` 环境变量：

```bash
export GOOGLE_APPLICATION_CREDENTIALS="path/to/your/credentials.json"
```

如果在 Web 环境中运行，应将 `GOOGLE_VERTEX_AI_WEB_CREDENTIALS` 环境变量设为 JSON 格式的字符串对象，并安装 `@langchain/google-vertexai-web` 包：

```bash
GOOGLE_VERTEX_AI_WEB_CREDENTIALS={"type":"service_account","project_id":"YOUR_PROJECT-12345",...}
```

如果你使用的是 Vertex AI Express 模式，则可以安装 `@langchain/google-vertexai` 或 `@langchain/google-vertexai-web` 包。
然后你可以前往 [Express 模式](https://console.cloud.google.com/vertex-ai/studio) 的 API 密钥页面，并将你的 API 密钥设置在 `GOOGLE_API_KEY` 环境变量中：

```bash
export GOOGLE_API_KEY="api_key_value"
```

如果你想获取模型调用的自动追踪，还可以通过取消注释以下内容来设置你的 [LangSmith](https://docs.smith.langchain.com/) API 密钥：

```bash
# export LANGSMITH_TRACING="true"
# export LANGSMITH_API_KEY="your-api-key"
```

### 安装

LangChain 的 `ChatVertexAI` 集成位于 `@langchain/google-vertexai` 包中：

```{=mdx}
import IntegrationInstallTooltip from "@mdx_components/integration_install_tooltip.mdx";
import Npm2Yarn from "@theme/Npm2Yarn";

<IntegrationInstallTooltip></IntegrationInstallTooltip>

<Npm2Yarn>
  @langchain/google-vertexai @langchain/core
</Npm2Yarn>

或者如果在 Web 环境中使用，例如 [Vercel Edge 函数](https://vercel.com/blog/edge-functions-generally-available)：

<Npm2Yarn>
  @langchain/google-vertexai-web @langchain/core
</Npm2Yarn>

```

## 实例化

现在我们可以实例化我们的模型对象并生成聊天补全结果：

In [1]:
import { ChatVertexAI } from "@langchain/google-vertexai"
// Uncomment the following line if you're running in a web environment:
// import { ChatVertexAI } from "@langchain/google-vertexai-web"

const llm = new ChatVertexAI({
    model: "gemini-2.0-flash-exp",
    temperature: 0,
    maxRetries: 2,
    // For web, authOptions.credentials
    // authOptions: { ... }
    // other params...
})

## 调用

In [2]:
const aiMsg = await llm.invoke([
    [
        "system",
        "You are a helpful assistant that translates English to French. Translate the user sentence.",
    ],
    ["human", "I love programming."],
])
aiMsg

AIMessageChunk {
  "content": "J'adore programmer. \n",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": [],
  "usage_metadata": {
    "input_tokens": 20,
    "output_tokens": 7,
    "total_tokens": 27
  }
}


In [3]:
console.log(aiMsg.content)

J'adore programmer. 



## 使用谷歌搜索检索的工具调用

您可以使用谷歌搜索工具调用模型，从而通过现实世界的信息来[支持](https://cloud.google.com/vertex-ai/generative-ai/docs/model-reference/grounding)内容生成并减少幻觉的产生。

目前 `gemini-2.0-flash-exp` 不支持基础信息支持（Grounding）。

您可以选择使用谷歌搜索进行基础信息支持，或者通过自定义数据存储来实现。以下是两者的示例：  

### 谷歌搜索检索

使用谷歌搜索的示例：


In [None]:
import { ChatVertexAI } from "@langchain/google-vertexai"

const searchRetrievalTool = {
  googleSearchRetrieval: {
    dynamicRetrievalConfig: {
      mode: "MODE_DYNAMIC", // Use Dynamic Retrieval
      dynamicThreshold: 0.7, // Default for Dynamic Retrieval threshold
    },
  },
};

const searchRetrievalModel = new ChatVertexAI({
  model: "gemini-1.5-pro",
  temperature: 0,
  maxRetries: 0,
}).bindTools([searchRetrievalTool]);

const searchRetrievalResult = await searchRetrievalModel.invoke("Who won the 2024 NBA Finals?");

console.log(searchRetrievalResult.content);

The Boston Celtics won the 2024 NBA Finals, defeating the Dallas Mavericks 4-1 in the series to claim their 18th NBA championship. This victory marked their first title since 2008 and established them as the team with the most NBA championships, surpassing the Los Angeles Lakers' 17 titles.



### 使用数据存储进行谷歌搜索检索

首先，设置你的数据存储（这是一个示例数据存储的模式）:

|    ID   |     日期     |    球队 1   |   比分  |   球队 2   |
|:-------:|:------------:|:-----------:|:--------:|:----------:|
|  3001   |  2023-09-07  |  阿根廷      |  1 - 0   |  厄瓜多尔   |
|  3002   |  2023-09-12  |  委内瑞拉    |  1 - 0   |  巴拉圭     |
|  3003   |  2023-09-12  |  智利        |  0 - 0   |  哥伦比亚   |
|  3004   |  2023-09-12  |  秘鲁        |  0 - 1   |  巴西       |
|  3005   |  2024-10-15  |  阿根廷      |  6 - 0   |  玻利维亚   |

然后，在下面提供的示例中使用此数据存储：

(请注意，你需要为 `projectId` 和 `datastoreId` 使用自己的变量)


In [None]:
import { ChatVertexAI } from "@langchain/google-vertexai";

const projectId = "YOUR_PROJECT_ID";
const datastoreId = "YOUR_DATASTORE_ID";

const searchRetrievalToolWithDataset = {
  retrieval: {
    vertexAiSearch: {
      datastore: `projects/${projectId}/locations/global/collections/default_collection/dataStores/${datastoreId}`,
    },
    disableAttribution: false,
  },
};

const searchRetrievalModelWithDataset = new ChatVertexAI({
  model: "gemini-1.5-pro",
  temperature: 0,
  maxRetries: 0,
}).bindTools([searchRetrievalToolWithDataset]);

const searchRetrievalModelResult = await searchRetrievalModelWithDataset.invoke(
  "What is the score of Argentina vs Bolivia football game?"
);

console.log(searchRetrievalModelResult.content);

Argentina won against Bolivia with a score of 6-0 on October 15, 2024.



你现在应该得到基于你提供的数据存储中的数据的结果。

## 上下文缓存

Vertex AI 提供上下文缓存功能，该功能通过在多个 API 请求中存储和重用长段消息内容来帮助优化成本。当你有较长的对话历史或频繁出现在交互中的消息片段时，此功能特别有用。

要使用此功能，请首先按照[此官方指南](https://cloud.google.com/vertex-ai/generative-ai/docs/context-cache/context-cache-create)创建一个上下文缓存。

创建缓存后，你可以按如下方式将缓存的 ID 作为运行时参数传入：

In [None]:
import { ChatVertexAI } from "@langchain/google-vertexai";

const modelWithCachedContent = new ChatVertexAI({
  model: "gemini-1.5-pro-002",
  location: "us-east5",
});

await modelWithCachedContent.invoke("What is in the content?", {
  cachedContent:
    "projects/PROJECT_NUMBER/locations/LOCATION/cachedContents/CACHE_ID",
});

你也可以将此字段直接绑定到模型实例上：

In [5]:
const modelWithBoundCachedContent = new ChatVertexAI({
  model: "gemini-1.5-pro-002",
  location: "us-east5",
}).bind({
  cachedContent:
    "projects/PROJECT_NUMBER/locations/LOCATION/cachedContents/CACHE_ID",
});


请注意，并非所有模型当前都支持上下文缓存。

## 链式调用

我们可以像这样将模型与提示模板进行[链式调用](/docs/how_to/sequence/)：

In [4]:
import { ChatPromptTemplate } from "@langchain/core/prompts"

const prompt = ChatPromptTemplate.fromMessages(
    [
        [
            "system",
            "You are a helpful assistant that translates {input_language} to {output_language}.",
        ],
        ["human", "{input}"],
    ]
)

const chain = prompt.pipe(llm);
await chain.invoke(
  {
    input_language: "English",
    output_language: "German",
    input: "I love programming.",
  }
);

AIMessageChunk {
  "content": "Ich liebe das Programmieren. \n",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": [],
  "usage_metadata": {
    "input_tokens": 15,
    "output_tokens": 9,
    "total_tokens": 24
  }
}


## API 参考文档

有关 ChatVertexAI 所有功能和配置的详细文档，请访问 API 参考页面: https://api.js.langchain.com/classes/langchain_google_vertexai.ChatVertexAI.html