# AssemblyAI 音频转录

`AssemblyAIAudioTranscriptLoader` 允许使用 [AssemblyAI API](https://www.assemblyai.com) 转录音频文件，并将转录文本加载到文档中。

要使用它，您应该安装 `assemblyai` Python 包，并将
环境变量 `ASSEMBLYAI_API_KEY` 设置为您的 API 密钥。或者，也可以将 API 密钥作为参数传递。

更多关于 AssemblyAI 的信息：

- [网站](https://www.assemblyai.com/)
- [获取免费 API 密钥](https://www.assemblyai.com/dashboard/signup)
- [AssemblyAI API 文档](https://www.assemblyai.com/docs)

## 安装

首先，你需要安装 `assemblyai` Python 包。

你可以在 [assemblyai-python-sdk GitHub repo](https://github.com/AssemblyAI/assemblyai-python-sdk) 中找到更多相关信息。

In [None]:
%pip install --upgrade --quiet  assemblyai

## 示例

`AssemblyAIAudioTranscriptLoader` 至少需要 `file_path` 参数。音频文件可以指定为 URL 或本地文件路径。

In [None]:
from langchain_community.document_loaders import AssemblyAIAudioTranscriptLoader

audio_file = "https://storage.googleapis.com/aai-docs-samples/nbc.mp3"
# or a local file path: audio_file = "./nbc.mp3"

loader = AssemblyAIAudioTranscriptLoader(file_path=audio_file)

docs = loader.load()

注意：调用 `loader.load()` 会阻塞直到转录完成。

转录的文本可在 `page_content` 中找到：

In [None]:
docs[0].page_content

“就职典礼、新总统和新的国会构成。还是一成不变的……”

`metadata` 包含完整的 JSON 响应，其中包含更多元信息：

In [None]:
docs[0].metadata

```
{'language_code': <LanguageCode.en_us: 'en_us'>,
 'audio_url': 'https://storage.googleapis.com/aai-docs-samples/nbc.mp3',
 'punctuate': True,
 'format_text': True,
  ...
}
```

## Transcription Formats

您可以为不同的格式指定 `transcript_format` 参数。

根据格式的不同，将返回一个或多个文档。以下是不同的 `TranscriptFormat` 选项：

- `TEXT`：一个包含转录文本的文档
- `SENTENCES`：多个文档，按每个句子分割转录内容
- `PARAGRAPHS`：多个文档，按每个段落分割转录内容
- `SUBTITLES_SRT`：一个按照 SRT 字幕格式导出的转录文档
- `SUBTITLES_VTT`：一个按照 VTT 字幕格式导出的转录文档

In [None]:
from langchain_community.document_loaders.assemblyai import TranscriptFormat

loader = AssemblyAIAudioTranscriptLoader(
    file_path="./your_file.mp3",
    transcript_format=TranscriptFormat.SENTENCES,
)

docs = loader.load()

## 转录配置

你也可以指定 `config` 参数来使用不同的音频智能模型。

访问 [AssemblyAI API 文档](https://www.assemblyai.com/docs) 来了解所有可用模型的概述！

In [None]:
import assemblyai as aai

config = aai.TranscriptionConfig(
    speaker_labels=True, auto_chapters=True, entity_detection=True
)

loader = AssemblyAIAudioTranscriptLoader(file_path="./your_file.mp3", config=config)

## 将 API密钥作为参数传递

除了将 API 密钥设置为环境变量 `ASSEMBLYAI_API_KEY` 之外，也可以将其作为参数传递。

In [None]:
loader = AssemblyAIAudioTranscriptLoader(
    file_path="./your_file.mp3", api_key="YOUR_KEY"
)