有道智云API的Python SDK。
pip install youdaoai
参数 | 默认值 | 描述 |
---|---|---|
q | 无,必填 | 待翻译文本 |
from_ | 无,必填 | 源语言 |
to_ | 无,必填 | 目标语言 |
ext | None | 翻译结果音频格式,支持mp3 |
audio_path | None | 音频储存路径 |
voice | None | 翻译结果发音选择,0为女声,1为男声 |
strict | None | 是否严格按照指定from和to进行翻译:true/false |
vocabId | None | 用户上传的词典 |
from youdaoai import Translation
ts = Translation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('大家好我是毕老师', 'zh-CHS', 'en')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
q | 无,必填 | 待翻译文本 |
from_ | 无,必填 | 源语言 |
to_ | 无,必填 | 目标语言 |
ext | None | 翻译结果音频格式,支持mp3 |
audio_path | None | 音频储存路径 |
docType | None | 服务器响应类型,目前只支持json |
render | None | 是否需要服务端返回渲染的图片,0:否;1:是,默认是0 |
nullIsError | None | 如果ocr没有检测到文字,是否返回错误,false:否;true:是,默认是false |
from youdaoai import OCRTranslation
ts = OCRTranslation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('ocr_translation.png', 'zh-CHS', 'en')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
q | 无,必填 | 待翻译文本 |
from_ | 无,必填 | 源语言 |
to_ | 无,必填 | 目标语言 |
rate | 'auto' | 采样率,默认会自动分析 |
format_ | 'wav' | 语音文件的格式, 目前只支持wav |
channel | '1' | 声道数, 仅支持单声道,请填写固定值1 |
type_ | '1' | 上传类型, 仅支持Base64上传,请填写固定值1 |
ext | 'mp3' | 翻译结果音频格式,支持mp3,默认mp3 |
voice | '0' | 翻译结果发音选择,0为女声,1为男声 |
signType | 'v1' | 签名版本 |
version | 'v1' | 接口版本 |
from youdaoai import SpeechTranslation
ts = SpeechTranslation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('speech.wav', 'zh-CHS', 'en')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
img | 无,必填 | 待识别图像路径 |
langType | 'auto' | 要识别的语言类型 |
angle | None | 是否进行360角度识别,0:不识别,1:识别。默认不识别(0) |
column | None | 是否按多列识别,onecolumn:按单列识别;columns:按多列识别。默认按单列识别 |
rotate | None | 是否需要获得文字旋转角度,donot_rotate:不需要得到倾斜角度,rotate:得到倾斜角度。默认不需要 |
from youdaoai import OCRGeneral
ocr = OCRGeneral('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('ocr_general.png')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
img | 无,必填 | 待识别图像路径 |
from youdaoai import OCRIDCard
ocr = OCRIDCard('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('身份证.jpg')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
img | 无,必填 | 待识别图像路径 |
from youdaoai import OCRReceipt
ocr = OCRReceipt('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('购物小票.jpg')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
img | 无,必填 | 待识别图像路径 |
docType | 无,必填 | 服务器响应类型,目前支持json和Excel |
excel_filepath | None | 若docType为excel可通过该参数指定生成的xlsx文件路径,若不填该参数则不会生成xlsx文件 |
angle | None | 是否进行360角度识别,0:不识别,1:识别。默认不识别(0) |
from youdaoai import OCRTable
ocr = OCRTable('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('表格图片.jpg', 'excel', 'test.xlsx')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
img | 无,必填 | 待识别图像路径 |
from youdaoai import OCRNamecard
ocr = OCRNamecard('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('名片照片.jpg')
print(result)
参数 | 默认值 | 描述 |
---|---|---|
q | 无,必填 | 待合成音频文件的文本字符串 |
langType | 无,必填 | 合成文本的语言类型 |
filepath | 无,必填 | 指定生成的mp3文件路径 |
voice | 0 | 翻译结果发音选择,0为女声,1为男声,默认为女声 |
speed | 1 | 合成音频的语速,1为正常速度,最大为2,最小为0.1 |
volumn | 1 | 合成音频的音量,正常为1.00,最大为5.00,最小为0.50 |
from youdaoai import TTS
tts = TTS('你的APP_KEY', '你的APP_SECRET')
result = tts.build('大家好我是毕老师', 'zh-CHS', '语音合成.mp3')
print(result)
from youdaoai import TTS
tts = TTS('你的APP_KEY', '你的APP_SECRET')
result = tts.build('Embedded finance will help fill the life insurance coverage gap', 'en-USA', '英语语音合成.mp3', 1, 1.5, 3)
print(result)
参数 | 默认值 | 描述 |
---|---|---|
q | 无,必填 | 待合成音频文件的文本字符串 |
langType | 无,必填 | 合成文本的语言类型,详情见官方文档 |
rate | 'auto' | 采样率,默认会自动分析(仅支持分析wav格式),非wav格式请手动指定采样率 |
format_ | 'wav' | 语音文件的格式, 目前支持wav、aac、mp3 |
channel | '1' | 声道数, 仅支持单声道,请填写固定值1 |
from youdaoai import ASR
asr = ASR('你的APP_KEY', '你的APP_SECRET')
result = asr.recognize('speech.wav', 'zh-CHS')
print(result)
from youdaoai import ASR
asr = ASR('你的APP_KEY', '你的APP_SECRET')
result = asr.recognize('speech.mp3', 'zh-CHS', 16000, 'mp3')
print(result)