Skip to content

AndersonBY/python-youdao-ai

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

python-youdao-ai

有道智云API的Python SDK。

安装

pip install youdaoai

使用方法

参数 默认值 描述
q 无,必填 待翻译文本
from_ 无,必填 源语言
to_ 无,必填 目标语言
ext None 翻译结果音频格式,支持mp3
audio_path None 音频储存路径
voice None 翻译结果发音选择,0为女声,1为男声
strict None 是否严格按照指定from和to进行翻译:true/false
vocabId None 用户上传的词典
from youdaoai import Translation


ts = Translation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('大家好我是毕老师', 'zh-CHS', 'en')
print(result)
参数 默认值 描述
q 无,必填 待翻译文本
from_ 无,必填 源语言
to_ 无,必填 目标语言
ext None 翻译结果音频格式,支持mp3
audio_path None 音频储存路径
docType None 服务器响应类型,目前只支持json
render None 是否需要服务端返回渲染的图片,0:否;1:是,默认是0
nullIsError None 如果ocr没有检测到文字,是否返回错误,false:否;true:是,默认是false
from youdaoai import OCRTranslation


ts = OCRTranslation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('ocr_translation.png', 'zh-CHS', 'en')
print(result)
参数 默认值 描述
q 无,必填 待翻译文本
from_ 无,必填 源语言
to_ 无,必填 目标语言
rate 'auto' 采样率,默认会自动分析
format_ 'wav' 语音文件的格式, 目前只支持wav
channel '1' 声道数, 仅支持单声道,请填写固定值1
type_ '1' 上传类型, 仅支持Base64上传,请填写固定值1
ext 'mp3' 翻译结果音频格式,支持mp3,默认mp3
voice '0' 翻译结果发音选择,0为女声,1为男声
signType 'v1' 签名版本
version 'v1' 接口版本
from youdaoai import SpeechTranslation


ts = SpeechTranslation('你的APP_KEY', '你的APP_SECRET')
result = ts.translate('speech.wav', 'zh-CHS', 'en')
print(result)
参数 默认值 描述
img 无,必填 待识别图像路径
langType 'auto' 要识别的语言类型
angle None 是否进行360角度识别,0:不识别,1:识别。默认不识别(0)
column None 是否按多列识别,onecolumn:按单列识别;columns:按多列识别。默认按单列识别
rotate None 是否需要获得文字旋转角度,donot_rotate:不需要得到倾斜角度,rotate:得到倾斜角度。默认不需要
from youdaoai import OCRGeneral


ocr = OCRGeneral('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('ocr_general.png')
print(result)
参数 默认值 描述
img 无,必填 待识别图像路径
from youdaoai import OCRIDCard


ocr = OCRIDCard('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('身份证.jpg')
print(result)
参数 默认值 描述
img 无,必填 待识别图像路径
from youdaoai import OCRReceipt


ocr = OCRReceipt('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('购物小票.jpg')
print(result)
参数 默认值 描述
img 无,必填 待识别图像路径
docType 无,必填 服务器响应类型,目前支持json和Excel
excel_filepath None 若docType为excel可通过该参数指定生成的xlsx文件路径,若不填该参数则不会生成xlsx文件
angle None 是否进行360角度识别,0:不识别,1:识别。默认不识别(0)
from youdaoai import OCRTable


ocr = OCRTable('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('表格图片.jpg', 'excel', 'test.xlsx')
print(result)
参数 默认值 描述
img 无,必填 待识别图像路径
from youdaoai import OCRNamecard


ocr = OCRNamecard('你的APP_KEY', '你的APP_SECRET')
result = ocr.recognize('名片照片.jpg')
print(result)
参数 默认值 描述
q 无,必填 待合成音频文件的文本字符串
langType 无,必填 合成文本的语言类型
filepath 无,必填 指定生成的mp3文件路径
voice 0 翻译结果发音选择,0为女声,1为男声,默认为女声
speed 1 合成音频的语速,1为正常速度,最大为2,最小为0.1
volumn 1 合成音频的音量,正常为1.00,最大为5.00,最小为0.50
from youdaoai import TTS


tts = TTS('你的APP_KEY', '你的APP_SECRET')
result = tts.build('大家好我是毕老师', 'zh-CHS', '语音合成.mp3')
print(result)
from youdaoai import TTS

tts = TTS('你的APP_KEY', '你的APP_SECRET')
result = tts.build('Embedded finance will help fill the life insurance coverage gap', 'en-USA', '英语语音合成.mp3', 1, 1.5, 3)
print(result)
参数 默认值 描述
q 无,必填 待合成音频文件的文本字符串
langType 无,必填 合成文本的语言类型,详情见官方文档
rate 'auto' 采样率,默认会自动分析(仅支持分析wav格式),非wav格式请手动指定采样率
format_ 'wav' 语音文件的格式, 目前支持wav、aac、mp3
channel '1' 声道数, 仅支持单声道,请填写固定值1
from youdaoai import ASR


asr = ASR('你的APP_KEY', '你的APP_SECRET')
result = asr.recognize('speech.wav', 'zh-CHS')
print(result)
from youdaoai import ASR

asr = ASR('你的APP_KEY', '你的APP_SECRET')
result = asr.recognize('speech.mp3', 'zh-CHS', 16000, 'mp3')
print(result)