Skip to content

翻译与审校的正确姿势

GloriaLee01 edited this page Feb 26, 2024 · 159 revisions

如何使用 Prompt 来实现高质量翻译

1.首先,发送以下 prompt,明确角色、目标和任务。

    Role:技术文档翻译师
    Background:技术文档翻译
    你是一位资深的高级技术文档翻译者,一位专注于将技术文档从一种语言翻译成另一种语言的专业人士。你擅长 Markdown 和 html 语言,擅长网页文本和 AI 领域的英译汉翻译。
    Attention:技术文档翻译 
    你要尽最大努力确保翻译的准确性和流畅性,以保持原文的专业性和清晰度。你要明白技术文档的重要性,因此要尽力确保翻译结果符合最高标准。
    Skills:
    - 准确理解原文内容,包括技术术语和专业名词。 
    - 熟练掌握源语言和目标语言,确保翻译质量。 
    - 具备良好的逻辑思维能力和表达能力,保持翻译的连贯性和专业性。
    Goals:
    - 提供准确、流畅的技术文档翻译服务,确保信息传递的准确性和完整性。
    - 确保翻译结果符合技术文档的专业标准和行业规范。
    - 尊重原文内容,确保翻译的忠实性和准确性。 
    - 遵守翻译行业的专业规范和道德准则。
    Workflow: 
    - 首先,仔细阅读原文内容,确保充分理解。
    - 掌握原文中的技术术语和专业名词,准备翻译。
    - 逐段翻译,确保翻译结果准确无误。 
    - 审核和校对翻译结果,确保流畅性和连贯性。
    - 输出最终翻译文档,确保符合客户需求和要求。
    - 当接收到非 prompt 语句的英文内容时,将其翻译为中文。
    - 当输出内容为代码时,请使用 bash。
    - 当输入内容为表格或行列时,请保持翻译后格式与原文格式一致。
    - 为了拉近与读者的距离,表示 “you”的时候,统一使用为用“你”。
    Stack:
    - 任务介绍:将英文版的技术文档翻译为中文,而且这份技术文档中包含了 markdown 语法 和 html 语法。
    - 任务陈述:
      - 现在要将一份包含计算机科学和人工智能专业术语的英文技术文档,你需要将其翻译成中文,译文要符合大部分中文读者的心理预期和阅读能力。
      - 提供准确、流畅的技术文档翻译服务,确保信息传递的准确性和完整性。
      - 确保翻译结果符合技术文档的专业标准和行业规范。
    如果你接受了以上指令,请回复我,接受指令。
  • Prompt 错误示范 ❌

    prompt 有误 例子
    译文风格有误 你是零一万物的高级文档工程师,使用中文翻译下面的内容,要生动活泼。
    使用“不需要”等否定词 ① 你是一名 01AI 的高级文档工程师,你非常擅长 Markdown 语言,并且擅长英文和中文。下面是一段 Markdown 笔记,你需要将里面的英文翻译为中文同时保持笔记的格式正确(注意链接不需要翻译!) ② 用中文翻译以下文章,并用 markdown 格式输出,保留用于结构化的标记符号,并在代码块中显示.以下专业名词(Yi,Yi-34B-chat)及链接不需要翻译。
    缺乏明确指令,例如,“如果你接受以上指令,回复我,接受指令。” 任务陈述:现在要将一份包含计算机科学和人工智能专业术语的英文技术文档,你需要将其翻译成中文,译文要符合大部分中文读者的心理预期和阅读能力。
    prompt 不全面 例子
    翻译要求不全面,缺乏译文风格和行业规范等内容 你现在是一个专业的译者,也是一个专业的技术文档工程师,擅长网页文本和AI领域的翻译,擅长英译汉翻译,现在我要给你发一些英文文本,请理解,并翻译为中文,用地道的表述,符合汉语读者的心理预期。
    翻译要求不全面,缺乏译文质量的要求 用中文翻译以下文章,并用markdown格式输出,保留用于结构化的标记符号,并在代码块中显示.以下专业名词(Yi,Yi-34B-chat)及链接不需要翻译。
  1. 随后,发送待翻译的内容。

  2. 如果你对译文不满意,你可以提出修改的方向,例如,使用以下 prompt。

    修改你的译文,使用通俗易懂、地道的表述,符合汉语读者的心理预期。
    把所有的“您” 换为“你”。
  1. 如果你想继续翻译其他内容,可以使用以下 prompt。
    翻译 <此处输入待翻译的内容>
  1. 如果你有不理解的内容,你可以先查询 Yi 术语表(TBD);你也可以提问,再自行优化译文,prompt 如下所示。
    用通俗易懂的中文解释:deployment。

翻译

  • 翻译时请记得保留原文的格式和链接,确保功能相同。

    原文:

    image

    译文(保留原文的格式和链接):

    image

  • 翻译内容包括:section 的内容以及目录中对应的标题。

    目录中的标题也需要翻译:

    image

  • 如果用 Visual Studio Code 编辑 Markdown 文件,请删除内部链接中的表情符号,确保超链接功能正常。

    image

    image

  • 译文风格

    • 译文应采用中性、客观和专业的语气,使用正式的语言风格,避免生动活泼或引人注意的风格。
    • 译文应清晰、准确、明确地传达信息。
  • 译文用语规范

    语态 使用主动语态,例如,“假如尚未安装这个软件“ 使用被动语态,例如,”假如此软件尚未被安装“
    使用现代汉语的常用表达方式 例如,“这是仅有的两种快速启动的方法。“ 例如,”这是唯二的快速启动的方法。“
    人称代词 使用“你” 使用“我/我们”
    代词 明确指代的内容,保证只有一个含义,例如,“从管理系统可以监视两个系统:中继系统和受中继系统直接控制的分配系统。” "其"、"该"、"此"、"这"等代词指代不明确,例如,“从管理系统可以监视中继系统和受其直接控制的分配系统。”
    “的”正确使用(形容词+的+名词) 例如,她露出了开心的笑容。
    “地”正确使用(副词+地+动词) 例如,她开心地笑了。
    “得”正确使用(动词+得+副词) 例如,她笑得很开心。
    专有名词翻译 第一次出现英文词汇时,在括号中给出中文标注。此后再次出现时,直接使用英文缩写即可。例如,”IOC(International Olympic Committee,国际奥林匹克委员会)。“这样定义后,便可以直接使用“IOC”了。
    处理名词之前的形容词 将形容词转为句子,例如,”此设备必须在技师的指导下使用,且指导技师必须接受过由本公司举办的正式设备培训。“ 名词前使用了过多的形式词,例如,“此设备的使用必须在接受过本公司举办的正式的设备培训的技师的指导下进行。”
    词汇选择
    举例说明 使用“例如” 使用“比如”
    操作说明 使用“运行” 使用“执行”
    句式选择
    尽量使用肯定句表达 例如,“请确认装置的电源已关闭。” 例如,“请确认没有接通装置的电源。”
    避免使用长句 例如,”本产品适用于多种体系结构。无论是由一台服务器(单一节点结构),还是由多台服务器(并行处理结构)进行动作控制,均可以使用本产品。“ 例如,”本产品适用于从由一台服务器进行动作控制的单一节点结构到由多台服务器进行动作控制的并行处理程序结构等多种体系结构。“
    避免使用双重否定句 例如,”用户必须拥有删除权限,才能删除此文件。“ 例如,”没有删除权限的用户,不能删除此文件。“
    尽量使用简单句和并列句,避免使用复合句。 并列句,例如,“他昨天生病了,没有参加会议。” 复合句,例如,“那个昨天生病的人没有参加会议。”
    句子内部的并列词,最后一个尽量使用(和)来连接,使句子读起来更加连贯 这些科技公司包括 Google、Facebook、腾讯、阿里和百度等。
  • 译文大小写、标点符号和间隔规范

    特殊名词大小写 Android、iOS、iPhone、Google、Apple,无论是否在句首都应该以同样的方式写。
    标点总规则 一律使用中文/全角标点。中英文混排中如果出现整句英文,则在这句英文中使用英文/半角标点。 在中文文本中混用了英文标点。
    句末标点规范 使用“运行以下命令。” 使用“运行以下命令:”
    例句格式规范 使用“例如,……” 使用“例如:……”
    冒号使用规范 使用中文冒号 使用英文冒号
    引号使用规范 使用中文引号“” 使用英文引号""
    括号使用规范 使用中文圆括号(),括号前后不加空格 使用英文圆括号 ()
    省略号使用规范 使用中文省略号⋯⋯ 使用。。。或...等非标准形式
    书名号使用规范 英文书名或电影名改用中文表达时,双引号应改为书名号,例如,他发表了一篇名为《航空业的未来》的文章。
    顿号使用规范 句子内部的并列词,应该用全角顿号(、) 分隔,即使并列词是英语也是如此。例如,”这些科技公司包括 Google、Facebook、腾讯、阿里和百度等。“ 使用逗号,这些科技公司包括 Google, Facebook, 腾讯, 阿里和百度等。
    冒号使用规范 使用半角冒号(:)来表示时间,例如,”早上8:00“ 使用全角冒号,例如,“早上 8:00”
    感叹号 应该使用平静的语气叙述,尽量避免使用感叹号 多个感叹号连用,例如,!!
    英文与非标点的中文之间 保留空格,例如,Yi 系列模型 不留空格,例如,Yi系列模型
    数字与非标点的中文之间 保留空格,例如,2024 年 01 月 26 日 不留空格,例如,2024年1月26日
    数字与单位之间 保留空格,例如,2024 年 01 月 26 日 不留空格,例如,2024年1月26日
    中文标点与其他字符间 一律不加空格,例如,”他的电脑是 MacBook Air。“ 留空格,例如,“他的电脑是 MacBook Air 。”
    • 连接号
      • 连接号用于连接两个类似的词。
      • 以下场合应该使用直线连接号(-),占一个半角字符的位置。
        • 两个名词的复合,例如,氧化-还原反应
        • 图表编号,例如,图 1-1
      • 数值范围(例如日期、时间或数字)应该使用波浪连接号(~)或一字号(—),占一个全角字符的位置。 例句:2009 年~2011 年 注意,波浪连接号前后两个值都建议加上单位。
      • 波浪连接号也可以用汉字“至”代替。 例句:周围温度:-20 °C 至 -10 °C
    • 尽量使用中文,避免中英文混合的情况。例如「app」一般应写为「应用」或「移动应用」。品牌、产品名、人名、地名等特殊名词,如果来自英文,请使用英文以避免在不同译法间选择。
  • 图片链接使用绝对路径

    • 为确保图片在所有平台上显示正常,使用绝对路径,而不是相对路径。
    • 首先,定位所需图片的GitHub页面,然后右键点击图片,选择“复制图片地址”,确保URL末尾包含“raw=true”。最后,将完整地址用于文档中的图片和链接。
    • 如需更多信息,请参阅如何获取 GitHub 的 "raw" 链接 (获取原始图片链接)
  • 翻译规范

    • 请不要直接复制粘贴AI的译文,建议在理解原文内容的基础上,修改 AI 产出的译文,最后再进行检查,实现更好的翻译效果。
  • Pull Request 提交规范

    • 提交 Pull Request 时,请在 PR 描述中加入预览的截图。

术语

英文 中文译文
Chat models Chat 模型
Base models Base 模型
LLM 大语言模型
open-sourced 开源
language understanding 语言认知
commonsense reasoning 常识推理
emergent ability 涌现能力
supervised Fine-Tuning 监督微调(SFT)技术
reinforcement Learning (RL) training 强化学习(RL)训练
hallucination 幻觉
cumulative Error 累积误差
path (学习)路径
deploy, deployment 部署
customizable options 自定义选项
quick start 快速上手
inference 推理
execute, run 运行
prerequisites 前提条件
dependencies 依赖项
instructions 指南
completion mode 续写模式(completion mode)
initialize 启用
fine-tuning 微调
hardware Setup 配备硬件
Post-Training Quantization) method 后训练量化方法
integrated 集成
minimum VRAM requirements 最低显存要求
Chinese characters 汉字
default context window 默认的上下文窗口
Step 1 第一步
model architecture 模型架构
tools, libraries, and resources 工具、库和资源
post-processing strategies 后处理策略
greedy decoding 贪心解码
data compliance checking algorithms 数据合规性检查算法

请注意,对于一些专业术语和缩写,如果在特定领域或上下文中具有特定的含义,我们通常不翻译,例如,“Docker”和“API”等术语在技术文档中通常保留英文原文,因为这些术语在行业中广泛使用,且翻译可能会导致混淆。

英文 翻译(保留英文原文)
Hugging Face Open LLM Leaderboard Hugging Face Open LLM Leaderboard
AlpacaEval Leaderboard AlpacaEval Leaderboard
Mixtral Mixtral
Claude Claude
Transformer Transformer
Llama Llama
MMMU MMMU
CMMMU CMMMU
4-bits 4-bits
pip pip
Docker Docker
conda-lock conda-lock
Web demo Web demo
Playground Playground
API API
batch=1 batch=1
prompt prompt
PIQA, SIQA, HellaSwag, WinoGrande, ARC, OBQA, CSQA, SquAD, QuAC, and BoolQ 均不翻译,保留英文原文

审校

  • 为了构建友好协作氛围,建议使用 comment 而不是 request changes 😺。 image

排版

  • 文档排版

    文档排版分类 工具 功能
    输入法 -「微信输入法」 -「搜狗输入法」 自动在英文和数字前后加空格
    在线文档 -「飞书文档」 -「石墨文档 一键修复所有空格和标点符号使用错误的功能
    在线工具 在线文本空格格式化 自动在英文和数字前后加空格
    Chrome 插件 空格之神 自动在英文和数字前后加空格
  • 代码排版

    • Prettier 是一个功能强大的代码格式化工具,可以自动处理代码的缩进、空格、换行、引号等,确保整个项目中代码风格一致,提高代码的可读性。

本文档参考文献: