Skip to content

rickltt/punctuation_restoration

Repository files navigation

中文医疗标点恢复

主要解决医疗领域,自动语音识别(ASR)的后处理步骤,给没有标点的序列添加标点符号。

预训练

完整的训练代码位于distill目录下。

使用了TextBrewer工具包实现知识蒸馏预训练过程,引入了PMP任务,对比学习,知识蒸馏。

微调

完整代码位于classifier_run.py

下载

预训练数据和模型权重下载

提取码: q12e

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published