Skip to content

ChatGPT面前,JioNLP 工具的价值在何处?

冬日新雨 edited this page May 18, 2023 · 7 revisions

ChatGPT 对整个 NLP 乃至 AI 行业的影响和改变

一、ChatGPT 的不足和缺陷

1、模型推理耗时

ChatGPT 本身是直接面向人的模型,而人本身对模型的推理耗时并不敏感。换句话说,ChatGPT 的推理耗时慢则停留在5~30秒的范围内(最初公开网页版),快也要在1~3秒的范围内(openai API版),由于模型的体量摆在这里,无论怎么优化,它的推理速度一定到不了毫秒级。

其实也有很多的任务,并不需要直接面向用户,而且人们忍受不了如此长的处理耗时,例如,地址解析,这个功能常用在快递行业、邮政行业等等,我们无法接受一个地址解析功能去调用 ChatGPT 模型,等待1到3秒钟,此外,全世界地址千千万万,每时每刻需要处理巨量的地址信息,这就导致了大模型在处理这些问题上的吃力。因此,对于这些不直接面向用户问答,并行计算量大,且任务难度并不算高的任务,传统的 NLP 工具和软件依然有存在价值。

二、JioNLP 工具的存在价值

不可否认,类 ChatGPT 将会对传统 NLP 的模式、工具、软件、商业都产生冲击,JioNLP 工具同样不可避免。但 JioNLP 也有一些独特的优势是类 ChatGPT 等模型难以替代的。

1、调用速度快,消耗资源少

目前而言,超大规模参数的 ChatGPT 带来的一个问题就是输出速度慢,针对一条问题的回复生成需要耗费较多的时间,针对大量的并发请求是不足够使用的。 而 JioNLP 工具瞄准的是针对简要、常用任务的高效调用。例如,JioNLP 的地址解析能力但进程调用速度可达180条每秒(不同机器性能不同),这对于 ChatGPT 模型是大材小用。所以,JioNLP 此时依然存在生存空间。

众所周知,Python 语言的处理速度是比较慢的,JioNLP 将在未来对某些需要大规模使用的接口和功能进行 C++ 语言的迁移,使得接口更加适用于生产环境。如文本清洗接口、分句功能等等。 当然,C++ 语言在对字符串的各种操作上是不方便的,尤其是涉及到字符串的编码方面,QString 库相对来讲较为优秀,但也存在局限性。

2、JioNLP 对大模型训练的支持

在未来,JioNLP 将对一些大模型需要的接口或者功能进行封装和优化。