文本中有英文单词包含pc两个字母可能会触发不正确的正则化:比如pca正则化为P Ca,PCA正则化为P CA,无论pc出现在单词何处(前中后都会被强制转换)。 猜测错误原因:pc正则化为p c的时候直接用的replace吗?需要先判断是否为一个单词(空格或者标点)? 这样不是很合理,大佬们有空修正一下吧。
文本中有英文单词包含pc两个字母可能会触发不正确的正则化:比如pca正则化为P Ca,PCA正则化为P CA,无论pc出现在单词何处(前中后都会被强制转换)。
猜测错误原因:pc正则化为p c的时候直接用的replace吗?需要先判断是否为一个单词(空格或者标点)?
这样不是很合理,大佬们有空修正一下吧。