wulindong 总结的数据清洗代码 work's code 小的tips 在使用re.sub替换时,如果你的pattern可能正好挨着 回车 可以先把回车替换成一个special token ,清洗完成之后再进行转换过来