g0v Slack CC0 corpus from #rand0m chatlog
https://github.com/moztw/cc0-sentences/blob/master/zh-TW/g0v_slack_rand0m.txt
整理的成果品質標準可參考目前的句子
將接下來的對話紀錄整理成一句一行。將14字以上的句子切斷成兩句。略過有ID與時間的行數。去除句中的英文。忽略所有符號、ID、emoji、空行。把數字改為中文大寫。改寫句子以維持順暢。句尾不需要句號。
整理至 2020/04 完成