Skip to content

py-bin/text_mining

Repository files navigation

anchor

MeU语义分析工具1.1产品使用说明文档

​ MeU研发的文本挖掘工具,主要是针对海量的非结构化电信投诉文本数据进行挖掘,提取出商业价值。1.1版本包含结构化信息提取、产品分类、地址提取三大功能,该产品将实际应用于广东电信工信部申诉压降及智能预警优化项目,使用了此工具后,移动网络质量文本数据的地址信息提取率提升了33%。

功能介绍

结构化信息处理

​ 电信的投诉内容正文结构复杂,揉合了所有信息,难以直接用于分析。通过此工具可把非结构化信息转为结构化数据,以便于存储于数据库或表格文件中。

结构化信息处理实例

匹配产品信息

​ 投诉内容正文中包含了投诉产品的信息,此工具会根据已有的《产品列表》,从受理内容正文中精准提取出客户投诉的产品,便于后续统计分析。

匹配产品信息实例

地址信息提取

​ 为了定位投诉多发网点,需要得到每条投诉内容中的地址信息。此工具可从投诉内容中提取地址信息,按照省、市、区、街道存储为表格文件。

地址信息提取实例

界面展示

下图为MeU语义分析工具,包括目录导航栏、数据预览区域、按钮标签、LOGO及版权信息

界面GUI展示

运行环境

​ 推荐在windows系统下Anaconda(py3.6版本)下运行,后续将转化为exe可执行文件,保证在非python环境下也能正常运行。

注意事项

  1. 待处理文本数据的列名固定为"受理内容",后续会改为在预览区域进行选择
  2. 地址信息提取速度较慢,需耐心等待
  3. 产品列表需要包含产品的近似名称(如B2I卡、互联网卡视为相同产品),而且产品列表需要及时更新。

About

a text mining tool for complaint information analysis

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages