Skip to content

blmoistawinde/simpleSanGuoNLP

Repository files navigation

三国演义简单分析

  • demo_KGsegmenter.ipynb:演示知识库+字典树辅助jieba分词的notebook
  • link_getting.py:知识库+字典树完成实体统计,并且建立人物联系网络。
  • name_data.xlsx:三国主要人物姓、名、字知识库。从网络上收集并整理。
  • ./三国演义:三国演义120回文本文件
  • TSNE_node2vec.html:将三国人物连接网络使用node2vec化为embedding,再用TSNE降至2维,最后使用pyecharts进行散点图可视化。【按照国家区分】
  • TSNE_node2vec_DBSCAN.html:散点构造过程同上,并且使用DBSCAN对点进行聚类。