自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类,word2vec训练词向量、文档摘要、情感识别、关系抽取。
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
Part1_TF-IDF update ReadMe Oct 28, 2017
Part2_Text_Classify update Part_2 Aug 3, 2017
Part3_Text_Cluster update README Apr 24, 2017
Part4_Word_Similarity
Part5_Sentiment_Analysis update Part_6 Jun 5, 2017
Part6_Relation_Extraction update Jun 29, 2017
Tools update Tools about google translate Nov 9, 2017
ppt update Apr 16, 2017
.gitignore update Tools about google translate Nov 9, 2017
Python 列表(list)、字典(dict)、字符串(string)常用操作.md update data Mar 13, 2017
README.md update ReadMe Oct 28, 2017

README.md

构建实验环境

1 安装python(2.7) https://www.python.org/

2 安装pip:

2.1 下载pip https://pypi.python.org/pypi/pip/9.0.1

2.2 解压缩后,安装指令 python setup.py install

2.3 pip升级 python -m pip install --upgrade pip

2.4 pip安装扩展包 pip install jieba (这里以jieba包为例),如果速度较慢,可改为国内的阿里源, 即 pip install jieba -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

3 安装pycharm http://www.jetbrains.com/pycharm/

4 使用GitHub获取代码

4.1 安装git https://git-scm.com/

4.2 登陆自己的GitHub账号,找到自己的项目,(别人的需要先fork过来,也可以直接 git clone xxx,或者直接下载zip包放进pycharm)

4.3 打开pycharm,首先设置git的位置及github账号,点击Test都通过后继续,依次在菜单栏点击 VCS checkout from version control GitHub,登陆自己的账号后选择相应的项目,得到代码。

4.4 (更新fork的项目到最新的版本)Syncing a fork https://help.github.com/articles/syncing-a-fork/

5 ipython交互式开发环境

5.1 安装ipython pip install ipython

5.2 安装jupyter(即notebook) pip install notebook

5.3 jupyter notebook 启动,打开浏览器即可(默认1224端口)