scik-learn 中文文本分类算法的实现

语料库的文件目录：
corpus目录
      类别A
        ----文件1.txt
        ----文件2.txt
      类别B
        ----文件3.txt
        ----文件4.txt
#########################

使用from sklearn.datasets.base import Bunch 永持久化保存语料库的content,label,filename…… 等信息
分别实现k-means，KNN,SVM,贝叶斯，topic_extraction等,同时评估分类的准确率，召回率和F值。

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
KNN.py		KNN.py
README.md		README.md
SVM.py		SVM.py
ch_stop_words.txt		ch_stop_words.txt
evaluation.py		evaluation.py
evaluation.pyc		evaluation.pyc
k-means-svd.py		k-means-svd.py
k-means.py		k-means.py
navibayers.py		navibayers.py
test_svm_evaluation.py		test_svm_evaluation.py
textprocess.py		textprocess.py
textprocess.pyc		textprocess.pyc
topic_extraction.py		topic_extraction.py

Provide feedback