Skip to content

joragupra/text-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Cómo clasificar artículos con Python

Lleva a cabo una clasificación de artículos usando un algoritmo de clustering (K-means) y la medida estadística TF-IDF (Term frequency-Inverse document frequency) aplicada a un conjunto de artículos.

Para este ejemplo, he utilizado iPython Notebook. El primer cuaderno, download_articles.ipynb, lleva a cabo la descarga de artículos online de varios periódicos online usando sus fuentes RSS (no relacionado con ninguna técnica de aprendizaje automático). El segundo, articles_classifier.ipynb, muestra cómo crear un clasificador utilizando la librería scikit-learn.

El directorio training contiene ya un conjunto de artículos que se pueden utilizar para entrenar el clasificador mientras que en test hay otros artículos distintos con los que se puede probar la precisión del clasificador. Otros conjuntos de ejempos se pueden encontrar en el directorio articles.

About

Ejemplo clasificación de textos con scikit-learn

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published