<a href="https://colab.research.google.com/github/fresilva-ai/public.ai/blob/main/AutomatedTextClassifier.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
# Paso 1: Instalar las dependencias necesarias
!pip install scikit-learn pandas nltk



In [3]:
# Paso 2: Importar las librerías
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.cluster import KMeans
import pandas as pd
import nltk
from nltk.corpus import stopwords

In [4]:
# Descargar las palabras vacías en español
nltk.download('stopwords')
stop_words_spanish = stopwords.words('spanish')

# Paso 3: Datos de ejemplo: correos electrónicos
correos = [
    "Quiero información sobre su producto.",
    "¿Cuánto cuesta su servicio?",
    "Gracias por la atención, estoy satisfecho.",
    "Tengo problemas con la configuración del software.",
    "¿Ofrecen soporte técnico?",
    "El producto llegó defectuoso, necesito una solución.",
]

# Paso 4: Preprocesar texto con TF-IDF y palabras vacías en español
vectorizer = TfidfVectorizer(stop_words=stop_words_spanish)
X = vectorizer.fit_transform(correos)

# Paso 5: Agrupamiento automático (Clustering) usando K-Means
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)

# Paso 6: Mostrar resultados
clusters = kmeans.labels_
resultados = pd.DataFrame({'Correo': correos, 'Cluster': clusters})

# Imprimir los resultados
print("Clasificación de correos por cluster:")
print(resultados)

# Paso 7: Opcional: Guardar resultados en un archivo CSV
resultados.to_csv("clasificacion_correos.csv", index=False)

# Mostrar el archivo generado
from google.colab import files
files.download("clasificacion_correos.csv")

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Unzipping corpora/stopwords.zip.


Clasificación de correos por cluster:
                                              Correo  Cluster
0              Quiero información sobre su producto.        2
1                        ¿Cuánto cuesta su servicio?        0
2         Gracias por la atención, estoy satisfecho.        0
3  Tengo problemas con la configuración del softw...        0
4                          ¿Ofrecen soporte técnico?        0
5  El producto llegó defectuoso, necesito una sol...        1


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>