In [17]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# Leer archivo CSV
df = pd.read_csv("activos_pi2.csv")

# Dividir en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(df["descripcion"], df["categoria"], test_size=0.3, random_state=42)

# Vectorización con TF-IDF
vectorizer = TfidfVectorizer()
X_train_tfidf = vectorizer.fit_transform(X_train)
X_test_tfidf = vectorizer.transform(X_test)

# Modelo Random Forest
clf = RandomForestClassifier(random_state=42)
clf.fit(X_train_tfidf, y_train)

# Predicciones
y_pred = clf.predict(X_test_tfidf)

# Resultados
print("=== Reporte de Clasificación ===")
print(classification_report(y_test, y_pred))


=== Reporte de Clasificación ===
                   precision    recall  f1-score   support

 Derecho de Autor       1.00      1.00      1.00        72
Diseño Industrial       1.00      1.00      1.00        75
            Marca       1.00      1.00      1.00        78
          Patente       1.00      1.00      1.00        75

         accuracy                           1.00       300
        macro avg       1.00      1.00      1.00       300
     weighted avg       1.00      1.00      1.00       300



In [14]:
# Nueva descripción para probar
nueva_descripcion = ["Sistema que permite almacenar energía eléctrica generada por paneles solares"]

# Vectorizar y predecir
nueva_tfidf = vectorizer.transform(nueva_descripcion)
prediccion = clf.predict(nueva_tfidf)[0]

print("Descripción:", nueva_descripcion[0])
print("Predicción de categoría:", prediccion)

Descripción: Sistema que permite almacenar energía eléctrica generada por paneles solares
Predicción de categoría: Patente


In [15]:
# Nueva descripción para probar
nueva_descripcion = ["una canción de un grupo de salsa"]

# Vectorizar y predecir
nueva_tfidf = vectorizer.transform(nueva_descripcion)
prediccion = clf.predict(nueva_tfidf)[0]

print("Descripción:", nueva_descripcion[0])
print("Predicción de categoría:", prediccion)

Descripción: una canción de un grupo de salsa
Predicción de categoría: Derecho de Autor


In [None]:
from google.colab import drive
drive.mount('/content/drive')