In [1]:
import tkinter as tk
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
import pandas as pd

In [2]:
# Función para cargar y procesar los datos
def cargar_datos():
    abstracts_train = pd.read_csv('abstracts_train.csv', delimiter='\t')
    entities_train = pd.read_csv('entities_train.csv', delimiter='\t')
    relations_train = pd.read_csv('relations_train.csv', delimiter='\t')

    train_data = pd.merge(relations_train, entities_train, left_on='entity_1_id', right_on='id', suffixes=('_relation', '_entity_1'))
    train_data = pd.merge(train_data, entities_train, left_on='entity_2_id', right_on='id', suffixes=('_entity_1', '_entity_2'))
    train_data = pd.merge(train_data, abstracts_train, on='abstract_id')
    return train_data

In [3]:
# Función para entrenar y clasificar con un modelo basado en texto
def clasificar_texto(train_data):
    tokenizer = Tokenizer(num_words=5000, oov_token="<OOV>")
    tokenizer.fit_on_texts(train_data['abstract'])

    X = tokenizer.texts_to_sequences(train_data['abstract'])
    X = pad_sequences(X)

    y = train_data['type']

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    model = Sequential()
    model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))
    model.add(Dense(8, activation='relu'))
    model.add(Dense(1, activation='sigmoid'))

    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

    model.fit(X_train, y_train, epochs=5, batch_size=32, validation_data=(X_test, y_test))

    y_pred = model.predict(X_test)
    y_pred = (y_pred > 0.5).astype(int)

    accuracy = accuracy_score(y_test, y_pred)
    classification_rep = classification_report(y_test, y_pred)

    return accuracy, classification_rep

In [4]:
# Función para entrenar y clasificar con un modelo de Naive Bayes (Multinomial)
def clasificar_multinomial(train_data):
    X = train_data[['feature1', 'feature2', ...]]
    y = train_data['type']

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    model = MultinomialNB()
    model.fit(X_train, y_train)

    y_pred = model.predict(X_test)

    accuracy = accuracy_score(y_test, y_pred)
    classification_rep = classification_report(y_test, y_pred)

    return accuracy, classification_rep

In [5]:
# Función para mostrar los resultados en la interfaz
def mostrar_resultados():
    train_data = cargar_datos()

    # Modelo basado en texto
    accuracy_texto, classification_rep_texto = clasificar_texto(train_data)

    # Modelo de Naive Bayes (Multinomial)
    accuracy_multinomial, classification_rep_multinomial = clasificar_multinomial(train_data)

    resultado_texto.set(f'Modelo basado en texto:\nAccuracy: {accuracy_texto:.2f}\n\nClassification Report:\n{classification_rep_texto}\n\n'
                        f'Modelo de Naive Bayes (Multinomial):\nAccuracy: {accuracy_multinomial:.2f}\n\nClassification Report:\n{classification_rep_multinomial}')


In [6]:
# Configuración de la interfaz gráfica
window = tk.Tk()
window.title("Sistema de Clasificación")


''

In [7]:

# Botón para cargar datos y realizar clasificación
tk.Button(window, text="Cargar Datos y Clasificar", command=mostrar_resultados).grid(row=0, column=0, columnspan=2)


In [8]:

# Etiqueta para mostrar el resultado de la clasificación
resultado_texto = tk.StringVar()
tk.Label(window, textvariable=resultado_texto).grid(row=1, column=0, columnspan=2)


In [10]:
# Configuración de la interfaz gráfica
window = tk.Tk()
window.title("Sistema de Clasificación")

# Etiqueta y entrada para ingresar nuevos datos
tk.Label(window, text="Ingresar nuevos datos:").grid(row=0, column=0, columnspan=2)
entrada_datos = tk.Entry(window)
entrada_datos.grid(row=1, column=0, columnspan=2)

# Botón para clasificar nuevos datos
tk.Button(window, text="Clasificar", command=clasificar_nuevos_datos).grid(row=2, column=0, columnspan=2)

# Checkbox para seleccionar algoritmos a mostrar
algoritmo1_var = tk.IntVar()
algoritmo2_var = tk.IntVar()

tk.Checkbutton(window, text="Algoritmo 1", variable=algoritmo1_var, command=actualizar_resultados).grid(row=3, column=0)
tk.Checkbutton(window, text="Algoritmo 2", variable=algoritmo2_var, command=actualizar_resultados).grid(row=3, column=1)

# Ejecutar la aplicación
window.mainloop()

NameError: name 'clasificar_nuevos_datos' is not defined