In [28]:
# ==============================================================================
# # Manipulación de datos
# ==============================================================================

import pandas as pd

# ==============================================================================
# Preprocesamiento de texto
# ==============================================================================

import nltk
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from nltk.stem import WordNetLemmatizer

# ==============================================================================
# Detección de idioma
# ==============================================================================

from langdetect import detect

# ==============================================================================
# Modelos guardados
# ==============================================================================

import pickle

# ==============================================================================
# Modelado y evaluación
# ==============================================================================

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

In [2]:
# Descargar recursos necesarios para nltk
nltk.download('punkt')
nltk.download('stopwords')
nltk.download('wordnet')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\buque\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\buque\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package wordnet to
[nltk_data]     C:\Users\buque\AppData\Roaming\nltk_data...
[nltk_data]   Package wordnet is already up-to-date!


True

In [60]:
with open('Modelo/best_model_logreg.pkl', 'rb') as file:
    best_model = pickle.load(file)
with open('Modelo/best_modelfinal_rf.pkl', 'rb') as file:
    best_model_rf = pickle.load(file)
with open('Modelo/best_modelfinal_svm.pkl', 'rb') as file:
    best_model_svm = pickle.load(file)
with open('vectorizer.pkl', 'rb') as file:
    vectorizer = pickle.load(file)

In [5]:
def preprocess_text_multilingual(text, language):
    lemmatizer = WordNetLemmatizer()
    if language == 'spanish':
        stop_words = set(stopwords.words('spanish'))
    elif language == 'english':
        stop_words = set(stopwords.words('english'))
    else:
        # Añadir más idiomas según sea necesario
        stop_words = set()
    
    tokens = word_tokenize(text.lower())
    tokens = [word for word in tokens if word not in stop_words]
    tokens = [lemmatizer.lemmatize(word) for word in tokens]
    return ' '.join(tokens)

In [61]:
def predict_comment(comment):
    try:
        language = detect(comment)
    except:
        language = 'unknown'
    
    if language in ['es', 'en']:  # Añadir más códigos de idiomas según sea necesario
        if language == 'es':
            language = 'spanish'
        elif language == 'en':
            language = 'english'
        preprocessed_comment = preprocess_text_multilingual(comment, language)
        vectorized_comment = vectorizer.transform([preprocessed_comment]).toarray()
        prediction = best_model_svm.predict(vectorized_comment)
        return 'Positivo' if prediction[0] == 1 else 'Negativo'
    else:
        return 'Idioma no soportado'

In [7]:
def detect_and_preprocess(text):
    try:
        language = detect(text)
    except:
        language = 'unknown'
    
    if language in ['es', 'en']:
        if language == 'es':
            language = 'spanish'
        elif language == 'en':
            language = 'english'
        return preprocess_text_multilingual(text, language)
    else:
        return text

In [62]:
comentario = "Buenas ideas pero la ejecución se queda corta"
comentario2 = "This game is great and very enjoyable!"
comentario_es = "Ha sido la peor experiencia de juego de mi vida"
comentario_en = "I am not playing this game again"

resultado = predict_comment(comentario)
resultado2 = predict_comment(comentario2)
resultado_es = predict_comment(comentario_es)
resultado_en = predict_comment(comentario_en)

print(f"El comentario en español: '{comentario}' es {resultado}")
print(f"El comentario en inglés: '{comentario2}' es {resultado2}")
print(f"El comentario en español: '{comentario_es}' es {resultado_es}")
print(f"El comentario en inglés: '{comentario_en}' es {resultado_en}")

El comentario en español: 'Buenas ideas pero la ejecución se queda corta' es Negativo
El comentario en inglés: 'This game is great and very enjoyable!' es Positivo
El comentario en español: 'Ha sido la peor experiencia de juego de mi vida' es Negativo
El comentario en inglés: 'I am not playing this game again' es Negativo


In [63]:
comentarios_positivos_es = [
    "Este juego es increíble, me encantó cada minuto.",
    "La jugabilidad es excelente y los gráficos son impresionantes.",
    "Me encanta cómo se desarrolla la historia, es muy atrapante.",
    "Los personajes están muy bien desarrollados y la trama es genial.",
    "Muy recomendable, horas de diversión garantizada.",
    "Un juego muy bien hecho, vale cada centavo.",
    "La música y los efectos de sonido son de primera calidad.",
    "Una experiencia de juego inolvidable, lo recomiendo mucho.",
    "El mejor juego que he jugado en años, simplemente fantástico.",
    "Me sorprendió gratamente, superó todas mis expectativas."
]

comentarios_negativos_es = [
    "El juego es aburrido y repetitivo, no lo recomiendo.",
    "Los gráficos son mediocres y la jugabilidad es terrible.",
    "La historia no tiene sentido y los personajes son planos.",
    "Perdí el interés rápidamente, muy decepcionante.",
    "Un desperdicio de dinero, no vale la pena.",
    "El control es incómodo y frustrante, no pude disfrutarlo.",
    "Tiene muchos errores y bugs, arruina la experiencia.",
    "Muy corto y sin contenido, se termina en unas pocas horas.",
    "El peor juego que he jugado, una pérdida de tiempo.",
    "No cumple con lo prometido, muy decepcionante."
]

comentarios_positivos_en = [
    "This game is amazing, I loved every minute of it.",
    "The gameplay is excellent and the graphics are stunning.",
    "I love how the story unfolds, it's very engaging.",
    "The characters are well-developed and the plot is great.",
    "Highly recommended, hours of guaranteed fun.",
    "A very well-made game, worth every penny.",
    "The music and sound effects are top-notch.",
    "An unforgettable gaming experience, highly recommend it.",
    "The best game I've played in years, simply fantastic.",
    "I was pleasantly surprised, exceeded all my expectations."
]

comentarios_negativos_en = [
    "The game is boring and repetitive, I don't recommend it.",
    "The graphics are mediocre and the gameplay is terrible.",
    "The story doesn't make sense and the characters are flat.",
    "I lost interest quickly, very disappointing.",
    "A waste of money, not worth it.",
    "The controls are awkward and frustrating, couldn't enjoy it.",
    "It has many bugs and glitches, ruins the experience.",
    "Very short and lacking content, finishes in a few hours.",
    "The worst game I've played, a complete waste of time.",
    "It doesn't live up to the hype, very disappointing."
]


for comentario in comentarios_positivos_es + comentarios_negativos_es + comentarios_positivos_en + comentarios_negativos_en:
    resultado = predict_comment(comentario)
    print(f"El comentario: '{comentario}' es {resultado}")


El comentario: 'Este juego es increíble, me encantó cada minuto.' es Positivo
El comentario: 'La jugabilidad es excelente y los gráficos son impresionantes.' es Positivo
El comentario: 'Me encanta cómo se desarrolla la historia, es muy atrapante.' es Positivo
El comentario: 'Los personajes están muy bien desarrollados y la trama es genial.' es Positivo
El comentario: 'Muy recomendable, horas de diversión garantizada.' es Positivo
El comentario: 'Un juego muy bien hecho, vale cada centavo.' es Positivo
El comentario: 'La música y los efectos de sonido son de primera calidad.' es Positivo
El comentario: 'Una experiencia de juego inolvidable, lo recomiendo mucho.' es Positivo
El comentario: 'El mejor juego que he jugado en años, simplemente fantástico.' es Positivo
El comentario: 'Me sorprendió gratamente, superó todas mis expectativas.' es Positivo
El comentario: 'El juego es aburrido y repetitivo, no lo recomiendo.' es Negativo
El comentario: 'Los gráficos son mediocres y la jugabilidad

In [17]:
game_overview = pd.read_csv('Data/game_overview.csv')

In [64]:
# Preprocesar los comentarios
game_overview = game_overview.dropna(subset=['overview'])
game_overview['overview'] = game_overview['overview'].apply(detect_and_preprocess)

In [65]:
# Vectorización del texto usando el vectorizador cargado
X_new = vectorizer.transform(game_overview['overview']).toarray()

# Evaluar el modelo en el nuevo conjunto de datos
y_new_pred = best_model.predict(X_new)

In [66]:
if 'Recomendado_binario' in game_overview.columns:
    y_true = game_overview['Recomendado_binario']
    print("Results on Game Overview Dataset:")
    print(classification_report(y_true, y_new_pred))
    print(confusion_matrix(y_true, y_new_pred))
    print(f"Accuracy: {accuracy_score(y_true, y_new_pred)}")
else:
    print("Predictions on Game Overview Dataset:")
    game_overview['prediction'] = y_new_pred
    pd.set_option('display.max_rows', None)  # Mostrar todas las filas
    print(game_overview[['overview', 'prediction']])

Predictions on Game Overview Dataset:
                                             overview  prediction
0   survive 1000 room cute terror ? break cuteness...           1
1   latest entry sakura series action-packed ever ...           1
2   free play shooter confrontation two irreconcil...           0
3   take helm gigantic capital ship get ready batt...           0
4   counter-strike : global offensive ( c : go ) e...           1
5   most-played game steam.every day , million pla...           0
6   exile , struggling survive dark continent wrae...           1
7   war thunder comprehensive free-to-play , cross...           0
8                                                               1
9   `` fun online `` - pc gameris free ! ’ catch !...           1
10  200 historic naval vessel command world warshi...           1
11                                                              1
12  take duelist around world `` yu-gi-oh ! duel l...           1
13  join 25+ million player paladin , 

In [67]:
# Función para predecir el sentimiento de un comentario independiente
def predict_comment(comment):
    preprocessed_comment = detect_and_preprocess(comment)
    vectorized_comment = vectorizer.transform([preprocessed_comment]).toarray()
    prediction = best_model_svm.predict(vectorized_comment)
    return 'Positivo' if prediction[0] == 1 else 'Negativo'

In [68]:
comentario = "This game is fantastic and very enjoyable!"
resultado = predict_comment(comentario)
print(f"El comentario: '{comentario}' es {resultado}")

El comentario: 'This game is fantastic and very enjoyable!' es Positivo


In [69]:
comentario = "Me aburre bastante"
resultado = predict_comment(comentario)
print(f"El comentario: '{comentario}' es {resultado}")

El comentario: 'Me aburre bastante' es Negativo


In [72]:
comentario = "this game is so boring"
resultado = predict_comment(comentario)
print(f"El comentario: '{comentario}' es {resultado}")

El comentario: 'this game is so boring' es Negativo


In [75]:
data_new_test = {
    'Contenido': [
        "Este juego es increíble, me encantó cada minuto.",
        "La jugabilidad es excelente y los gráficos son impresionantes.",
        "Me encanta cómo se desarrolla la historia, es muy atrapante.",
        "Los personajes están muy bien desarrollados y la trama es genial.",
        "Muy recomendable, horas de diversión garantizada.",
        "Un juego muy bien hecho, vale cada centavo.",
        "La música y los efectos de sonido son de primera calidad.",
        "Una experiencia de juego inolvidable, lo recomiendo mucho.",
        "El mejor juego que he jugado en años, simplemente fantástico.",
        "Me sorprendió gratamente, superó todas mis expectativas.",
        "El juego es aburrido y repetitivo, no lo recomiendo.",
        "Los gráficos son mediocres y la jugabilidad es terrible.",
        "La historia no tiene sentido y los personajes son planos.",
        "Perdí el interés rápidamente, muy decepcionante.",
        "Un desperdicio de dinero, no vale la pena.",
        "El control es incómodo y frustrante, no pude disfrutarlo.",
        "Tiene muchos errores y bugs, arruina la experiencia.",
        "Muy corto y sin contenido, se termina en unas pocas horas.",
        "El peor juego que he jugado, una pérdida de tiempo.",
        "No cumple con lo prometido, muy decepcionante.",
        "This game is amazing, I loved every minute of it.",
        "The gameplay is excellent and the graphics are stunning.",
        "I love how the story unfolds, it's very engaging.",
        "The characters are well-developed and the plot is great.",
        "Highly recommended, hours of guaranteed fun.",
        "A very well-made game, worth every penny.",
        "The music and sound effects are top-notch.",
        "An unforgettable gaming experience, highly recommend it.",
        "The best game I've played in years, simply fantastic.",
        "I was pleasantly surprised, exceeded all my expectations.",
        "The game is boring and repetitive, I don't recommend it.",
        "The graphics are mediocre and the gameplay is terrible.",
        "The story doesn't make sense and the characters are flat.",
        "I lost interest quickly, very disappointing.",
        "A waste of money, not worth it.",
        "The controls are awkward and frustrating, couldn't enjoy it.",
        "It has many bugs and glitches, ruins the experience.",
        "Very short and lacking content, finishes in a few hours.",
        "The worst game I've played, a complete waste of time.",
        "It doesn't live up to the hype, very disappointing.",
        "Es un juego excepcional, con una historia muy envolvente.",
        "La calidad gráfica es sobresaliente, me fascinó.",
        "No puedo dejar de jugar, es sumamente adictivo.",
        "Los desafíos y misiones son muy entretenidos.",
        "Cada nivel es una nueva sorpresa, me encanta.",
        "El mejor juego del año sin duda alguna.",
        "La jugabilidad es muy fluida y dinámica.",
        "Un juego que realmente vale la pena comprar.",
        "Los desarrolladores hicieron un trabajo estupendo.",
        "Muy divertido y emocionante, lo recomiendo.",
        "El juego tiene muchos bugs y errores.",
        "La música de fondo es repetitiva y molesta.",
        "Los personajes no tienen profundidad ni carisma.",
        "Los controles son muy difíciles de manejar.",
        "El argumento es confuso y poco interesante.",
        "El diseño de niveles es pobre y aburrido.",
        "Me arrepiento de haber comprado este juego.",
        "La experiencia de juego es muy mala.",
        "No se lo recomendaría a nadie.",
        "Es una total pérdida de tiempo.",
        "Amazing graphics but the storyline is weak.",
        "The game mechanics are flawed and unresponsive.",
        "Characters lack development and are boring.",
        "Not worth the price, very disappointing.",
        "Expected much more from this game.",
        "The updates have made the game worse.",
        "Multiplayer mode is very laggy.",
        "Customer support is unhelpful.",
        "The game crashes frequently.",
        "The worst game I've bought in recent years.",
        "Absolutely love the gameplay and graphics.",
        "The multiplayer experience is fantastic.",
        "The storyline is captivating and well-written.",
        "I enjoy the character customization options.",
        "The game is very immersive and engaging.",
        "Highly addictive, I play it every day.",
        "The updates keep getting better.",
        "Great value for the price.",
        "The best game I've ever played.",
        "Would recommend to all my friends.",
        "Excelente juego, muy recomendado.",
        "La interacción con otros jugadores es genial.",
        "Los gráficos son de última generación.",
        "Me encanta la variedad de armas y habilidades.",
        "El juego es muy intuitivo y fácil de aprender.",
        "Cada partida es una experiencia diferente.",
        "El soporte técnico es muy eficiente.",
        "No puedo esperar para jugar la próxima actualización.",
        "Es un juego que nunca aburre.",
        "Sin duda, uno de mis favoritos.",
    ],
    'Recomendado_binario': [
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  # Positive comments in Spanish
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  # Negative comments in Spanish
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  # Positive comments in English
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  # Negative comments in English
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  # Additional positive comments in Spanish
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  # Additional negative comments in Spanish
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  # Additional negative comments in English
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  # Additional positive comments in English
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1   # Final set of positive comments in Spanish
    ]
}

df_new_test = pd.DataFrame(data_new_test)
df_new_test.to_csv('test_comments_generated.csv', index=False)
df_new_test.head()

Unnamed: 0,Contenido,Recomendado_binario
0,"Este juego es increíble, me encantó cada minuto.",1
1,La jugabilidad es excelente y los gráficos son...,1
2,"Me encanta cómo se desarrolla la historia, es ...",1
3,Los personajes están muy bien desarrollados y ...,1
4,"Muy recomendable, horas de diversión garantizada.",1


In [73]:
df_new_test['Contenido'] = df_new_test['Contenido'].apply(detect_and_preprocess)

In [74]:
X_test = vectorizer.transform(df_new_test['Contenido']).toarray()

In [76]:
y_true = df_new_test['Recomendado_binario']

In [80]:
y_pred_svm = best_model_svm.predict(X_test)
y_pred_logreg = best_model_rf.predict(X_test)
y_pred_rf = best_model.predict(X_test)

In [81]:
print(classification_report(y_true, y_pred_svm))
print(confusion_matrix(y_true, y_pred_svm))
print(f"Accuracy: {accuracy_score(y_true, y_pred_svm)}")

              precision    recall  f1-score   support

           0       0.78      0.72      0.75        40
           1       0.79      0.84      0.82        50

    accuracy                           0.79        90
   macro avg       0.79      0.78      0.78        90
weighted avg       0.79      0.79      0.79        90

[[29 11]
 [ 8 42]]
Accuracy: 0.7888888888888889


In [82]:
print(classification_report(y_true, y_pred_rf))
print(confusion_matrix(y_true, y_pred_rf))
print(f"Accuracy: {accuracy_score(y_true, y_pred_rf)}")

              precision    recall  f1-score   support

           0       0.85      0.72      0.78        40
           1       0.80      0.90      0.85        50

    accuracy                           0.82        90
   macro avg       0.83      0.81      0.82        90
weighted avg       0.83      0.82      0.82        90

[[29 11]
 [ 5 45]]
Accuracy: 0.8222222222222222


In [83]:
print(classification_report(y_true, y_pred_logreg))
print(confusion_matrix(y_true, y_pred_logreg))
print(f"Accuracy: {accuracy_score(y_true, y_pred_logreg)}")

              precision    recall  f1-score   support

           0       0.73      0.60      0.66        40
           1       0.72      0.82      0.77        50

    accuracy                           0.72        90
   macro avg       0.72      0.71      0.71        90
weighted avg       0.72      0.72      0.72        90

[[24 16]
 [ 9 41]]
Accuracy: 0.7222222222222222
