In [9]:
import json
import os
import sys
import re

# Obtener la ruta del directorio actual
directorio_actual = os.getcwd()

# Construir las rutas completas de los archivos
archivo_sentimientos = os.path.join(directorio_actual, "Sentimientos.txt")
archivo_tweets = os.path.join(directorio_actual, "Tweets.txt")
archivo_resultados = os.path.join(directorio_actual, "Resultados_Sentimientos.txt")

# Cargar el diccionario de sentimientos
try:
    with open(archivo_sentimientos, "r", encoding="utf-8") as sentimientos:
        valores = {}
        for linea in sentimientos:
            termino, valor = linea.strip().split("\t")
            valores[termino] = int(
                valor
            )  # Guardar palabra con su sentimiento sin modificarla
except FileNotFoundError:
    print(f"Error: No se encontró el archivo '{archivo_sentimientos}'")
    sys.exit(1)


def calcular_sentimiento(tweet, valores):
    """
    Calcular el sentimiento del tweet sumando los valores de las palabras conocidas.
    """
    palabras = tweet.split()
    return sum(valores.get(palabra, 0) for palabra in palabras)


def tweet_tiene_contenido(tweet):
    """
    Determina si un tweet tiene contenido significativo.
    Filtra tweets que sean solo espacios, caracteres especiales o que no formen una frase comprensible.
    """
    return bool(
        re.search(r"[a-zA-Z0-9áéíóúÁÉÍÓÚñÑ]{2,}", tweet)
    )  # Requiere al menos una palabra con letras o números


def procesar_tweets():
    """
    Leer los tweets, calcular su sentimiento y guardar los resultados.
    """
    try:
        with open(archivo_tweets, "r", encoding="utf-8") as f, open(
            archivo_resultados, "w", encoding="utf-8"
        ) as out:
            for line in f:
                try:
                    tweet_json = json.loads(line)
                    texto_tweet = (
                        tweet_json.get("text", "").strip().replace("\n", " ")
                    )  # Reemplazar saltos de línea por espacios

                    if texto_tweet and tweet_tiene_contenido(
                        texto_tweet
                    ):  # Filtrar tweets sin contenido significativo
                        sentimiento = calcular_sentimiento(texto_tweet, valores)
                        resultado = f"EL SIGUIENTE TWEET: '{texto_tweet}' TIENE UN SENTIMIENTO ASOCIADO DE: {sentimiento}"
                        print(resultado)
                        out.write(resultado + "\n")
                except json.JSONDecodeError:
                    continue
    except FileNotFoundError:
        print(f"Error: No se encontró el archivo '{archivo_tweets}'")
        sys.exit(1)


# Ejecutar el procesamiento de tweets
procesar_tweets()
print(f"Resultados guardados en: {archivo_resultados}")

EL SIGUIENTE TWEET: '@Brenamae_ I WHALE SLAP YOUR FIN AND TELL YOU ONE LAST TIME: GO AWHALE' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'Metin Şentürk Twitterda @metinsenturk MUHTEŞEM ÜÇLÜ; SEN, BEN, MÜZİK' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'RT @byunghns: 😭 I LOVE #틴탑 SO MUCH #쉽지않아 IS GOING TO BE SO GOOD 😭' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'que hdp maicon lo que le hizo a david luiz jajajajajajajajajajaj,igual se jodio la carrera' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'RT @Positivamos: tudo o que eu quero é um amor sincero.' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'RT @GossipRoomOff: Si Nathalie sait pertinemment que son couple ne va pas durer, alors pourquoi accepter la demande en mariage de Vivian ? …' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'RT @Dayannalozano_: Junior va perdiendo... http://t.co/5mOsR7boLx' TIENE UN SENTIMIENTO ASOCIADO DE: 0
EL SIGUIENTE TWEET: 'RT @Positivam