## Exercise 2: Word's feeling
#### (written in Spanish)
Dado un archivo que contiene en cada línea una palabra o conjunto de palabras seguido de un valor numérico denominado “sentimiento” y un conjunto de tweets, se pide calcular el sentimiento de aquellas palabras o conjunto de palabras que no tienen un valor asociado en el archivo de “sentimientos”. Se pueden seguir distintas estrategias para asignar un valor. Por ejemplo, se podría asignar como valor el valor del “sentimiento” del tweet en que se encuentra la palabra o conjunto de palabras sin valor, o el valor medio del “sentimiento” del tweet.

Obsérvese que:
- Como resultado se debe mostrar por pantalla en cada línea, una palabra o conjunto de palabras y a continuación un valor numérico que represente el “sentimiento” de dicha palabra o conjunto de palabras. Solo se mostrarán la palabra o conjunto de palabras que no aparecían con un valor en el archivo original.
- No todos los tweets que se van a considerar tienen contenido, por lo que hay que filtrar aquellos que tienen de los que no tienen.
- El programa tendrá 2 parámetros de entrada: el archivo que contiene los sentimientos de los términos y el archivo que contiene los tweets.

In [1]:
import numpy as np
import json  as js

In [2]:
# Function which read the feelings file with name 'filename'.
# Return a dictionary with the words and its feeling.
def readFeelingsFile(filename) :
    data = open(filename)
    feelings = {}
    
    for line in data:
        word, feeling = line.split("\t")
        feelings[word] = int(feeling)
    
    return feelings

In [3]:
# Function which read the tweets file with name 'filename'.
# Return a list with the tweets.
def readTweetsFile(filename) :
    data = open(filename)
    
    tweets = []
    
    for line in data :
        tweets.append(js.loads(line))
    
    return tweets

In [4]:
# Function which gets the feeling of the 'text' param with the feelings in 'feelings' param.
def getTweetFeeling(feelings, text) :
    feeling = 0
    # For each word in tweet's text
    for word in text.split(" ") :
        if word in feelings : 
            # If the word is in feelings, its feeling's amount increments with its feeling in feelings
            feeling += feelings[word]
            
    return feeling

In [5]:
# Function which calculates the word's feeling with the params: 'feelings' and 'tweets'.
# Return a list of string with the word and its feeling.
def calculateWordsFeeling(feelings, tweets) :
    
    # Get the words in feelings with feeling = 0
    wordsWithOutFeeling = [ word for word in feelings if feelings[word] == 0 ]
    
    # Get the tweets with contents
    tweetsWithContents = [ tweet for tweet in tweets if 'delete' not in tweet ]
    
    wordsFeeling = []
    
    # For each word without feeling
    for word in wordsWithOutFeeling :
        amountTweets  = 0 # Amount of tweets which the word appears
        amountFeeling = 0 # Amount of feeling which the word contains
    
        # For each tweet
        for tweet in tweetsWithContents :
            if word in tweet['text'] : # Tweet contains the word
                # Add the tweet's feeling
                amountFeeling += getTweetFeeling(feelings, tweet['text'])
                # Increase amount of tweets
                amountTweets  += 1
        
        if amountTweets != 0 and amountFeeling != 0 :
            # If the word appears in several tweets, its feeling is the mean of all tweet's feelings
            wordsFeeling.append(word + '\t' + str(amountFeeling/amountTweets))
        else :
            # Else, its feeling is 0
            wordsFeeling.append(word + '\t' + str(amountFeeling))
            
    return wordsFeeling

In [6]:
if __name__ == '__main__' :
    
    # Get feelings of the file
    feelings = readFeelingsFile('feelings.txt')
    # Get tweets of the file
    tweets = readTweetsFile('tweets.txt')

    # Calculate tweet's feeling
    wordsFeelings = calculateWordsFeeling(feelings, tweets)
    
    # Show the results:
    for word in wordsFeelings:
        print(word)

playing	0
believe	2.5
mean 	-0.5
everything	3.0
some kind	0
