## Sentiment Analisys
### Input: article lead

## Load Data

In [1]:
import pandas as pd
import numpy as np

In [2]:
df = pd.read_csv('data/izq_econ_news.csv')

In [3]:
inf_izq = df.loc[df.flyer.str.contains('INFLA|INDEC|SUBA|PRECIO', na=False),'lead']
inf_izq = inf_izq.reset_index()
inf_izq.drop('index', axis=1,inplace=True)

In [4]:
df = pd.read_csv('data/derecha_econ_news.csv')

In [5]:
inf_der = df.loc[df.title.str.contains('inflacion|inflación|emisión|salarios|salario|indec', na=False), 'lead']
inf_der.dropna(inplace=True)
inf_der = inf_der.reset_index()
inf_der.drop('index', axis=1,inplace=True)

## Text Blob
Translation with TextBlob and googletrans

In [6]:
from textblob import TextBlob
from googletrans import Translator

#### Parts of Speech(POS) Tagging
#### Spanish VS English (Example)
There are evident issues in the tagging process before translation that lead to the imposibility of getting the sentiment scores.

In [7]:
print(f'Input en español:\n{inf_izq.iloc[0].lead}\n')
text = TextBlob(inf_izq.iloc[0].lead)

print(f'POS: {text.tags}\n')

print(f'Sustantivos: {text.noun_phrases}\n')

print(text.sentiment,'\n')

translator = Translator()
translation = translator.translate(inf_izq.iloc[0].lead, src='es', dest='en')

print(f'Traducción:\n{translation.text}\n')
text = TextBlob(translation.text)

print(f'POS: {text.tags}\n')

print(f'Sustantivos: {text.noun_phrases}\n') 

print(text.sentiment)

Input en español:
Las exportaciones se derrumbaron un 21,6 % respecto al mismo mes del año anterior, la baja más pronunciada de los últimos cinco años. Los exportadores esperan un tipo de cambio más alto.

POS: [('Las', 'NNP'), ('exportaciones', 'NNS'), ('se', 'VBD'), ('derrumbaron', 'NN'), ('un', 'JJ'), ('21,6', 'CD'), ('%', 'NN'), ('respecto', 'NN'), ('al', 'NN'), ('mismo', 'NN'), ('mes', 'NNS'), ('del', 'VBP'), ('año', 'JJ'), ('anterior', 'RB'), ('la', 'FW'), ('baja', 'FW'), ('más', 'FW'), ('pronunciada', 'FW'), ('de', 'FW'), ('los', 'FW'), ('últimos', 'NNP'), ('cinco', 'NN'), ('años', 'NN'), ('Los', 'NNP'), ('exportadores', 'VBZ'), ('esperan', 'JJ'), ('un', 'JJ'), ('tipo', 'NN'), ('de', 'IN'), ('cambio', 'FW'), ('más', 'FW'), ('alto', 'NN')]

Sustantivos: ['las', 'exportaciones se derrumbaron un', '% respecto', 'mismo mes del año anterior', 'baja más pronunciada', 'los últimos cinco años', 'los', 'exportadores esperan un tipo', 'cambio más alto']

Sentiment(polarity=0.0, subjectivi

In [8]:
print(f'Input en español: {inf_der.iloc[0].lead}\n')
text = TextBlob(inf_izq.iloc[0].lead)

print(f'POS: {text.tags}\n')

print(f'Sustantivos: {text.noun_phrases}\n')

print(text.sentiment,'\n')

translator = Translator()
translation = translator.translate(inf_izq.iloc[0].lead, src='es', dest='en')

print(f'Traducción: {translation.text}\n')
text = TextBlob(translation.text)

print(f'POS: {text.tags}\n')

print(f'Sustantivos: {text.noun_phrases}\n') 

print(text.sentiment)

Input en español: Desde la década de 1940 Argentina padece una economía inflacionaria, con la sola excepción del Plan de Convertibilidad entre 1991 y 2001. ¿Qué es la inflación y cuáles fueron las diferentes estrategias utilizadas a lo largo de la historia argentina?

POS: [('Las', 'NNP'), ('exportaciones', 'NNS'), ('se', 'VBD'), ('derrumbaron', 'NN'), ('un', 'JJ'), ('21,6', 'CD'), ('%', 'NN'), ('respecto', 'NN'), ('al', 'NN'), ('mismo', 'NN'), ('mes', 'NNS'), ('del', 'VBP'), ('año', 'JJ'), ('anterior', 'RB'), ('la', 'FW'), ('baja', 'FW'), ('más', 'FW'), ('pronunciada', 'FW'), ('de', 'FW'), ('los', 'FW'), ('últimos', 'NNP'), ('cinco', 'NN'), ('años', 'NN'), ('Los', 'NNP'), ('exportadores', 'VBZ'), ('esperan', 'JJ'), ('un', 'JJ'), ('tipo', 'NN'), ('de', 'IN'), ('cambio', 'FW'), ('más', 'FW'), ('alto', 'NN')]

Sustantivos: ['las', 'exportaciones se derrumbaron un', '% respecto', 'mismo mes del año anterior', 'baja más pronunciada', 'los últimos cinco años', 'los', 'exportadores esperan u

### Datasets - Sentiment Analisys

#### 1. "derecha diario"

Text blob with google translator

In [9]:
translator = Translator()
pol_t = lambda x: np.around(TextBlob(translator.translate(x, src='es', dest='en').text).sentiment.polarity, 3)
sub_t = lambda x: np.around(TextBlob(translator.translate(x, src='es', dest='en').text).sentiment.subjectivity, 3)

In [10]:
inf_der['polarity'] = inf_der.lead.apply(pol_t)
inf_der['subjectivity'] = inf_der.lead.apply(sub_t)

In [11]:
print(f'Polarity: {inf_der.polarity.mean()}\nSubjectivity: {inf_der.subjectivity.mean()}')

Polarity: 0.11063157894736844
Subjectivity: 0.47205263157894733


Text blob wit textblob translator

In [19]:
pol = lambda x: np.around(TextBlob(x).translate(to='en').sentiment.polarity, 3)
sub = lambda x: np.around(TextBlob(x).translate(to='en').sentiment.subjectivity, 3)

In [20]:
inf_der['polarity'] = inf_der.lead.apply(pol)
inf_der['subjectivity'] = inf_der.lead.apply(sub)

HTTPError: HTTP Error 429: Too Many Requests

In [13]:
print(f'Polarity: {inf_der.polarity.mean()}\nSubjectivity: {inf_der.subjectivity.mean()}')

Polarity: 0.11063157894736844
Subjectivity: 0.47205263157894733


#### 2. "izquierda diario"

In [14]:
inf_izq['polarity'] = inf_izq.lead.apply(pol)
inf_izq['subjectivity'] = inf_izq.lead.apply(sub)

URLError: <urlopen error [Errno -3] Temporary failure in name resolution>

In [15]:
print(f'Polarity: {inf_izq.polarity.mean()}\nSubjectivity: {inf_izq.subjectivity.mean()}')

AttributeError: 'DataFrame' object has no attribute 'polarity'

In [16]:
inf_izq['polarity'] = inf_izq.lead.apply(pol_t)
inf_izq['subjectivity'] = inf_izq.lead.apply(sub_t)

In [17]:
print(f'Polarity: {inf_izq.polarity.mean()}\nSubjectivity: {inf_izq.subjectivity.mean()}')

Polarity: 0.059812500000000005
Subjectivity: 0.36806250000000007
