## Ejemplo 6: Análisis de Sentimientos

### 1. Objetivos:
    - Aprender a realizar un análisis de sentimientos utilizando TextBlob
    
---
    
### 2. Desarrollo:

El análisis de sentimientos se refiere al uso del procesamiento de lenguaje natural para identificar y extraer información subjetiva de nuestros textos. La información subjetiva tiene que ver con los afectos: desde un punto de vista subjetivo, ¿qué tan positiva o negativa es esta oración?

Hoy en día se utiliza machine learning para hacer análisis de sentimientos, pero como método de introducción al tema, nosotros vamos a utilizar una librería llamada `TextBlob`. `TextBlob` está construida sobre `nltk` y nos da una interfaz sumamente sencilla para realizar análisis de sentimientos. Exploremos un poco nuestro dataset con esta herramienta.

> Lamentablemente, TextBlob sólo puede realizar análisis de sentimientos en inglés, alemán y francés. Es posible traducir de español a inglés usando TextBlob, aunque los resultados no son enteramente satisfactorios.

In [58]:
import pandas as pd
import nltk
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

In [59]:
df = pd.read_csv('../Prototype/tweets_Infonavit.csv')

df.head()

Unnamed: 0,texts_Infonavit
0,conferenciapresidenteel director del infonavit...
1,este ano infonavit ha entregadomil creditos pa...
2,este ano infonavit ha entregadomil creditos pa...
3,en la conferencia matutina el secretario meyer...
4,atendemos el rezago de vivienda producto del n...


In [60]:
grouped_by_title = df.groupby('texts_Infonavit')['texts_Infonavit'].max()
grouped_by_title = grouped_by_title.str.lower()
grouped_by_title = grouped_by_title.str.strip()
grouped_by_title = grouped_by_title.str.replace('[^\w\s]', '')
grouped_by_title = grouped_by_title.str.replace('\d', '')
grouped_by_title = grouped_by_title.str.replace('\\n', '')
grouped_by_title = grouped_by_title.dropna()

In [45]:
grouped_by_title

texts_Infonavit
" imprescindible guia "\n\ngarcia luna su jefefelipecalderonsus secuaces sabian mucho demasiado mas no...                     imprescindible guia garcia luna su jefefelipe...
"recordarle a la gente que el ahorro que tienen en infonavit es de ellos estamos atendiendo a gente que no se ate...         recordarle a la gente que el ahorro que tienen...
"supera infonavit enla meta original de colocacion de unamos credito" gutierrez porter\nmas demil finan...                   supera infonavit enla meta original de colocac...
...                                                                                                                                                                           
a\ninfonavit                                                                                                                                                        ainfonavit
                                                                                                             

Ahora, para poder utilizar `textBlob` hay que correr los siguientes comandos:

`pip install textblob`

`python3 -m textblob.download_corpora`

In [61]:
from textblob import TextBlob

In [47]:
# Crear un objeto TextBlob

TextBlob(grouped_by_title.iloc[100])

TextBlob("canadevinac gonzalomendez infonavit pues no hay calidad en las casas tiene sadasioficial escombrobasurabote")

In [48]:
analysis = "This table is black"
analysis

'This table is black'

In [57]:
df_traslate = TextBlob(analysis).translate(to='es')
df_traslate

TextBlob("Esta mesa es negra")

In [56]:
grouped_by_title(['texts_Infonavit'])

TypeError: 'Series' object is not callable

In [20]:
df_traslate = TextBlob(df['texto']).translate(to='en')

TypeError: The `text` argument passed to `__init__(text)` must be a string, not <class 'pandas.core.series.Series'>

In [7]:
# Obteniendo análisis de sentimientos

TextBlob(grouped_by_title.iloc[100]).sentiment

Sentiment(polarity=0.0, subjectivity=0.0)

'polarity' va de -1 a 1, -1 siendo extremadamente negativo y 1 siendo extremadamente positivo.

'subjectivity' va de 0 a 1, 0 siendo muy objetivo y 1 siendo muy subjetivo.

In [None]:
# Vamos a crear una columna que nos indique la polaridad de todas nuestras descripciones

polarity = grouped_by_title.apply(lambda x: TextBlob(x).sentiment.polarity)
polarity.name = 'polarity'

In [None]:
df_with_polarity = pd.concat([grouped_by_title, polarity], axis=1)

In [None]:
# Vamos a eliminar las polaridades neutrales

df_with_polarity['polarity'] != 0

In [None]:
no_neutral = df_with_polarity[df_with_polarity['polarity'] != 0]

In [None]:
sns.displot(no_neutral['polarity'], kde=False);

In [None]:
sns.boxplot(x=no_neutral['polarity']);

In [None]:
no_neutral[no_neutral['polarity'] > 0.75]['description']

In [None]:
# Como puedes ver, al modelo no es muy exacto. Esta descripción, por ejemplo, no es en realidad feliz

no_neutral.loc["LOVE THE ONE YOU'RE WITH", 'description']

In [None]:
no_neutral.loc["LOVE THE ONE YOU'RE WITH", 'polarity']

In [None]:
no_neutral[no_neutral['polarity'] < -0.75]['description']

In [None]:
# Esta sí es una descripción con bastantes tintes negativos

no_neutral.loc["KINDRED IN DEATH", 'description']

In [None]:
no_neutral.loc["KINDRED IN DEATH", 'polarity']

Hoy en día existen modelos mucho más precisos para realizar análisis de sentimientos, todos ellos utilizando machine learning para el entrenamiento. Aunque `TextBlob` es algo viejo y por lo tanto no muy preciso, resulta útil para realizar análisis rápidos y generales de nuestros datos.