<center><img src="images/banner.jpg"></center>

<center><h1>Análisis de sentimientos de las elecciones a la Asamblea de Madrid 2021</h1></center>



## Introducción

El pasado martes 4 de mayo se celebraban las elecciones a la Asamblea de Madrid 2021. Estas elecciones son de alguna forma excepcionales y polémicas desde el mismo instante de su convocatoria. Esto se debe a la pandemia y a la polarización política de los últimos años en España. Así pues, se han saldado con la victoria de los partidos derecha y la derrota de la izquierda, obligando a dos de los principales candidatos a abandonar la política. También hemos asistido a la desaparición del partido Ciudadanos de la Asamblea, empeorando aún más su crisis como partido. 

Por si fuera poco, la campaña electoral se desarrolló bajo un clima de mucha tensión, ya que algunos políticos del país recibieron sobres con balas. En las redes sociales, esta polarización se manifiesta más. Es frecuente ver insultos y descalificaciones en la mayoría de los mensajes.

Las elecciones de Madrid pueden afectar de alguna forma a elecciones futuras. Por tanto, es interesante analizar los sentimientos de los usuarios en redes —en este caso Twitter— con el objetivo de ver cómo se desarrolla esta polarización en todo el país.

### 🟢 Objetivo:

> Realizar un análisis de sentimientos en Twitter para ver el desarrollo de la polarización en España.

### 📚 Librerías

Para conseguir nuestro objetivo, necesitamos las siguientes librerías:

* **Tweepy**: la usaremos para descargar los tweets utilizando la API de Twitter.
* **Pandas**: librería para el análisis de los datos.

In [19]:
import pandas as pd

## TODO: Extracción de tweets

## 🧹 Limpieza de datos

Una vez extraídos los tweets en un archivo CSV, el siguiente paso consiste en eliminar aquellos datos que no son importantes para el análisis. Para ello, vamos a usar la librería `Pandas`, que nos permitirá gestionar los tweets en tablas llamadas *Dataframes*.

In [20]:
# Importamos los datos a un Dataframe
data = pd.read_csv('data.csv', index_col='ID')

data.head()

Unnamed: 0_level_0,Tweets,len,Date,Source,Likes,RTs
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1389716466304491522,"RT @vox_es: ‼ @Santi_ABASCAL ""Son unos buenos ...",139,2021-05-04 22:59:59,Twitter for iPhone,0,0
1389716466195472388,RT @mtgarcia82: Que gane el PP en un barrio ob...,140,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465390080002,"RT @elsitacabello: Ahora sí, lo puedo decir, m...",100,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465205583877,RT @YTanRicamente: Esta casa apoya a @Yolanda_...,140,2021-05-04 22:59:59,Twitter Web App,0,0
1389716462936412164,RT @Juanmi_News: Qué asco tener que ver que lo...,138,2021-05-04 22:59:59,Twitter for Android,0,0


A continuación, vamos a hacer un análisis exploratorio para ver los datos que disponemos. Comprobaremos también si tenemos datos nulos y duplicados.

In [21]:
# Mostramos las filas y columnas del dataframe
data.shape

(1000, 6)

In [22]:
# Comprobamos valores nulos
data.isna().any()

Tweets    False
len       False
Date      False
Source    False
Likes     False
RTs       False
dtype: bool

In [23]:
# Eliminar la cadena 'RT' en los tweets para quedarnos con la información relevante
data['Tweets'] = data['Tweets'].str.replace(r'RT.*:', '', regex=True)
data.head()

Unnamed: 0_level_0,Tweets,len,Date,Source,Likes,RTs
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1389716466304491522,"‼ @Santi_ABASCAL ""Son unos buenos resultados ...",139,2021-05-04 22:59:59,Twitter for iPhone,0,0
1389716466195472388,Que gane el PP en un barrio obrero y pendient...,140,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465390080002,"Ahora sí, lo puedo decir, meteros los aplauso...",100,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465205583877,"Esta casa apoya a @Yolanda_Diaz_, encargada d...",140,2021-05-04 22:59:59,Twitter Web App,0,0
1389716462936412164,Qué asco tener que ver que los que pisotean e...,138,2021-05-04 22:59:59,Twitter for Android,0,0


In [24]:
# Eliminar saltos de línea y retorno para tenerlo todo en una frase
data['Tweets'] = data['Tweets'].str.replace('\n', '')
data['Tweets'] = data['Tweets'].str.replace('\r', '')


Unnamed: 0_level_0,Tweets,len,Date,Source,Likes,RTs
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1389716466304491522,"‼ @Santi_ABASCAL ""Son unos buenos resultados ...",139,2021-05-04 22:59:59,Twitter for iPhone,0,0
1389716466195472388,Que gane el PP en un barrio obrero y pendient...,140,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465390080002,"Ahora sí, lo puedo decir, meteros los aplauso...",100,2021-05-04 22:59:59,Twitter for Android,0,0
1389716465205583877,"Esta casa apoya a @Yolanda_Diaz_, encargada d...",140,2021-05-04 22:59:59,Twitter Web App,0,0
1389716462936412164,Qué asco tener que ver que los que pisotean e...,138,2021-05-04 22:59:59,Twitter for Android,0,0
...,...,...,...,...,...,...
1389716230307782656,Durante muchos años @CiudadanosCs jugó a la am...,140,2021-05-04 22:59:03,Twitter for iPhone,2,0
1389716229296955394,La única lucha que se pierde es la que se aba...,140,2021-05-04 22:59:03,Twitter for iPhone,0,0
1389716228743249921,Grupo de apoyo a #LxsPresxsPoliticxs manifies...,140,2021-05-04 22:59:03,Twitter Web App,0,0
1389716228629954561,//t.co/RVKDJc…,140,2021-05-04 22:59:03,Twitter for Android,0,0
