# Paso 1: Limpieza de tweets (opcional)

In [None]:
import tweepy
import pandas as pd
from textblob import TextBlob 
import re 

##SENTIMENT ANALYSIS

def clean_tweet_text(tweet): 
        ''' 
        Utility function to clean tweet text by removing links, special characters 
        using simple regex statements. 
        '''
        return ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)", " ", tweet).split())
  


# Paso 2: Función de análisis de sentimiento para textos en inglés

Con la función de la librería TextBlob *sentiment.polarity* podemos obtener un número asociado al sentimiento de cada tweet. Esto se obtiene comparándolo de forma interna con un corpus de sentimiento. 

Completa el if statement con la polaridad *neutral* y *negative*.

In [None]:
def get_tweet_sentiment(tweet): 
        ''' 
        Utility function to classify sentiment of passed tweet 
        using textblob's sentiment method 
        '''
        # create TextBlob object of passed tweet text 
        analysis = TextBlob(tweet) 
        # set sentiment 
        if analysis.sentiment.polarity > 0: 
            return 'positive'
       #Completa el if statement con la polaridad neutral y negative.
        elif analysis.sentiment.polarity == 0: 
            return 'neutral'
        else: 
            return 'negative'
        

# Paso 3: Cargar csv y procesar sentiment 

In [None]:
if __name__ == "__main__": 
    
    #cargamos los datos del csv a fetched_tweets
    #fetched_tweets = pd.read_csv("_________.csv", header=0, usecols=['Text'])
    fetched_tweets = pd.read_csv("_____.csv")
  
    print(fetched_tweets.head())

    try:
        # relacionando text con sentiment 
        sentiment_sum = {'text': [], 'sentiment': []}  

        #iteramos la columna para extraer el sentimiento de cada tweet
        for index, tweet in fetched_tweets.iterrows(): 

                parsed_tweet = {}
                
                # almacenamos texto original
                parsed_tweet['text'] =  tweet['Tweet'] #coge sólo la columna 'Text'
                
                # almacenamos sentimiento 
                parsed_tweet['sentiment'] = get_tweet_sentiment(parsed_tweet['text'])  #llama a la función get_tweet_sentiment
                
                #guarda en las listas sentiment_sum cada uno de los valores de parsed_tweet

                sentiment_sum['text'].append(........)
                sentiment_sum['sentiment'].append(...........)

    except tweepy.TweepError as e: 
        print("Error : " + str(e))     

    #ahora cada uno de nuestros tweets tiene una polaridad asignada
    print(sentiment_sum)

            Created_at  ...                                              Tweet
0           Created_at  ...                                              Tweet
1           Created_at  ...                                              Tweet
2  2020-04-28 22:37:22  ...  No se porque seguís intentando entender la #De...
3  2020-04-28 22:37:20  ...  #Desescalada\n\n#FASE6 MANIFESTACIÓN NACIONAL ...
4  2020-04-28 22:37:10  ...  Recordamos que en la fase 1 no estará permitid...

[5 rows x 4 columns]
{'text': ['Tweet', 'Tweet', 'No se porque seguís intentando entender la #Desescalada cuando todos los fin de año os explican las campanadas para… https://t.co/9HB3OvSal2', '#Desescalada\n\n#FASE6 MANIFESTACIÓN NACIONAL CONTRA EL ACTUAL GOBIERNO SOCIALCOMUNISTA QUE HA TRAÍDO ESTA CRISIS A L… https://t.co/3FGaK3Zb4i', 'Recordamos que en la fase 1 no estará permitido ir a teletrabajar a casa de tu amante.\n#desescalada #boe #medidas… https://t.co/JFbtaijtDD', 'El Gobierno aprueba un Plan de #desescalad

# Paso 4: Copiar sentiment en CSV

In [None]:
    df2 = fetched_tweets.assign(sentiment = sentiment_sum['sentiment']) 
    df2.to_csv(path_or_buf = ".csv", encoding="utf-8")

# Paso 5: Análisis del sentimiento en castellano con MeaningCloud

* Crea una cuenta para tener el acceso a su API
https://www.meaningcloud.com/developer/create-account

* En esta sección encontrarás en API key
https://www.meaningcloud.com/developer/account/subscriptions

* En el siguiente enlace encontrarás la documentación de Sentiment Analysis
https://www.meaningcloud.com/developer/sentiment-analysis/doc/2.1/response

El primer paso será instalar la librería con pip

In [None]:
!pip install meaningCloud-python

Collecting meaningCloud-python
  Downloading https://files.pythonhosted.org/packages/66/e9/4db96ee81f815db0636134c280fe5a13ac6a85e025c4128ef14af6cacc51/MeaningCloud_python-1.2.2-py2.py3-none-any.whl
Collecting pyOpenSSL>=0.14; extra == "security"
[?25l  Downloading https://files.pythonhosted.org/packages/9e/de/f8342b68fa9e981d348039954657bdf681b2ab93de27443be51865ffa310/pyOpenSSL-19.1.0-py2.py3-none-any.whl (53kB)
[K     |████████████████████████████████| 61kB 2.8MB/s 
[?25hCollecting cryptography>=1.3.4; extra == "security"
[?25l  Downloading https://files.pythonhosted.org/packages/3c/04/686efee2dcdd25aecf357992e7d9362f443eb182ecd623f882bc9f7a6bba/cryptography-2.9.2-cp35-abi3-manylinux2010_x86_64.whl (2.7MB)
[K     |████████████████████████████████| 2.7MB 7.6MB/s 
Installing collected packages: meaningCloud-python, cryptography, pyOpenSSL
Successfully installed cryptography-2.9.2 meaningCloud-python-1.2.2 pyOpenSSL-19.1.0



Navegando en su API llegamos al Github donde tienen alojados ejemplos de llamadas a la API en Python


In [None]:
#Credits to MeaningCloud Support Team

import sys
import meaningcloud

model = 'IAB_en'

license_key = ''

#text = 'Me encantan los macarrones de mi madre en Madrid.'

text = 'London is a very nice city but I also love Madrid.'

 
try: 

    # SENTIMENT API CALL
 
    sentiment_response = meaningcloud.SentimentResponse(
    meaningcloud.SentimentRequest(license_key, lang='en', txt=text, txtf='plain').sendReq())
    
    #full JSON sentiment_response.getResponse()

    if sentiment_response.isSuccessful():
      print("\tSentiment detected: "+sentiment_response.getGlobalScoreTag()+"\n")
  

except ValueError:
    e = sys.exc_info()[0]
    print("\nException: " + str(e)) 


	Sentiment detected: P+



In [None]:
    #full JSON 
    sentiment_response.getResponse()


{'agreement': 'AGREEMENT',
 'confidence': '98',
 'irony': 'NONIRONIC',
 'model': 'general_en',
 'score_tag': 'P+',
 'sentence_list': [{'agreement': 'AGREEMENT',
   'bop': 'y',
   'confidence': '98',
   'endp': '49',
   'inip': '0',
   'score_tag': 'P+',
   'segment_list': [{'agreement': 'AGREEMENT',
     'confidence': '98',
     'endp': '25',
     'inip': '0',
     'polarity_term_list': [{'confidence': '98',
       'endp': '20',
       'inip': '17',
       'score_tag': 'P+',
       'sentimented_concept_list': [{'endp': '25',
         'form': 'city',
         'id': '817857ee40',
         'inip': '22',
         'score_tag': 'P+',
         'type': 'Top>Location>GeoPoliticalEntity>City',
         'variant': 'city'}],
       'sentimented_entity_list': [{'endp': '5',
         'form': 'London',
         'id': '01d0d69c7d',
         'inip': '0',
         'score_tag': 'P+',
         'type': 'Top>Location>GeoPoliticalEntity>City',
         'variant': 'London'}],
       'text': '(very) nice'}],
 

Vamos a analizar el objeto respuesta con Pandas

In [None]:
import pandas as pd 


for key, value in sentiment_response.getResults().items():
     print(key, '->', value)


model -> general_en
score_tag -> P+
agreement -> AGREEMENT
subjectivity -> SUBJECTIVE
confidence -> 98
irony -> NONIRONIC
sentence_list -> [{'text': 'London is a very nice city but I also love Madrid.', 'inip': '0', 'endp': '49', 'bop': 'y', 'confidence': '98', 'score_tag': 'P+', 'agreement': 'AGREEMENT', 'segment_list': [{'text': 'London is a very nice city', 'segment_type': 'main', 'inip': '0', 'endp': '25', 'confidence': '98', 'score_tag': 'P+', 'agreement': 'AGREEMENT', 'polarity_term_list': [{'text': '(very) nice', 'inip': '17', 'endp': '20', 'confidence': '98', 'score_tag': 'P+', 'sentimented_entity_list': [{'form': 'London', 'id': '01d0d69c7d', 'variant': 'London', 'inip': '0', 'endp': '5', 'type': 'Top>Location>GeoPoliticalEntity>City', 'score_tag': 'P+'}], 'sentimented_concept_list': [{'form': 'city', 'id': '817857ee40', 'variant': 'city', 'inip': '22', 'endp': '25', 'type': 'Top>Location>GeoPoliticalEntity>City', 'score_tag': 'P+'}]}]}, {'text': 'I also love Madrid', 'segment

Podemos adaptar el código del Paso 3 a la nueva función de Meaning Cloud.

Recuerda completar el nombre del fichero del que lees y la llamada a la función de MeaningCloud.

In [None]:
import tweepy
import pandas as pd
import time

#cargamos los datos del csv a fetched_tweets
fetched_tweets = pd.read_csv("data_clean_11jun.csv")

fetched_tweets = fetched_tweets[0:30] 
print(fetched_tweets.head())
    
try:
        # relacionando text con sentiment 
        sentiment_sum = {'text': [], 'sentiment': []}  
        
        for index, tweet in fetched_tweets.iterrows(): 

            sentiment_response = meaningcloud.SentimentResponse(
            meaningcloud.SentimentRequest(license_key, lang='es', txt=tweet['Tweet'], txtf='plain').sendReq())
            
            #guarda en las listas sentiment_sum cada uno de los valores de parsed_tweet
            parsed_tweet = {}
                
            # almacenamos texto original
            parsed_tweet['text'] =  tweet['Tweet'] #coge sólo la columna 'Tweet'
                
            # almacenamos sentimiento 
            parsed_tweet['sentiment'] = sentiment_response.getGlobalScoreTag() #llama a la función get_tweet_sentiment
                
            #guarda en las listas sentiment_sum cada uno de los valores de parsed_tweet

            sentiment_sum['text'].append(parsed_tweet['text'])
            sentiment_sum['sentiment'].append(parsed_tweet['sentiment'])

            time.sleep(1)

except tweepy.TweepError as e: 
    print("Error : " + str(e))     

#ahora cada uno de nuestros tweets tiene una polaridad asignada
print(sentiment_sum)

   Unnamed: 0  ...                                              Tweet
0           0  ...  Desde  afirman que las ayudas articuladas medi...
1           1  ...  Participa en nuestra Asamblea General Ordinari...
2           2  ...  Ahora que llega la  se pondrá a prueba el futu...
3           3  ...  Más claro agua Aunque también se puede decir O...
4           4  ...  Recopilación de medidas y normativa relacionad...

[5 rows x 5 columns]
{'text': ['Desde  afirman que las ayudas articuladas mediante el  sólo tienen una intención estética y aseg… ', 'Participa en nuestra Asamblea General Ordinaria y Electoral\n\nJueves 25 de junio \n11 horas\nAuditorio Victor Villega… ', 'Ahora que llega la  se pondrá a prueba el futuro del  La arraigadísima tradición del presen… ', 'Más claro agua Aunque también se puede decir O jugamos todos o se rompe la baraja\nVía  ', 'Recopilación de medidas y normativa relacionadas con el  😷\n\nConsulta el estado de situación aquí 📲… ', 'Ayudas para  y  de  frente

Ahora vamos a añadir la columna 'Sentiment' al DataFrame inicial y vamos a volcar todo el contenido a un nuevo fichero CSV

In [None]:
df2 = fetched_tweets.assign(sentiment = sentiment_sum['sentiment']) 
df2.to_csv(path_or_buf = "tweet_sentiment.csv", encoding="utf-8")

In [None]:
df2.head(20)

Unnamed: 0.1,Unnamed: 0,Created_at,User_name,Location,Tweet,sentiment
0,0,2020-06-11 10:11:27,elfaradio,,Desde afirman que las ayudas articuladas medi...,P
1,1,2020-06-11 10:10:04,AJERegionMurcia,Región de Murcia,Participa en nuestra Asamblea General Ordinari...,P
2,2,2020-06-11 10:09:18,FernandoM_Badas,"Madrid, Comunidad de Madrid",Ahora que llega la se pondrá a prueba el futu...,NONE
3,3,2020-06-11 10:05:29,mr_nac,Burgos,Más claro agua Aunque también se puede decir O...,NEU
4,4,2020-06-11 10:05:21,camaravalencia,"Valencia, España",Recopilación de medidas y normativa relacionad...,N
5,5,2020-06-11 10:04:07,pyrasesores,Palma de Mallorca,Ayudas para y de frente al \n\n,NONE
6,6,2020-06-11 10:01:11,centrobuendia,Universidad de Valladolid,❗️ Estas son las novedades de la para la de ...,NONE
7,7,2020-06-11 10:00:26,LocuraFood,,Pretzels salados rellenos con sabor miel y del...,P+
8,8,2020-06-11 10:00:20,vivendibc,"c. París, 45-47, entlo. 3ª. 08",La flexibilidad es la clave para volver al tra...,P
9,9,2020-06-11 10:00:17,FaroPontevedra,"Pontevedra, Galicia",📸 GALERÍA\nReencuentros a pie de estación padr...,NONE


MeaningCloud también posee extracción de *topics* más comunes así como detección automática del idioma o clusterización

In [None]:
text = 'London is a very nice city but I also love Madrid.'

try:
    # We are going to make a request to the Topics Extraction API
    topics_response = meaningcloud.TopicsResponse(meaningcloud.TopicsRequest(license_key, txt=text, lang='en',
                                                                             topicType='e').sendReq())

    # If there are no errors in the request, we print the output
    if topics_response.isSuccessful():
        print("\nThe request to 'Topics Extraction' finished successfully!\n")

        entities = topics_response.getEntities()
        if entities:
            print("\tEntities detected (" + str(len(entities)) + "):\n")
            for entity in entities:
                print("\t\t" + topics_response.getTopicForm(entity) + ' --> ' +
                      topics_response.getTypeLastNode(topics_response.getOntoType(entity)) + "\n")

        else:
            print("\tNo entities detected!\n")
    else:
        if topics_response.getResponse() is None:
            print("\nOh no! The request sent did not return a Json\n")
        else:
            print("\nOh no! There was the following error: " + topics_response.getStatusMsg() + "\n")

 

except ValueError:
    e = sys.exc_info()[0]
    print("\nException: " + str(e))