# TextBlob para Análisis de Sentimiento

[Textblob](http://textblob.readthedocs.org/) es una librería de procesamiento del texto para Python que permite realizar tareas de Procesamiento del Lenguaje Natural como análisis morfológico, extracción de entidades, análisis de opinión, traducción automática, etc. Nosotros nos centraremos en la tarea de análisis de sentimiento basado el léxico. Es una de la más populares junto con VADER. En este ejemplo, veremos algunas de sus características más relevantes.


Está construida sobre otras dos librerías muy famosas de Python: [NLTK](http://www.nltk.org/) y [pattern](http://www.clips.ua.ac.be/pages/pattern-en). La principal ventaja de [textblob](http://textblob.readthedocs.org/) es que permite combinar el uso de las dos herramientas anteriores en un interfaz más simple.

Lo primero es importar el objeto `TextBlob` que nos permite acceder a todas las herramentas que incluye e instalarlo si nuestra distribución lo tuviese. También importaremos la librería nltk y descargaremos:


*  punkt: se descarga los recursos para dividir un texto en tokens.
*  brown: se descarga los recursos para fragmentar frases nominales.
* wordnet: se descarga los recursos para realizar la lematización, entre otras tareas.
* omw-1.4: se descarga los recursos para realizar tareas de lematización y conversiones del singular y plural.
* averaged_perceptron_tagger: se descarga recursos necesarios para hacer análisis morfosintáctico.

In [None]:
from textblob import TextBlob
import nltk
nltk.download('punkt_tab')
nltk.download('brown')
nltk.download('wordnet')
nltk.download('omw-1.4')
nltk.download('averaged_perceptron_tagger_eng')

Se hace uso de la librería deep-translator si necesitamos traducir a otro idioma.

In [None]:
pip install deep-translator

Vamos a crear nuestro primer ejemplo de *textblob* a través del objeto `TextBlob`. Los *textblobs* son como una especie de cadenas de texto de Python, analizadas y enriquecidas con algunas características extra.

In [None]:
texto = "In new lawsuits brought against the ride-sharing companies Uber and Lyft, the top prosecutors in Los Angeles and San Francisco counties make an important point about the lightly regulated sharing economy. The consumers who  participate deserve a very clear picture of the risks they arere taking"

tb = TextBlob(texto)

#Mostramos el objeto textblob
print(tb)

## Procesando oraciones, palabras y entidades

Podemos segmentar en oraciones accediendo a la propiedad `.sentences` e imprimimos por pantalla:

In [None]:
# Dividimos el texto en frases y las mostramos por pantalla
for sentence in tb.sentences:
    print(sentence)
    print("-" * 75)

Segmentamos en palabras accediendo a la propiedad  .words e imprimimos por pantalla:

In [None]:
# Dividimos el texto en palabras y las mostramos por pantalla
print(tb.words)
#print(texto.split())

La propiedad `.noun_phrases` nos permite acceder a la lista de entidades (en realidad, son sintagmas nominales) incluídos en el *textblob*

In [None]:
#Obtenenmos las entidades y lo mostramos por pantalla
print("El texto de ejemplo contiene", len(tb.noun_phrases), "entidades")

#Se muestran por pantalla dichas entidades
for element in tb.noun_phrases:
    print("-", element)

In [None]:
# Haciendo lematización, muestra la palabra, su singular y su plural
for word in tb.words:
    if word.endswith("s"):
        print(word.lemmatize(), word, word.singularize())
    else:
        print(word.lemmatize(), word, word.pluralize())

Otra opción de realizar la lematización es utilizar la propiedad tags, que nos hace un análisis de cada palabra. Permite hacer el procedimiento POS.

In [None]:
# Realizamos un análisis de cada palabra con .tags, luego pasamos a plural solamente
# si es un nombre en singular, o un nombre en plural
for item in tb.tags:
    if item[1] == "NN":
        print(item[0], "-->", item[0].pluralize())
    elif item[1] == "NNS":
        print(item[0], "-->", item[0].singularize())
    else:
        print(item[0], item[0].lemmatize())

## Análisis sintático

Aunque podemos utilizar otros analizadores, por defecto el método `.parse()` invoca al analizador morfosintáctico del módulo  `pattern`.

In [None]:
# Se realiza el análisis
print(tb.parse())

## Corregir errores en el texto

La función correct, permite corregir errores ortográficos en el texto.

In [None]:
# Realizar corrección ortográfica
b1 = TextBlob("I havv goood speling!")
print(b1.correct())

## Traducción automática


A partir de cualquier texto procesado con `TextBlob`, se puede traducir a otro idioma. Se debe indicar la lengua de destino. La lengua de origen, la detecta automáticamente de la frase que se desea traducir.

In [None]:
# Si necesitamos un determinado diccionario, podemos traducir el texto usando la biblioteca deep_translator
from deep_translator import GoogleTranslator

tb_es = TextBlob("La deuda pública ha marcado nuevos récords en España en el tercer trimestre")


print("--------------")
print(GoogleTranslator(source="auto", target="en").translate(tb_es.string))

print("--------------")
print(GoogleTranslator(source="auto", target="fr").translate(tb_es.string))

## Análisis de opinion

En textblob podemos obtener una métrica de polaridad y subjetividad. La polaridad es el sentimiento mismo, que va de -1 a +1. La subjetividad es una medida del sentimiento siendo objetivo a subjetivo, y va de 0 a 1.

In [None]:
# Realizamos un análisis de la opinión 1 y lo mostramos
opinion1 = TextBlob("This new restaurant is great. I had so much fun!! :-P")
print(opinion1.sentiment)

# Realizamos un análisis de la opinión 2 y lo mostramos
opinion2 = TextBlob("Google News to close in Spain.")
print(opinion2.sentiment)

#También se puede solicitar solamente la polaridad o la subjectividad
print(opinion1.sentiment.polarity)
if opinion1.sentiment.subjectivity > 0.5:
    print("Se trata de una opinión")