# **TextBlob**

O meu primeiro TextBlob :)

In [42]:
from textblob import TextBlob

atla = TextBlob("Sokka said his first girlfriend turned into the moon.")

### **üó£ _Part-of-speech Tagging_**

O _Part of speech tagging_ (POS _tagging_) √© um processo que atribui uma etiqueta a cada palavra de um texto, tendo em conta a sua defini√ß√£o e o contexto em que esta se encontra. 

Algumas das etiquetas dispon√≠veis:
- **NN:** nome singular
- **PRP$:** pronome possessivo 
- **JJ:** adjetivo
- **VBD:** verbo no passado
- **IN:** preposi√ß√£o
- **DT:** determinante
- **NNP:** nome pr√≥prio

[Refer√™ncia](https://www.guru99.com/pos-tagging-chunking-nltk.html)

In [43]:
atla.tags

[('Sokka', 'NNP'),
 ('said', 'VBD'),
 ('his', 'PRP$'),
 ('first', 'JJ'),
 ('girlfriend', 'NN'),
 ('turned', 'VBD'),
 ('into', 'IN'),
 ('the', 'DT'),
 ('moon', 'NN')]

### **‚õè Extra√ß√£o de _noun phrases_**

In [44]:
atla.noun_phrases

WordList(['sokka'])

### **üòä An√°lise de sentimentos**

A propriedade _sentiment_ retorna um tuplo com a seguinte forma:

        Sentiment(polarity, subjectivity)

no qual:
- **polarity:** float pertencente ao intervalo [-1.0, 1.0], onde valores negativos significam polaridade negativa e valores positivos significam polaridade positiva.
- **subjectivity:** float pertencente ao intervalo [0.0, 1.0], onde 0.0 significa muito objetivo e 1.0 significa muito subjetivo.

In [45]:
phrase = TextBlob("I'm feeling really incredible.")
phrase.sentiment

# Devolver apenas a polaridade
#wiki.sentiment.polarity

# Devolver apenas a subjetividade
#wiki.sentiment.subjectivity

Sentiment(polarity=0.9, subjectivity=0.9)

### **üî™ Tokeniza√ß√£o:**

√â poss√≠vel repartir os TextBlobs em palavras ou em frases:

In [71]:
jude = TextBlob("Hey Jude, don't make it bad. Take a sad song and make it better. "
                "Remember to let her into your heart, then you can start to make it better.")

jude.words

WordList(['Hey', 'Jude', 'do', "n't", 'make', 'it', 'bad', 'Take', 'a', 'sad', 'song', 'and', 'make', 'it', 'better', 'Remember', 'to', 'let', 'her', 'into', 'your', 'heart', 'then', 'you', 'can', 'start', 'to', 'make', 'it', 'better'])

In [72]:
jude.sentences

[Sentence("Hey Jude, don't make it bad."),
 Sentence("Take a sad song and make it better."),
 Sentence("Remember to let her into your heart, then you can start to make it better.")]

**Nota:** Os objetos _sentence_ t√™m as mesmas propriedades e m√©todos que os TextBlobs.

### **üìù Inflex√£o de palavras e lematiza√ß√£o**

Cada palavra presente em TextBlob.words e Sentence.words √© um objeto Word que cont√©m m√©todos √∫teis, como √© o caso da inflex√£o de palavras (colocar palavras no plural ou no singular).

In [73]:
poirot = TextBlob("It is the brain, the little grey cells on which one must rely. One must seek the truth within - not without.")
poirot.words

WordList(['It', 'is', 'the', 'brain', 'the', 'little', 'grey', 'cells', 'on', 'which', 'one', 'must', 'rely', 'One', 'must', 'seek', 'the', 'truth', 'within', 'not', 'without'])

In [74]:
poirot.words[3].pluralize()

'brains'

In [75]:
poirot.words[7].singularize()

'cell'

Os objetos Word podem tamb√©m ser lematizados atrav√©s do m√©todo lemmatize:

In [100]:
from textblob import Word

w1 = Word("cars")
w1.lemmatize()

'car'

In [101]:
w2 = Word("am")

# Indica√ß√£o do part of speech, neste caso um verbo (v)
w2.lemmatize("v")

'be'

### **üìñ Integra√ß√£o do WordNet:**

√â poss√≠vel obter os [synsets](https://www.geeksforgeeks.org/nlp-synsets-for-a-word-in-wordnet/) de um objeto Word, bem como consultar a defini√ß√£o de cada um destes:

In [102]:
w3 = Word("rainbow")
w3.synsets

[Synset('rainbow.n.01'), Synset('rainbow.n.02')]

In [103]:
w3.definitions

["an arc of colored light in the sky caused by refraction of the sun's rays by rain",
 'an illusory hope']

### **üí¨ WordLists**

Uma WordList √© uma lista de Python com m√©todos adicionais.

In [109]:
food = TextBlob("potato salad pastry")
food.words

WordList(['potato', 'salad', 'pastry'])

In [110]:
food.words.pluralize()

WordList(['potatoes', 'salads', 'pastries'])

### **‚ùå Spelling Correction**

In [111]:
wrong = TextBlob("Somewere over te ranbow")
print(wrong.correct())

Somewhere over te rainbow


Objetos do tipo Word possuem o m√©todo spellcheck() que retorna uma lista de tuplos do tipo:

    (word, confidence)

In [115]:
wrong.words[3].spellcheck()

[('rainbow', 1.0)]

O corretor presente nesta biblioteca √© baseado no "How to Write a Spelling Corrector" do Peter Norvig e tem uma _accuracy_ de cerca de 70%.

### **üßÆ Obter a frequ√™ncia de nomes e _noun phrases_**

**1.¬∫ m√©todo:**

In [117]:
poirot.word_counts['one']

2

Este m√©todo n√£o √© _case sensitive_!

**2.¬∫ m√©todo:**

In [118]:
poirot.words.count('one', case_sensitive=True)

1

Este m√©todo permite especificar se a nossa procura √© _case\_sensitive_ ou n√£o atrav√©s do par√¢metro case_sensitive. Contudo, este √© opcional e o seu valor _default_ √© false.

Estes m√©todos podem tamb√©m ser utilizados em _noun phrases_:

In [120]:
poirot.noun_phrases.count('grey cells')

1

### **üññ Parsing** 

In [121]:
anotherPhrase = TextBlob("And the dreams that you dare to dream really do come true.")
print(anotherPhrase.parse())

And/CC/O/O the/DT/B-NP/O dreams/NNS/I-NP/O that/IN/B-PP/B-PNP you/PRP/B-NP/I-PNP dare/VB/B-VP/O to/TO/B-PP/B-PNP dream/NN/B-NP/I-PNP really/RB/B-VP/O do/VBP/I-VP/O come/VB/I-VP/O true/JJ/B-ADJP/O ././O/O


Este m√©todo utiliza a _pattern library_ edificada por Tom de Smedt. O link para a documenta√ß√£o encontra-se indispon√≠vel, por isso n√£o consegui descodificar as tags adicionadas aos texto.

### **üêç Os TextBlobs comportam-se como strings de Python!**