<a href="https://colab.research.google.com/github/MonRaes/Processamento-de-Linguagem-Natural/blob/main/Aula_6_AnaliseSemantica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Aula 06** - Interpretação Semântica e Gramáticas
- Compreender os conceitos de **interpretação semântica** e sua importância no Processamento de Linguagem Natural (PLN).
- Explorar **extruturas gramaticas** e seu impacto na análise de textos.
- Aplicar técnicas de **análise semântica** em um corpus textual.
- Utilizar bibliotecas PLN para **extrair significado dos textos**.

### Exemplo 1 - POS Tagging com Spacy

In [1]:
import nltk
from nltk.corpus import wordnet

nltk.download('wordnet')
  # banco de dados para utilização de sinônimos
nltk.download('omw-1.4')
  # Corpus que relaciona as palavras em diversos idiomas - tradução automática

# Método para encontrar os sinônimos da palavra indicada e o idioma
sinonimos = wordnet.synsets("carros", lang="por")

print(sinonimos) # Imprime a lista gerada

for s in sinonimos:
  print(s.lemmas()[0].name()) # Mostra sinônimos da palavra

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


[]


### Exemplo 2 - Representação do significado das palavras e frases por Vetores (embeddings)

In [2]:
!python -m spacy download pt_core_news_md

Collecting pt-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_md-3.8.0/pt_core_news_md-3.8.0-py3-none-any.whl (42.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.4/42.4 MB[0m [31m17.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pt-core-news-md
Successfully installed pt-core-news-md-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [5]:
import spacy

nlp = spacy.load('pt_core_news_md')

palavra1 = nlp('rei')
palavra2 = nlp('rainha')

print(palavra1.similarity(palavra2))

0.6001228094100952


### Exemplo 3 - Árvore Sintática

In [12]:
!python -m spacy download pt_core_news_sm

Collecting pt-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_sm-3.8.0/pt_core_news_sm-3.8.0-py3-none-any.whl (13.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.0/13.0 MB[0m [31m69.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pt-core-news-sm
Successfully installed pt-core-news-sm-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [13]:
import spacy
from spacy import displacy
 # Módulos para visualização de dependências

nlp = spacy.load("pt_core_news_sm")
frase = "Se você fosse você, como seria e o que faria?"
doc = nlp(frase)

displacy.render(doc,style='dep',jupyter=True)

### Exemplo 4 - Ontologia




In [27]:
from owlready2 import *

# Criando uma nova ontologia
onto = get_ontology("https://exemplo.com/minha_ontologia.owl")

with onto:
  class Animal(Thing):pass
  class Mamifero(Animal):pass
  class Cachorro(Mamifero):pass
  class Gato(Mamifero):pass

onto.save("minha_ontologia.owl")

### Aplicação de Análise Semântica em Corpus

In [16]:
# Importando as bibliotecas necessárias
import spacy
import nltk
import pandas as pd

from nltk.corpus import wordnet as wn
  # Banco de dados léxico - agrupa palavras em conjuntos de sinônimos

In [18]:
nltk.download('wordnet')
nltk.download('omw-1.4')

nlp = spacy.load("en_core_web_sm")
  # Acessar as funcionalidades como tokenização, análise sintática e vetores de palavras

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


In [24]:
# 2. Reconhecimento de Entidade Nomeadas (NER)

entities_data = []

for ent in doc.ents:
    entities_data.append(
      {
          "Entidade":ent.text,
          "Tipo":ent.label_
      }
  )

# Convertendo para DataFrame
df_entities = pd.DataFrame(entities_data)
print("\n Reconhecimento de Entidades:")
print(df_entities)


 Reconhecimento de Entidades:
Empty DataFrame
Columns: []
Index: []


In [26]:
# 3. Análise Semântica com WordNet
semantic_data = []

for token in doc:
  synsets = wn.synsets(token.text)
  if synsets:
    semantic_data.append({
        "Palavra":token.text,
        "Significado":synets[0].definition(),
        "Exemplo":synsets[0].examples()
    })

# Convertendo pra DataFrame
df_semantic = pd.DataFrame(semantic_data)
print("\n Análise Semântica:")
print(df_semantic)


 Análise Semântica:
  Palavra                                        Significado Exemplo
0      Se  a toxic nonmetallic element related to sulfur ...      []
1   fosse  a toxic nonmetallic element related to sulfur ...      []
2       e  a toxic nonmetallic element related to sulfur ...      []
3       o  a toxic nonmetallic element related to sulfur ...      []
