<a href="https://colab.research.google.com/github/Polt3r/PLN/blob/main/Aula_06_Interpreta%C3%A7%C3%A3o_Sem%C3%A2ntica_e_Gram%C3%A1ticas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Resumo da Aula 06 - Análise Semântica e Relações Lexicais

>- Introdução à análise semântica com foco no significado das palavras e suas relações.
- Utilização de WordNet (NLTK) e funcionalidades do SpaCy (português) para:
  - **Consulta de significados (synsets)** e exemplos de uso.
  - **Identificação de relações semânticas** (sinonímia, antonímia, hiperonímia, hiponímia).
  - **Extração de definições** e informações lexicais.
- Organização e visualização de dados semânticos com `pandas` em DataFrames.

---

## Exemplo 01 - Representação do significado das palavras e frases com redes Semânticas.

In [1]:
import nltk
from nltk.corpus import wordnet

nltk.download('wordnet')
# banco de dados para utilização do sinônimos
nltk.download('omw-1.4')
# Corpus que relaciona as palavras em diversos idiomas - tradução automática

# Método para encontrar os sinônimos da palavras indicada e o idioma
sinonimos = wordnet.synsets("carro", lang="por")

print(sinonimos) # imprime a lista gerada

for s in sinonimos:
    print(s.lemmas()[0].name())  # Mostra sinônimos da palavra
    # s.lemmas(): Obtém a lista de lemmas (formas básicas das palavras) no synset atual.
    # [0]: Pega o primeiro lemma da lista.
    # .name(): Obtém o nome do lemma (o sinônimo em si).
    # print(): Imprime o sinônimo na tela.


[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


[Synset('beach_wagon.n.01'), Synset('car.n.01'), Synset('car.n.02'), Synset('cart.n.01')]
beach_wagon
car
car
cart


## Exemplo 02 - Representação do significado das palavras e frases por Vetores (embeddings).

In [2]:
!python -m spacy download pt_core_news_md

import spacy

# Carregando o modelo pre treinado - modelo com relações entre palavras
nlp = spacy.load('pt_core_news_md')

# criação de objetos, com suas informações e vetores
palavra1 = nlp('rei')
palavra2 = nlp('rainha')

# Calculo de similaridade dos objetos vetorizadas
print(palavra1.similarity(palavra2))


Collecting pt-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_md-3.8.0/pt_core_news_md-3.8.0-py3-none-any.whl (42.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.4/42.4 MB[0m [31m15.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pt-core-news-md
Successfully installed pt-core-news-md-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.
0.6001228094100952


# Exemplo 03 - Árvore Sintática

In [3]:
!python -m spacy download pt_core_news_sm

import spacy
from spacy import displacy  # módulo para visualização de dependências

nlp = spacy.load("pt_core_news_sm")
frase = "O cachorro correu no parque."
doc = nlp(frase)

displacy.render(doc, style='dep', jupyter=True)


Collecting pt-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_sm-3.8.0/pt_core_news_sm-3.8.0-py3-none-any.whl (13.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.0/13.0 MB[0m [31m48.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pt-core-news-sm
Successfully installed pt-core-news-sm-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


#Exemplo 04 - Ontologia

In [4]:
!pip install owlready2

from owlready2 import *

# Criando uma nova ontologia
onto = get_ontology("http://exemplo.com/minha_ontologia.owl")

with onto:
  class Animal(Thing): pass
  class Mamifero(Animal): pass
  class Cachorro(Mamifero): pass
  class Gato(Mamifero): pass

onto.save("minha_ontologia.owl")

Collecting owlready2
  Downloading owlready2-0.47.tar.gz (27.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m27.3/27.3 MB[0m [31m39.8 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: owlready2
  Building wheel for owlready2 (pyproject.toml) ... [?25l[?25hdone
  Created wheel for owlready2: filename=owlready2-0.47-cp311-cp311-linux_x86_64.whl size=24577497 sha256=dbe5dc2092f12a8c355e66e4a450473aaff6abfc0e61242106227fded2091afa
  Stored in directory: /root/.cache/pip/wheels/25/9a/a3/fb1ac6339caa859c8bb18d685736168b0b51d851af13d81d52
Successfully built owlready2
Installing collected packages: owlready2
Successfully installed owlready2-0.47


#Estudo de Caso 01 - Aplicação de Análise Semântica em um corpus

In [5]:
# Importando as bibliotecas necessárias
import spacy
import nltk
import pandas as pd

from nltk.corpus import wordnet as wn
# banco de dados léxico - agrupa palavras em conjuntos de sinônimos

nltk.download('wordnet')
nltk.download('omw-1.4')

nlp = spacy.load("en_core_web_sm")
# Acessar as funcionalidades como tokenização, análise sintática e vetores de pala

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


In [6]:
# 1 # 2. Reconhecimento de Entidades Nomeadas (NER)
entities_data = []

for ent in doc.ents:
  entities_data.append({
      "Entidade": ent.text,
      "Tipo": ent.label_
  })

# 10 # Convertendo para DataFrame
df_entities = pd.DataFrame(entities_data)
print("\nReconhecimento de Entidades:")
print(df_entities)


Reconhecimento de Entidades:
Empty DataFrame
Columns: []
Index: []


In [7]:
# 1 # 3. Análise Semântica com WordNet
semantic_data = []

for token in doc:
  synsets = wn.synsets(token.text)
  if synsets:
    semantic_data.append({
        "Palavra": token.text,
        "Significado": synsets[0].definition(),
        "Exemplo": synsets[0].examples()
    })

# 13 # Convertendo para DataFrame
df_semantic = pd.DataFrame(semantic_data)
print("\nAnálise Semântica:")
print(df_semantic)


Análise Semântica:
  Palavra                                        Significado  \
0       O  a nonmetallic bivalent element that is normall...   
1      no                                         a negative   

                       Exemplo  
0                           []  
1  [his no was loud and clear]  
