# Aula 06 - Interpretação Semântica e Gramáticas

* Compreender os conceitos de **interpretação semântica** e sua importância no Processamento de Linguagem Natural (PLN).
* Explorar **estruturas gramaticais** e seu impacto na análise de textos.
* Aplicar técnicas de **análise semântica** em um corpus textual.
* Utilizar bibliotecas de PLN para **extrair significado de textos**.

## Exemplo 1 - Representação do significado das palavras e frases com redes semanticas

In [None]:
import nltk
from nltk.corpus import wordnet

In [None]:
nltk.download('wordnet')
# banco de dados para utilização do sinônimos

nltk.download('omw-1.4')

# Corpus que relaciona as palavras em diversos idiomas - tradução automatica

# Metodo para encontrar os sinonimos da palavra indicada e o idioma

sinonimos = wordnet.synsets("carro", lang="por")

print(sinonimos) # imprimi a lista gerada

for s in sinonimos:
  print(s.lemmas()[0].name()) # Mostra sinônimos da palavra

  # s.lemmas(): obtém a lista de lemmas (formas básicas das palavras) no synset atual.
  # [0]: Pega o primeiro lemma da lista
  # .name(): Obtém o nome do lemma (o sinonimo em si)
  # print(): Imprime o sinonimo na tela



[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


[Synset('beach_wagon.n.01'), Synset('car.n.01'), Synset('car.n.02'), Synset('cart.n.01')]
beach_wagon
car
car
cart


[nltk_data]   Package omw-1.4 is already up-to-date!


## Exemplo 2 - Representação do significado das palavras e frases por Vetores (embeddings)


In [None]:
!python -m spacy download pt_core_news_md

Collecting pt-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_md-3.8.0/pt_core_news_md-3.8.0-py3-none-any.whl (42.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.4/42.4 MB[0m [31m14.5 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [None]:
import spacy

# carregando o modelo pré treinado - modelo com relações entre palavras

nlp = spacy.load('pt_core_news_md')

# criação de objetos, com suas informações e vetores

palavra1 = nlp('rei')
palavra2 = nlp('rainha')

# Calculo de similaridade dos objetos vetorizados
print(palavra1.similarity(palavra2))

0.6001228094100952


## Exemplo 3 - Árvore sintatica

In [None]:
!python -m spacy download pt_core_news_sm

Collecting pt-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_sm-3.8.0/pt_core_news_sm-3.8.0-py3-none-any.whl (13.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.0/13.0 MB[0m [31m84.8 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pt-core-news-sm
Successfully installed pt-core-news-sm-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [None]:
import spacy
from spacy import displacy

# modulo para visualização de dependencias

nlp = spacy.load("pt_core_news_sm")

frase = "O cachorro correu no parque"

doc = nlp(frase)

displacy.render(doc, style='dep', jupyter=True)



## Exemplo 04 - Ontologia

In [None]:
!pip install owlready2

Collecting owlready2
  Downloading owlready2-0.47.tar.gz (27.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m27.3/27.3 MB[0m [31m48.4 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: owlready2
  Building wheel for owlready2 (pyproject.toml) ... [?25l[?25hdone
  Created wheel for owlready2: filename=owlready2-0.47-cp311-cp311-linux_x86_64.whl size=24577498 sha256=3abebc73d1ee663376d473b65146afc62e9b4903e2e09d3ff4b8dcc626727d94
  Stored in directory: /root/.cache/pip/wheels/25/9a/a3/fb1ac6339caa859c8bb18d685736168b0b51d851af13d81d52
Successfully built owlready2
Installing collected packages: owlready2
Successfully installed owlready2-0.47


In [None]:
from owlready2 import *

# Criando uma nova ontologia

onto = get_ontology("http://exemplo.com/minha_ontologia.owl")

with onto:
  class Animal(Thing):pass
  class Mamifero(Animal):pass
  class Cachorro(Mamifero):pass
  class Gato(Mamifero):pass

  onto.save("minha ontologia.owl")



# Estudo de caso 1 - Aplicação de Análise Semantica em um corpus

In [None]:
# Importanto as bibliotecas necessárias

import spacy
import nltk
import pandas as pd

from nltk.corpus import wordnet as wn

# banco de dados léxico - agrupa palavras em conjuntos de sinônimos

nltk.download('wordnet')
nltk.download('omw-1.4')

nlp = spacy.load("en_core_web_sm")

# Acessar as funcionalidades como tokenização, análise sintática e vetores de palavras

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


In [None]:
#2. Reconhecimento de Entidades nomeadas (NER)

entities_data = []

for ent in doc.ents:
  entities_data.append({
      "Entidade": ent.text,
      "Tipo": ent.label_
  })

  # Convertendo para DataFrame

  df_entities = pd.DataFrame(entities_data)

  print("\n Reconhecimento de Entidades")

  print(df_entities)

In [None]:
# 3. Análise Semantica com WordNet

semantic_data = []

for token in doc:
    synsets = wn.synsets(token.text)
    if synsets:
      semantic_data.append({
          "Palavra": token.text,
          "Significado": synsets[0].definition(),
          "Exemplo": synsets[0].examples()
      })

  # Convertendo para DataFrame

df_semantic = pd.DataFrame(semantic_data)
print("\n Análise Semântica: ")
print(df_semantic)




 Análise Semântica: 
  Palavra                                        Significado  \
0       O  a nonmetallic bivalent element that is normall...   
1      no                                         a negative   

                       Exemplo  
0                           []  
1  [his no was loud and clear]  
