<a href="https://colab.research.google.com/github/Thayane25/PLN/blob/main/Aula_06_An%C3%A1lise_Sem%C3%A2ntica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Aula 06 - Análise Semântica
### tem como objetivo apresentar conceitos e exemplos práticos de análise semântica em Processamento de Linguagem Natural (PLN). Ele aborda representações do significado de palavras e frases por meio de redes semânticas (como o WordNet) e vetores (embeddings), utilizando ferramentas como o NLTK. O notebook visa demonstrar como extrair, interpretar e representar semanticamente informações textuais.

#Exemplo 01 - Representação do significado das palavras e frases com redes

In [1]:
import nltk
from nltk.corpus import wordnet

nltk.download('wordnet')  # Download do WordNet para sinônimos
nltk.download('omw-1.4')  # Download do corpus de palavras em vários idiomas

# Encontra os sinônimos da palavra "sand" e seu significado
sinonimos = wordnet.synsets("sand")

print(sinonimos)  # Imprime a lista de sinônimos encontrados

for s in sinonimos:
    print(s.lemmas()[0].name())  # Mostra cada sinônimo encontrado



[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


[Synset('sand.n.01'), Synset('sand.n.02'), Synset('backbone.n.02'), Synset('sandpaper.v.01')]
sand
Sand
backbone
sandpaper


## Exemplo 02 - Representação do significado das palavras e frases por vetores (embeddings)


In [None]:
!pip install spacy
!python -m spacy download pt_core_news_md

Collecting pt-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_md-3.8.0/pt_core_news_md-3.8.0-py3-none-any.whl (42.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.4/42.4 MB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [None]:
import spacy

nlp = spacy.load('pt_core_news_md')

# Criação de objetos, com suas informações e vetores
palavra1 = nlp('rei')
palavra2 = nlp('rainha')

# Calculo de similaridades dos objetos vetorizados
print(palavra1.similarity(palavra2))

0.6001228094100952


## Exemplo 03 - Árvore Sintática

In [None]:
import spacy
from spacy import displacy
  # Módulo para visualização de dependencias

nlp = spacy.load('pt_core_news_md')
frase = "O cachorro correu no parque."
doc = nlp(frase)

displacy.render(doc, style='dep', jupyter=True)

In [None]:
##Exemplo 04 - Ontologia

In [None]:
!pip install owlready2

Collecting owlready2
  Downloading owlready2-0.47.tar.gz (27.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m27.3/27.3 MB[0m [31m46.1 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: owlready2
  Building wheel for owlready2 (pyproject.toml) ... [?25l[?25hdone
  Created wheel for owlready2: filename=owlready2-0.47-cp311-cp311-linux_x86_64.whl size=24577498 sha256=fef7550680e926e8395600eebf99196926370368535c3b7550d338561f34e587
  Stored in directory: /root/.cache/pip/wheels/25/9a/a3/fb1ac6339caa859c8bb18d685736168b0b51d851af13d81d52
Successfully built owlready2
Installing collected packages: owlready2
Successfully installed owlready2-0.47


In [None]:
from owlready2 import *

# Criando uma nova ontologia
onto = get_ontology("http://exemplo.com/minha_ontologia.owl")

with onto:
  class Animal(Thing): pass
  class Mamifero(Animal): pass
  class cachorro(Mamifero): pass
  class Gato(Mamifero): pass

  onto.save("minha_ontologia.owl")

## Estudo de Caso 01 - Aplicação de Análise Semântica em um corpus

In [None]:
# Importando as bibliotecas necessárias
import spacy
import nltk
import pandas as pd

from nltk.corpus import wordnet as wn


In [None]:
nltk.download('wordnet')
nltk.download('omw-1.4')

nlp = spacy.load("en_core_web_sm")

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


In [None]:
# Texto de estudo de caso
text = "Apple is looking at buying U.K. startup for $1 billion. Steve Jobs founded Apple"

# 1. Análise Sintática
doc = nlp(text)
syntatic_data = []

for token in doc:
  syntatic_data.append({
      "Token": token.text,
      "Pos-Tag": token.pos_,
      "Dependência": token.dep_,
      "Cabeça da Dep": token.head.text
  })

  # Convertendo para DataFrame
  df_syntatic = pd.DataFrame(syntatic_data)
  print("\n Análise Sintática:")
  print(df_syntatic)


 Análise Sintática:
   Token Pos-Tag Dependência Cabeça da Dep
0  Apple   PROPN       nsubj       looking

 Análise Sintática:
   Token Pos-Tag Dependência Cabeça da Dep
0  Apple   PROPN       nsubj       looking
1     is     AUX         aux       looking

 Análise Sintática:
     Token Pos-Tag Dependência Cabeça da Dep
0    Apple   PROPN       nsubj       looking
1       is     AUX         aux       looking
2  looking    VERB        ROOT       looking

 Análise Sintática:
     Token Pos-Tag Dependência Cabeça da Dep
0    Apple   PROPN       nsubj       looking
1       is     AUX         aux       looking
2  looking    VERB        ROOT       looking
3       at     ADP        prep       looking

 Análise Sintática:
     Token Pos-Tag Dependência Cabeça da Dep
0    Apple   PROPN       nsubj       looking
1       is     AUX         aux       looking
2  looking    VERB        ROOT       looking
3       at     ADP        prep       looking
4   buying    VERB       pcomp            at

 Aná

In [None]:
# 2. Reconhecimento de Entidades Nomeadas (NER)
entities_data = []

for ent in doc.ents:
  entities_data.append({
      "Entidade": ent.text,
      "Tipo": ent.label_
  })

  # Convertendo para DataFrame
  df_entities = pd.DataFrame(entities_data)
  print("\n Reconhecimento de Entidades:")
  print(df_entities)


 Reconhecimento de Entidades:
  Entidade Tipo
0    Apple  ORG

 Reconhecimento de Entidades:
  Entidade Tipo
0    Apple  ORG
1     U.K.  GPE

 Reconhecimento de Entidades:
     Entidade   Tipo
0       Apple    ORG
1        U.K.    GPE
2  $1 billion  MONEY

 Reconhecimento de Entidades:
     Entidade    Tipo
0       Apple     ORG
1        U.K.     GPE
2  $1 billion   MONEY
3  Steve Jobs  PERSON

 Reconhecimento de Entidades:
     Entidade    Tipo
0       Apple     ORG
1        U.K.     GPE
2  $1 billion   MONEY
3  Steve Jobs  PERSON
4       Apple     ORG


In [None]:
# 3. Análise Semântica com WordNet
semantic_data = []

for token in doc:
  synsets = wn.synsets(token.text)
  if synsets:
    semantic_data.append({
        "Palavra": token.text,
        "Significado": synsets[0].definition(),
        "Exemplo": synsets[0].examples()
    })

    # Convertendo para DataFrame
    df_semantic = pd.DataFrame(semantic_data)
    print("\n Análise Semântica:")
    print(df_semantic)


 Análise Semântica:
  Palavra                                        Significado Exemplo
0   Apple  fruit with red or yellow or green skin and swe...      []

 Análise Semântica:
  Palavra                                        Significado  \
0   Apple  fruit with red or yellow or green skin and swe...   
1      is  have the quality of being; (copula, used with ...   

                                     Exemplo  
0                                         []  
1  [John is rich, This is not a good answer]  

 Análise Semântica:
   Palavra                                        Significado  \
0    Apple  fruit with red or yellow or green skin and swe...   
1       is  have the quality of being; (copula, used with ...   
2  looking  the act of directing the eyes toward something...   

                                             Exemplo  
0                                                 []  
1          [John is rich, This is not a good answer]  
2  [he went out to have a look, his loo