<a href="https://colab.research.google.com/github/gucardos/PLN_6sem/blob/main/Aula06_PLN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Exemplo 01 - Representação do significado das palavras e frases com redes semânticas

In [None]:
import nltk
from nltk.corpus import wordnet

nltk.download('wordnet')
  # banco de dados para a utilização do sinônimos
nltk.download('omw-1.4')
  # corpus que relaciona as palavraas em diversos idiomas - tradução automática

# método para encontrar os sinônimos da palavra indicada e o idioma
sinonimos = wordnet.synsets("carro", lang='por')

print(sinonimos) # imprime a lista gerada

for s in sinonimos:
  print(s.lemmas()[0].name()) # mostra os sinonimos da palavra
    # s.lemmas(): obtém a lista de lemmas (formas básicas das palavras) no synset atual
    # [0]: pega o primeiro lema da lista.
    # .name(): obtém o nome do lemma (o sinônimo em sí)
    # print(): imprime o sinônimo na tela

[Synset('beach_wagon.n.01'), Synset('car.n.01'), Synset('car.n.02'), Synset('cart.n.01')]
beach_wagon
car
car
cart


[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


# Exemplo 02 - Representação das palvras e frases por vetores (Embeddings).

In [None]:
!python -m spacy download pt_core_news_md

import spacy

# carregando o modelo pré treinado - modelo com relações entre palavras
nlp = spacy.load('pt_core_news_md')

# criação de objetos com suas informações e vetores
palavra1 = nlp('rei')
palavra2 = nlp('rainha')

# calculo de similaridade dos objetos vetorizados
print(palavra1.similarity(palavra2))

Collecting pt-core-news-md==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_md-3.8.0/pt_core_news_md-3.8.0-py3-none-any.whl (42.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.4/42.4 MB[0m [31m15.9 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.
0.6001228094100952


# Exemplo 03 - Árvore sintática

In [None]:
!python -m spacy download pt_core_news_sm

Collecting pt-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/pt_core_news_sm-3.8.0/pt_core_news_sm-3.8.0-py3-none-any.whl (13.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.0/13.0 MB[0m [31m45.1 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('pt_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [None]:
import spacy
from spacy import displacy
  # módulo para visualização de dependências

nlp = spacy.load('pt_core_news_sm')
frase = "O cachorro correu no parque."
doc = nlp(frase)

displacy.render(doc, style='dep', jupyter=True)

# Exemplo 04 - Ontologia

In [None]:
!pip install owlready2



In [None]:
from owlready2 import *

# Criando uma nova ontologia
onto = get_ontology("http://exemplo.com/minha_ontologia.owl")

with onto:
  class Animal(Thing): pass
  class Mamifero(Animal): pass
  class Cachorro(Mamifero): pass
  class Gato(Mamifero): pass

onto.save(file="minha_ontologia.owl")

# Estudo de Caso 01 - Aplicação de Análise Semântica em corpus

In [None]:
# Importando as bibliotecas necessárias
import spacy
import nltk
import pandas as pd

from nltk.corpus import wordnet as wn
  # banco de dados léxico - agrupa palavras em conjuntos de sinônimos

In [None]:
nltk.download('wordnet')
nltk.download('omw-1.4')

nlp = spacy.load('en_core_web_sm')
  # Acessar as funcionalidades como tokenização, análise sintática e vetores de palavras

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


In [None]:
# Texto de estudo de caso
text = "Apple looking at buying U.K. startup for $1 billion. Steve Jobs founded Apple in 1976."

# 1. Análise Sintática
doc = nlp(text)
syntactic_data = []

for token in doc:
  syntactic_data.append({
      "Token": token.text,
      "Pos-Tag": token.pos_,
      "Dependência": token.dep_,
      "Cabeça da Dep": token.head.text
  })

#Convertendo para DataFrame
df_syntactic = pd.DataFrame(syntactic_data)
print("\n Análise Sintática: ")
print(df_syntactic)


 Análise Sintática: 
      Token Pos-Tag Dependência Cabeça da Dep
0     Apple    NOUN       nsubj       startup
1   looking    VERB         acl         Apple
2        at     ADP        prep       looking
3    buying    VERB       pcomp            at
4      U.K.   PROPN        dobj        buying
5   startup    VERB        ROOT       startup
6       for     ADP        prep       startup
7         $     SYM    quantmod       billion
8         1     NUM    compound       billion
9   billion     NUM        pobj           for
10        .   PUNCT       punct       startup
11    Steve   PROPN    compound          Jobs
12     Jobs   PROPN       nsubj       founded
13  founded    VERB        ROOT       founded
14    Apple   PROPN        dobj       founded
15       in     ADP        prep       founded
16     1976     NUM        pobj            in
17        .   PUNCT       punct       founded


In [None]:
# 2. Reconhecimento de Entidades Nomeadas (NER)
entities_data = []

for ent in doc.ents:
  entities_data.append({
      "Entidade": ent.text,
      "Tipo": ent.label_
  })

# Convertendo para DataFrame
df_entities = pd.DataFrame(entities_data)
print("\n Reconhecimento de Entidades: ")
print(df_entities)


 Reconhecimento de Entidades: 
     Entidade    Tipo
0       Apple     ORG
1        U.K.     GPE
2  $1 billion   MONEY
3  Steve Jobs  PERSON
4       Apple     ORG
5        1976    DATE


In [None]:
# 3. Análise Semântica com WordNet
semantic_data = []

for token in doc:
  synsets = wn.synsets(token.text)
  if synsets:
    semantic_data.append({
        "Palavra": token.text,
        "Significado": synsets[0].definition(),
        "Exemplo": synsets[0].examples()
    })

# Convertendo para DataFrame
df_semantic = pd.DataFrame(semantic_data)
print("\n Análise Semântica: ")
print(df_semantic)



 Análise Semântica: 
    Palavra                                        Significado  \
0     Apple  fruit with red or yellow or green skin and swe...   
1   looking  the act of directing the eyes toward something...   
2        at  a highly unstable radioactive element (the hea...   
3    buying                                  the act of buying   
4      U.K.  a monarchy in northwestern Europe occupying mo...   
5   startup                    the act of setting in operation   
6         1  the smallest whole number or a numeral represe...   
7   billion  the number that is represented as a one follow...   
8      Jobs  the principal activity in your life that you d...   
9   founded                                    set up or found   
10    Apple  fruit with red or yellow or green skin and swe...   
11       in    a unit of length equal to one twelfth of a foot   

                                              Exemplo  
0                                                  []  
1   [he