#Procesamiento de lenguaje natural

In [1]:
!pip install nltk



In [2]:
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize

In [3]:
# Descargamos recursos necesarios de NLTK
nltk.download('punkt')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt.zip.


True

In [4]:
# Texto de ejemplo
texto = "Hola a todos, bienvenidos al curso de Python. Hoy aprenderemos sobre procesamiento de lenguaje natural. @josecodetech"

In [5]:
# Tokenizacion de palabras
tokens_palabras = word_tokenize(texto)
print("Tokens de palabras: ", tokens_palabras)

Tokens de palabras:  ['Hola', 'a', 'todos', ',', 'bienvenidos', 'al', 'curso', 'de', 'Python', '.', 'Hoy', 'aprenderemos', 'sobre', 'procesamiento', 'de', 'lenguaje', 'natural', '.', '@', 'josecodetech']


In [6]:
# Tokenizamos oraciones
tokens_oraciones = sent_tokenize(texto)
print("Tokens de oraciones: ", tokens_oraciones)

Tokens de oraciones:  ['Hola a todos, bienvenidos al curso de Python.', 'Hoy aprenderemos sobre procesamiento de lenguaje natural.', '@josecodetech']


#Lematizacion

In [7]:
import nltk
from nltk.stem import WordNetLemmatizer

In [8]:
# Descarga de recursos
nltk.download('wordnet')
nltk.download('omw-1.4')

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...


True

In [9]:
# Creamos el lematizador
lemmatizer = WordNetLemmatizer()

In [20]:
# Palabras de ejemplo
palabras = ["gatos", "corriendo", "estupendo", "mejor", "mejorado", "correrá"]


In [21]:
# Lematizacion de palabras
lemas = [lemmatizer.lemmatize(palabra) for palabra in palabras]
print("Lemas: ", lemas)

Lemas:  ['gatos', 'corriendo', 'estupendo', 'mejor', 'mejorado', 'correrá']


#Analisis de sentimientos

In [22]:
!pip install textblob



In [23]:
from textblob import TextBlob

In [66]:
# Texto de ejemplo
texto = "Este curso es fantastico!, voy a compartirlo en redes con el hashtag #cursoPython de @josecodetech"

In [67]:
# Crear un objeto
blob = TextBlob(texto)

In [69]:
# Analizamos el sentimiento
sentimiento = blob.sentiment
print("Polaridad:",sentimiento.polarity)
print("Subjetividad:",sentimiento.subjectivity)

Polaridad: 0.0
Subjetividad: 0.0


#Ejercicio practico

In [70]:
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
from nltk.stem import WordNetLemmatizer
from textblob import TextBlob

In [71]:
# Descarga de recursos
nltk.download('punkt')
nltk.download('wordnet')
nltk.download('omw-1.4')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


True

In [72]:
# Texto de ejemplo
texto = "Hola a todos, bienvenidos al curso de Python. Hoy aprenderemos sobre procesamiento de lenguaje natural. @josecodetech. El curso es bueno, vamos a aprender mucho."

In [73]:
# Tokenizacion de palabras y oraciones
tokens_palabras = word_tokenize(texto)
tokens_oraciones = sent_tokenize(texto)
print("Tokens de palabras: ", tokens_palabras)
print("Tokens de oraciones: ", tokens_oraciones)

Tokens de palabras:  ['Hola', 'a', 'todos', ',', 'bienvenidos', 'al', 'curso', 'de', 'Python', '.', 'Hoy', 'aprenderemos', 'sobre', 'procesamiento', 'de', 'lenguaje', 'natural', '.', '@', 'josecodetech', '.', 'El', 'curso', 'es', 'bueno', ',', 'vamos', 'a', 'aprender', 'mucho', '.']
Tokens de oraciones:  ['Hola a todos, bienvenidos al curso de Python.', 'Hoy aprenderemos sobre procesamiento de lenguaje natural.', '@josecodetech.', 'El curso es bueno, vamos a aprender mucho.']


In [74]:
# Lematizacion
lemmatizer = WordNetLemmatizer()
lemas = [lemmatizer.lemmatize(palabra) for palabra in tokens_palabras]
print("Lemas: ", lemas)

Lemas:  ['Hola', 'a', 'todos', ',', 'bienvenidos', 'al', 'curso', 'de', 'Python', '.', 'Hoy', 'aprenderemos', 'sobre', 'procesamiento', 'de', 'lenguaje', 'natural', '.', '@', 'josecodetech', '.', 'El', 'curso', 'e', 'bueno', ',', 'vamos', 'a', 'aprender', 'mucho', '.']


In [75]:
# Analisis de sentimientos
blob = TextBlob(texto)
sentimiento = blob.sentiment
print("Polaridad:",sentimiento.polarity)
print("Subjetividad:",sentimiento.subjectivity)

Polaridad: 0.1
Subjetividad: 0.4
