# **3. Análisis de Texto con NLP**
Objetivo: Aplicar análisis de sentimiento usando NLTK.

In [None]:
import nltk
from nltk.sentiment import SentimentIntensityAnalyzer

# Descargar recursos de NLTK
nltk.download('vader_lexicon')

# Inicializar el analizador
sia = SentimentIntensityAnalyzer()

# Frases de ejemplo
frases = [
    "Este producto es increíble, me encanta.",
    "No estoy satisfecho con el servicio.",
    "La calidad es aceptable, pero podría mejorar."
]

# Análisis de sentimiento
for frase in frases:
    print(f"Frase: {frase}")
    print("Análisis de sentimiento:", sia.polarity_scores(frase))

Frase: Este producto es increíble, me encanta.
Análisis de sentimiento: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
Frase: No estoy satisfecho con el servicio.
Análisis de sentimiento: {'neg': 0.306, 'neu': 0.694, 'pos': 0.0, 'compound': -0.296}
Frase: La calidad es aceptable, pero podría mejorar.
Análisis de sentimiento: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}


[nltk_data] Downloading package vader_lexicon to /root/nltk_data...


El idioma no es preciso, usaremos otro modelo de IA

# **Análisis de Sentimiento con transformers en Español**

In [None]:
!pip install transformers

from transformers import pipeline

# Cargar el pipeline de análisis de sentimiento en español
analisis_sentimiento = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")

# Frases de ejemplo
frases = [
    "Este producto es increíble, me encanta.",
    "No estoy satisfecho con el servicio.",
    "La calidad es aceptable, pero podría mejorar."
]

# Realizar el análisis de sentimiento
for frase in frases:
    resultado = analisis_sentimiento(frase)
    print(f"Frase: {frase}")
    print("Resultado del análisis de sentimiento:", resultado)



The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/953 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/669M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/39.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/872k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Frase: Este producto es increíble, me encanta.
Resultado del análisis de sentimiento: [{'label': '5 stars', 'score': 0.899738073348999}]
Frase: No estoy satisfecho con el servicio.
Resultado del análisis de sentimiento: [{'label': '2 stars', 'score': 0.4568404257297516}]
Frase: La calidad es aceptable, pero podría mejorar.
Resultado del análisis de sentimiento: [{'label': '3 stars', 'score': 0.6664752960205078}]


# **Análisis de Texto con spaCy en Español**

In [None]:
import spacy

# Descargar el modelo de lenguaje en español de spaCy
!python -m spacy download es_core_news_sm

# Cargar el modelo de spaCy para español
nlp = spacy.load('es_core_news_sm')

# Frases de ejemplo
frases = [
    "Este producto es increíble, me encanta.",
    "No estoy satisfecho con el servicio.",
    "La calidad es aceptable, pero podría mejorar."
]

# Procesar y analizar las frases
for frase in frases:
    doc = nlp(frase)
    print(f"Frase: {frase}")
    print("Tokens y sus características:")
    for token in doc:
        print(f"{token.text}: {token.pos_}, {token.dep_}")
    print()

Collecting es-core-news-sm==3.7.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_sm-3.7.0/es_core_news_sm-3.7.0-py3-none-any.whl (12.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.9/12.9 MB[0m [31m63.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: es-core-news-sm
Successfully installed es-core-news-sm-3.7.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.
Frase: Este producto es increíble, me encanta.
Tokens y sus características:
Este: DET, det
producto: NOUN, nsubj
es: AUX, cop
increíble: ADJ, ccomp
,: PUNCT, punct
me: PRON, iobj
encanta: VERB, ROOT
.: PUNCT, punct

Frase: No estoy satisfecho c

# **Explicación**
transformers: Los modelos como BERT son más precisos para el análisis de sentimiento porque se han entrenado con datos multilingües y pueden manejar matices del español mejor que NLTK. spaCy: Se usa para tokenizar y analizar texto en español. Es útil para tareas de análisis de texto generales.