In [1]:
!pip install spacy



In [2]:
!python -m spacy download es_core_news_sm

Collecting es-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_sm-3.8.0/es_core_news_sm-3.8.0-py3-none-any.whl (12.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.9/12.9 MB[0m [31m109.3 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [5]:
import spacy
import pandas as pd

# Cargamos el modelo de spaCy en español
nlp = spacy.load("es_core_news_sm")

# Diccionario de equivalencias POS (Inglés → Español)
etiquetas_es = {
    "ADJ": "Adjetivo",
    "ADP": "Preposición",
    "ADV": "Adverbio",
    "AUX": "Verbo auxiliar",
    "CCONJ": "Conjunción coordinante",
    "DET": "Determinante / Artículo",
    "INTJ": "Interjección",
    "NOUN": "Sustantivo",
    "NUM": "Número",
    "PART": "Partícula",
    "PRON": "Pronombre",
    "PROPN": "Nombre propio",
    "PUNCT": "Signo de puntuación",
    "SCONJ": "Conjunción subordinante",
    "SYM": "Símbolo",
    "VERB": "Verbo",
    "X": "Otro",
    "SPACE": "Espacio"
}

def analisis_morfologico_spacy(oracion):
    """
    Realiza análisis morfológico completo de una oración en español usando spaCy,
    mostrando etiquetas POS traducidas al español.
    """
    doc = nlp(oracion)

    # Tokens y etiquetas
    tokens = [token.text for token in doc]
    pos_tags = [(token.text, token.pos_, etiquetas_es.get(token.pos_, "Desconocido")) for token in doc]

    # Cálculos
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3) if total_tokens > 0 else 0

    # Diccionario resultado
    resultado = {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

    return resultado
oracion_ejemplo = "El gato negro salta alto y el perro corre rápido por el parque."
resultado = analisis_morfologico_spacy(oracion_ejemplo)

print("📊 Análisis general:")
print(f"Total de tokens: {resultado['total_tokens']}")
print(f"Total de tipos: {resultado['total_tipos']}")
print(f"Ratio tipo/token: {resultado['ratio_tt']}\n")

# Mostrar los tokens y etiquetas en una tabla
df = pd.DataFrame(resultado['pos_tags'], columns=["Token", "Etiqueta_POS", "Etiqueta_ES"])
display(df)


📊 Análisis general:
Total de tokens: 14
Total de tipos: 13
Ratio tipo/token: 0.929



Unnamed: 0,Token,Etiqueta_POS,Etiqueta_ES
0,El,DET,Determinante / Artículo
1,gato,NOUN,Sustantivo
2,negro,ADJ,Adjetivo
3,salta,NOUN,Sustantivo
4,alto,ADJ,Adjetivo
5,y,CCONJ,Conjunción coordinante
6,el,DET,Determinante / Artículo
7,perro,PROPN,Nombre propio
8,corre,VERB,Verbo
9,rápido,ADV,Adverbio
