In [1]:
!pip install spacy



In [2]:
!python -m spacy download es_core_news_sm

Collecting es-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_sm-3.8.0/es_core_news_sm-3.8.0-py3-none-any.whl (12.9 MB)
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m12.9/12.9 MB[0m [31m109.3 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m‚úî Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_sm')
[38;5;3m‚ö† Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [5]:
import spacy
import pandas as pd

# Cargamos el modelo de spaCy en espa√±ol
nlp = spacy.load("es_core_news_sm")

# Diccionario de equivalencias POS (Ingl√©s ‚Üí Espa√±ol)
etiquetas_es = {
    "ADJ": "Adjetivo",
    "ADP": "Preposici√≥n",
    "ADV": "Adverbio",
    "AUX": "Verbo auxiliar",
    "CCONJ": "Conjunci√≥n coordinante",
    "DET": "Determinante / Art√≠culo",
    "INTJ": "Interjecci√≥n",
    "NOUN": "Sustantivo",
    "NUM": "N√∫mero",
    "PART": "Part√≠cula",
    "PRON": "Pronombre",
    "PROPN": "Nombre propio",
    "PUNCT": "Signo de puntuaci√≥n",
    "SCONJ": "Conjunci√≥n subordinante",
    "SYM": "S√≠mbolo",
    "VERB": "Verbo",
    "X": "Otro",
    "SPACE": "Espacio"
}

def analisis_morfologico_spacy(oracion):
    """
    Realiza an√°lisis morfol√≥gico completo de una oraci√≥n en espa√±ol usando spaCy,
    mostrando etiquetas POS traducidas al espa√±ol.
    """
    doc = nlp(oracion)

    # Tokens y etiquetas
    tokens = [token.text for token in doc]
    pos_tags = [(token.text, token.pos_, etiquetas_es.get(token.pos_, "Desconocido")) for token in doc]

    # C√°lculos
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3) if total_tokens > 0 else 0

    # Diccionario resultado
    resultado = {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

    return resultado
oracion_ejemplo = "El gato negro salta alto y el perro corre r√°pido por el parque."
resultado = analisis_morfologico_spacy(oracion_ejemplo)

print("üìä An√°lisis general:")
print(f"Total de tokens: {resultado['total_tokens']}")
print(f"Total de tipos: {resultado['total_tipos']}")
print(f"Ratio tipo/token: {resultado['ratio_tt']}\n")

# Mostrar los tokens y etiquetas en una tabla
df = pd.DataFrame(resultado['pos_tags'], columns=["Token", "Etiqueta_POS", "Etiqueta_ES"])
display(df)


üìä An√°lisis general:
Total de tokens: 14
Total de tipos: 13
Ratio tipo/token: 0.929



Unnamed: 0,Token,Etiqueta_POS,Etiqueta_ES
0,El,DET,Determinante / Art√≠culo
1,gato,NOUN,Sustantivo
2,negro,ADJ,Adjetivo
3,salta,NOUN,Sustantivo
4,alto,ADJ,Adjetivo
5,y,CCONJ,Conjunci√≥n coordinante
6,el,DET,Determinante / Art√≠culo
7,perro,PROPN,Nombre propio
8,corre,VERB,Verbo
9,r√°pido,ADV,Adverbio
