In [26]:
!pip install -q spacy
!python -m spacy download es_core_news_sm


Collecting es-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_sm-3.8.0/es_core_news_sm-3.8.0-py3-none-any.whl (12.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.9/12.9 MB[0m [31m42.2 MB/s[0m eta [36m0:00:00[0m
[?25h[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [27]:
import spacy
nlp = spacy.load("es_core_news_sm")


In [28]:
def analisis_morfologico(oracion):
    """
    Realiza análisis morfológico completo de una oración en español.

    Args:
        oracion (str): Texto en español a analizar.

    Returns:
        dict: Diccionario con total de tokens, total de tipos,
              ratio tipo-token y etiquetas POS.
    """
    # Procesar el texto con spaCy
    doc = nlp(oracion)

    # Lista de tokens
    tokens = [token.text for token in doc]

    # Total de tokens
    total_tokens = len(tokens)

    # Total de tipos (únicos)
    total_tipos = len(set(tokens))

    # Ratio tipo-token (redondeado a 3 decimales)
    ratio_tt = round(total_tipos / total_tokens, 3) if total_tokens > 0 else 0

    # Etiquetas POS: lista de tuplas (palabra, etiqueta_POS)
    pos_tags = [(token.text, token.pos_) for token in doc]

    # Diccionario de resultados
    resultado = {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

    return resultado


In [29]:
# Ejemplo de prueba
oracion_ejemplo = "El gato negro salta alto y el perro corre rápido por el parque."
resultado = analisis_morfologico(oracion_ejemplo)

print("📊 Resultado del análisis morfológico:")
print(resultado)


📊 Resultado del análisis morfológico:
{'total_tokens': 14, 'total_tipos': 13, 'ratio_tt': 0.929, 'pos_tags': [('El', 'DET'), ('gato', 'NOUN'), ('negro', 'ADJ'), ('salta', 'NOUN'), ('alto', 'ADJ'), ('y', 'CCONJ'), ('el', 'DET'), ('perro', 'PROPN'), ('corre', 'VERB'), ('rápido', 'ADV'), ('por', 'ADP'), ('el', 'DET'), ('parque', 'NOUN'), ('.', 'PUNCT')]}


In [30]:
# Imprimir resultados de forma clara
print(f"Total de tokens: {resultado['total_tokens']}")
print(f"Total de tipos: {resultado['total_tipos']}")
print(f"Ratio tipo-token: {resultado['ratio_tt']}\n")

print("Etiquetas POS:")
for palabra, etiqueta in resultado['pos_tags']:
    print(f"{palabra:15} ➝ {etiqueta}")


Total de tokens: 14
Total de tipos: 13
Ratio tipo-token: 0.929

Etiquetas POS:
El              ➝ DET
gato            ➝ NOUN
negro           ➝ ADJ
salta           ➝ NOUN
alto            ➝ ADJ
y               ➝ CCONJ
el              ➝ DET
perro           ➝ PROPN
corre           ➝ VERB
rápido          ➝ ADV
por             ➝ ADP
el              ➝ DET
parque          ➝ NOUN
.               ➝ PUNCT
