In [33]:
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_eng')
nltk.download('universal_tagset')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package averaged_perceptron_tagger_eng to
[nltk_data]     /root/nltk_data...
[nltk_data]   Unzipping taggers/averaged_perceptron_tagger_eng.zip.
[nltk_data] Downloading package universal_tagset to /root/nltk_data...
[nltk_data]   Package universal_tagset is already up-to-date!


True

# ⚠ La libreria nltk no es un modelo oficial para español
Al no ser nativo para el idioma español, los cambios que hay en este afectan a las funciones al utilizarse en este mismo, por lo que:

En lugar de usar la preparacion de entorno predeterminada:
```python
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_esp')
```
Se usó:
```python
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_eng')
nltk.download('universal_tagset')
```
 Añadiendo `universal_tagset` y modificando `averaged_perceptron_tagger_eng`

In [34]:

# ==========================
# ⚙️ Función de análisis morfológico
# ==========================
def analisis_morfologico(oracion):
    """
    Realiza análisis morfológico completo de una oración en español usando NLTK.

    Args:
        oracion (str): Texto en español a analizar.

    Returns:
        dict: Diccionario con tokens, tipos, ratio TT y POS tags.
    """
    # Tokenización
    tokens = nltk.word_tokenize(oracion, language='spanish')

    # Etiquetado morfosintáctico (POS tagging)
    pos_tags = nltk.pos_tag(tokens, tagset='universal')

    # Cálculo de estadísticas
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3)

    # Construcción del resultado
    resultado = {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

    return resultado

# ==========================
# 🧪 Ejemplo de uso
# ==========================
oracion_ejemplo = "El gato negro salta alto y el perro corre rápido por el parque."
resultado = analisis_morfologico(oracion_ejemplo)

print(resultado)



{'total_tokens': 14, 'total_tipos': 13, 'ratio_tt': 0.929, 'pos_tags': [('El', 'NOUN'), ('gato', 'NOUN'), ('negro', 'NOUN'), ('salta', 'NOUN'), ('alto', 'VERB'), ('y', 'NOUN'), ('el', 'NOUN'), ('perro', 'NOUN'), ('corre', 'NOUN'), ('rápido', 'NOUN'), ('por', 'NOUN'), ('el', 'NOUN'), ('parque', 'NOUN'), ('.', '.')]}
