In [33]:
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_eng')
nltk.download('universal_tagset')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package averaged_perceptron_tagger_eng to
[nltk_data]     /root/nltk_data...
[nltk_data]   Unzipping taggers/averaged_perceptron_tagger_eng.zip.
[nltk_data] Downloading package universal_tagset to /root/nltk_data...
[nltk_data]   Package universal_tagset is already up-to-date!


True

# ‚ö† La libreria nltk no es un modelo oficial para espa√±ol
Al no ser nativo para el idioma espa√±ol, los cambios que hay en este afectan a las funciones al utilizarse en este mismo, por lo que:

En lugar de usar la preparacion de entorno predeterminada:
```python
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_esp')
```
Se us√≥:
```python
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger_eng')
nltk.download('universal_tagset')
```
 A√±adiendo `universal_tagset` y modificando `averaged_perceptron_tagger_eng`

In [34]:

# ==========================
# ‚öôÔ∏è Funci√≥n de an√°lisis morfol√≥gico
# ==========================
def analisis_morfologico(oracion):
    """
    Realiza an√°lisis morfol√≥gico completo de una oraci√≥n en espa√±ol usando NLTK.

    Args:
        oracion (str): Texto en espa√±ol a analizar.

    Returns:
        dict: Diccionario con tokens, tipos, ratio TT y POS tags.
    """
    # Tokenizaci√≥n
    tokens = nltk.word_tokenize(oracion, language='spanish')

    # Etiquetado morfosint√°ctico (POS tagging)
    pos_tags = nltk.pos_tag(tokens, tagset='universal')

    # C√°lculo de estad√≠sticas
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3)

    # Construcci√≥n del resultado
    resultado = {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

    return resultado

# ==========================
# üß™ Ejemplo de uso
# ==========================
oracion_ejemplo = "El gato negro salta alto y el perro corre r√°pido por el parque."
resultado = analisis_morfologico(oracion_ejemplo)

print(resultado)



{'total_tokens': 14, 'total_tipos': 13, 'ratio_tt': 0.929, 'pos_tags': [('El', 'NOUN'), ('gato', 'NOUN'), ('negro', 'NOUN'), ('salta', 'NOUN'), ('alto', 'VERB'), ('y', 'NOUN'), ('el', 'NOUN'), ('perro', 'NOUN'), ('corre', 'NOUN'), ('r√°pido', 'NOUN'), ('por', 'NOUN'), ('el', 'NOUN'), ('parque', 'NOUN'), ('.', '.')]}
