# Examen Parcial - Análisis Morfológico con NLTK
**Alumno:** Kevin Ramos  
**Materia:** Procesamiento de Lenguaje Natural  
**Herramienta:** Python + NLTK  


## 1. Preparación del Entorno

Se importan las librerías y se descargan todos los paquetes de NLTK necesarios para el examen. Esto previene errores de recursos no encontrados.

In [None]:
import nltk
import os

# Forzar ubicación accesible para NLTK
nltk_data_dir = os.path.join(os.getcwd(), "nltk_data")
if not os.path.exists(nltk_data_dir):
    os.mkdir(nltk_data_dir)

nltk.data.path.append(nltk_data_dir)

# Descarga todos los recursos necesarios
nltk.download('punkt', download_dir=nltk_data_dir)
nltk.download('punkt_tab', download_dir=nltk_data_dir)
nltk.download('averaged_perceptron_tagger', download_dir=nltk_data_dir)
nltk.download('averaged_perceptron_tagger_eng', download_dir=nltk_data_dir)



[nltk_data] Downloading package punkt to /content/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to /content/nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!
[nltk_data] Downloading package averaged_perceptron_tagger to
[nltk_data]     /content/nltk_data...
[nltk_data]   Package averaged_perceptron_tagger is already up-to-
[nltk_data]       date!
[nltk_data] Downloading package averaged_perceptron_tagger_eng to
[nltk_data]     /content/nltk_data...
[nltk_data]   Package averaged_perceptron_tagger_eng is already up-to-
[nltk_data]       date!


True

## 2. Implementación de la función `analisis_morfologico(oracion)`

In [None]:
from nltk import word_tokenize, pos_tag
import json

def analisis_morfologico(oracion):
    tokens = word_tokenize(oracion, language='spanish')
    pos_tags = pos_tag(tokens)  # sin lang='esp'
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3)
    return {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

# Ejemplo
oracion_ejemplo = "El gato negro salta alto y el perro corre rápido por el parque."
resultado_ejemplo = analisis_morfologico(oracion_ejemplo)
print(json.dumps(resultado_ejemplo, indent=4, ensure_ascii=False))


{
    "total_tokens": 14,
    "total_tipos": 13,
    "ratio_tt": 0.929,
    "pos_tags": [
        [
            "El",
            "NNP"
        ],
        [
            "gato",
            "NN"
        ],
        [
            "negro",
            "NN"
        ],
        [
            "salta",
            "NN"
        ],
        [
            "alto",
            "VBP"
        ],
        [
            "y",
            "NN"
        ],
        [
            "el",
            "NN"
        ],
        [
            "perro",
            "NN"
        ],
        [
            "corre",
            "NN"
        ],
        [
            "rápido",
            "NN"
        ],
        [
            "por",
            "NN"
        ],
        [
            "el",
            "NN"
        ],
        [
            "parque",
            "NN"
        ],
        [
            ".",
            "."
        ]
    ]
}


## 3. Pruebas y Resultados

In [None]:
from nltk import word_tokenize, pos_tag
import json

def analisis_morfologico(oracion):
    tokens = word_tokenize(oracion, language='spanish')
    pos_tags = pos_tag(tokens)  # sin lang='esp'
    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3)
    return {
        'total_tokens': total_tokens,
        'total_tipos': total_tipos,
        'ratio_tt': ratio_tt,
        'pos_tags': pos_tags
    }

# Prueba
oracion_ejemplo = "El gato negro salta alto y el perro corre rápido por el parque."
resultado_ejemplo = analisis_morfologico(oracion_ejemplo)
print(json.dumps(resultado_ejemplo, indent=4, ensure_ascii=False))


{
    "total_tokens": 14,
    "total_tipos": 13,
    "ratio_tt": 0.929,
    "pos_tags": [
        [
            "El",
            "NNP"
        ],
        [
            "gato",
            "NN"
        ],
        [
            "negro",
            "NN"
        ],
        [
            "salta",
            "NN"
        ],
        [
            "alto",
            "VBP"
        ],
        [
            "y",
            "NN"
        ],
        [
            "el",
            "NN"
        ],
        [
            "perro",
            "NN"
        ],
        [
            "corre",
            "NN"
        ],
        [
            "rápido",
            "NN"
        ],
        [
            "por",
            "NN"
        ],
        [
            "el",
            "NN"
        ],
        [
            "parque",
            "NN"
        ],
        [
            ".",
            "."
        ]
    ]
}
