# Examen: Análisis Morfológico con NLTK
## Información del Examen
**Materia:** Procesamiento de Lenguaje Natural

**Herramientas:** Python, NLTK, Google Colab

**Duración estimada:** 45 minutos

**Dificultad:** Intermedia


## Instrucciones tecnicas
1. Crear una rama ``` git checkout -b QuelaliGaston/ExamenParcial ```
2. Subir el cuaderno (archivo) con el nombre `ExamenParcial.ipynb` dentro de la carpeta `examen-parcila` en tu rama.
## Instrucciones Generales
1. Implemente la función solicitada en Google Colab
2. Use únicamente las bibliotecas especificadas
3. Comente su código adecuadamente
4. Pruebe con los casos de prueba proporcionados
5. Prepare un breve análisis de los resultados

## Ejercicio practico: Análisis Morfológico
### Enunciado Completo
Implemente una función `analisis_morfologico(oracion)` que reciba una cadena de texto en español y retorne un diccionario con la siguiente información:
- **total_tokens**: número total de tokens en la oración
- **total_tipos**: número de tipos únicos (vocabulario)
- **ratio_tt**: ratio tipo-token (tipos/tokens) redondeado a 3 decimales
- **pos_tags**: lista de tuplas (palabra, etiqueta_POS) para cada token



## Preparacion del entorno

---



### codigo base para implementar

In [21]:
!pip install spacy
!python -m spacy download es_core_news_sm

Collecting es-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_sm-3.8.0/es_core_news_sm-3.8.0-py3-none-any.whl (12.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.9/12.9 MB[0m [31m94.6 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: es-core-news-sm
Successfully installed es-core-news-sm-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [22]:
# 1. Preparación del entorno
import spacy

In [23]:
# Cargar modelo de español
nlp = spacy.load("es_core_news_sm")

In [27]:
def analisis_morfologico_spacy(oracion):
    doc = nlp(oracion)

    tokens = [token.text for token in doc]
    pos_tags = [(token.text, token.pos_) for token in doc]

    total_tokens = len(tokens)
    total_tipos = len(set(tokens))
    ratio_tt = round(total_tipos / total_tokens, 3)

    return {
        "Tokens": tokens,
        "Total Tokens": total_tokens,
        "Tipos": total_tipos,
        "Ratio TT": ratio_tt,
        "POS Tags": pos_tags
    }

oracion = "El gato negro salta alto y el perro corre rápido por el parque."
resultado = analisis_morfologico_spacy(oracion)

print("🔹 Tokens:", resultado["Tokens"])
print("🔹 Total de Tokens:", resultado["Total Tokens"])
print("🔹 Tipos únicos:", resultado["Tipos"])
print("🔹 Ratio TT:", resultado["Ratio TT"])
print("🔹 Etiquetas POS:")
for palabra, etiqueta in resultado["POS Tags"]:
    print(f"   {palabra} → {etiqueta}")

🔹 Tokens: ['El', 'gato', 'negro', 'salta', 'alto', 'y', 'el', 'perro', 'corre', 'rápido', 'por', 'el', 'parque', '.']
🔹 Total de Tokens: 14
🔹 Tipos únicos: 13
🔹 Ratio TT: 0.929
🔹 Etiquetas POS:
   El → DET
   gato → NOUN
   negro → ADJ
   salta → NOUN
   alto → ADJ
   y → CCONJ
   el → DET
   perro → PROPN
   corre → VERB
   rápido → ADV
   por → ADP
   el → DET
   parque → NOUN
   . → PUNCT


## **Funciones a utilizar:**

nltk.word_tokenize() para tokenización en español

nltk.pos_tag() para etiquetado POS

## **Cálculos requeridos:**
**Tokens:** Conteo de todos los elementos tokenizados

**Tipos:** Conteo de elementos únicos (case-sensitive)

**Ratio TT:** total_tipos / total_tokens (redondeado a 3 decimales)