# Avance 3. Baseline

# Respuestas a las preguntas
1. **¿Qué algoritmo se puede utilizar como baseline para predecir las variables objetivo?**
   
En nuestro caso, hemos implementado dos modelos basados en los servicios de Azure. El primero se encarga de la clasificación de documentos, mientras que el segundo se dedica a la identificación y extracción de información. Además, ambos algoritmos pueden potenciarse mediante la integración de los modelos preentrenados de Azure Form Recognizer, que aplican técnicas avanzadas de deep learning y transfer learning para optimizar la clasificación y extracción de datos.

2. **¿Se puede determinar la importancia de las características para el modelo generado?**

Si para este caso realizamos el etiquetado de los documentos a clasificar, los cuales tienen caracteristicas notorias como ciertas imagenes, longitud de documento, secciones las cuales son interpretadas por el modeo de clasificación.

Se tienen las siguientes cantidades de datos:

| Mes        | Datos de entrenamiento | Datos de prueba | Total |
|------------|-------------------------|-----------------|-------|
| Diciembre  | 7                       | 3               | 10    |
| Noviembre  | 5                       | 2               | 7     |
| Octubre    | 9                       | 4               | 13    |
| **Total**  | 21                      | 9               | 30    |

Dada la distribución de los actas como primer paso se van a clasificar 21 documentos de la siguiente manera:

| Tipo de Acta               | Cantidad |
|----------------------------|----------|
| FNA Ahorro                 | 12       |
| Fondo nacional del ahorro  | 9        |

Se muestra la clasificación mediante etiquetado a los documentos del conjunto de pruebas:
![Etiquetado](evidencias_avance_3/etiquetado.png "Etiquetado")

Ejecutamos el entrenamiento para generar nuestro modelo:

![Entrenamiento](evidencias_avance_3/entrenamiento.png "Entrenamiento")

Ya teniendo nuestro modelo entrenado con los 21 documentos, vamos a evaluar el modelo con los 9 documentos:

![Evaluación](evidencias_avance_3/evaluacion.png "Evaluación")

A lo cual obtenemos los siguientes resultados:

![Resultados](evidencias_avance_3/resultados.png "Resultados")

3. **¿El modelo está sub/sobreajustando los datos de entrenamiento?**

Se observa que el modelo clasifica correctamente todas las instancias en el conjunto evaluado. Esto indica que el modelo no presenta subajuste (underfitting), ya que está capturando perfectamente los patrones de los datos evaluados.

Sin embargo, es importante considerar lo siguiente:

**Posible Sobreajuste (Overfitting):**
Aunque los resultados son perfectos, si el conjunto de prueba es muy pequeño (en este caso, 9 documentos) o no es suficientemente diverso (por ejemplo, contiene únicamente ejemplos de la clase positiva), estos resultados podrían ser indicativos de un sobreajuste. Es decir, el modelo podría estar memorizando los datos de entrenamiento en lugar de aprender patrones generalizables a nuevos datos.

**Recomendación:**
Se recomienda evaluar el modelo con un conjunto de datos más amplio y representativo, que incluya ejemplos de ambas clases (positiva y negativa), para poder confirmar si el desempeño perfecto se mantiene en condiciones más realistas y verificar que el modelo generaliza correctamente.

4. **¿Cuál es la métrica adecuada para este problema de negocio?**







In [5]:
from sklearn.metrics import accuracy_score, f1_score, roc_auc_score

# Supongamos que "1" representa una clasificación fna_ahorro y fondo_nacional_ahorro .
y_true = [1, 1, 1, 1, 1, 0, 0, 1, 1]  # Etiquetas reales
y_pred = [1, 1, 1, 1, 1, 0, 0, 1, 1]  # Etiquetas predichas

# Calcular Accuracy y F1-score
accuracy = accuracy_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)

# Para calcular AUC-ROC se requieren probabilidades predichas
y_scores = [0.792, 0.773, 0.92, 0.9, 0.96, 0.416, 0.674, 0.783, 0.832]

# Calcular AUC-ROC
try:
    auc = roc_auc_score(y_true, y_scores)
except ValueError as e:
    auc = None
    print("No se pudo calcular AUC-ROC:", e)

print("Accuracy:", accuracy)
print("F1 Score:", f1)
print("AUC-ROC:", auc)


Accuracy: 1.0
F1 Score: 1.0
AUC-ROC: 1.0


Estos resultados indican que, en el conjunto de prueba evaluado, el modelo ha logrado clasificar correctamente todas las instancias. En detalle:

- **Accuracy** de 1.0: Significa que el modelo ha clasificado correctamente el 100% de los documentos.

- **F1 Score** de 1.0: Refleja que tanto la precisión como el recall son perfectos, es decir, no hubo ni falsos positivos ni falsos negativos.

- **AUC-ROC** de 1.0: Sugiere que el modelo tiene una capacidad ideal para diferenciar entre clases.

Por lo cual estas 3 metricas nos permiten entender desde puntos de vistas distintos y mostrar que el modelo es muy bueno y cada uno complementa el entendimiento del mismo.

5. **¿Cuál debería ser el desempeño mínimo a obtener?**

Para el negocio, es fundamental que el sistema de clasificación alcance una precisión del 100% y un AUC-ROC cercano a 1.0. Esto garantiza que el modelo discrimine de manera óptima entre los documentos relevantes y los que no lo son, asegurando que únicamente aquellos correctamente clasificados sean procesados por el modelo de extracción. De esta forma, se mantiene la consistencia de los datos y se optimizan los recursos en etapas posteriores del procesamiento.