Módulo 02 Lección 4 - 04 Análisis de caso
# Estructura de datos en Python y sentencias iterativas

**Instrucciones generales Referente:**

El análisis de casos tiene como objetivo permitir a los participantes aplicar de manera práctica los conceptos y habilidades aprendidos en la lección a una situación realista o simulada. Se espera que el caso propuesto presente un desafío concreto, donde los participantes deban analizar, tomar decisiones y proponer soluciones efectivas basadas en su conocimiento

**Situación inicial** 📍
Una empresa de tecnología llamada DataSolvers se especializa en la gestión de grandes volúmenes de datos para diversos clientes, ayudándoles a analizar y organizar su información de manera eficiente. Actualmente, DataSolvers está desarrollando un sistema para analizar y categorizar datos financieros provenientes de diferentes fuentes. En su fase actual, el equipo de desarrollo necesita implementar estructuras de datos eficientes para almacenar y procesar esta información. Debido a la complejidad del proyecto, se enfrentan a un desafío: optimizar el almacenamiento y acceso a los datos mientras utilizan sentencias iterativas para analizar grandes
conjuntos de información. Se espera que el equipo utilice listas, diccionarios y conjuntos en Python para manejar la carga de datos de forma efectiva.

**Descripción del Caso** 🔎
Eres un desarrollador de DataSolvers encargado de liderar la optimización de las estructuras de datos para el sistema de análisis financiero. Tu misión es diseñar una serie de funciones que utilicen sentencias iterativas y estructuras de datos
adecuadas para procesar y analizar los datos financieros, garantizando eficiencia y precisión en los resultados. Tendrás que resolver los siguientes desafíos basándote en los conceptos estudiados.

A partir del mismo, realiza lo siguiente:
1.  **Análisis de la Estructura de Datos**
-  Analiza cómo las estructuras de datos en Python (listas y diccionarios) ayudan a organizar y manipular los datos en el código de ejemplo. Describe las principales ventajas de usar listas para almacenar transacciones y diccionarios para categorizar ingresos.
-  Identifica posibles limitaciones o mejoras al utilizar estas estructuras en el proyecto de DataSolvers.
2.  **Optimización de Sentencias Iterativas**
Explica cómo se pueden optimizar las sentencias iterativas en las funciones calcular_total_ingresos() y filtrar_ingresos_altos() para mejorar la eficiencia.
-  Describe cómo podrías usar expresiones generadoras o comprensión de listas para optimizar estos procesos.
3.  **Implementación de Pruebas para las Funciones**
-   Crea una serie de pruebas para validar que las funciones calcular_total_ingresos(), filtrar_ingresos_altos(), y agrupar_por_categoria() funcionan correctamente con diferentes conjuntos de datos.
-   Implementa una estructura de prueba que incluya datos de prueba representativos y explica cómo verificar los resultados.
4.  **Aplicación de Estructuras de Datos Avanzadas**
-  Investiga cómo podría utilizarse un conjunto (set) en el código para optimizar la verificación de categorías únicas en el sistema financiero.
-  Describe los beneficios de utilizar conjuntos en Python para tareas de deduplicación y acceso rápido en comparación con listas.
5.  Refactorización del Código**
-  Utilizando el análisis previo, refactoriza el código base para incorporar las mejoras propuestas. Implementa comprensión de listas y optimiza el uso de estructuras de datos para que el sistema sea más eficiente.

<br>

### Código dado

In [1]:
import pandas as pd
from collections import defaultdict

In [2]:
class AnalizadorFinanciero:
    # Calcula el total de ingresos en una lista de transacciones
    def calcular_total_ingresos(self, transacciones):
        total = 0
        for ingreso in transacciones:
            total += ingreso
        return total
    # Filtra y retorna solo los ingresos mayores a un umbral dado
    def filtrar_ingresos_altos(self, transacciones, umbral):
        ingresos_altos = []
        for ingreso in transacciones:
            if ingreso > umbral:
               ingresos_altos.append(ingreso)
        return ingresos_altos
    # Agrupa ingresos en un diccionario por categorías
    def agrupar_por_categoria(self, transacciones, categorias):
        agrupado = {}
        for categoria, ingreso in zip(categorias, transacciones):
            if categoria in agrupado:
                agrupado[categoria].append(ingreso)
            else:
                agrupado[categoria] = [ingreso]
        return agrupado

In [3]:
cat = ["Salud", "Educación", "Salud"]
tran = [100, 200, 150]

In [4]:
af = AnalizadorFinanciero()
a = af.agrupar_por_categoria(tran,cat)
a

{'Salud': [100, 150], 'Educación': [200]}

### Posibles mejoras

In [5]:
class AnalizadorFinanciero:
    # Optimización expresón generada + validación isintance()
    def calcular_total_ingresos(self, transacciones):
        return sum(ingreso for ingreso in transacciones if isinstance(ingreso, (int, float)))
    # Optimización compresión de lista + validación isintance()
    def filtrar_ingresos_altos(self, transacciones, umbral):
        return [ingreso for ingreso in transacciones if isinstance(ingreso, (int, float)) and ingreso > umbral]
    def agrupar_por_categoria(self, transacciones, categorias):
        agrupado = {}
        for categoria, ingreso in zip(categorias, transacciones):
            if categoria in agrupado:
                agrupado[categoria].append(ingreso)
            else:
                agrupado[categoria] = [ingreso]
        return agrupado

In [6]:
# Instancia de la clase AnalizadorFinanciero
af = AnalizadorFinanciero()
# Lista con las etiquetas de las transacciones
cat = ["Salud", "Educación", "Salud", "Vivienda", "Salud"]
# lista con las Transacciones
tran = [100, 200, 150, 350, 300]
# Calcular Total de Ingresos por medio del método calcular_total_ingresos de la clase AnalizadorFinanciero
tot_ing = af.calcular_total_ingresos(tran)
print(f"El Valor Total de los ingresos es: ${tot_ing}")
"""
Obtener Altos Ingresos (mayores a $200 dolares) por medio del método 
filtrar_ingresos_altos de la clase AnalizadorFinanciero
"""
ing_alt = af.filtrar_ingresos_altos(tran, 200)
print(f"Los Ingresos Altos (mayores a 200 dolares) son: {ing_alt}")
"""
Obtener los Ingresos agrupados por Categorías mediante el método agrupar_por_categoria
de la clase AnalizadorFinanciero
"""
ing_group = af.agrupar_por_categoria(tran, cat)
print(f"Los Ingresos agrupados por categoría son: {ing_group}")

El Valor Total de los ingresos es: $1100
Los Ingresos Altos (mayores a 200 dolares) son: [350, 300]
Los Ingresos agrupados por categoría son: {'Salud': [100, 150, 300], 'Educación': [200], 'Vivienda': [350]}


### Verificación de Categorías duplicadas

In [7]:
cat = ["Salud", "Educación", "Salud", "Vivienda", "Salud"]
cat_unique = set(cat)
cat_unique

{'Educación', 'Salud', 'Vivienda'}

### Refactorización el código

In [8]:
class AnalizadorFinanciero:
    # Optimización con expresión generadora + validación de tipo
    def calcular_total_ingresos(self, transacciones):
        return sum(
            ingreso for ingreso in transacciones
            if isinstance(ingreso, (int, float))
        )

    # Optimización con comprensión de lista + validación de tipo
    def filtrar_ingresos_altos(self, transacciones, umbral):
        return [
            ingreso for ingreso in transacciones
            if isinstance(ingreso, (int, float)) and ingreso > umbral
        ]

    # Agrupación eficiente usando zip + defaultdict
    def agrupar_por_categoria(self, transacciones, categorias):
        agrupado = defaultdict(list)
        for categoria, ingreso in zip(categorias, transacciones):
            agrupado[categoria].append(ingreso)
        return dict(agrupado)

    # Obtener categorías únicas usando set
    def obtener_categorias_unicas(self, categorias):
        return set(categorias)

In [9]:
af = AnalizadorFinanciero()
cat = ["Salud", "Educación", "Salud", "Vivienda", "Salud"]
tran = [100, 200, 150, 350, 300]
ing_group = af.agrupar_por_categoria(tran, cat)
ing_group

{'Salud': [100, 150, 300], 'Educación': [200], 'Vivienda': [350]}

<br>

**Observación:**

Se adjunta en el Moodle del Bootcamp el documento *reporte_analisis_de_caso* que contiene el resultado y la explicación del análisis solicitado para su posterior evaluación. 