# Reto: Analisis descriptivo

## Objetivo:


*   Identificar y clasificar la información del problema con el que se desea
 trabajar.
*   Integrar los conocimientos adquiridos para manipular la información disponible en un archivo de texto
*   Sintetizar los datos disponibles a través de Python

## Introducción
 Vamos a trabajr con la hipótesis de que con la información recabada podría explicar **el fenómeno de  deserción laboral** que tanto afecta en la actualidad a las empresas y organizaciones.

 En esta primera aproximación, queremos saber:

 a) Cuál es la edad promedio de los empleados durante en  las fechas en las que se recabo la información.

 b) La mayoría son hombres o mujeres.


## A continuación realizamos el paso a paso de la resolución.

### Paso 1:
Vamos a trabajar con el archivo Employees-1.csv.
Lo primero que hacemos es definir una función que abra el archivo desde el entorno local.

In [None]:
def abri_archivo():
    """
    Este método abre el archivo CSV que contiene los datos de empleados.

    Args:
        No recibe argumentos.

    Returns:
        Retorna un manejador de archivo abierto (file handler) con el encabezado ya saltado.
    """
    # Abrir un archivo con open() y close()
    file_handler = open('Employees-1.csv')
    # Saltamo el encabezado porque no lo necesitamos para trabajar
    next(file_handler)
    return file_handler

### Paso 2:
Desarrollamos la función para calcular el promedio de edad de los empleados en base a los datos del archivo.

In [None]:
def calcularPromedio(file_handler):
    """
    Este método calcula la edad promedio de los empleados presentes en el archivo.

    Args:
        file_handler: Objeto de archivo abierto, apuntando a un archivo CSV ya sin encabezado.

    Returns:
        No retorna ningún valor. Imprime por pantalla:
            - La suma total de edades válidas.
            - La cantidad total de empleados considerados.
            - La edad promedio redondeada con 2 decimales.
    """
    edad_total = cantidad_empleados = 0
    for linea in file_handler:
        lst = linea.strip().split(',')
        if lst[2] != 'NA' and lst[2] != '':
            try:
                edad = int(lst[2])
                edad_total += edad
                cantidad_empleados += 1
            except ValueError:
                continue

    # Mostrar resultados
    print("Sumatoria de Edad de toda la Muestra: ", edad_total)
    print("Cantidad total de empleados: ", cantidad_empleados)
    try:
        promedio = round(edad_total / cantidad_empleados, 2)
        print("Promedio de edad de la muestra: ", promedio)
    except ZeroDivisionError:
        print("No hay datos válidos para calcular promedio.")


    # Cerramos el archivo
    file_handler.close()

### Paso 3:
Desarrollamos la función para calcular si hay más mujeres que hombres en la muestra, o al revés.

In [None]:
def mayoriaMuestra(file_handler):
    """
    Este método determina si hay más hombres o mujeres en la muestra del archivo.

    Args:
        file_handler: Objeto de archivo abierto, apuntando a un archivo CSV ya sin encabezado.

    Returns:
        No retorna ningún valor. Imprime por pantalla qué género es mayoritario
        junto con el total de personas de cada uno.
    """
    cantidad_hombres = cantidad_mujeres = 0
    for linea in file_handler:
        lst = linea.strip().split(',')
        if lst[1] != 'NA' and lst[1] != '':
            try:
                genero = lst[1]
                if genero == "F":
                    cantidad_mujeres +=1
                else:
                    cantidad_hombres += 1
            except ValueError:
                continue
    if cantidad_mujeres > cantidad_hombres:
        print(f"En la muestra hay \033[1mmás mujeres\033[0m que hombres con un total de \033[1m{cantidad_mujeres}\033[0m mujeres sobre \033[1m{cantidad_hombres}\033[0m hombres")
    elif cantidad_hombres > cantidad_mujeres:
        print(f"En la muestra hay \033[1mmás hombres\033[0m que mujeres con un total de \033[1m{cantidad_hombres}\033[0m hombres sobre \033[1m{cantidad_mujeres}\033[0m mujeres")
    else:
        print(f"En la muestra hay \033[1migual cantidad\033[0m de hombres y mujeres: \033[1m{cantidad_hombres}\033[0m")

### Paso 4:
Llamamos a la función para abrir el archivo y luego llamamos a la función para calcular el promedio de edad.

In [None]:
file = abri_archivo()
calcularPromedio(file)

Sumatoria de Edad de toda la Muestra:  261035
Cantidad total de empleados:  6588
Promedio de edad de la muestra:  39.62


### Paso 5:
Llamamos a la función para abrir nuevamente el archivo y luego llamamos a la función para verificar si hay más mujeres que hombres en la muestra.

Se llama de nuevo a la función para cargar el archivo porque el cursor quedó al final tras la manipulación realizada en la función calcularPromedio.


In [None]:
file = abri_archivo()
mayoriaMuestra(file)

En la muestra hay [1mmás mujeres[0m que hombres con un total de [1m4114[0m mujeres sobre [1m2886[0m hombres


## Explicación Final

En este trabajo se desarrolló un script en Python para analizar los datos del archivo `Employees.csv`, cumpliendo con todos los requisitos planteados en el reto.

El análisis se realizó sin el uso de librerías como `pandas`, `csv` o `numpy`, accediendo a los datos únicamente a través de la lectura línea por línea con `open()` y utilizando estructuras nativas de Python como listas, condicionales y excepciones.

Se implementaron las siguientes funcionalidades:

- Apertura del archivo y salto del encabezado.
- Extracción y validación de los datos correspondientes a la **edad** y el **género** de cada empleado.
- Cálculo del **promedio de edad**, con manejo de excepciones para evitar errores en caso de datos faltantes.
- Conteo de empleados por género y comparación para determinar si hay **más mujeres o más hombres** en la muestra (o si hay igualdad).
- Uso de texto en **negrita** en la salida para mejorar la visualización de los resultados.

El código fue documentado paso a paso y cumple con todos los criterios técnicos y formales solicitados. El enlace a esta libreta fue compartido con los permisos adecuados para su revisión.
