# Proyecto 2: Analizador de Rendimiento de Empleados

**El Objetivo:** Crear un sistema en Python que lea un archivo CSV con los scores de rendimiento de los empleados, los agrupe por departamento, calcule las estadísticas descriptivas para cada uno y finalmente identifique al departamento con el promedio de rendimiento más alto.

## 1. Prepara tus Datos (el archivo `rendimiento_empleados.csv`)

El primer paso es tener datos con los que trabajar. La siguiente celda de código crea el archivo CSV programáticamente para que nuestro notebook sea autocontenido.

## 2. Define la Clase `Departamento`

Esta clase representará a un solo departamento y será responsable de analizar sus propios datos.

* **Atributos:**
    * `nombre`: El nombre del departamento (ej. "Ventas").
    * `scores`: Una lista de números (los scores de rendimiento de sus empleados).
* **Métodos:**
    * `calcular_estadisticas()`: Debe calcular y devolver un diccionario con la `media`, `mediana` y `desviacion_estandar` de la lista de `scores`.
    * `__str__()`: Debe devolver un string bien formateado que resuma las estadísticas del departamento.

## 3. Define la Clase `AnalizadorRendimiento`

Esta es la clase principal que orquestará todo el análisis.

* **Atributos:**
    * `nombre_analisis`: El nombre del reporte (ej. "Análisis de Rendimiento Q3").
    * `departamentos`: Un **diccionario** para guardar los objetos `Departamento` que se creen (la clave será el nombre del departamento).
* **Métodos:**
    * `cargar_datos_desde_csv(ruta_archivo)`: Debe leer el CSV. Por cada fila, debe agrupar los scores por departamento. Si un departamento no está en `self.departamentos`, debe crear un nuevo objeto `Departamento`. Si ya existe, simplemente añade el nuevo score a la lista de `scores` del objeto existente.
    * `encontrar_mejor_departamento()`: Debe iterar sobre los objetos `Departamento` guardados, imprimir sus estadísticas y finalmente declarar cuál tuvo el **promedio de rendimiento más alto**.


## 4. Ejecuta el Análisis

Este bloque final pondrá todo tu sistema en marcha.

# Proyecti final: Solución del analizador de rendimiento de empleados:

***Objetivo :***  Crear un sistema en Python que lea un archivo CSV con los scores de rendimiento de los empleados, los agrupe por departamento, calcule las estadísticas descriptivas para cada uno y finalmente identifique al departamento con el promedio de rendimiento más alto.

### 1. Preparación de los Datos

Como primer paso creamos el archivo CSV con los datos de rendimiento de los empleados, esto tiene como objetivo crear una fuente de datos "Externa" y hace que el contenido sea reproducible

In [2]:
# Importación de librerias necesarias

import csv

# Definimos los datos que tendrá nuestro archivo.
datos_csv = [
    ['id_empleado', 'departamento', 'score_rendimiento'],
    ['E01', 'Ventas', '85'],
    ['E02','Marketing', '92'],
    ['E03', 'Ventas', '78'],
    ['E04', 'Ingeniería', '95'],
    ['E05', 'Marketing', '88'],
    ['E06', 'Ingeniería', '91'],
    ['E07', 'Ventas', '81'],
    ['E08', 'Ingeniería', '93']
]

# Usamos with open() para crear y escribir en el archivo de forma segura.
# 'w' es el modo de escritura (write) y newline='' es una buena práctica para archivos CSV.

with open('rendimiento_empleados.csv', 'w', newline='') as csvfile:
    # Creamos un objeto 'write' para escribir en el archivo.
    writer = csv.writer(csvfile)
    # El método .writerows() escribe todas las filas de nuestra lista de datos
    writer.writerows(datos_csv)

# Imprimimos un mensaje para confirmar que el archivo se creo con éxito
print(f"Archivo rendimiento_empleados.csv fue creado con exito")


Archivo rendimiento_empleados.csv fue creado con exito


## Codigo para generar 500 registros en el archivo CSV de forma aleatoria, buscando revisar la escalabilidad del codigo

In [4]:
import csv
import random

# --- PARÁMETROS DE GENERACIÓN ---
nombre_archivo = 'rendimiento_empleados.csv'
numero_de_registros = 500
lista_departamentos = ['Ventas', 'Marketing', 'Ingeniería', 'Recursos Humanos', 'Soporte', 'Finanzas']
encabezados = ['id_empleado', 'departamento', 'score_rendimiento']

# --- LÓGICA DE GENERACIÓN ---

# Creamos una lista para guardar todas las filas de datos
datos_generados = []

# Usamos un bucle for para crear cada uno de los 500 registros
for i in range(1, numero_de_registros + 1):
    # Generamos un ID de empleado único y formateado (ej. E001, E002, ...)
    id_empleado = f"E{str(i).zfill(3)}"

    # Elegimos un departamento al azar de nuestra lista
    departamento = random.choice(lista_departamentos)

    # Generamos un score de rendimiento aleatorio entre 60 y 100
    score_rendimiento = random.randint(60, 100)

    # Añadimos la nueva fila a nuestra lista de datos
    datos_generados.append([id_empleado, departamento, score_rendimiento])

# --- ESCRITURA DEL ARCHIVO CSV ---

# Usamos with open() para crear y escribir en el archivo de forma segura
with open(nombre_archivo, 'w', newline='') as file:
    # Creamos un objeto writer para escribir en el archivo
    writer = csv.writer(file)
    # Escribimos la fila de encabezados
    writer.writerow(encabezados)
    # Escribimos todas las filas de datos que generamos
    writer.writerows(datos_generados)

print(f"¡Archivo '{nombre_archivo}' con {numero_de_registros} registros creado con éxito!")

¡Archivo 'rendimiento_empleados.csv' con 500 registros creado con éxito!


### Creación de las clases

Diseñamos nuestras clases `Departamento` en primer medida para poder obtener la información de los departamentos y sus indicadores

In [5]:
# Importar librerias necesarias para el ejercicio

import statistics
from collections import Counter

class Departamento:
    # Generar objeto constructor
    def __init__(self, nombre, scores):
            self.nombre = nombre # Atributo de los nombres del departamento
            self.scores = scores # Atributos del score de los departamentos en mención

    # Método que realiza los cálculos estadísticos por departamento
    def calcular_estadisticas(self):
        # Verificamos si tenemos suficientes datos para los respectivos calculos
        if len(self.scores) == 0:
            return {'media': 0, 'mediana': 0, 'std_dev': 0, 'minimo': 0, 'maximo': 0}
        if len(self.scores) == 1:
            # Si solo hay un dato, la desviación estándar no se puede calcular
            score = self.scores[0]
            return {'media': score, 'mediana': score, 'std_dev': 0, 'minimo': score, 'maximo': score}
        # Si tenemos 2 o más datos, ejecutamos los calculos normales.
        return {
            'media': statistics.mean(self.scores), # Promedio de los valores (score)
            'mediana': statistics.median(self.scores), # Valor central de los datos ordenados
            'std_dev': statistics.stdev(self.scores), # desviación estándar (dispersión)
            'minimo': min(self.scores), # Valor minimo (mas pequeño)
            'maximo': max(self.scores)
        }

    # Método especial que define como imprimir el objeto de forma legible
    def __str__(self):
        # Llama a su propio método para obtener las estadisticas#
        stats = self.calcular_estadisticas()
        # Devuelve un string formateado con los resultados clave.
        return f"--- Resumen del departamento {self.nombre} ---\nMedia: {stats['media']:.2f}\nMediana: {stats['mediana']}\nDesv. Estándar: {stats['std_dev']:.2f}"

class AnalizadorRendimiento:
    # Constructor para inicializar el objetivo
    def __init__(self, nombre_analisis):
        self.nombre_analisis = nombre_analisis
        self.departamentos = {}

    def cargar_datos_desde_csv(self, ruta_datos):
        # Creamos listas temporales para cada grupo
        rendimiento_departamento = {}

        with open(ruta_datos, 'r') as file_csv:
            reader = csv.DictReader(file_csv)
            for row in reader:
                departamento = row['departamento']
                score_departamento = int(row['score_rendimiento'])                # Diligenciamiento del diccionario rendimiento_departamentos
                if departamento not in rendimiento_departamento:
                    # Si es la primera vez que se agrega el departamento al diccionario
                    rendimiento_departamento[departamento] = [score_departamento]
                    # Si ya existe, simplemente añadimos el nuevo score
                else:
                    rendimiento_departamento[departamento].append(score_departamento)

        # Iteramos sobre los departamentos y creamos objetos Departamento
        for departamento, scores in rendimiento_departamento.items():
            self.departamentos[departamento] = Departamento(departamento, scores)

        print("¡Datos cargados y objetos 'Departamento' creados con éxito!")

    def encontrar_mejor_departamento(self):
        # Itera sobre los departamentos, imprime sus estadísticas y encuentra el de mejor promedio
        max_promedio = -1
        mejor_departamento = None

        print(f"\n===== RESULTADOS DEL ANÁLISIS: {self.nombre_analisis} =====")
        for depto_objeto in self.departamentos.values():
            print(depto_objeto) # Imprime el resumen usando el método __str__
            stats = depto_objeto.calcular_estadisticas()
            if stats['media'] > max_promedio:
                max_promedio = stats['media']
                mejor_departamento = depto_objeto

        print("\n--- CONCLUSIÓN ---")
        if mejor_departamento:
            print(f"El departamento con el mayor rendimiento es: '{mejor_departamento.nombre}' con un promedio de {max_promedio:.2f}.")
        else:
            print("No se encontraron datos para analizar.")
        print("=" * 40)

    def OptenerMejorEmpleado(self, Id_Empleado):
        # Obtener del diccionario la información de los empleados
        conteo_empleados = Counter(self.departamentos)
        print(f"El conteo de los empleados {conteo_empleados}")
        mejor_empleado = conteo_empleados.most_common(1)
        Id_Empleado = mejor_empleado[0][0]

# 1. Creamos una instancia del analizador
analisis_q3 = AnalizadorRendimiento("Análisis de Rendimiento Q4 2025")

# 2. Le pedimos que cargue y procese los datos del archivo
analisis_q3.cargar_datos_desde_csv('rendimiento_empleados.csv')

# 3. Le pedimos que ejecute el análisis final y muestre al ganador
analisis_q3.encontrar_mejor_departamento()


¡Datos cargados y objetos 'Departamento' creados con éxito!

===== RESULTADOS DEL ANÁLISIS: Análisis de Rendimiento Q4 2025 =====
--- Resumen del departamento Marketing ---
Media: 80.68
Mediana: 81
Desv. Estándar: 11.82
--- Resumen del departamento Ingeniería ---
Media: 81.17
Mediana: 80.0
Desv. Estándar: 12.62
--- Resumen del departamento Recursos Humanos ---
Media: 79.91
Mediana: 79.5
Desv. Estándar: 10.52
--- Resumen del departamento Ventas ---
Media: 80.45
Mediana: 79
Desv. Estándar: 12.55
--- Resumen del departamento Finanzas ---
Media: 78.91
Mediana: 77.0
Desv. Estándar: 12.64
--- Resumen del departamento Soporte ---
Media: 79.82
Mediana: 78.5
Desv. Estándar: 12.99

--- CONCLUSIÓN ---
El departamento con el mayor rendimiento es: 'Ingeniería' con un promedio de 81.17.


In [6]:
from collections import namedtuple
import csv
import statistics

# Creamos una "plantilla" para guardar los datos de cada empleado de forma clara
Empleado = namedtuple('Empleado', ['id', 'score'])

class Departamento:
    def __init__(self, nombre):
        # El departamento ahora guarda una lista de empleados (nuestros namedtuples)
        self.empleados = []

    def agregar_empleado(self, empleado):
        self.empleados.append(empleado)

    def calcular_estadisticas(self):
        # Usamos una list comprehension para extraer solo los scores para los cálculos
        scores = [emp.score for emp in self.empleados]

        if len(scores) < 2:
            # ... (la lógica de casos extremos que ya tenías) ...
            s = scores[0] if scores else 0
            return {'media': s, 'mediana': s, 'std_dev': 0}

        return {
            'media': statistics.mean(scores),
            'mediana': statistics.median(scores),
            'std_dev': statistics.stdev(scores)
        }

    # ... (el método __str__ se queda igual) ...
    def __str__(self):
        stats = self.calcular_estadisticas()
        return f"--- Resumen del Dpto. '{self.nombre}' ---\nMedia: {stats['media']:.2f}\nMediana: {stats['mediana']}\nDesv. Estándar: {stats['std_dev']:.2f}"


class AnalizadorRendimiento:
    def __init__(self, nombre_analisis):
        self.nombre_analisis = nombre_analisis
        self.departamentos = {}

    def cargar_datos_desde_csv(self, ruta_archivo):
        with open(ruta_archivo, 'r') as file_csv:
            reader = csv.DictReader(file_csv)
            for row in reader:
                departamento = row['departamento']
                # Creamos nuestra tupla nombrada con los datos del empleado
                empleado = Empleado(id=row['id_empleado'], score=int(row['score_rendimiento']))

                # Si el departamento es nuevo, lo creamos
                if departamento not in self.departamentos:
                    self.departamentos[departamento] = Departamento(departamento)

                # Añadimos el empleado al departamento correspondiente
                self.departamentos[departamento].agregar_empleado(empleado)
        print("¡Datos cargados y objetos 'Departamento' creados con éxito!")

    # ... (el método encontrar_mejor_departamento se queda igual) ...
    def encontrar_mejor_departamento(self):
        max_promedio = -1
        mejor_departamento = None
        for depto_objeto in self.departamentos.values():
            stats = depto_objeto.calcular_estadisticas()
            if stats['media'] > max_promedio:
                max_promedio = stats['media']
                mejor_departamento = depto_objeto
        return mejor_departamento # <-- Lo hacemos retornar el objeto ganador

    # --- AQUÍ ESTÁ TU NUEVO MÉTODO, AHORA POSIBLE GRACIAS AL REFACTOR ---
    def obtener_mejores_empleados(self):
        # 1. Encontrar el mejor departamento
        depto_ganador = self.encontrar_mejor_departamento()

        # 2. Encontrar el mejor empleado DENTRO de ese departamento
        # Usamos max() con una 'key' lambda para decirle que ordene por el score
        mejor_empleado_depto = max(depto_ganador.empleados, key=lambda emp: emp.score)

        # 3. Encontrar el mejor empleado EN GENERAL
        # Primero, creamos una lista con TODOS los empleados de TODOS los departamentos
        todos_los_empleados = []
        for depto in self.departamentos.values():
            todos_los_empleados.extend(depto.empleados)

        # Ahora buscamos el máximo en esa lista general
        mejor_empleado_general = max(todos_los_empleados, key=lambda emp: emp.score)

        # Imprimimos los resultados
        print("\n--- ANÁLISIS DE MEJORES EMPLEADOS ---")
        print(f"El mejor departamento fue '{depto_ganador.nombre}'.")
        print(f" -> El mejor empleado de este departamento es: {mejor_empleado_depto.id} con un score de {mejor_empleado_depto.score}.")
        print(f"El mejor empleado de toda la compañía es: {mejor_empleado_general.id} con un score de {mejor_empleado_general.score}.")

In [9]:
# 1. Creamos una instancia del analizador
analisis_q3 = AnalizadorRendimiento("Análisis de Rendimiento Q4 2025")

# 2. Le pedimos que cargue y procese los datos del archivo
analisis_q3.cargar_datos_desde_csv('rendimiento_empleados.csv')

# 3. Le pedimos que ejecute el análisis final y muestre al ganador
analisis_q3.encontrar_mejor_departamento()


¡Datos cargados y objetos 'Departamento' creados con éxito!


<__main__.Departamento at 0x28f60fba470>