# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

column_specification = [(0, 10), (10, 40), (40, 50), (50, 55)]
column_names = ['fecha', 'producto', 'precio', 'cantidad']

def cargar_datos(file_path):
    try:

        df = pd.read_fwf(file_path, colspecs=column_specification, names=column_names)
        
        df['precio'] = pd.to_numeric(df['precio'], errors='coerce')

        df['cantidad'] = pd.to_numeric(df['cantidad'], errors='coerce')

        return df
    except Exception as e:
        print(f"Error al cargar los datos: {e}")
        return None

file_path = 'datos.dat'

datos = cargar_datos(file_path)

datos 

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
def calcular_totales(datos):
    try:
        # Calcular el importe total (precio * cantidad)
        datos['importe'] = datos['precio'] * datos['cantidad']
        importe = datos['importe'].sum()
        cantidad = datos['cantidad'].sum()
        return importe, cantidad
    except Exception as e:
        print(f"Error al calcular los totales: {e}")
        return None, None

# Calcular el importe total y la cantidad total
importe, cantidad = calcular_totales(datos)

# Mostrar los resultados

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
def unidades_vendidas(datos):
    try:
        # Agrupar por producto y sumar las cantidades
        ventas_por_producto = datos.groupby('producto')['cantidad'].sum().reset_index()
        return ventas_por_producto
    except Exception as e:
        print(f"Error al calcular las unidades vendidas: {e}")
        return None

# Listar las unidades vendidas por producto
unidades_vendidas_por_producto = unidades_vendidas(datos)
# print(unidades_vendidas_por_producto)

# unidades_vendidas(datos)
# Imprimir el DataFrame de forma más limpia
if unidades_vendidas_por_producto is not None:
    print(unidades_vendidas_por_producto.to_string(index=False))  # Evitar el índice en la impresión
else:
    print("Hubo un error al calcular las unidades vendidas.")

  producto  cantidad
 Coca Cola        57
   Mirinda        85
Pepsi Cola        89
    Sprite        72
   Torasso        32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [4]:
def precio_promedio(datos):
    try:
        # Agrupar por el nombre del producto y calcular el precio promedio
        promedio_por_producto = datos.groupby('producto')['precio'].mean().reset_index()
        
        # Redondear los precios promedio a 2 decimales
        promedio_por_producto['precio'] = promedio_por_producto['precio'].round(2)
        
        # Renombrar la columna para una mejor presentación
        promedio_por_producto.columns = ['Producto', 'Precio Promedio']
        
        # Mostrar el resultado
        print("Listado del precio promedio por producto:")
        print(promedio_por_producto)
        
    except Exception as e:
        print(f"Error al calcular el precio promedio por producto: {e}")
        return None

# Llamar a la función para calcular y mostrar el precio promedio por producto
precio_promedio(datos)


Listado del precio promedio por producto:
     Producto  Precio Promedio
0   Coca Cola          1072.50
1     Mirinda          1545.83
2  Pepsi Cola          1245.00
3      Sprite           841.43
4     Torasso           920.00


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [5]:
def ranking_productos(datos):
    try:
        # Agrupar por el nombre del producto y sumar la cantidad vendida
        ranking = datos.groupby('producto')['cantidad'].sum().reset_index()
        
        # Renombrar la columna para una mejor presentación
        ranking.columns = ['Producto', 'Unidades Vendidas']
        
        # Ordenar el DataFrame de mayor a menor según las unidades vendidas
        ranking = ranking.sort_values(by='Unidades Vendidas', ascending=False)
        
        # Seleccionar los 3 productos más vendidos
        top_3_productos = ranking.head(3)
        
        # Mostrar el resultado
        print("Ranking de los 3 productos más vendidos:")
        print(top_3_productos)
        
    except Exception as e:
        print(f"Error al calcular el ranking de productos: {e}")
        return None

# Llamar a la función para mostrar el ranking de productos
ranking_productos(datos)

Ranking de los 3 productos más vendidos:
     Producto  Unidades Vendidas
2  Pepsi Cola                 89
1     Mirinda                 85
3      Sprite                 72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [6]:
def ventas_por_mes(datos):
    try:
        # Asegurarse de que la columna de fecha sea de tipo datetime
        datos['fecha'] = pd.to_datetime(datos['fecha'], format='%Y-%m-%d')
        
        # Extraer el mes y el año de la fecha
        datos['mes'] = datos['fecha'].dt.to_period('M')
        
        # Agrupar por mes y producto, y sumar la cantidad vendida
        ventas_mes = datos.groupby(['mes', 'producto'])['cantidad'].sum().reset_index()
        
        # Renombrar las columnas para una mejor presentación
        ventas_mes.columns = ['Mes', 'Producto', 'Total Unidades Vendidas']
        
        # Mostrar el resultado
        print("Total de unidades vendidas por producto separado por mes:")
        print(ventas_mes)
        
    except Exception as e:
        print(f"Error al listar las ventas por mes: {e}")
        return None

# Llamar a la función para mostrar las ventas por mes
ventas_por_mes(datos)


Total de unidades vendidas por producto separado por mes:
       Mes    Producto  Total Unidades Vendidas
0  2024-08     Mirinda                       27
1  2024-08  Pepsi Cola                       10
2  2024-08     Torasso                        8
3  2024-09   Coca Cola                       57
4  2024-09     Mirinda                       58
5  2024-09  Pepsi Cola                       79
6  2024-09      Sprite                       72
7  2024-09     Torasso                       24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [8]:
def resumen_ventas(datos):
    try:
        # Calcular el importe total por producto
        datos['importe'] = datos['precio'] * datos['cantidad']
        
        # Agrupar por producto y calcular total de unidades y precio promedio
        informe = datos.groupby('producto').agg(
            cantidad_vendida=('cantidad', 'sum'),
            precio_promedio=('precio', 'mean'),
            importe_total=('importe', 'sum')
        ).reset_index()
        
        # Ordenar el informe alfabéticamente por producto
        informe = informe.sort_values(by='producto')
        
        # Mostrar el resultado
        print("Informe general de productos:")
        for index, row in informe.iterrows():
            print(f"Producto: {row['producto']}, Cantidad Vendida: {row['cantidad_vendida']}, "
                  f"Precio Promedio: ${row['precio_promedio']:.2f}, Importe Total: ${row['importe_total']:.2f}")
        
    except Exception as e:
        print(f"Error al generar el informe general: {e}")

# Llamar a la función para mostrar el resumen de ventas
resumen_ventas(datos)


Informe general de productos:
Producto: Coca Cola, Cantidad Vendida: 57, Precio Promedio: $1072.50, Importe Total: $60780.00
Producto: Mirinda, Cantidad Vendida: 85, Precio Promedio: $1545.83, Importe Total: $131080.00
Producto: Pepsi Cola, Cantidad Vendida: 89, Precio Promedio: $1245.00, Importe Total: $110510.00
Producto: Sprite, Cantidad Vendida: 72, Precio Promedio: $841.43, Importe Total: $61040.00
Producto: Torasso, Cantidad Vendida: 32, Precio Promedio: $920.00, Importe Total: $29320.00


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [9]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    # Probar valores de a, b, c en un rango
    for a in range(-10, 11):
        for b in range(-10, 11):
            for c in range(-10, 11):
                # Calcular la predicción para cada valor de x
                Y_pred = f(X, (a, b, c))
                
                # Calcular el error
                if np.all(error(Y, Y_pred) == 0):
                    return a, b, c
    return None  # Si no se encuentran coeficientes que cumplan la condición

coeficientes = buscar_coeficientes()
print(coeficientes)


(-2, 10, 0)


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [10]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])  # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    # Inicializar coeficientes aleatorios
    coeficientes = np.random.uniform(-10, 10, 3)
    err = float('inf')  # Inicializar error alto
    learning_rate = 0.001  # Tasa de aprendizaje

    while True:
        y_pred = f(X, coeficientes)
        current_error = error(Y, y_pred)

        if current_error < 1:  # Condición de parada
            break

        # Generar nuevos coeficientes con un pequeño ajuste
        nuevos_coeficientes = coeficientes + np.random.uniform(-1, 1, 3) * learning_rate
        y_pred_nuevos = f(X, nuevos_coeficientes)
        new_error = error(Y, y_pred_nuevos)

        # Si el nuevo error es menor, reemplazamos los coeficientes
        if new_error < current_error:
            coeficientes = nuevos_coeficientes

    return coeficientes, current_error

coeficientes, err = buscar_coeficientes()

# Imprimir los resultados
print(f"Los coeficientes son {np.round(coeficientes, 3)} y el error es {err}")
coeficientes


Los coeficientes son [-1.78   8.96   0.625] y el error es 0.9999296565939735


array([-1.77977442,  8.95995533,  0.62454   ])