# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [15]:
import pandas as pd
def cargar_datos():
    especificaciones = [(0, 10), (10, 40), (40, 50), (50, 55)]
    columnas = ['fecha', 'producto', 'precio', 'cantidad']

    datos = pd.read_fwf(
        'datos.dat',
        colspecs=especificaciones,
        names=columnas,
        header=None
    )
    return datos

datos = cargar_datos()
datos

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [33]:
def calcular_totales(datos):
    datos = datos.copy()
    datos['importe'] = datos['precio'] * datos['cantidad']

    total_importe = datos['importe'].sum()
    total_cantidad = datos['cantidad'].sum()
    resumen = {
        'Total Importe': total_importe,
        'Total Cantidad': total_cantidad
    }

    return total_importe, total_cantidad

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [157]:
def unidades_vendidas(datos):
    total_de_los_producto = datos.groupby('producto')['cantidad'].sum()
    return total_de_los_producto.reset_index()

unidades_vendidas(datos)

Unnamed: 0,producto,cantidad
0,Coca Cola,57
1,Mirinda,85
2,Pepsi Cola,89
3,Sprite,72
4,Torasso,32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [158]:
def precio_promedio(datos):
    agrupados = datos.groupby('producto')
    promedios = agrupados['precio'].mean()
    promedios_df = promedios.reset_index()
    promedios_df.columns = ['producto', 'precio_promedio']
    promedios_df['precio_promedio'] = promedios_df['precio_promedio'].apply(lambda x: f"{x:.2f}")

    
    print("Precios promedio de los productos:")
    return promedios_df

precio_promedio(datos)

Precios promedio de los productos:


Unnamed: 0,producto,precio_promedio
0,Coca Cola,1072.5
1,Mirinda,1545.83
2,Pepsi Cola,1245.0
3,Sprite,841.43
4,Torasso,920.0


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [179]:
def ranking_productos(datos, top=3):
    totales = datos.groupby('producto')['cantidad'].sum()
    ranking_ordenado = totales.sort_values(ascending=False)
    top_productos = ranking_ordenado.head(top)
    ranking_df = top_productos.reset_index()
    ranking_df.columns = ['Producto', 'Cantidad Vendida']
    
    print("Productos más vendidos:")
    return ranking_df
ranking_productos(datos)

Productos más vendidos:


Unnamed: 0,Producto,Cantidad Vendida
0,Pepsi Cola,89
1,Mirinda,85
2,Sprite,72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [192]:
def ventas_por_mes(datos):
    datos = datos.copy()
    datos['fecha'] = pd.to_datetime(datos['fecha'], format='%Y-%m-%d')
    datos['mes'] = datos['fecha'].dt.to_period('M')
    ventas_agrupadas = datos.groupby(['producto', 'mes'])['cantidad'].sum()
    ventas_ordenadas = ventas_agrupadas.sort_index(level=['mes', 'producto'])
    ventas_df = ventas_ordenadas.reset_index()
    ventas_df.columns = ['Producto', 'Mes', 'Cantidad Vendida']

    print("Ventas por mes:")
    return ventas_df

ventas_por_mes(datos)

Ventas por mes:


Unnamed: 0,Producto,Mes,Cantidad Vendida
0,Mirinda,2024-08,27
1,Pepsi Cola,2024-08,10
2,Torasso,2024-08,8
3,Coca Cola,2024-09,57
4,Mirinda,2024-09,58
5,Pepsi Cola,2024-09,79
6,Sprite,2024-09,72
7,Torasso,2024-09,24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [241]:
def resumen_ventas(datos):
    precios = datos.groupby('producto')['precio']
    precio_promedio = precios.mean().round(2)
    cantidades = datos.groupby('producto')['cantidad']
    cantidad_vendida = cantidades.sum()
    
    importes_totales = precio_promedio * cantidad_vendida
    importe_total = importes_totales.round(2)
    
    resumen = pd.DataFrame()
    resumen['precio promedio'] = precio_promedio
    resumen['cantidad vendida'] = cantidad_vendida
    resumen['importe total'] = importe_total
    
    resumen = resumen.sort_index()

    return resumen

resumen_ventas(datos)

Unnamed: 0_level_0,precio promedio,cantidad vendida,importe total
producto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Coca Cola,1072.5,57,61132.5
Mirinda,1545.83,85,131395.55
Pepsi Cola,1245.0,89,110805.0
Sprite,841.43,72,60582.96
Torasso,920.0,32,29440.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [242]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    X_cuadrado = X**2
    X_lineal = X
    X_constante = np.ones_like(X)
    A = np.vstack([X_cuadrado, X_lineal, X_constante]).T
    resultado = np.linalg.lstsq(A, Y, rcond=None)
    coeficientes = resultado[0]
    coeficientes = np.where(np.abs(coeficientes) < 1e-10, 0, coeficientes)
    
    return coeficientes

coeficientes = buscar_coeficientes()
coeficientes

array([-2., 10.,  0.])

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [243]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    
    y_pred = f(X, coeficientes)
    diferencias = Y - y_pred
    errores_cuadrados = diferencias**2
    error_anterior = np.sum(errores_cuadrados)

    umbral_error = 1
    aprendizaje = 0.001

    while error_anterior > umbral_error:
        coeficientes_nuevos = coeficientes + randint(-1, 2, 3) * aprendizaje
        y_pred_nuevo = f(X, coeficientes_nuevos)
    
        error_nuevo = error(Y, y_pred_nuevo)
        
        if error_nuevo < error_anterior:
            coeficientes = coeficientes_nuevos
            error_anterior = error_nuevo
            
    return coeficientes, error_anterior

coeficientes, error_final = buscar_coeficientes()

coeficientes_redondeados = np.round(coeficientes, 3)
print(f"Coeficientes: 1)={coeficientes_redondeados[0]}, 2)={coeficientes_redondeados[1]}, 3)={coeficientes_redondeados[2]}")
print(f"Los coeficientes son {coeficientes_redondeados} y el error es {error_final:.15f}")



coeficientes = buscar_coeficientes()
coeficientes

Coeficientes: 1)=-1.78, 2)=8.959, 3)=0.623
Los coeficientes son [-1.78   8.959  0.623] y el error es 0.999698000000089


(array([-1.781,  8.965,  0.629]), np.float64(0.9999009999996059))