# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [240]:
import pandas as pd
def cargar_datos():
    datos = pd.read_fwf(
        "datos.dat",
        colspecs = [(0,10), (10,40), (40,50), (50,55)],
        header = None,
        names = ['fecha','producto','precio', 'cantidad']
    )
    return datos

datos = cargar_datos()
datos 

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [241]:
def calcular_totales(datos):
    importe = (datos['precio'] * datos['cantidad']).sum() 
    cantidad = datos['cantidad'].sum()  
    return importe, cantidad

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [242]:
def unidades_vendidas(datos):
    return datos.groupby('producto') ['cantidad'].sum()

unidades_vendidas(datos)

producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: cantidad, dtype: int64

###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [243]:
def precio_promedio(datos):
    datos['precio_promedio'] = datos.groupby('producto')['precio'].transform('mean')
    
    print("Precio promedio por producto:")
    print(datos[['producto', 'precio_promedio']].drop_duplicates())

precio_promedio(datos)

Precio promedio por producto:
     producto  precio_promedio
0     Mirinda      1545.833333
2     Torasso       920.000000
3  Pepsi Cola      1245.000000
6      Sprite       841.428571
7   Coca Cola      1072.500000


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [244]:
def ranking_productos(datos, top=3):
    ranking = datos.groupby('producto').agg({'cantidad': 'sum'})
    
    ranking = ranking['cantidad'].sort_values(ascending=False)
    
    return ranking.iloc[:top]

ranking_productos(datos)

producto
Pepsi Cola    89
Mirinda       85
Sprite        72
Name: cantidad, dtype: int64

### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [245]:
def ventas_por_mes(datos):
    
    datos['fecha'] = pd.to_datetime(datos['fecha'])  
    
    datos['mes'] = datos['fecha'].dt.to_period('M') 
    
    ventas_por_mes = datos.pivot_table(values='cantidad', index=['producto', 'mes'], aggfunc='sum').reset_index()
    
    ventas_por_mes.columns = ['Producto', 'Mes', 'Total Ventas']
    
    print("\n======== Ventas por Mes ========\n")
    print(ventas_por_mes.to_string(index=False))
    print("\n===================================")


ventas_por_mes(datos)



  Producto     Mes  Total Ventas
 Coca Cola 2024-09            57
   Mirinda 2024-08            27
   Mirinda 2024-09            58
Pepsi Cola 2024-08            10
Pepsi Cola 2024-09            79
    Sprite 2024-09            72
   Torasso 2024-08             8
   Torasso 2024-09            24



### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [246]:
def resumen_ventas(df):
    resumen_ventas = df.groupby('producto').agg({
        'precio': 'mean',   
        'cantidad': 'sum'    
    }).rename(columns={'precio': 'promedio_precio', 'cantidad': 'total_unidades'}).reset_index()
    
    resumen_ventas['total_importe'] = resumen_ventas['promedio_precio'] * resumen_ventas['total_unidades']

    resumen_ventas_ordenado = resumen_ventas.sort_values('producto')
    
    def formato_precio(x):
        return '{:,.2f}'.format(x) 
    
    def formato_unidades(x):
        return '{:,}'.format(x)     

    def formato_importe(x):
        return '{:,.2f}'.format(x)  

    print("\n=================== Informe General ===================\n")
    print(resumen_ventas_ordenado.to_string(index=False, formatters={
        'promedio_precio': formato_precio,
        'total_unidades': formato_unidades,
        'total_importe': formato_importe
    }))
    print("\n=======================================================\n")

resumen_ventas(datos)



  producto promedio_precio total_unidades total_importe
 Coca Cola        1,072.50             57     61,132.50
   Mirinda        1,545.83             85    131,395.83
Pepsi Cola        1,245.00             89    110,805.00
    Sprite          841.43             72     60,582.86
   Torasso          920.00             32     29,440.00




## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [247]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    rango = np.linspace(-5, 5, 100)
    mejor_error = np.inf  
    coeficientes_optimos = np.empty(3)  

    for a in rango:
        for b in rango:
            for c in rango:
                coef_actuales = np.array([a, b, c])
                
                y_pred = f(X, coef_actuales)
                err_actual = error(Y, y_pred)

                err_actual_suma = np.sum(err_actual)

                if err_actual_suma < mejor_error:
                    mejor_error = err_actual_suma
                    coeficientes_optimos[:] = coef_actuales

                if mejor_error < 1e-6: 
                    return coeficientes_optimos

    return coeficientes_optimos
    
coeficientes = buscar_coeficientes()
print(f"Coeficientes encontrados: a = {coeficientes[0]:.4f}, b = {coeficientes[1]:.4f}, c = {coeficientes[2]:.4f}")
coeficientes



Coeficientes encontrados: a = -1.1616, b = 4.7980, c = 5.0000


array([-1.16161616,  4.7979798 ,  5.        ])

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [248]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) 

def buscar_coeficientes():
    coef_actuales = randint(-10, 10, size=3)

    pred_inicial = f(X, coef_actuales)
    
    error_actual = error(Y, pred_inicial)
    
    tasa_aprendizaje = 0.001  
    
    while error_actual > 1:
        ajuste_coef = coef_actuales + tasa_aprendizaje * (np.random.rand(3) - 0.5)  
        
        nueva_pred = f(X, ajuste_coef)
        
        nuevo_error = error(Y, nueva_pred)
        
        if nuevo_error < error_actual:
            coef_actuales = ajuste_coef
            error_actual = nuevo_error
    
    return coef_actuales

coeficientes = buscar_coeficientes()

print(f"Coeficientes encontrados: a = {coeficientes[0]:.4f}, b = {coeficientes[1]:.4f}, c = {coeficientes[2]:.4f}")

coeficientes

Coeficientes encontrados: a = -1.7794, b = 8.9583, c = 0.6229


array([-1.77941812,  8.95829537,  0.62287737])