# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [6]:
import pandas as pd
def cargar_datos():
    ancho_fijo = [10, 30, 10, 5]
    df = pd.read_fwf('datos.dat', widths=ancho_fijo, names=['fecha', 'producto', 'precio', 'cantidad'])
    return df

datos = cargar_datos()
datos 

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [11]:
def calcular_totales(datos):
    cantidad = sum(datos['cantidad'])
    precio = sum(datos['precio'])
    importe = precio * cantidad
    return importe, cantidad

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $15939300.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [19]:
def unidades_vendidas(datos):
    productos = datos.groupby('producto').sum()
    productos = productos.reset_index()
    return productos[['producto', 'cantidad']]

unidades_vendidas(datos)

Unnamed: 0,producto,cantidad
0,Coca Cola,57
1,Mirinda,85
2,Pepsi Cola,89
3,Sprite,72
4,Torasso,32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [28]:
def precio_promedio(datos):
    productos = datos.groupby('producto').sum()
    precio = datos.groupby('producto')['precio'].sum()
    total = productos['cantidad'] * precio
    promedio = total / productos['cantidad']
    df_resultado = pd.DataFrame({
        'producto': promedio.index,
         'promedio' : promedio.values
    })

    return df_resultado

precio_promedio(datos)

Unnamed: 0,producto,promedio
0,Coca Cola,8580.0
1,Mirinda,18550.0
2,Pepsi Cola,9960.0
3,Sprite,5890.0
4,Torasso,4600.0


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [56]:
def ranking_productos(datos, top=3):
    total = datos.groupby('producto')['cantidad'].sum().reset_index()
    return total.head(top).sort_values(ascending=False, by='cantidad')

ranking_productos(datos)

Unnamed: 0,producto,cantidad
2,Pepsi Cola,89
1,Mirinda,85
0,Coca Cola,57


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [37]:
def ventas_por_mes(datos):
    datos['fecha'] = pd.to_datetime(datos['fecha'])
    datos['mes'] = datos['fecha'].dt.month
    mes = datos.groupby('mes')['cantidad'].sum().reset_index()
    return mes

ventas_por_mes(datos)

Unnamed: 0,mes,cantidad
0,8,45
1,9,290


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [51]:
def resumen_ventas(datos):
    productos = datos.groupby('producto')[['cantidad']].sum()
    precio = datos.groupby('producto')['precio'].sum()
    total = productos['cantidad'] * precio
    promedio = total / productos['cantidad']
    listado = pd.DataFrame({
        'producto': promedio.index,
        'cantidad': productos['cantidad'],
        'total': total,
        'promedio': promedio.values
    }).reset_index(drop=True)
    return listado.sort_values(by='producto')

resumen_ventas(datos)

Unnamed: 0,producto,cantidad,total,promedio
0,Coca Cola,57,489060,8580.0
1,Mirinda,85,1576750,18550.0
2,Pepsi Cola,89,886440,9960.0
3,Sprite,72,424080,5890.0
4,Torasso,32,147200,4600.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [12]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
   for a in range(-10, 11):  
        for b in range(-10, 11):  
            for c in range(-10, 11): 
                coeficientes = (a, b, c) 
                Y_pred = f(X, coeficientes)  
                if np.array_equal(Y_pred, Y):  
                    return a, b, c  
   return None  

coeficientes = buscar_coeficientes()
coeficientes

(-2, 10, 0)

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [8]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)  
    Y_pred = f(X, coeficientes)
    error_actual = error(Y, Y_pred)
    
    aprendizaje = 0.001 

    while error_actual > 1:  
        nuevos_coeficientes = coeficientes + randint(-10, 10, 3) * aprendizaje
        Y_pred = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, Y_pred)
        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error
            print(f"Coeficientes actuales: {coeficientes}, Error actual: {error_actual}")

    return coeficientes


coeficientes = buscar_coeficientes()
coeficientes

Coeficientes actuales: [ 6.995 -5.008  8.006], Error actual: 26881.662235000003
Coeficientes actuales: [ 6.992 -5.011  8.003], Error actual: 26848.324773999997
Coeficientes actuales: [ 6.986 -5.014  8.007], Error actual: 26791.902909000004
Coeficientes actuales: [ 6.985 -5.014  8.005], Error actual: 26782.250674000003
Coeficientes actuales: [ 6.979 -5.005  8.008], Error actual: 26748.159963999988
Coeficientes actuales: [ 6.97  -4.999  8.009], Error actual: 26681.308621999986
Coeficientes actuales: [ 6.963 -5.006  8.014], Error actual: 26609.237403
Coeficientes actuales: [ 6.954 -5.007  8.012], Error actual: 26528.01927899999
Coeficientes actuales: [ 6.953 -5.017  8.011], Error actual: 26500.021820999984
Coeficientes actuales: [ 6.948 -5.021  8.002], Error actual: 26444.96679899999
Coeficientes actuales: [ 6.942 -5.03   8.006], Error actual: 26377.700627999984
Coeficientes actuales: [ 6.932 -5.026  7.999], Error actual: 26295.32469299998
Coeficientes actuales: [ 6.928 -5.032  7.996], Er

array([-1.778,  8.968,  0.616])