# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [22]:
import pandas as pd
def cargar_datos():
    with open('datos.dat', 'r') as archivo:
        datos = []
        for l in archivo:
            fecha = l[0:10].strip()
            producto = l[10:45].strip()
            cantidad = l[45:50].strip()
            precio = l[50:].strip()

            datos.append([fecha, producto, cantidad, precio])

    tabla = pd.DataFrame(datos, columns=['fecha','producto','precio','cantidad'])
    tabla['fecha'] = pd.to_datetime(tabla['fecha'], format='%Y-%m-%d')
    tabla['cantidad'] = pd.to_numeric(tabla['cantidad'])
    tabla['precio'] = pd.to_numeric(tabla['precio'])
    
    return tabla

datos = cargar_datos()
datos 

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [23]:
def calcular_totales(datos):
    
    sum_precios = (datos['cantidad']*datos['precio']).sum()
    cant_prductos = datos['cantidad'].sum()


    return sum_precios, cant_prductos

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:,.2f} en {cantidad} unidades")


Las ventas fueron de $392,730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [24]:
def unidades_vendidas(datos):
    unidades = datos.groupby('producto').agg({'cantidad':'sum'})
    
    return unidades

unidades_vendidas(datos)

Unnamed: 0_level_0,cantidad
producto,Unnamed: 1_level_1
Coca Cola,57
Mirinda,85
Pepsi Cola,89
Sprite,72
Torasso,32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [25]:
def precio_promedio(datos):
    promedio = (datos.groupby('producto').agg({'precio':'mean'})).round(2)
    return promedio

precio_promedio(datos)

Unnamed: 0_level_0,precio
producto,Unnamed: 1_level_1
Coca Cola,1072.5
Mirinda,1545.83
Pepsi Cola,1245.0
Sprite,841.43
Torasso,920.0


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [46]:
def ranking_productos(datos, top=3):
    a = unidades_vendidas(datos)
    listado = (a.sort_values(by='cantidad', ascending=False)).head(top)

    return listado

ranking_productos(datos)

Unnamed: 0_level_0,cantidad
producto,Unnamed: 1_level_1
Pepsi Cola,89
Mirinda,85
Sprite,72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [47]:
def ventas_por_mes(datos):
    a = datos.copy()	
    a['mes'] = (datos['fecha'].dt.month).map({8:'agosto',9:'sept'})
    
    lista = a.groupby(['mes', 'producto']).sum('cantidad')

    return lista


ventas_por_mes(datos)

Unnamed: 0_level_0,Unnamed: 1_level_0,precio,cantidad
mes,producto,Unnamed: 2_level_1,Unnamed: 3_level_1
agosto,Mirinda,4590,27
agosto,Pepsi Cola,1210,10
agosto,Torasso,940,8
sept,Coca Cola,8580,57
sept,Mirinda,13960,58
sept,Pepsi Cola,8750,79
sept,Sprite,5890,72
sept,Torasso,3660,24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [48]:
def resumen_ventas(datos):
    print(datos)

resumen_ventas(datos)

        fecha    producto  precio  cantidad
0  2024-08-27     Mirinda    1510        14
1  2024-08-27     Mirinda    1560        12
2  2024-08-28     Torasso     940         8
3  2024-08-29  Pepsi Cola    1210        10
4  2024-08-30     Mirinda    1520         1
5  2024-09-01     Mirinda    1550        15
6  2024-09-01      Sprite     810         4
7  2024-09-02   Coca Cola    1100         4
8  2024-09-02  Pepsi Cola    1220        13
9  2024-09-02     Torasso     910         5
10 2024-09-02     Torasso     920         3
11 2024-09-03   Coca Cola    1020         8
12 2024-09-03     Mirinda    1570         7
13 2024-09-03     Mirinda    1590         2
14 2024-09-04  Pepsi Cola    1220        13
15 2024-09-05     Mirinda    1500         3
16 2024-09-05  Pepsi Cola    1300         5
17 2024-09-06   Coca Cola    1080         1
18 2024-09-06      Sprite     860        12
19 2024-09-06     Torasso     930         3
20 2024-09-07   Coca Cola    1080        14
21 2024-09-07      Sprite     87

## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [49]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    R = np.arange(-5, 15, 1)
    for a in R:
        for b in R:
            for c in R:
                y_pred = f(X, (a, b, c))  
                if np.all(error(Y, y_pred) == 0):  
                    return a, b, c  
    return None

coeficientes = buscar_coeficientes()
coeficientes

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [50]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10,10,3)
    aprendizaje = 0.001
    prediccion = f(X, coeficientes)
    err = error(Y, prediccion)

    while err > 1:
        nuevos_coeficientes = coeficientes + aprendizaje * np.random.randn(3)
        prediccion_nuevo = f(X, nuevos_coeficientes)
        error_nuevo = error(Y, prediccion_nuevo)

        if error_nuevo < err:
            coeficientes = nuevos_coeficientes
            err = error_nuevo
    return coeficientes




coeficientes = buscar_coeficientes()
coeficientes