# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [19]:
import pandas as pd
import numpy as np
from numpy.random import randint

def cargar_datos():
    formato_fijo = [10, 30, 10, 5]
    data_frame = pd.read_fwf('datos.dat', widths=formato_fijo, names=['fecha', 'producto', 'precio', 'cantidad'])
    return data_frame

datos = cargar_datos()
print(datos)

         fecha    producto  precio  cantidad
0   2024-08-27     Mirinda    1510        14
1   2024-08-27     Mirinda    1560        12
2   2024-08-28     Torasso     940         8
3   2024-08-29  Pepsi Cola    1210        10
4   2024-08-30     Mirinda    1520         1
5   2024-09-01     Mirinda    1550        15
6   2024-09-01      Sprite     810         4
7   2024-09-02   Coca Cola    1100         4
8   2024-09-02  Pepsi Cola    1220        13
9   2024-09-02     Torasso     910         5
10  2024-09-02     Torasso     920         3
11  2024-09-03   Coca Cola    1020         8
12  2024-09-03     Mirinda    1570         7
13  2024-09-03     Mirinda    1590         2
14  2024-09-04  Pepsi Cola    1220        13
15  2024-09-05     Mirinda    1500         3
16  2024-09-05  Pepsi Cola    1300         5
17  2024-09-06   Coca Cola    1080         1
18  2024-09-06      Sprite     860        12
19  2024-09-06     Torasso     930         3
20  2024-09-07   Coca Cola    1080        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [20]:
def calcular_totales(datos):
    total_cantidad = datos['cantidad'].sum()
    total_precio = datos['precio'].sum()
    total_importe = total_precio * total_cantidad
    return total_importe, total_cantidad

importe, cantidad = calcular_totales(datos)
print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


Las ventas fueron de $15939300.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [21]:
def unidades_vendidas(datos):
    productos_agrupados = datos.groupby('producto').sum().reset_index()
    return productos_agrupados[['producto', 'cantidad']]

unidades_vendidas(datos)


Unnamed: 0,producto,cantidad
0,Coca Cola,57
1,Mirinda,85
2,Pepsi Cola,89
3,Sprite,72
4,Torasso,32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [22]:
def precio_promedio(datos):
    agrupados = datos.groupby('producto').sum()
    precios = datos.groupby('producto')['precio'].sum()
    total_valor = agrupados['cantidad'] * precios
    promedio_precio = total_valor / agrupados['cantidad']
    df_resultado = pd.DataFrame({'producto': promedio_precio.index, 'promedio': promedio_precio.values})
    return df_resultado

precio_promedio(datos)


Unnamed: 0,producto,promedio
0,Coca Cola,8580.0
1,Mirinda,18550.0
2,Pepsi Cola,9960.0
3,Sprite,5890.0
4,Torasso,4600.0


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [14]:
def ranking_productos(datos, top=3):
    total_cantidad = datos.groupby('producto')['cantidad'].sum().reset_index()
    return total_cantidad.nlargest(top, 'cantidad')

ranking_productos(datos)

Unnamed: 0,producto,cantidad
2,Pepsi Cola,89
1,Mirinda,85
3,Sprite,72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [15]:
def ventas_por_mes(datos):
    datos['fecha'] = pd.to_datetime(datos['fecha'])
    datos['mes'] = datos['fecha'].dt.month
    cantidad_por_mes = datos.groupby('mes')['cantidad'].sum().reset_index()
    return cantidad_por_mes

ventas_por_mes(datos)


Unnamed: 0,mes,cantidad
0,8,45
1,9,290


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [16]:
def resumen_ventas(datos):
    resumen = datos.groupby('producto')[['cantidad']].sum()
    total_precios = datos.groupby('producto')['precio'].sum()
    total_ventas = resumen['cantidad'] * total_precios
    promedio_ventas = total_ventas / resumen['cantidad']
    listado_resumen = pd.DataFrame({
        'producto': promedio_ventas.index,
        'cantidad': resumen['cantidad'],
        'total': total_ventas,
        'promedio': promedio_ventas.values
    }).reset_index(drop=True)
    return listado_resumen.sort_values(by='producto')

resumen_ventas(datos)

Unnamed: 0,producto,cantidad,total,promedio
0,Coca Cola,57,489060,8580.0
1,Mirinda,85,1576750,18550.0
2,Pepsi Cola,89,886440,9960.0
3,Sprite,72,424080,5890.0
4,Torasso,32,147200,4600.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [17]:
def f(x, coef):
    return coef[0] * x**2 + coef[1] * x + coef[2]

def error(y_real, y_predicho):
    return np.sum((y_real - y_predicho)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    y_predicho = f(X, coeficientes)
    error_actual = error(Y, y_predicho)
    tasa_aprendizaje = 0.001

    while error_actual > 1:
        nuevos_coef = coeficientes + randint(-10, 10, 3) * tasa_aprendizaje
        y_predicho_nuevo = f(X, nuevos_coef)
        nuevo_error = error(Y, y_predicho_nuevo)
        if nuevo_error < error_actual:
            coeficientes = nuevos_coef
            error_actual = nuevo_error
            print(f"Coeficientes actuales: {coeficientes}, Error actual: {error_actual}")

    return coeficientes

coeficientes = buscar_coeficientes()
coeficientes

Coeficientes actuales: [ 8.999 -3.009 -1.004], Error actual: 47126.63196400002
Coeficientes actuales: [ 8.989 -3.002 -0.997], Error actual: 47032.06406200001
Coeficientes actuales: [ 8.986 -2.993 -0.996], Error actual: 47020.330391
Coeficientes actuales: [ 8.977 -2.995 -0.996], Error actual: 46911.06775600001
Coeficientes actuales: [ 8.967 -2.995 -1.005], Error actual: 46790.317637000015
Coeficientes actuales: [ 8.969 -3.004 -1.015], Error actual: 46785.42607000001
Coeficientes actuales: [ 8.966 -2.996 -1.017], Error actual: 46769.551653000024
Coeficientes actuales: [ 8.966 -3.002 -1.026], Error actual: 46749.57531600002
Coeficientes actuales: [ 8.962 -3.007 -1.031], Error actual: 46688.11703800002
Coeficientes actuales: [ 8.955 -3.01  -1.027], Error actual: 46602.07323000002
Coeficientes actuales: [ 8.954 -3.016 -1.023], Error actual: 46577.852109000036
Coeficientes actuales: [ 8.944 -3.019 -1.022], Error actual: 46455.669727000044
Coeficientes actuales: [ 8.943 -3.023 -1.028], Error 

array([-1.78 ,  8.956,  0.616])

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [18]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1])
def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)  
    Y_pred = f(X, coeficientes)
    error_actual = error(Y, Y_pred)
    
    aprendizaje = 0.001 

    while error_actual > 1:  
        nuevos_coeficientes = coeficientes + randint(-10, 10, 3) * aprendizaje
        Y_pred = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, Y_pred)
        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error
            print(f"Coeficientes actuales: {coeficientes}, Error actual: {error_actual}")

    return coeficientes


coeficientes = buscar_coeficientes()
coeficientes

Coeficientes actuales: [ 4.992 -8.998 -8.005], Error actual: 5804.204301000002
Coeficientes actuales: [ 4.989 -8.994 -8.006], Error actual: 5796.5081709999995
Coeficientes actuales: [ 4.981 -8.988 -7.999], Error actual: 5773.73199
Coeficientes actuales: [ 4.977 -8.998 -8.002], Error actual: 5754.455331000003
Coeficientes actuales: [ 4.971 -9.003 -8.004], Error actual: 5731.585800000001
Coeficientes actuales: [ 4.961 -9.01  -8.011], Error actual: 5694.245650000003
Coeficientes actuales: [ 4.955 -9.02  -8.02 ], Error actual: 5668.390475000002
Coeficientes actuales: [ 4.946 -9.025 -8.013], Error actual: 5636.414093999999
Coeficientes actuales: [ 4.947 -9.034 -8.016], Error actual: 5634.395626999999
Coeficientes actuales: [ 4.944 -9.032 -8.016], Error actual: 5625.766719999999
Coeficientes actuales: [ 4.936 -9.035 -8.016], Error actual: 5598.063935000001
Coeficientes actuales: [ 4.928 -9.036 -8.025], Error actual: 5571.228525
Coeficientes actuales: [ 4.928 -9.042 -8.034], Error actual: 556

array([-1.778,  8.95 ,  0.602])