# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [95]:
import pandas as pd

def cargar_datos():# Implementar la función cargar_datos
    ventas = []
    with open("datos.dat","r") as archivo:
        lineas = archivo.readlines()
        for linea in lineas:
            fecha   = linea[:10].strip()
            producto = linea[10:40].strip()
            precio = int(linea[40:50].strip())
            cantidad = int(linea[50:55].strip())

            venta = {
                'fecha' : fecha,
                'producto': producto,
                'precio': precio,
                'cantidad': cantidad
            }
            ventas.append(venta)
    data_frame = pd.DataFrame(ventas)
    return data_frame

datos = cargar_datos()
print(datos) 

         fecha    producto  precio  cantidad
0   2024-08-27     Mirinda    1510        14
1   2024-08-27     Mirinda    1560        12
2   2024-08-28     Torasso     940         8
3   2024-08-29  Pepsi Cola    1210        10
4   2024-08-30     Mirinda    1520         1
5   2024-09-01     Mirinda    1550        15
6   2024-09-01      Sprite     810         4
7   2024-09-02   Coca Cola    1100         4
8   2024-09-02  Pepsi Cola    1220        13
9   2024-09-02     Torasso     910         5
10  2024-09-02     Torasso     920         3
11  2024-09-03   Coca Cola    1020         8
12  2024-09-03     Mirinda    1570         7
13  2024-09-03     Mirinda    1590         2
14  2024-09-04  Pepsi Cola    1220        13
15  2024-09-05     Mirinda    1500         3
16  2024-09-05  Pepsi Cola    1300         5
17  2024-09-06   Coca Cola    1080         1
18  2024-09-06      Sprite     860        12
19  2024-09-06     Torasso     930         3
20  2024-09-07   Coca Cola    1080        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [96]:

def calcular_totales(datos):# implementar
    total_importe_general = 0
    total_cantidad_general = 0

    for _, dato in datos.iterrows():
        producto = dato['producto']
        precio = dato['precio']
        cantidad = dato['cantidad']

        total_importe_general += precio * cantidad
        total_cantidad_general += cantidad
    return total_importe_general , total_cantidad_general

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [97]:
def unidades_vendidas(datos):
    total_unidades = {}

    for _, dato in datos.iterrows():
        producto = dato['producto']
        cantidad = dato['cantidad']

        if producto in total_unidades:
            total_unidades[producto] += cantidad
        else:
            total_unidades[producto] = cantidad

    return total_unidades

unidades = unidades_vendidas(datos)
for producto in unidades:
    cantidad_total = unidades[producto]  # Obtener la cantidad total
    print(f"{producto}: {cantidad_total}") 

Mirinda: 85
Torasso: 32
Pepsi Cola: 89
Sprite: 72
Coca Cola: 57


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [98]:
def precio_promedio(datos):# Implementar
    precios_totales = {}
    cantidades_totales = {}

    for _, dato in datos.iterrows():
        producto = dato['producto']
        precio = dato['precio']
        cantidad = dato['cantidad']

        if producto in precios_totales:
            precios_totales[producto] += precio * cantidad
            cantidades_totales[producto] += cantidad
        else:
            precios_totales[producto] = precio * cantidad
            cantidades_totales[producto] = cantidad

    precios_promedio =  {}

    for producto in precios_totales:
        precios_promedio[producto] = precios_totales[producto] / cantidades_totales[producto]

    return precios_promedio

promedios = precio_promedio(datos)

print("Listado del precio promedio por producto c:")
for producto in promedios:
    print(f"{producto}: ${promedios[producto]:.2f}")

Listado del precio promedio por producto c:
Mirinda: $1542.12
Torasso: $916.25
Pepsi Cola: $1241.69
Sprite: $847.78
Coca Cola: $1066.32


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [99]:
def funcionComparadora(venta):# Implementar
    return venta['cantidad']

def ranking_productos(datos, top=3): 
    total_vendido = datos.groupby('producto')['cantidad'].sum().reset_index()
    total_vendido = total_vendido.sort_values(by='cantidad', ascending = False)
    return total_vendido.head(top)

def listar_ranking(ranking):
    print("Ranking 3 de los productos")
    for _,row in ranking.iterrows():
        print(f"{row['producto']}: {row['cantidad']} unidades") 

ranking = ranking_productos(datos)
listar_ranking(ranking)

Ranking 3 de los productos
Pepsi Cola: 89 unidades
Mirinda: 85 unidades
Sprite: 72 unidades


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [100]:
import pandas as pd

def ventas_por_mes(datos): 
    resultado_cantidades = {}
    resultado_importes = {}
    resultado = pd.DataFrame({
        'producto': [],
        'cantidad_total': [],
        'importe_total': [],
        'importe_promedio': []
    })

    for index, dato in datos.iterrows():
        identificador = dato['producto'] + ' ' + dato['fecha'][:7]
        
        if identificador in resultado_cantidades:
            resultado_cantidades[identificador] += dato['cantidad']
            resultado_importes[identificador] += dato['precio'] * dato['cantidad']
        else:
            resultado_cantidades[identificador] = dato['cantidad']
            resultado_importes[identificador] = dato['precio'] * dato['cantidad']
    
    for nombre_producto in resultado_cantidades:
        df = pd.DataFrame({
            'producto': [nombre_producto],
            'cantidad_total': [resultado_cantidades[nombre_producto]],
            'importe_total': [resultado_importes[nombre_producto]],
            'importe_promedio': [resultado_importes[nombre_producto] / resultado_cantidades[nombre_producto]]
        })
        resultado = pd.concat([resultado, df], ignore_index=True)
    
    return resultado

def listar_ventas_mensuales(ventas):
    print(ventas)



ventas_mensuales = ventas_por_mes(datos)
listar_ventas_mensuales(ventas_mensuales)


             producto  cantidad_total  importe_total  importe_promedio
0     Mirinda 2024-08            27.0        41380.0       1532.592593
1     Torasso 2024-08             8.0         7520.0        940.000000
2  Pepsi Cola 2024-08            10.0        12100.0       1210.000000
3     Mirinda 2024-09            58.0        89700.0       1546.551724
4      Sprite 2024-09            72.0        61040.0        847.777778
5   Coca Cola 2024-09            57.0        60780.0       1066.315789
6  Pepsi Cola 2024-09            79.0        98410.0       1245.696203
7     Torasso 2024-09            24.0        21800.0        908.333333


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [101]:
def resumen_ventas(datos):#Implementar
    resumen = datos.groupby('producto').agg(
        cantidad_total=('cantidad', 'sum'),
        importe_total=('precio', lambda x: (x * datos.loc[x.index, 'cantidad']).sum())
    ).reset_index()
    
    resumen['importe_promedio'] = resumen['importe_total'] / resumen['cantidad_total']
    
    resumen = resumen.sort_values(by='producto')
    
    return resumen
    

resumen = resumen_ventas(datos)
print(resumen)

     producto  cantidad_total  importe_total  importe_promedio
0   Coca Cola              57          60780       1066.315789
1     Mirinda              85         131080       1542.117647
2  Pepsi Cola              89         110510       1241.685393
3      Sprite              72          61040        847.777778
4     Torasso              32          29320        916.250000


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [102]:
import numpy as np

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():# Implementar
     rango = range(-10,11)
     for a in rango:
         for b in rango:
             for c in rango:
                 y = f(X,(a,b,c))
                 if np.all(error(Y, y)==0):
                     return np.array([a, b, c])
     return None

coeficientes = buscar_coeficientes()

a,b,c = coeficientes
print(f"Valores encontrados: valor a = {a} valor b = {b} valor = {c}") 
coeficientes

Valores encontrados: valor a = -2 valor b = 10 valor = 0


array([-2, 10,  0])

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [106]:
import numpy as np
from numpy.random import randint

aprendizaje = 0.001

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():# Implementar
    coeficientes = randint(-10, 10, 3)
    y_pred = f(X,coeficientes)
    e = error(Y, y_pred)
    while e > 1:
        nuevos_coeficientes = coeficientes + randint(-1, 2, 3) * aprendizaje
        y_pred = f(X,nuevos_coeficientes)
        nuevo_error = error(Y, y_pred)
        if nuevo_error < e:
            e = nuevo_error
            coeficientes = nuevos_coeficientes
    return coeficientes

coeficientes = buscar_coeficientes()
a,b,c = coeficientes
print(f"Valores encontrados: valor a = {a} valor b = {b} valor = {c}") 
coeficientes

Valores encontrados: valor a = -1.8269999999996904 valor b = 9.323000000000492 valor = -0.017999999998993155


array([-1.827,  9.323, -0.018])