# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd
def cargar_datos():
    lineas=open("datos.dat","r").readlines()
    
    lugares=[10,30,10,5]
    claves=["Fecha","Producto","Precio","Cantidad"]
    listaDiccionarios=[]
    for elem in lineas:
        diccionario={}
        posicion=0
        for clave, lugar in zip(claves, lugares): #zip() convierte en tuplas los elementos de cada lista, sirve para iterar listas simultaneamente
            diccionario[clave]=elem[posicion:posicion+lugar].strip() #Quita los espacion en blanco.
            #                                                Strip devuelve una cadena limpia, mientras que split devuelve una lista de subcadenas
            posicion+=lugar #      0/10/40/50 --- 10/40/50/55
        listaDiccionarios.append(diccionario)
    
    return listaDiccionarios
dataFrame=pd.DataFrame(cargar_datos())
datos = dataFrame
print(datos)

## Otra Opcion mas simple con Panda
# def cargar_datos_en_dataframe():
#     # Carga los datos en un DataFrame utilizando pd.read_fwf
#     df = pd.read_fwf("datos.dat", 
#                     widths=[10, 30, 10, 5], 
#                     names=["Fecha", "Producto", "Precio", "Cantidad"], 
#                     header=None)
    
#     return df

# datos = cargar_datos_en_dataframe()
# print(datos)

         Fecha    Producto  Precio  Cantidad
0   2024-08-27     Mirinda    1510        14
1   2024-08-27     Mirinda    1560        12
2   2024-08-28     Torasso     940         8
3   2024-08-29  Pepsi Cola    1210        10
4   2024-08-30     Mirinda    1520         1
5   2024-09-01     Mirinda    1550        15
6   2024-09-01      Sprite     810         4
7   2024-09-02   Coca Cola    1100         4
8   2024-09-02  Pepsi Cola    1220        13
9   2024-09-02     Torasso     910         5
10  2024-09-02     Torasso     920         3
11  2024-09-03   Coca Cola    1020         8
12  2024-09-03     Mirinda    1570         7
13  2024-09-03     Mirinda    1590         2
14  2024-09-04  Pepsi Cola    1220        13
15  2024-09-05     Mirinda    1500         3
16  2024-09-05  Pepsi Cola    1300         5
17  2024-09-06   Coca Cola    1080         1
18  2024-09-06      Sprite     860        12
19  2024-09-06     Torasso     930         3
20  2024-09-07   Coca Cola    1080        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [5]:
def calcular_totales(datos):
    datos['Precio']=pd.to_numeric(datos['Precio'])
    datos['Cantidad']=pd.to_numeric(datos['Cantidad'])
    return ( datos['Precio']*datos['Cantidad'] ).sum(), (datos['Cantidad'].sum())

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [9]:
def unidades_vendidas(datos):
    datos['Cantidad']=pd.to_numeric(datos['Cantidad'])
    ventas=datos.groupby('Producto')['Cantidad'].sum()
    print(ventas.to_string())
unidades_vendidas(datos)

Producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [17]:
def precio_promedio(datos):
    datos['Precio'] = pd.to_numeric(datos['Precio'])
    precios_promedio = datos.groupby('Producto')['Precio'].mean().to_dict()
    return precios_promedio

promedios=precio_promedio(datos)
def listar_promedios(datos):
    for producto, promedio in datos.items():
        print(f"Producto: {producto}\nPrecio promedio: {promedio:.2f}\n")
listar_promedios(promedios)

Producto: Coca Cola
Precio promedio: 1072.50

Producto: Mirinda
Precio promedio: 1545.83

Producto: Pepsi Cola
Precio promedio: 1245.00

Producto: Sprite
Precio promedio: 841.43

Producto: Torasso
Precio promedio: 920.00



### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [18]:
def ranking_productos(datos, top=3):
    datos['Cantidad'] = pd.to_numeric(datos['Cantidad'])
    ranking = datos.groupby('Producto')['Cantidad'].sum().sort_values(ascending=False).nlargest(top)
    return ranking
def listarRanking(ranking):
    for i, (prod, cant) in enumerate(ranking.items()):
        print(f"{i+1}) - {prod} (vendió {cant} unidades)\n")
ranking =ranking_productos(datos)
listarRanking(ranking)

1) - Pepsi Cola (vendió 89 unidades)

2) - Mirinda (vendió 85 unidades)

3) - Sprite (vendió 72 unidades)



### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [21]:
def ventas_por_mes(datos):
    datos['Fecha'] = pd.to_datetime(datos['Fecha'])
    datos['Cantidad'] = pd.to_numeric(datos['Cantidad'])
    datos['Mes'] = datos['Fecha'].dt.month
    
    ventas_mes = datos.groupby(['Mes', 'Producto'])['Cantidad'].sum().unstack('Producto')
    ventas_mes = ventas_mes.fillna(0)
    return ventas_mes
def listarVentasMensuales(datos):
    for index, fila in datos.iterrows():
        print(f"\nVentas mes: {index}:\n")
        for producto, cantidad in fila.items():
            print(f"\t{producto}: {int(cantidad)} unidades")
ventas =ventas_por_mes(datos)
listarVentasMensuales(ventas)


Ventas mes: 8:

	Coca Cola: 0 unidades
	Mirinda: 27 unidades
	Pepsi Cola: 10 unidades
	Sprite: 0 unidades
	Torasso: 8 unidades

Ventas mes: 9:

	Coca Cola: 57 unidades
	Mirinda: 58 unidades
	Pepsi Cola: 79 unidades
	Sprite: 72 unidades
	Torasso: 24 unidades


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [22]:
def resumen_ventas(datos):
    datos['Precio'] = pd.to_numeric(datos['Precio'])
    datos['Cantidad'] = pd.to_numeric(datos['Cantidad'])
    
    resumen = datos.groupby('Producto').agg({
        'Precio': 'mean',
        'Cantidad': 'sum'
    }).rename(columns={'Precio': 'Precio promedio', 'Cantidad': 'Cantidad vendida'})
    
    resumen['Importe total'] = resumen['Precio promedio'] * resumen['Cantidad vendida']
    
    return resumen

def informe_ventas(datos):
    print("Resumen de ventas:")
    for index, fila in datos.sort_index().iterrows():
        print(f"\nProducto:\n\t{index}")
        print(f"\tPrecio promedio: ${fila['Precio promedio']:.2f}")
        print(f"\tCantidad vendida: {int(fila['Cantidad vendida'])} unidades")
        print(f"\tImporte total: ${fila['Importe total']:.2f}")

resumen =resumen_ventas(datos)
informe_ventas(resumen)


Resumen de ventas:

Producto:
	Coca Cola
	Precio promedio: $1072.50
	Cantidad vendida: 57 unidades
	Importe total: $61132.50

Producto:
	Mirinda
	Precio promedio: $1545.83
	Cantidad vendida: 85 unidades
	Importe total: $131395.83

Producto:
	Pepsi Cola
	Precio promedio: $1245.00
	Cantidad vendida: 89 unidades
	Importe total: $110805.00

Producto:
	Sprite
	Precio promedio: $841.43
	Cantidad vendida: 72 unidades
	Importe total: $60582.86

Producto:
	Torasso
	Precio promedio: $920.00
	Cantidad vendida: 32 unidades
	Importe total: $29440.00


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [23]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    for a in np.arange(-20, 21):
        for b in np.arange(-20, 21):
            for c in np.arange(-20, 21):
                coeficientes = np.array([a, b, c])
                y_pred = f(X, coeficientes)
                if np.all(error(Y, y_pred) == 0):
                    return coeficientes
    return "No se encontró solución exacta."

coeficientes = buscar_coeficientes()
coeficientes

array([-2, 10,  0])

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [24]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    aprendizaje = 0.001
    errorVigente = error(Y, f(X, coeficientes))
    
    while errorVigente > 1:
        nuevos_coeficientes = coeficientes + randint(-10, 10, 3) * aprendizaje
        errorActualizado = error(Y, f(X, nuevos_coeficientes))
        
        if errorActualizado < errorVigente:
            coeficientes = nuevos_coeficientes
            errorVigente = errorActualizado
    
    return coeficientes

coeficientes = buscar_coeficientes()
coeficientes

array([-1.778,  8.955,  0.613])