# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [9]:
import pandas as pd

def cargar_datos():
    # Definir las longitudes de las columnas de ancho fijo
    colspecs = [(0, 10), (10, 40), (40, 50), (50, 55)]
    # Definir los nombres de las columnas
    column_names = ["fecha", "producto", "precio", "cantidad"]
    
    # Leer el archivo usando read_fwf (fixed width format)
    df = pd.read_fwf("datos.dat", colspecs=colspecs, header=None, names=column_names)
    
    return df

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Imprimir el DataFrame para verificar los datos cargados
print(datos)


         fecha    producto  precio  cantidad
0   2024-08-27     Mirinda    1510        14
1   2024-08-27     Mirinda    1560        12
2   2024-08-28     Torasso     940         8
3   2024-08-29  Pepsi Cola    1210        10
4   2024-08-30     Mirinda    1520         1
5   2024-09-01     Mirinda    1550        15
6   2024-09-01      Sprite     810         4
7   2024-09-02   Coca Cola    1100         4
8   2024-09-02  Pepsi Cola    1220        13
9   2024-09-02     Torasso     910         5
10  2024-09-02     Torasso     920         3
11  2024-09-03   Coca Cola    1020         8
12  2024-09-03     Mirinda    1570         7
13  2024-09-03     Mirinda    1590         2
14  2024-09-04  Pepsi Cola    1220        13
15  2024-09-05     Mirinda    1500         3
16  2024-09-05  Pepsi Cola    1300         5
17  2024-09-06   Coca Cola    1080         1
18  2024-09-06      Sprite     860        12
19  2024-09-06     Torasso     930         3
20  2024-09-07   Coca Cola    1080        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [10]:
def calcular_totales(df):
    total_importe = (df['precio'] * df['cantidad']).sum()
    total_cantidad = df['cantidad'].sum()
    
    return total_importe, total_cantidad


datos = cargar_datos()


importe, cantidad = calcular_totales(datos)


print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [11]:
def unidades_vendidas(df):
    
    ventas_por_producto = df.groupby('producto')['cantidad'].sum()
    
    return ventas_por_producto

def listar_ventas(ventas):
    for producto, cantidad in ventas.items():
        print(f"Producto: {producto}, Unidades Vendidas: {cantidad}")


datos = cargar_datos()


ventas = unidades_vendidas(datos)


listar_ventas(ventas)


Producto: Coca Cola, Unidades Vendidas: 57
Producto: Mirinda, Unidades Vendidas: 85
Producto: Pepsi Cola, Unidades Vendidas: 89
Producto: Sprite, Unidades Vendidas: 72
Producto: Torasso, Unidades Vendidas: 32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [12]:
def precio_promedio(df):
   
    precio_promedio_por_producto = df.groupby('producto')['precio'].mean()
    
    return precio_promedio_por_producto

def listar_precios(precios):
    for producto, promedio in precios.items():
        print(f"Producto: {producto}, Precio Promedio: ${promedio:.2f}")


datos = cargar_datos()


precios = precio_promedio(datos)


listar_precios(precios)


Producto: Coca Cola, Precio Promedio: $1072.50
Producto: Mirinda, Precio Promedio: $1545.83
Producto: Pepsi Cola, Precio Promedio: $1245.00
Producto: Sprite, Precio Promedio: $841.43
Producto: Torasso, Precio Promedio: $920.00


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [13]:
def ranking_productos(df, top=3):
    
    ventas_por_producto = df.groupby('producto')['cantidad'].sum()
    

    ranking = ventas_por_producto.sort_values(ascending=False)
    

    return ranking.head(top)

def listar_ranking(ranking):
    for i, (producto, cantidad) in enumerate(ranking.items(), start=1):
        print(f"#{i} Producto: {producto}, Unidades Vendidas: {cantidad}")


datos = cargar_datos()


ranking = ranking_productos(datos)


listar_ranking(ranking)


#1 Producto: Pepsi Cola, Unidades Vendidas: 89
#2 Producto: Mirinda, Unidades Vendidas: 85
#3 Producto: Sprite, Unidades Vendidas: 72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [14]:
def ventas_por_mes(df):
    
    df['fecha'] = pd.to_datetime(df['fecha'])
    
    
    df['mes'] = df['fecha'].dt.to_period('M')
    
    
    ventas_mensuales = df.groupby(['mes', 'producto'])['cantidad'].sum().unstack(fill_value=0)
    
    return ventas_mensuales

def listar_ventas_mensuales(ventas):
    for mes, productos in ventas.iterrows():
        print(f"\nVentas en {mes}:")
        for producto, cantidad in productos.items():
            if cantidad > 0:  # Solo listar productos con ventas
                print(f"  Producto: {producto}, Unidades Vendidas: {cantidad}")


datos = cargar_datos()


ventas = ventas_por_mes(datos)


listar_ventas_mensuales(ventas)



Ventas en 2024-08:
  Producto: Mirinda, Unidades Vendidas: 27
  Producto: Pepsi Cola, Unidades Vendidas: 10
  Producto: Torasso, Unidades Vendidas: 8

Ventas en 2024-09:
  Producto: Coca Cola, Unidades Vendidas: 57
  Producto: Mirinda, Unidades Vendidas: 58
  Producto: Pepsi Cola, Unidades Vendidas: 79
  Producto: Sprite, Unidades Vendidas: 72
  Producto: Torasso, Unidades Vendidas: 24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [15]:
def resumen_ventas(df):
    # Calcular las unidades vendidas y el precio promedio
    ventas = unidades_vendidas(df)
    precios_promedio = precio_promedio(df)

    # Crear un DataFrame para almacenar el resumen de ventas
    resumen_por_producto = pd.DataFrame(index=df['producto'].unique())
    resumen_por_producto['unidades_vendidas'] = resumen_por_producto.index.map(ventas)
    resumen_por_producto['precio_promedio'] = resumen_por_producto.index.map(precios_promedio)
    
    # Calcular el total vendido
    resumen_por_producto['total_vendido'] = df.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())
    
    return resumen_por_producto

def informe_ventas(resumen):
    # Ordenar los productos alfabéticamente
    productos_ordenados = resumen.sort_index()

    print("Resumen de Ventas por Producto (ordenado alfabéticamente):\n")
    for producto, datos in productos_ordenados.iterrows():
        print(f"Producto: {producto}")
        print(f"  Precio Promedio: ${datos['precio_promedio']:.2f}")
        print(f"  Unidades Vendidas: {datos['unidades_vendidas']}")
        print(f"  Importe Total Vendido: ${datos['total_vendido']:.2f}\n")

# Cargar los datos en un DataFrame (usando el primer bloque que implementamos antes)
datos = cargar_datos()

# Obtener el resumen de ventas
resumen = resumen_ventas(datos)

# Generar el informe de ventas
informe_ventas(resumen)


Resumen de Ventas por Producto (ordenado alfabéticamente):

Producto: Coca Cola
  Precio Promedio: $1072.50
  Unidades Vendidas: 57.0
  Importe Total Vendido: $60780.00

Producto: Mirinda
  Precio Promedio: $1545.83
  Unidades Vendidas: 85.0
  Importe Total Vendido: $131080.00

Producto: Pepsi Cola
  Precio Promedio: $1245.00
  Unidades Vendidas: 89.0
  Importe Total Vendido: $110510.00

Producto: Sprite
  Precio Promedio: $841.43
  Unidades Vendidas: 72.0
  Importe Total Vendido: $61040.00

Producto: Torasso
  Precio Promedio: $920.00
  Unidades Vendidas: 32.0
  Importe Total Vendido: $29320.00



  resumen_por_producto['total_vendido'] = df.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [16]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    pass # Implementar

coeficientes = buscar_coeficientes()
coeficientes

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [17]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    pass # Implementar


coeficientes = buscar_coeficientes()
coeficientes