# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

def cargar_datos():
    # Definir los anchos de las columnas basadas en el formato de ancho fijo
    widths = [10, 30, 10, 5]
    # Definir los nombres de las columnas
    column_names = ['fecha', 'producto', 'precio', 'cantidad']
    # Leer el archivo de ancho fijo en un DataFrame
    df = pd.read_fwf('datos.dat', widths=widths, names=column_names)
    return df

# Cargar los datos en un DataFrame
datos = cargar_datos()
datos

Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
import pandas as pd

def calcular_totales(datos):
    # Calcular el importe total (precio * cantidad)
    datos['importe'] = datos['precio'] * datos['cantidad']
    # Sumar el importe total y la cantidad total de unidades utilizando métodos de Pandas
    importe_total = datos['importe'].sum()
    cantidad_total = datos['cantidad'].sum()
    return importe_total, cantidad_total

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Calcular los totales
importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
import pandas as pd

def unidades_vendidas(datos):
    # Agrupar por producto y sumar las cantidades vendidas
    unidades_por_producto = datos.groupby('producto')['cantidad'].sum()
    return unidades_por_producto

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Listar las unidades vendidas por producto
unidades_vendidas_por_producto = unidades_vendidas(datos)
print(unidades_vendidas_por_producto)

producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: cantidad, dtype: int64


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [4]:
import pandas as pd

def precio_promedio(datos):
    # Agrupar por producto y calcular el precio promedio
    precio_promedio_por_producto = datos.groupby('producto')['precio'].mean()
    return precio_promedio_por_producto

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Calcular el precio promedio por producto
precio_promedio_por_producto = precio_promedio(datos)
print(precio_promedio_por_producto)


producto
Coca Cola     1072.500000
Mirinda       1545.833333
Pepsi Cola    1245.000000
Sprite         841.428571
Torasso        920.000000
Name: precio, dtype: float64


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [5]:
import pandas as pd

def ranking_productos(datos, top=3):
    # Verificar que los datos se han cargado correctamente
    if datos.empty:
        print("No se han cargado datos.")
        return pd.DataFrame()
    # Agrupar por producto y sumar las cantidades vendidas
    unidades_por_producto = datos.groupby('producto')['cantidad'].sum()
    
    # Verificar que la agrupación se ha realizado correctamente
    if unidades_por_producto.empty:
        print("No se encontraron productos.")
        return pd.DataFrame()
    
    # Ordenar los productos por la cantidad de unidades vendidas de mayor a menor
    ranking = unidades_por_producto.sort_values(ascending=False)
    
    # Convertir la serie a un DataFrame para formatear la salida
    ranking_df = ranking.reset_index()
    
    # Imprimir la agrupación para depuración
    print("Unidades por producto:")
    for _, row in ranking_df.iterrows():
        print(f"{row['producto']}: {row['cantidad']} unidades")
    
    # Seleccionar los top N productos
    top_ranking = ranking_df.head(top) 
    return top_ranking
# Cargar los datos en un DataFrame
datos = cargar_datos()

# Obtener e imprimir el ranking de los productos más vendidos
ranking = ranking_productos(datos)


Unidades por producto:
Pepsi Cola: 89 unidades
Mirinda: 85 unidades
Sprite: 72 unidades
Coca Cola: 57 unidades
Torasso: 32 unidades


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [6]:
import pandas as pd

def ventas_por_mes(datos):
    # Convertir la columna 'fecha' a tipo datetime
    datos['fecha'] = pd.to_datetime(datos['fecha'])
    # Extraer el mes y el año de la fecha
    datos['mes'] = datos['fecha'].dt.to_period('M')
    # Agrupar por mes y producto, y sumar las cantidades vendidas
    ventas_mensuales = datos.groupby(['mes', 'producto'])['cantidad'].sum().reset_index()
    # Pivotar la tabla para tener los productos como columnas y los meses como filas
    ventas_pivot = ventas_mensuales.pivot(index='mes', columns='producto', values='cantidad').fillna(0)
    # Convertir las cantidades a enteros
    ventas_pivot = ventas_pivot.astype(int)
    return ventas_pivot

def imprimir_ventas_por_mes(ventas_pivot):
    # Imprimir las ventas por mes de manera legible
    for mes in ventas_pivot.index:
        print(f"Mes: {mes}")
        for producto in ventas_pivot.columns:
            print(f"  {producto}: {ventas_pivot.loc[mes, producto]} unidades")
        print()

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Obtener las ventas por mes
ventas_mensuales = ventas_por_mes(datos)

# Imprimir las ventas por mes de manera legible
imprimir_ventas_por_mes(ventas_mensuales)

Mes: 2024-08
  Coca Cola: 0 unidades
  Mirinda: 27 unidades
  Pepsi Cola: 10 unidades
  Sprite: 0 unidades
  Torasso: 8 unidades

Mes: 2024-09
  Coca Cola: 57 unidades
  Mirinda: 58 unidades
  Pepsi Cola: 79 unidades
  Sprite: 72 unidades
  Torasso: 24 unidades



### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [7]:
import pandas as pd

def resumen_ventas(datos):
    # Calcular el precio promedio por producto
    precio_promedio = datos.groupby('producto')['precio'].mean()
    
    # Calcular la cantidad total de unidades vendidas por producto
    cantidad_vendida = datos.groupby('producto')['cantidad'].sum()
    
    # Calcular el importe total vendido por producto
    datos['importe'] = datos['precio'] * datos['cantidad']
    importe_total = datos.groupby('producto')['importe'].sum()
    
    # Combinar los resultados en un DataFrame
    resumen = pd.DataFrame({
        'Precio Promedio': precio_promedio,
        'Cantidad Vendida': cantidad_vendida,
        'Importe Total': importe_total
    })
    
    # Ordenar el DataFrame alfabéticamente por producto
    resumen = resumen.sort_index()
    
    # Convertir las cantidades a enteros
    resumen['Cantidad Vendida'] = resumen['Cantidad Vendida'].astype(int)
    
    return resumen

def imprimir_resumen_ventas(resumen):
    # Imprimir el resumen de ventas de manera legible
    for producto in resumen.index:
        print(f"Producto: {producto}")
        print(f"  Precio Promedio: ${resumen.loc[producto, 'Precio Promedio']:.2f}")
        print(f"  Cantidad Vendida: {resumen.loc[producto, 'Cantidad Vendida']} unidades")
        print(f"  Importe Total: ${resumen.loc[producto, 'Importe Total']:.2f}")
        print()

# Cargar los datos en un DataFrame
datos = cargar_datos()

# Obtener el resumen de ventas
resumen = resumen_ventas(datos)

# Imprimir el resumen de ventas de manera legible
imprimir_resumen_ventas(resumen)

Producto: Coca Cola
  Precio Promedio: $1072.50
  Cantidad Vendida: 57 unidades
  Importe Total: $60780.00

Producto: Mirinda
  Precio Promedio: $1545.83
  Cantidad Vendida: 85 unidades
  Importe Total: $131080.00

Producto: Pepsi Cola
  Precio Promedio: $1245.00
  Cantidad Vendida: 89 unidades
  Importe Total: $110510.00

Producto: Sprite
  Precio Promedio: $841.43
  Cantidad Vendida: 72 unidades
  Importe Total: $61040.00

Producto: Torasso
  Precio Promedio: $920.00
  Cantidad Vendida: 32 unidades
  Importe Total: $29320.00



## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [8]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    # Crear la matriz de diseño para el sistema de ecuaciones lineales
    A = np.vstack([X**2, X, np.ones(len(X))]).T
    # Resolver el sistema de ecuaciones lineales para encontrar los coeficientes
    coeficientes, _, _, _ = np.linalg.lstsq(A, Y, rcond=None)
    # Redondear los coeficientes a valores enteros
    coeficientes = np.round(coeficientes).astype(int)
    return coeficientes

coeficientes = buscar_coeficientes()
print("Coeficientes encontrados:", coeficientes)

Coeficientes encontrados: [-2 10  0]


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [9]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])  # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    # Crear un array con los coeficientes elegidos al azar
    coeficientes = randint(-10, 10, 3)
    aprendizaje = 0.001
    error_actual = error(Y, f(X, coeficientes))
    
    while error_actual > 1:
        # Definir nuevos coeficientes agregándoles un pequeño valor al azar
        nuevos_coeficientes = coeficientes + aprendizaje * randint(-10, 10, 3)
        nuevo_error = error(Y, f(X, nuevos_coeficientes))
        
        # Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales
        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error
    
    return coeficientes

coeficientes = buscar_coeficientes()
print("Coeficientes encontrados:", coeficientes)

Coeficientes encontrados: [-1.899  9.688 -0.146]
