<a href="https://colab.research.google.com/github/Alejandro-lopez1/ventas-pandas/blob/main/Untitled3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Analizamos un archivo .xlsx donde están registradas las ventas de un local de comidas rápidas**

En este Notebook vamos a analizar y estudiar las métricas de un local, basándonos en una hoja de Excel donde se registraban las ventas diarias.

In [4]:
#Importamos las librerías necesarias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [28]:
#leer el archivo
df = pd.read_excel('ventas_negocio_simuladas.xlsx')
df.head(5)


Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta,Costo Unitario,Total Costo,Ganancia
0,2024-01-01,Cerveza,3,1500,4500,1210,3630,870
1,2024-01-01,Papas,4,1700,6800,1000,4000,2800
2,2024-01-01,Hamburguesa XL,3,3200,9600,2100,6300,3300
3,2024-01-01,Papas,2,1700,3400,1000,2000,1400
4,2024-01-01,Hamburguesa XL,5,3200,16000,2100,10500,5500


In [43]:
df.columns

Index(['Fecha', 'Producto', 'Cantidad', 'Precio Unitario', 'Total Venta',
       'Costo Unitario', 'Total Costo', 'Ganancia'],
      dtype='object')

#**En esta parte creamos una función para leer de manera más óptima los números resultados de las sumas.**

In [48]:
#Creamos una función para formatear números con separador al llegar al millar
def formatear_miles(valor, moneda=False):
  if isinstance(valor, (int, float)):
    resultado = f"{valor:,.0f}".replace(",", ".")
    return f"${resultado}" if moneda else resultado
  else:
    return valor

In [50]:
#calculamos el total de las ventas realizadas
total_venta = df['Total Venta'].sum()
print(formatear_miles(int(total_venta)))

18.535.600


#**Econtramos el producto más vendido**
¿Qué hace este código?



*   Agrupa por nombre del producto
*   Suma las cantidad vendida por cada producto
*   Ordena de mayor a menor
*   Muestra el más vendido con "head()"




In [55]:
#calculamos el producto más vendido:
producto_mas_vendido = (
    df.groupby("Producto")["Cantidad"]
    .sum()
    .sort_values(ascending=False)
)

print(producto_mas_vendido.head(3)) #los 3 más vendidos

Producto
Hamburguesa Regular    2008
Papas                  1686
Hamburguesa XL         1469
Name: Cantidad, dtype: int64


#**Producto que más ingresos generó (ventas totales)**

Asumiendo que la columna "Total Venta" representa los ingresos de cada transacción:

In [62]:
producto_mayor_ingreso = (
    df.groupby("Producto")["Total Venta"]
    .sum()
    .sort_values(ascending=False)
)

print(producto_mayor_ingreso.head(1))

Producto
Pizza    5423000
Name: Total Venta, dtype: int64


#**Ahora llegó el turno de mostrar el producto que dejó más ganancia.**

In [63]:
producto_mayor_ganancia = (
    df.groupby("Producto")["Ganancia"]
    .sum()
    .sort_values(ascending=False)
)

print(producto_mayor_ganancia.head(1))  # Producto más rentable


Producto
Pizza    2119900
Name: Ganancia, dtype: int64


#**Ahora comparamos estos valores en unsa sola tabla:**

In [65]:
df_ganancias = df.groupby("Producto")[["Cantidad", "Total Venta", "Ganancia"]].sum()
df_ganancias = df_ganancias.sort_values("Ganancia", ascending=False)

# Formatear si querés ver bonito
df_ganancias["Total Venta"] = df_ganancias["Total Venta"].apply(lambda x: formatear_miles(x, True))
df_ganancias["Ganancia"] = df_ganancias["Ganancia"].apply(lambda x: formatear_miles(x, True))

print(df_ganancias.head(3))


                     Cantidad Total Venta    Ganancia
Producto                                             
Pizza                     986  $5.423.000  $2.119.900
Hamburguesa XL           1469  $4.700.800  $1.615.900
Hamburguesa Regular      2008  $4.417.600  $1.405.600


#**Análisis diario**

In [67]:
resumen_diario = df.groupby("Fecha")[["Cantidad", "Total Venta", "Ganancia"]].sum().sort_index()
print(resumen_diario)


            Cantidad  Total Venta  Ganancia
Fecha                                      
2024-01-01        92       249400     87600
2024-01-02        83       193300     66480
2024-01-03        70       168800     56540
2024-01-04        58       172800     62850
2024-01-05        47       134700     48280
...              ...          ...       ...
2024-03-27        87       178800     58650
2024-03-28       117       348800    124630
2024-03-29        58       139900     46940
2024-03-30        51       104500     32810
2024-03-31        72       221000     81590

[91 rows x 3 columns]


#**Día más rentable**

In [68]:
mejor_dia = resumen_diario["Ganancia"].idxmax()
ganancia_max = resumen_diario["Ganancia"].max()
print(f"🤑 El día más rentable fue {mejor_dia} con una ganancia de {formatear_miles(ganancia_max, True)}")


🤑 El día más rentable fue 2024-03-07 00:00:00 con una ganancia de $126.110


#**Ventas promedio por producto**

In [72]:
promedios = df.groupby("Producto")[["Cantidad", "Total Venta", "Ganancia"]].mean()
print(formatear_miles(promedios))

                     Cantidad   Total Venta     Ganancia
Producto                                                
Cerveza              3.081967   4622.950820   893.770492
Hamburguesa Regular  2.957290   6506.038292  2070.103093
Hamburguesa XL       3.016427   9652.566735  3318.069815
Papas                2.952715   5019.614711  2066.900175
Pizza                3.006098  16533.536585  6463.109756


#**Detectar productos poco vendidos**

In [73]:
productos_poco_vendidos = df.groupby("Producto")["Cantidad"].sum().sort_values().head()
print(productos_poco_vendidos)

Producto
Cerveza                 752
Pizza                   986
Hamburguesa XL         1469
Papas                  1686
Hamburguesa Regular    2008
Name: Cantidad, dtype: int64


#**Productos con ganancia negativa (si los hubiera)**

In [74]:
perdidas = df[df["Ganancia"] < 0]
print(perdidas)

Empty DataFrame
Columns: [Fecha, Producto, Cantidad, Precio Unitario, Total Venta, Costo Unitario, Total Costo, Ganancia]
Index: []


#**Descargamos el documento ya modificado con todos los parámetros necesarios para tener en cuenta a la hora de iniciar una nueva campaña de venta**

In [76]:
from google.colab import files

#primero guardamos el progreso:
df.to_excel("ventas_modificado.xlsx", index=False)

#ahora creamos el script que nos va a permitir descargarlo
files.download("ventas_modificado.xlsx")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>