### **Analizador de ventas**

#### **Objetivo**

Crear un programa en Python que analice un **conjunto de datos de ventas de una tienda**. El programa debe realizar varias operaciones de Data Science para proporcionar información valiosa sobre las ventas de la tienda.

#### **Consigna**

1. **Lectura de Datos**: Crear un DataFrame que contenga los datos del archivo Datos_Ventas_Tienda.csv, el cual incluirá información como fecha de venta, categoría de producto, cantidad vendida y precio.
2. **Fusión de Datos**: Crear un segundo DataFrame que contenga los datos del archivo Datos_Ventas_Tienda2.csv, y concatenarlos para tener un solo DataFrame con toda la información.
3. **Tratamiento de Datos**: Utilizar Pandas para manipular estos datos y realizar tareas como limpieza, filtrado y transformaciones básicas de datos.
4. **Análisis de ventas**: Realizar un análisis para responder preguntas como:

- ¿Cuál es el departamento con más ventas?
- ¿Cuál es el mes con más ventas?

5. **Datos agrupados**: Agrupar los datos por categoría de producto y analiza las ventas por categoría.
6. **Guardar resultados**: Al final, se guardará el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en el ordenador.


In [2]:
import pandas as pd

# ====================== #
#   CARGA Y UNIÓN DE DATOS
# ====================== #

# Carga los archivos CSV con los datos de ventas.
df1 = pd.read_csv("Datos_Ventas_Tienda.csv")
df2 = pd.read_csv("Datos_Ventas_Tienda2.csv")

# Une los dos DataFrames en uno solo.
df = pd.concat([df1, df2], ignore_index=True)

# ====================== #
#   LIMPIEZA Y TRANSFORMACIÓN
# ====================== #

# Estandariza los nombres de las columnas: minúsculas y con guiones bajos.
df.columns = df.columns.str.lower().str.replace(" ", "_")

# Convierte las columnas "precio_unitario" y "total_venta" a tipo float.
df[["precio_unitario", "total_venta"]] = df[["precio_unitario", "total_venta"]].astype("float")

# Renombra la columna "producto" a "departamento".
df = df.rename(columns={"producto": "departamento"})

# Corrige error de escritura en el nombre del departamento.
df["departamento"] = df["departamento"].replace("Electrónic", "Electrónica")

# Convierte la columna "fecha" a formato datetime.
df["fecha"] = pd.to_datetime(df["fecha"], format="%m/%d/%Y")

# Extrae el nombre del mes y lo guarda en la columna "mes".
df["mes"] = df["fecha"].dt.month_name()

# ====================== #
#   ANÁLISIS DE VENTAS
# ====================== #

# Agrupa las ventas por departamento, suma el total vendido y ordena de mayor a menor.
ventas_por_depto = df.groupby("departamento")["total_venta"].sum().sort_values(ascending=False)
# Agrupa las ventas por mes, suma el total vendido y ordena de mayor a menor.
ventas_por_mes = df.groupby("mes")["total_venta"].sum().sort_values(ascending=False)

# ====================== #
#   EXPORTAR DATA LIMPIA
# ====================== #

# Guarda el DataFrame final en un archivo CSV
df.to_csv("ventas_limpias.csv", index=False)

# ====================== #
#   RESULTADOS
# ====================== #

# Imprime los resultados.
print("📊 Ventas por departamento (ordenadas):\n", ventas_por_depto, "\n")
print("📅 Ventas por mes (ordenadas):\n", ventas_por_mes)

📊 Ventas por departamento (ordenadas):
 departamento
Electrónica    244000.0
Ropa            56400.0
Juguetes        33390.0
Libros          20840.0
Alimentos       12620.0
Name: total_venta, dtype: float64 

📅 Ventas por mes (ordenadas):
 mes
August       45090.0
January      43030.0
May          39380.0
December     33560.0
June         30520.0
February     28410.0
September    27870.0
July         26350.0
October      25610.0
April        23210.0
March        23200.0
November     21020.0
Name: total_venta, dtype: float64


### **Respuestas**

- ¿Cuál es el departamento con más ventas?  
  R.- El departamento de Electrónica, con un total de $244,000.00

- ¿Cuál es el mes con más ventas?  
  R.- Agosto, con un total de $45,090.00
