# **Análisis de venta**

Análisis exploratorio de una tabla de ventas proporcionada por negocio.


## **Contexto de los datos**

Cada fila de la tabla representa una venta individual.
El objetivo de este análisis es entender el comportamiento de las ventas
por producto, canal y fecha, y detectar posibles problemas de calidad
en los datos antes de analizarlos.


## **Carga de datos** 

Se carga el archivo CSV proporcionado por negocio para comenzar
la inspección inicial de los datos.


In [5]:
import pandas as pd

df = pd.read_csv("../data/raw/ventas_sucias.csv")

### Inspección inicial

Primera visualización de los datos para entender estructura y contenido general.


In [6]:
df.head()

Unnamed: 0,id_venta,fecha,cliente,producto,precio,cantidad,canal
0,1,2024-01-05,Ana López,Teclado,25.5,2.0,web
1,2,05/01/2024,Carlos Ruiz,Ratón,15.0,1.0,tienda
2,3,2024-01-06,,Monitor,180.0,1.0,web
3,4,2024-01-06,Marta Pérez,Teclado,25.5,,tienda
4,5,2024/01/07,Juan Gómez,Portátil,850.0,1.0,web


### Estructura y tipos de datos

Se revisa la estructura del DataFrame para identificar tipos de datos,
valores nulos y posibles problemas antes de realizar cualquier limpieza.


In [7]:
df.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   id_venta  8 non-null      int64  
 1   fecha     8 non-null      object 
 2   cliente   7 non-null      object 
 3   producto  8 non-null      object 
 4   precio    8 non-null      float64
 5   cantidad  7 non-null      float64
 6   canal     7 non-null      object 
dtypes: float64(2), int64(1), object(4)
memory usage: 580.0+ bytes


In [8]:
df.isna().sum()

id_venta    0
fecha       0
cliente     1
producto    0
precio      0
cantidad    1
canal       1
dtype: int64

## Observaciones iniciales

A partir de la inspección inicial se observan los siguientes problemas:

- Existen valores nulos en las columnas `cliente`, `cantidad` y `canal`.
- La columna `fecha` está almacenada como texto y no como datetime.
- La columna `cantidad` debería contener valores enteros positivos.
- Hay datos que no cumplen las reglas mínimas de negocio para una venta válida.

## <u> Objetivos del Análisis </u>

El objetivo de este análisis es obtener una visión general del rendimiento
de las ventas a partir de la información disponible.

En concreto, se pretende responder a las siguientes preguntas:

- ¿Cuántas ventas se han realizado en total?
- ¿Cuáles son los clientes que más y menos han comprado?
- ¿Qué productos se venden con mayor y menor frecuencia?
- ¿Cuánto dinero se ha gastado cada cliente?
- ¿Cuál es el gasto medio por cliente?
- ¿Cómo evolucionan las ventas a lo largo del tiempo?
- ¿Qué día se vendió más y qué día se vendió menos?
- ¿Qué canal de venta genera mayores ingresos?
