# Análisis Exploratorio de Ventas Online
Objetivo: Analizar un conjunto de datos de ventas en línea aplicando técnicas de exploración, limpieza, análisis y visualización con Python.  

* Tomas Castillo Avila

## Instrucciones Generales  
1. Descargue el archivo 'ventas_online.csv' proporcionado junto a esta actividad.  
2. Ejecute el código en Google Colab o Jupyter Notebook.  
3. Complete las respuestas solicitadas en cada sección.  
4. Entregue el Notebook en formato .ipynb o exportado como PDF. 

In [None]:
# importar librerias importantes
import pandas as pd
import matplotlib.pyplot as pl
import numpy as np

## Parte 1 — Carga y Exploración
• Cargar el dataset y mostrar las primeras 10 filas.  
• Mostrar número de filas y columnas.  
• Mostrar tipos de datos por columna.  
• Contar valores nulos por columna.  
Preguntas: ¿Cuántos valores nulos hay en cada columna? ¿Qué variables son numéricas y cuáles categóricas?  


In [None]:
# cargar el dataset
myDf = pd.read_csv("local-data/ventas_online.csv")

In [None]:
# mostrar las primeras 10 lineas
myDf.head(n=10)

In [None]:
# cantidad de filas y columnas
print("filas:",len(myDf), "   columnas:", myDf.shape[1])

In [None]:
# tipo de dato por columna
print(myDf.dtypes)

In [None]:
# valores nulos por columna
print(myDf.isnull().sum())

## Parte 2 — Limpieza de Datos
• Eliminar registros duplicados.  
• Eliminar registros con precios negativos.  
• Rellenar valores nulos en 'country' con 'Unknown'.  
Preguntas: ¿Cuántos duplicados había? ¿Cuántos registros con precios negativos fueron eliminados?  


In [None]:
# rliminar duplicados
myDf.drop_duplicates()

In [None]:
#eliminar registros con precios negativos

for i in range (myDf.shape[0]):
    if myDf.loc[i,"price"]<0:
        print(myDf.loc[i,"price"])
        # eliminar fila
        myDf.drop(i)



-398.13
-251.64
-217.68
-261.14
-478.24
-315.16
-473.81
-436.35
-218.85
-485.48


## Parte 3 — Análisis por País
• Calcular el total de ventas por país.  
• Mostrar el Top 5 países por ingresos.  
• Identificar el país con menores ingresos.  
• Generar gráfico de barras con el Top 5.  
Preguntas: ¿Cuál es el país con más ingresos? ¿Cuál tiene menos ingresos?

## Parte 4 — Análisis por Categoría
• Calcular la cantidad total vendida por categoría.  
• Mostrar categorías ordenadas de mayor a menor venta.  
• Generar gráfico de barras con las ventas por categoría.  
Preguntas: ¿Qué categoría es la más vendida? ¿Cuál es la menos vendida?  

## Parte 5 — Análisis Temporal
• Convertir la columna 'date' a tipo fecha.  
• Calcular ventas mensuales.  
• Generar gráfico de línea con la evolución mensual de ventas.  
Preguntas: ¿En qué mes hubo más ingresos? ¿Hay patrones estacionales?  

## Entrega
• Suba su Notebook (.ipynb) o PDF a la plataforma Blackboard  
• Incluya todos los gráficos generados.  
• Responda las preguntas de cada sección en el mismo Notebook.   