## **TPI Data Analytics - Yamila Lerman**

#📋 CONFIGURACIÓN INICIAL

- Cargo librerías: Pandas y Numpy.
- Cargo los datasets.




In [4]:
import pandas as pd
import numpy as np

ventas_df = pd.read_csv('/content/drive/MyDrive/Portfolio_DataAnalyst_Yamila_Lerman/Análisis-de-datos-c-Python/LermanYamila-Comisión25261-TPIDataAnalytics/Datasets/ventas.csv')
clientes_df = pd.read_csv('/content/drive/MyDrive/Portfolio_DataAnalyst_Yamila_Lerman/Análisis-de-datos-c-Python/LermanYamila-Comisión25261-TPIDataAnalytics/Datasets/clientes.csv')
marketing_df = pd.read_csv('/content/drive/MyDrive/Portfolio_DataAnalyst_Yamila_Lerman/Análisis-de-datos-c-Python/LermanYamila-Comisión25261-TPIDataAnalytics/Datasets/marketing.csv')

print("✅ Datasets cargados exitosamente")
print(f"Ventas: {len(ventas_df)} registros")
print(f"Clientes: {len(clientes_df)} registros")
print(f"Marketing: {len(marketing_df)} registros")

✅ Datasets cargados exitosamente
Ventas: 3035 registros
Clientes: 567 registros
Marketing: 90 registros


# 🔹 ETAPA 1: RECOPILACIÓN Y PREPARACIÓN DE DATOS



Limpieza de datos, calculo de Ventas Mensuales y por Producto:
1. El programa verifica los tipos de datos que tenemos en el dataset ventas.
2. Limpio el tipo de datos precio y lo convierte.
3. Calculo la venta total después de convertir el precio.
3. Normalizo fecha.
4. Elimino registros con fecha invalidas.


In [5]:
print("Tipos de datos de las columnas:")
print(ventas_df.dtypes)

Tipos de datos de las columnas:
id_venta         int64
producto        object
precio          object
cantidad       float64
fecha_venta     object
categoria       object
dtype: object


In [6]:
ventas_df['precio'] = ventas_df['precio'].str.replace('$', '').str.replace(',', '').astype(float)

ventas_df['venta_total'] = ventas_df['precio'] * ventas_df['cantidad']

ventas_df['fecha_venta'] = pd.to_datetime(ventas_df['fecha_venta'], errors='coerce')


if ventas_df['fecha_venta'].isnull().any():
    print("⚠️ Advertencia: Hay fechas que no pudieron ser convertidas. Se eliminarán estos registros.")
    ventas_df = ventas_df.dropna(subset=['fecha_venta'])

print("✅ CONVERSIONES COMPLETADAS")
print(f"Tipos de datos actualizados:")
print(ventas_df.dtypes)

⚠️ Advertencia: Hay fechas que no pudieron ser convertidas. Se eliminarán estos registros.
✅ CONVERSIONES COMPLETADAS
Tipos de datos actualizados:
id_venta                int64
producto               object
precio                float64
cantidad              float64
fecha_venta    datetime64[ns]
categoria              object
venta_total           float64
dtype: object


5. Calculo las ventas mensuales.

In [7]:
ventas_mensuales = ventas_df.groupby(ventas_df['fecha_venta'].dt.month)['venta_total'].sum()

print("📈 VENTAS MENSUALES:")
print("=" * 45)
for mes, total in ventas_mensuales.items():
    print(f"Mes {mes}: ${total:.2f}")

print(f"\n💰 VENTA TOTAL GLOBAL: ${ventas_df['venta_total'].sum():.2f}")

📈 VENTAS MENSUALES:
Mes 1: $35813.42
Mes 2: $62419.50
Mes 3: $41350.64
Mes 4: $40841.22
Mes 5: $49496.33
Mes 6: $50875.32
Mes 7: $58644.45
Mes 8: $52239.92
Mes 9: $42206.39
Mes 10: $49905.12
Mes 11: $54428.57
Mes 12: $44756.34

💰 VENTA TOTAL GLOBAL: $582977.22


6. Calculo las ventas por producto.

In [8]:
print("💳 RESUMEN DE VENTAS POR PRODUCTO:")
print("=" * 45)
ventas_por_producto = ventas_df.groupby('producto').agg({
    'cantidad': 'sum',
    'venta_total': 'sum'
}).sort_values('venta_total', ascending=False)

print(ventas_por_producto)

💳 RESUMEN DE VENTAS POR PRODUCTO:
                        cantidad  venta_total
producto                                     
Auriculares                395.0     33126.87
Lámpara de mesa            439.0     32901.91
Microondas                 307.0     25593.56
SmartWatch                 311.0     23535.69
Smartphone                 255.0     22664.16
Batidora                   315.0     22358.79
Plancha de vapor           317.0     21761.04
Secadora                   313.0     21640.83
Cafetera                   285.0     21196.70
Elementos de cerámica      255.0     21099.14
Proyector                  281.0     20848.63
Adorno de pared            295.0     20810.59
Cuadro decorativo          287.0     20720.84
Laptop                     254.0     20705.19
Cortinas                   273.0     20579.21
Jarrón decorativo          287.0     20432.32
Aspiradora                 260.0     20166.93
Consola de videojuegos     255.0     19995.71
Rincón de plantas          278.0     19002.03


Estructuras de Datos:

- Decidí usar DICCIONARIOS para almacenar datos de ventas y mostrar un ejemplo.
- El sistema muestra los primeros 5 registros del diccionario.
- Agregué una justificación de la decisión para estructurar los datos.


In [9]:
print("📊 ESTRUCTURAS DE DATOS")
print("=" * 45)

ventas_dict = {
    'productos': ventas_df['producto'].tolist(),
    'precios': ventas_df['precio'].tolist(),
    'cantidades': ventas_df['cantidad'].tolist(),
    'ventas_totales': ventas_df['venta_total'].tolist(),
    'categorias': ventas_df['categoria'].tolist()
}

print("🛒 EJEMPLO DE DICCIONARIO DE VENTAS:")
print(f"Total de registros almacenados: {len(ventas_dict['productos'])}")
print(f"Productos únicos: {len(set(ventas_dict['productos']))}")
print("\n📋 MUESTRA DE DATOS EN DICCIONARIO (primeros 5):")
for i in range(5):
    print(f"• {ventas_dict['productos'][i]} | ${ventas_dict['precios'][i]} x {ventas_dict['cantidades'][i]} = ${ventas_dict['ventas_totales'][i]:.2f} | {ventas_dict['categorias'][i]}")

print(f"\n💡 JUSTIFICACIÓN: Usamos DICCIONARIOS porque:")
print("  • Son más eficientes para datos estructurados")
print("  • Permiten acceso rápido por clave")
print("  • Facilitan la organización de datos relacionados")
print("  • Son ideales para este tipo de análisis de ventas")

📊 ESTRUCTURAS DE DATOS
🛒 EJEMPLO DE DICCIONARIO DE VENTAS:
Total de registros almacenados: 1189
Productos únicos: 30

📋 MUESTRA DE DATOS EN DICCIONARIO (primeros 5):
• Cuadro decorativo | $69.94 x 5.0 = $349.70 | Decoración
• Lámpara de mesa | $105.1 x 5.0 = $525.50 | Decoración
• Secadora | $97.96 x 3.0 = $293.88 | Electrodomésticos
• Heladera | $114.35 x 8.0 = $914.80 | Electrodomésticos
• Secadora | $106.21 x 4.0 = $424.84 | Electrodomésticos

💡 JUSTIFICACIÓN: Usamos DICCIONARIOS porque:
  • Son más eficientes para datos estructurados
  • Permiten acceso rápido por clave
  • Facilitan la organización de datos relacionados
  • Son ideales para este tipo de análisis de ventas


Análisis Exploratorio con Pandas:
1. Muestro la información general del dataset ventas.
2. Muestro la información estructural.
3. Muestro estadísticas descriptivas.

In [10]:
print("ANÁLISIS EXPLORATORIO CON PANDAS")
print("=" * 65)

print("DATASET DE VENTAS - INFORMACIÓN GENERAL")
print("=" * 65)
print(ventas_df.head(8))

print("\nINFORMACIÓN ESTRUCTURAL:")
print(ventas_df.info())

print("\nESTADÍSTICAS DESCRIPTIVAS - VENTAS:")
print(ventas_df[['precio', 'cantidad', 'venta_total']].describe())


ANÁLISIS EXPLORATORIO CON PANDAS
DATASET DE VENTAS - INFORMACIÓN GENERAL
   id_venta           producto  precio  cantidad fecha_venta  \
0       792  Cuadro decorativo   69.94       5.0  2024-02-01   
1       811    Lámpara de mesa  105.10       5.0  2024-02-01   
2      1156           Secadora   97.96       3.0  2024-02-01   
3      1372           Heladera  114.35       8.0  2024-02-01   
4      1546           Secadora  106.21       4.0  2024-02-01   
5      1697    Horno eléctrico   35.35       9.0  2024-02-01   
6      1710   Plancha de vapor   65.43       2.0  2024-02-01   
7      2959          Proyector   88.17       9.0  2024-02-01   

           categoria  venta_total  
0         Decoración       349.70  
1         Decoración       525.50  
2  Electrodomésticos       293.88  
3  Electrodomésticos       914.80  
4  Electrodomésticos       424.84  
5  Electrodomésticos       318.15  
6  Electrodomésticos       130.86  
7        Electrónica       793.53  

INFORMACIÓN ESTRUCTURAL:


Calidad de Datos:
1. Defino una función para analizar la calidad de los datos por datasets.
2. Aplico el análisis a cada dataset.

In [11]:
print("✅ CALIDAD DE DATOS")
print("=" * 40)

print("ANÁLISIS DE CALIDAD POR DATASET:")
print("=" * 40)


def analizar_calidad(df, nombre):
    print(f"\n📊 {nombre.upper()}:")
    print(f"Registros: {len(df)}")
    print(f"Valores nulos: {df.isnull().sum().sum()}")
    print(f"Duplicados: {df.duplicated().sum()}")
    if df.isnull().sum().sum() > 0:
        print("Desglose de nulos:")
        for columna, nulos in df.isnull().sum().items():
            if nulos > 0:
                print(f"  - {columna}: {nulos} nulos")


analizar_calidad(ventas_df, "ventas")
analizar_calidad(clientes_df, "clientes")
analizar_calidad(marketing_df, "marketing")


✅ CALIDAD DE DATOS
ANÁLISIS DE CALIDAD POR DATASET:

📊 VENTAS:
Registros: 1189
Valores nulos: 0
Duplicados: 35

📊 CLIENTES:
Registros: 567
Valores nulos: 0
Duplicados: 0

📊 MARKETING:
Registros: 90
Valores nulos: 0
Duplicados: 0


## 🔹 ETAPA 2: PREPROCESAMIENTO Y LIMPIEZA DE DATOS

Limpieza de datos:

1. Hago copia del dataset original parar preservar los datos.
2. Elimino los duplicados.
3. Limpio textos.
4. Filtro datos usando columnas convertidas.
7. Hago print de valores duplicados eliminados y de registros finales.

In [12]:
print("LIMPIEZA DE DATOS")
print("=" * 45)

ventas_clean = ventas_df.copy()


registros_antes = len(ventas_clean)
ventas_clean = ventas_clean.drop_duplicates()
print(f"✅ Duplicados eliminados: {registros_antes - len(ventas_clean)}")


ventas_clean['producto'] = ventas_clean['producto'].str.strip()
ventas_clean['categoria'] = ventas_clean['categoria'].str.strip()

ventas_clean = ventas_clean[
    (ventas_clean['precio'] > 0) &
    (ventas_clean['precio'] <= 1000) &
    (ventas_clean['cantidad'] > 0)
]

print(f"📊 REGISTROS FINALES: {len(ventas_clean)}")

LIMPIEZA DE DATOS
✅ Duplicados eliminados: 35
📊 REGISTROS FINALES: 1154


Transformación - Productos Alto Rendimiento:
1. Imprimo títulos y separadores para organizar la salida.
2. Calculo tres métricas clave por producto: por cantidad (volumen de ventas), por venta total (valor económico) y por transacciones (frecuencia de compras).
3. Ordeno los productos por ingreso total (descendente).
4. Defino el criterio de alto rendimiento: uso el percentil 50 (mediana) de venta total como umbral. Productos de alto rendimiento = aquellos que generan más ingresos que el 50% superior.
5. Filtro las ventas originales para conservar solo los productos de alto rendimiento.
6. Muestro Resumen final y tabla final de productos de alto rendimiento


In [13]:
print("🚀 TRANSFORMACIÓN - PRODUCTOS ALTO RENDIMIENTO")
print("=" * 60)
print("IDENTIFICANDO PRODUCTOS DE ALTO RENDIMIENTO...")


rendimiento_productos = ventas_clean.groupby('producto').agg({
    'cantidad': 'sum',
    'venta_total': 'sum',
    'id_venta': 'count'

}).rename(columns={'id_venta': 'transacciones'})
rendimiento_productos = rendimiento_productos.sort_values('venta_total', ascending=False)
print("📈 RENDIMIENTO DE TODOS LOS PRODUCTOS:")
print(rendimiento_productos)


umbral_alto_rendimiento = rendimiento_productos['venta_total'].quantile(0.5)
productos_alto_rendimiento = rendimiento_productos[rendimiento_productos['venta_total'] > umbral_alto_rendimiento]
print(f"\n🎯 PRODUCTOS DE ALTO RENDIMIENTO (umbral: ${umbral_alto_rendimiento:.2f}):")
print(productos_alto_rendimiento)


ventas_alto_rendimiento = ventas_clean[ventas_clean['producto'].isin(productos_alto_rendimiento.index)]

print(f"\n📊 RESUMEN FINAL:")
print(f"• Total productos analizados: {len(rendimiento_productos)}")
print(f"• Productos de alto rendimiento: {len(productos_alto_rendimiento)}")
print(f"• Ventas de alto rendimiento: {len(ventas_alto_rendimiento)} registros")
print(f"• Porcentaje de productos de alto rendimiento: {(len(productos_alto_rendimiento)/len(rendimiento_productos))*100:.1f}%")
print("\n🛒 TABLA DE VENTAS - PRODUCTOS ALTO RENDIMIENTO:")
print(ventas_alto_rendimiento.head(10))

🚀 TRANSFORMACIÓN - PRODUCTOS ALTO RENDIMIENTO
IDENTIFICANDO PRODUCTOS DE ALTO RENDIMIENTO...
📈 RENDIMIENTO DE TODOS LOS PRODUCTOS:
                        cantidad  venta_total  transacciones
producto                                                    
Auriculares                365.0     30834.01             53
Lámpara de mesa            410.0     30479.14             61
Microondas                 307.0     25593.56             46
Batidora                   315.0     22358.79             45
SmartWatch                 294.0     22247.37             44
Plancha de vapor           317.0     21761.04             45
Smartphone                 243.0     21180.96             40
Cafetera                   284.0     21134.47             42
Elementos de cerámica      255.0     21099.14             37
Proyector                  280.0     20728.29             41
Cuadro decorativo          287.0     20720.84             38
Secadora                   291.0     20542.04             40
Adorno de pared

Agregación por categoria:
1. Inicio una nueva sección del análisis y muestro títulos informativos.
2. Agrupo los datos por categoría y el programa calcula 5 métricas: para ventas total: suma total, promedio y conteo, para cantidad suma y para precio promedio.
3. Renombro columnas para facilitar la interpretación de los resultados.
4. Ordeno categorías por venta total (de mayor a menor) y muestro resumen con todas las métricas.
5. Realizo un análisis por catégoria y muestro: en ventas totales (cuánto dinero generó), en transacciones (cuántas ventas individuales), en cantidad vendida (volumen de unidades), en venta promedio (valor promedio por transacción) y en precio promedio (precio típico de productos).
6. Identifico de la categoria lider: tomo la primera categoría (ya están ordenadas por ventas), el sistema calcula porcentaje de contribución: (venta_categoría_líder / venta_total_todas_categorías) × 100. Sugiero una estrategia: enfocarse en la categoría líder para maximizar ingresos.


In [14]:
print("AGREGACIÓN POR CATEGORÍA")
print("=" * 45)
print("CALCULANDO VENTAS AGRUPADAS POR CATEGORÍA...")


ventas_por_categoria = ventas_clean.groupby('categoria').agg({
    'venta_total': ['sum', 'mean', 'count'],
    'cantidad': 'sum',
    'precio': 'mean'
}).round(2)

ventas_por_categoria.columns = [
    'venta_total_sum',
    'venta_promedio',
    'transacciones',
    'cantidad_total',
    'precio_promedio'
]


ventas_por_categoria = ventas_por_categoria.sort_values('venta_total_sum', ascending=False)
print("\nVENTAS POR CATEGORÍA - RESUMEN COMPLETO:")
print(ventas_por_categoria)

print("\nANÁLISIS DETALLADO POR CATEGORÍA:")
print("=" * 40)
for categoria, datos in ventas_por_categoria.iterrows():
    print(f"\n{categoria.upper()}:")
    print(f"   • Ventas totales: ${datos['venta_total_sum']:.2f}")
    print(f"   • Transacciones: {datos['transacciones']}")
    print(f"   • Cantidad vendida: {datos['cantidad_total']} unidades")
    print(f"   • Venta promedio: ${datos['venta_promedio']:.2f}")
    print(f"   • Precio promedio: ${datos['precio_promedio']:.2f}")


categoria_lider = ventas_por_categoria.iloc[0]
print(f"\n CATEGORÍA LÍDER: {ventas_por_categoria.index[0]}")
print(f"   • Contribución: {(categoria_lider['venta_total_sum']/ventas_por_categoria['venta_total_sum'].sum())*100:.1f}% del total")
print(f"   • Estrategia: Focus en productos de {ventas_por_categoria.index[0]} para maximizar ingresos")

AGREGACIÓN POR CATEGORÍA
CALCULANDO VENTAS AGRUPADAS POR CATEGORÍA...

VENTAS POR CATEGORÍA - RESUMEN COMPLETO:
                   venta_total_sum  venta_promedio  transacciones  \
categoria                                                           
Electrodomésticos        192545.57          497.53            387   
Decoración               189625.79          475.25            399   
Electrónica              184856.45          502.33            368   

                   cantidad_total  precio_promedio  
categoria                                           
Electrodomésticos          2612.0            74.36  
Decoración                 2614.0            72.86  
Electrónica                2386.0            77.32  

ANÁLISIS DETALLADO POR CATEGORÍA:

ELECTRODOMÉSTICOS:
   • Ventas totales: $192545.57
   • Transacciones: 387.0
   • Cantidad vendida: 2612.0 unidades
   • Venta promedio: $497.53
   • Precio promedio: $74.36

DECORACIÓN:
   • Ventas totales: $189625.79
   • Transacciones: 39

Integración de datos: ventas y marketing.

1. Limpio datos del dataset de marketing: creo copi para limpiar, normalizo los nombres de las columnas, elimino duplicados, verifico y limpio valores nulos, limpio espacios en texto de columnas y muestro la información del dataset limpio.

In [15]:
print("\n LIMPIEZA DE DATOS DE MARKETING")
print("=" * 35)

marketing_clean = marketing_df.copy()

marketing_clean.columns = marketing_clean.columns.str.strip().str.lower()
print("✅ Nombres de columnas normalizados")


duplicados_marketing = marketing_clean.duplicated().sum()
marketing_clean = marketing_clean.drop_duplicates()
print(f"✅ Eliminados {duplicados_marketing} registros duplicados")


valores_nulos_marketing = marketing_clean.isnull().sum()
print("Valores nulos por columna:")
print(valores_nulos_marketing)


if 'producto' in marketing_clean.columns:
    marketing_clean['producto'] = marketing_clean['producto'].str.strip()
    print("✅ Columna 'producto' limpiada")


print(f"\n📈 Dataset marketing_clean: {marketing_clean.shape}")
print(" Columnas disponibles:", marketing_clean.columns.tolist())
print(marketing_clean.head(3))


 LIMPIEZA DE DATOS DE MARKETING
✅ Nombres de columnas normalizados
✅ Eliminados 0 registros duplicados
Valores nulos por columna:
id_campanha     0
producto        0
canal           0
costo           0
fecha_inicio    0
fecha_fin       0
dtype: int64
✅ Columna 'producto' limpiada

📈 Dataset marketing_clean: (90, 6)
 Columnas disponibles: ['id_campanha', 'producto', 'canal', 'costo', 'fecha_inicio', 'fecha_fin']
   id_campanha         producto  canal  costo fecha_inicio   fecha_fin
0           74  Adorno de pared     TV   4.81   20/03/2024  03/05/2024
1           12           Tablet   RRSS   3.40   26/03/2024  13/05/2024
2           32  Lámpara de mesa  Email   5.54   28/03/2024  20/04/2024


2. Inicio una nueva sección donde integro datos de ventas y marketing con datasets limpios.
3. Verifico que ambas ambas tablas tengan la columna 'producto'.
4. Verifico productos únicos en cada dataset.
5. Realizo la integración principal con un letf join, verifico los resultados del merge e edentificación de las columnas agregadas.


In [16]:
print("\nINTEGRACIÓN DE DATOS: VENTAS + MARKETING")
print("=" * 50)
print("COMBINANDO DATASETS PARA ANÁLISIS INTEGRADO...")

print("VERIFICACIÓN DE COLUMNAS:")
print(f"Columnas en ventas_clean: {ventas_clean.columns.tolist()}")
print(f"Columnas en marketing_clean: {marketing_clean.columns.tolist()}")


print(f"\n PRODUCTOS ÚNICOS:")
print(f"• En ventas_clean: {ventas_clean['producto'].nunique()} productos")
print(f"• En marketing_clean: {marketing_clean['producto'].nunique()} productos")

ventas_marketing = pd.merge(
    ventas_clean,
    marketing_clean,
    on='producto',
    how='left',  # Mantego TODAS las ventas
    indicator=True
)

print(f"\n✅ INTEGRACIÓN COMPLETADA:")
print(f"• Registros originales en ventas: {len(ventas_clean)}")
print(f"• Registros después de integrar: {len(ventas_marketing)}")


conexiones = ventas_marketing['_merge'].value_counts()
print(f"• Registros con match en marketing: {conexiones.get('both', 0)}")
print(f"• Registros sin match en marketing: {conexiones.get('left_only', 0)}")


columnas_originales_ventas = ventas_clean.columns.tolist()
columnas_finales = ventas_marketing.columns.tolist()
columnas_agregadas = [col for col in columnas_finales if col not in columnas_originales_ventas and col != '_merge']
print(f"• Columnas de marketing agregadas: {columnas_agregadas}")

ventas_marketing = ventas_marketing.drop('_merge', axis=1)


INTEGRACIÓN DE DATOS: VENTAS + MARKETING
COMBINANDO DATASETS PARA ANÁLISIS INTEGRADO...
VERIFICACIÓN DE COLUMNAS:
Columnas en ventas_clean: ['id_venta', 'producto', 'precio', 'cantidad', 'fecha_venta', 'categoria', 'venta_total']
Columnas en marketing_clean: ['id_campanha', 'producto', 'canal', 'costo', 'fecha_inicio', 'fecha_fin']

 PRODUCTOS ÚNICOS:
• En ventas_clean: 30 productos
• En marketing_clean: 30 productos

✅ INTEGRACIÓN COMPLETADA:
• Registros originales en ventas: 1154
• Registros después de integrar: 3462
• Registros con match en marketing: 3462
• Registros sin match en marketing: 0
• Columnas de marketing agregadas: ['id_campanha', 'canal', 'costo', 'fecha_inicio', 'fecha_fin']


Anexo:

In [17]:
print(" ANEXO - DOCUMENTACIÓN COMPLETA")
print("=" * 35)

print("\n ENLACE A CARPETA DE GOOGLE DRIVE:")
print("https://drive.google.com/drive/folders/1aQS9gZaBwcJxq_MZFTwEauSOO1xka2QA?usp=sharing")

print("\n CONTENIDO DE LA CARPETA:")
print("1. ventas.csv - Dataset original de transacciones comerciales")
print("2. clientes.csv - Dataset original de información demográfica de clientes")
print("3. marketing.csv - Dataset original de campañas publicitarias")
print("4. Data_Analytics_Pre_Entrega.ipynb")

print("\n HERRAMIENTAS UTILIZADAS:")
print("- Google Colab - Entorno de ejecución")
print("- Pandas - Manipulación de datos")
print("- NumPy - Operaciones numéricas")

print("\n INFORMACIÓN DEL ANALISTA:")
print("• Nombre: Yamila Lerman")
print("• Comisión: 25261")
print("• Fecha de entrega: [17/10/2025]")

 ANEXO - DOCUMENTACIÓN COMPLETA

 ENLACE A CARPETA DE GOOGLE DRIVE:
https://drive.google.com/drive/folders/1aQS9gZaBwcJxq_MZFTwEauSOO1xka2QA?usp=sharing

 CONTENIDO DE LA CARPETA:
1. ventas.csv - Dataset original de transacciones comerciales
2. clientes.csv - Dataset original de información demográfica de clientes
3. marketing.csv - Dataset original de campañas publicitarias
4. Data_Analytics_Pre_Entrega.ipynb

 HERRAMIENTAS UTILIZADAS:
- Google Colab - Entorno de ejecución
- Pandas - Manipulación de datos
- NumPy - Operaciones numéricas

 INFORMACIÓN DEL ANALISTA:
• Nombre: Yamila Lerman
• Comisión: 25261
• Fecha de entrega: [17/10/2025]
