# Análisis EDA y Decisiones de Negocio en Ventas de Automóviles

Este notebook contiene 15 ejercicios que combinan análisis exploratorio de datos (EDA) y reflexiones críticas de negocio. Cada punto incluye instrucciones detalladas, paso a paso, para realizar agrupaciones y filtros, de modo que se guíe al estudiante en cada parte del proceso.

La estructura del dataset es la siguiente:

```
year, make, model, trim, body, transmission, vin, state, condition, odometer, color, interior, seller, mmr, sellingprice, saledate
```

¡Comienza el análisis y sigue cada paso para proponer estrategias de negocio basadas en los resultados!

In [2]:
# Descargar y descomprimir el dataset
!wget https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
!unzip -o cars_dataset.zip

--2025-03-13 20:08:51--  https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
Resolving github.com (github.com)... 140.82.114.4
Connecting to github.com (github.com)|140.82.114.4|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip [following]
--2025-03-13 20:08:51--  https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 19753181 (19M) [application/zip]
Saving to: ‘cars_dataset.zip.1’


2025-03-13 20:08:52 (87.5 MB/s) - ‘cars_dataset.zip.1’ saved [19753181/19753181]

Archive:  cars_dataset.zip
  inflating: car_prices.csv          

## 1. Dimensiones y Representatividad del Dataset

a) Carga el dataset (desde un archivo CSV) y muestra sus dimensiones (número de filas y columnas).

b) Describe brevemente qué representa cada fila y reflexiona: ¿Crees que el dataset es representativo del mercado de ventas de automóviles? Justifica tu respuesta.

In [31]:
import pandas as pd

data = pd.read_csv('car_prices.csv')
num_filas, num_columnas = data.shape
print(f"El dataset tiene {num_filas} filas y {num_columnas} columnas.")

print("Cada fila representa un vehículo en venta con características y precio.")
print("La representatividad depende de la fuente de datos. Si proviene de un solo sitio web o región, podría no reflejar el mercado global.")

El dataset tiene 558837 filas y 16 columnas.
Cada fila representa un vehículo en venta con características y precio.
La representatividad depende de la fuente de datos. Si proviene de un solo sitio web o región, podría no reflejar el mercado global.


## 2. Ventas Totales y Promedio

a) Calcula la suma total y el promedio de la columna `sellingprice`.

b) Caso de negocio: Si el precio promedio es bajo, ¿qué estrategias de precio o promociones sugerirías para aumentar la rentabilidad? Explica tu respuesta.

In [None]:
a. ventas_totales = data['sellingprice'].sum()
venta_promedio = data['sellingprice'].mean()
print(f"Ventas totales: ${ventas_totales:,.2f}")
print(f"Precio promedio de venta: ${venta_promedio:,.2f}")

b.  print("si el precio promedio es bajo,se pueden aplicar estrategias como financiamiento flexible o paquetes con mantenimiento incluido lo cual podría aumentar la rentabilidad")

## 3. Distribución de Ventas por Marca

a) Utiliza `value_counts()` para determinar cuántas ventas se registraron por cada marca (`make`).

b) Caso de negocio: ¿Qué marcas parecen dominar el mercado? Basado en esta distribución, ¿en qué marcas invertirías en publicidad y por qué?

In [68]:
ventas_por_marca = data['make'].value_counts()
print("Ventas por marca:\n", ventas_por_marca)
print("Las marcas que parecen dominar son como Ford y chevrolet, ya que ofrecen buenos precios y buena calidad, tambien post venta y por eso las personas lo prefieren")
print("Invertir en publicidad para las marcas con más ventas y mayor influencia, tambien evaluar estrategias para las marcas que sean menos populares")

Ventas por marca:
 make
Ford          93554
Chevrolet     60197
Nissan        53946
Toyota        39871
Dodge         30710
              ...  
airstream         1
ford tk           1
chev truck        1
hyundai tk        1
Lotus             1
Name: count, Length: 96, dtype: int64
Las marcas que parecen dominar son como Ford y chevrolet, ya que ofrecen buenos precios y buena calidad, tambien post venta y por eso las personas lo prefieren
Invertir en publicidad para las marcas con más ventas y mayor influencia, tambien evaluar estrategias para las marcas que sean menos populares


## 4. Segmentación de Clientes por Kilometraje

a) Crea un DataFrame filtrado que incluya únicamente las ventas donde el `odometer` es menor a 20,000 millas. Cuantos Vehiculos tiene este dataset?

b) Caso de negocio: Este segmento de vehículos con bajo uso puede tener mayor valor percibido. ¿Cómo ajustarías la estrategia de marketing para este grupo?

In [30]:
low_mileage_cars = data[data['odometer'] < 20000]
print("Número de vehículos con menos de 20,000 millas:", low_mileage_cars.shape[0])
print ("Venderlos como 'seminuevos' con garantía extendida y precios premium")

Número de vehículos con menos de 20,000 millas: 84206
Venderlos como 'seminuevos' con garantía extendida y precios premium


## 5. Agrupación por Marca: Precio y Volumen

a) Agrupa el dataset por `make` y calcula:
   - El promedio de `sellingprice`.
   - La cantidad de ventas por marca (usa el conteo de registros como proxy).

b) Caso de negocio: Si una marca tiene alto volumen pero precios bajos, ¿qué medidas recomendarías para mejorar el margen?

**Paso a paso:**
1. Realiza la agrupación.
2. Renombra las columnas para que sean claras.
3. Interpreta el resultado antes de pasar al siguiente filtro o análisis.

In [50]:
brand_stats = data.groupby('make').agg(
    avg_selling_price=('sellingprice', 'mean'),
    sales_volume=('make', 'count')
).reset_index()
brand_stats.columns = ['Marca', 'Precio Promedio de Venta', 'Unidades Vendidas']
print(brand_stats)
brand_stats_sorted = brand_stats.sort_values(by='Unidades Vendidas', ascending=False)
top_5_brands = brand_stats.head(5)
print("Top 5 marcas con mayor volumen de ventas y su precio promedio de venta:")
print(top_5_brands)
print("\nCaso de negocio:")
print("Si una marca tiene alto volumen de ventas pero precios bajos, se recomienda:")
print("- Analizar el posicionamiento de mercado y la percepción de marca.")
print("- Explorar estrategias de diferenciación para agregar valor.")
print(" - Por ejemplo: Garantías extendidas, paquetes de servicios adicionales, mejoras en la experiencia del cliente.")
print(" - Aumentar la percepción de calidad y exclusividad para justificar precios más altos.")
print(" - Evaluar ajustes en la estrategia de precios o reducir descuentos.")

           Marca  Precio Promedio de Venta  Unidades Vendidas
0          Acura              14017.268260               5901
1   Aston Martin              54812.000000                 25
2           Audi              19915.432782               5869
3            BMW              21441.895748              20719
4        Bentley              74367.672414                116
..           ...                       ...                ...
91        subaru               3710.416667                 60
92        suzuki               4810.000000                  5
93        toyota               7339.105263                 95
94    volkswagen               6145.833333                 24
95            vw              13672.916667                 24

[96 rows x 3 columns]
Top 5 marcas con mayor volumen de ventas y su precio promedio de venta:
          Marca  Precio Promedio de Venta  Unidades Vendidas
0         Acura              14017.268260               5901
1  Aston Martin              54812.0000

## 6. Análisis de Rentabilidad por Marca

a) Crea una nueva columna `profit` que sea la diferencia entre `mmr` y `sellingprice`.
b) Agrupa por `make` y calcula el beneficio promedio para cada marca.

c) Caso de negocio: Identifica las 5 marcas con mayor beneficio promedio y explica qué acciones estratégicas implementarías (por ejemplo, renegociar precios o invertir en calidad).

In [63]:
brand_stats = data.groupby('make').agg({
    'sellingprice': ['mean', 'count']
}).reset_index()
brand_stats.columns = ['Marca', 'Precio Promedio de Venta', 'Unidades Vendidas']

print(brand_stats)
print("\nInterpretación de los resultados:")
print("- Si el Precio Promedio de Venta es alto, la marca es percibida como valiosa en el mercado.")
print("- Si el Volumen de Ventas es alto, significa que la marca es popular y tiene alta demanda.")
print("- Si el Precio Promedio de Venta es bajo pero el Volumen de Ventas es alto, la marca es asequible y tiene buen desempeño en términos de unidades vendidas.")
print("- Si el Precio Promedio de Venta es bajo y el Volumen de Ventas también es bajo, la marca podría no ser tan competitiva en el mercado.")

           Marca  Precio Promedio de Venta  Unidades Vendidas
0          Acura              14017.268260               5901
1   Aston Martin              54812.000000                 25
2           Audi              19915.432782               5869
3            BMW              21441.895748              20719
4        Bentley              74367.672414                116
..           ...                       ...                ...
91        subaru               3710.416667                 60
92        suzuki               4810.000000                  5
93        toyota               7339.105263                 95
94    volkswagen               6145.833333                 24
95            vw              13672.916667                 24

[96 rows x 3 columns]

Interpretación de los resultados:
- Si el Precio Promedio de Venta es alto, la marca es percibida como valiosa en el mercado.
- Si el Volumen de Ventas es alto, significa que la marca es popular y tiene alta demanda.
- Si el Precio 

## 7. Análisis Temporal: Ventas del Año 2015

a) Filtra el dataset para obtener únicamente las ventas del año 2015 y muestra las primeras 10 filas. Cuantos Vehiculos tiene esta dataset


b) Caso de negocio: Si 2015 muestra comportamientos atípicos en comparación con otros años, ¿deberías ajustar la estrategia basándote en tendencias actuales? Explica tu criterio.

In [84]:
data_2015 = data[data['year'] == 2015]
print("Primeras 10 filas del dataset de 2015:")
print(data_2015.head(10))  # Aquí también cambié 'data_2015' por 'data_2015.head(10)'
total_vehiculos_2015 = len(data_2015)
print(f"\nCantidad total de vehículos vendidos en 2015: {total_vehiculos_2015}")
print("no se como hacer el b")

Primeras 10 filas del dataset de 2015:
    year       make    model   trim   body transmission                vin  \
0   2015        Kia  Sorento     LX    SUV    automatic  5xyktca69fg566472   
1   2015        Kia  Sorento     LX    SUV    automatic  5xyktca69fg561319   
3   2015      Volvo      S60     T5  Sedan    automatic  yv1612tb4f1310987   
5   2015     Nissan   Altima  2.5 S  Sedan    automatic  1n4al3ap1fn326013   
11  2015        Kia   Optima     LX  Sedan    automatic  5xxgm4a73fg353538   
12  2015       Ford   Fusion     SE  Sedan    automatic  3fa6p0hdxfr145753   
13  2015        Kia  Sorento     LX    SUV    automatic  5xyktca66fg561407   
15  2015     Nissan   Altima  2.5 S  Sedan    automatic  1n4al3ap5fc124223   
16  2015    Hyundai   Sonata     SE  Sedan    automatic  5npe24af4fh001562   
20  2015  Chevrolet   Impala    LTZ  Sedan    automatic  2g1165s30f9103921   

   state  condition  odometer   color interior  \
0     ca        5.0   16639.0   white    black   
1 

## 8. Comparación por Tipo de Carrocería

a) Agrupa por la columna `body` y calcula el promedio de `sellingprice` para cada tipo.

b) Caso de negocio: Determina qué tipo de carrocería tiene mayor precio promedio y argumenta cómo podrías aprovechar esta información para posicionar una línea premium o ajustar el inventario.

In [91]:
print(data.columns)
precio_promedio_carroceria = data.groupby('body')['sellingprice'].mean()
print(precio_promedio_carroceria)
tipo_mas_caro = precio_promedio_carroceria.idxmax()
precio_mas_alto = precio_promedio_carroceria.max()
print(f"El tipo de carrocería con el mayor precio promedio es '{tipo_mas_caro}' con un precio promedio de venta de ${precio_mas_alto:,.2f}.")

Index(['year', 'make', 'model', 'trim', 'body', 'transmission', 'vin', 'state',
       'condition', 'odometer', 'color', 'interior', 'seller', 'mmr',
       'sellingprice', 'saledate'],
      dtype='object')
body
Access Cab            13262.500000
Beetle Convertible    18070.192308
CTS Coupe             22758.527132
CTS Wagon             17811.538462
CTS-V Coupe           38425.750000
                          ...     
transit van           22707.142857
tsx sport wagon       18118.750000
van                   15009.742105
wagon                 10551.605442
xtracab                5250.000000
Name: sellingprice, Length: 87, dtype: float64
El tipo de carrocería con el mayor precio promedio es 'granturismo convertible' con un precio promedio de venta de $79,041.67.


## 9. Filtros Combinados para un Caso Específico

a) **Paso 1:** Agrupa los datos por `state`, `model` y calcula el promedio de `sellingprice` para ver cuál es el precio promedio por combinación.

b) **Paso 2:** Utiliza el resultado del agrupamiento para filtrar el dataset original. Por ejemplo, filtra los registros de un estado ('ca') y un modelo ('Sorento') cuyo `sellingprice` supere el precio promedio calculado.

c) Caso de negocio: Analiza este segmento y plantea qué acciones implementarías para potenciar las ventas en California, considerando el modelo y el segmento premium.

In [94]:
data['saledate'] = pd.to_datetime(data['saledate'], errors='coerce')
precio_promedio_2015 = data[data['saledate'].dt.year == 2015].groupby(['state', 'model'])['sellingprice'].mean()
print(precio_promedio_2015)
precio_promedio_general_2015 = precio_promedio_2015.mean()
print(f"Precio promedio general en 2015: {precio_promedio_general_2015:.2f}")
estado = 'ca'
modelo = 'sorento'
data_filtrada = data_2015[(data_2015['state'].str.lower() == estado) & (data_2015['model'].str.lower() == modelo)]
precio_modelo_estado = data_filtrada['sellingprice'].mean()
if pd.notna(precio_promedio_general_2015) and pd.notna(precio_promedio_general_2015):
    if precio_promedio_general_2015 < precio_promedio_2015.mean():
        print(f"El modelo {modelo} en el estado {estado} tiene un precio mayor al promedio del año 2015.")
        print(f"Se recomienda aumentar el inventario de este modelo en California para aprovechar la mayor demanda.")
    else:
        print(f"El modelo {modelo} en {estado} tiene un precio menor o igual al promedio general del 2015. Evaluar su rentabilidad antes de expandir la oferta.")
print(data['saledate'].isna().sum())


state  model   
ab     1500        26865.384615
       200         15146.153846
       3 Series     8433.333333
       300         19022.727273
       500          8000.000000
                       ...     
wi     town         7100.000000
       windstar      525.000000
       wrangler    12500.000000
       xB           8200.000000
       xD           7550.000000
Name: sellingprice, Length: 13575, dtype: float64
Precio promedio general en 2015: 12042.37
El modelo sorento en ca tiene un precio menor o igual al promedio general del 2015. Evaluar su rentabilidad antes de expandir la oferta.
163348


## 10. Ventas Totales por Estado

a) Agrupa por `state` y calcula la suma de `sellingprice` para cada estado.

b) Caso de negocio: Identifica el estado con mayores ventas totales y discute cómo enfocar campañas de marketing o ampliar la red de distribución en ese estado.

In [97]:
precio_total_estado = data.groupby('state')['sellingprice'].sum()
print(precio_total_estado)
estado_mayor_precio = precio_total_estado.idxmax()
precio_maximo_estado = precio_total_estado.max()

print(f"El estado con el mayor precio total de ventas es {estado_mayor_precio} con un total de {precio_maximo_estado:,.2f}")

state
3vwd17aj0fm227318        13700.0
3vwd17aj2fm258506        13300.0
3vwd17aj2fm261566        13400.0
3vwd17aj2fm285365        14050.0
3vwd17aj3fm259017        14250.0
                        ...     
tx                   606495361.0
ut                    22152489.0
va                   103111220.0
wa                   103419009.0
wi                   137948766.0
Name: sellingprice, Length: 64, dtype: float64
El estado con el mayor precio total de ventas es fl con un total de 1,151,064,556.00


## 11. Rentabilidad por Estado

a) Agrupa por `state` y calcula el promedio de eficiencia operativa. Como no contamos con 'Operating Margin', usa como proxy `profit/sellingprice`.

b) Caso de negocio: Identifica el estado con mayor eficiencia operativa y sugiere estrategias para replicar ese éxito en otros mercados.

In [102]:
data['saledate'] = pd.to_datetime(data['saledate'], errors='coerce')
data['sellingprice'] = pd.to_numeric(data['sellingprice'], errors='coerce')
data['mmr'] = pd.to_numeric(data['mmr'], errors='coerce')
data['eficiencia_operativa'] = data['sellingprice'] / data['mmr']
eficiencia_estado = data.groupby('state')['eficiencia_operativa'].mean()
estado_mayor_rentabilidad = eficiencia_estado.idxmax()
rentabilidad_maxima = eficiencia_estado.max()
print(eficiencia_estado)
print(f"El estado con la mayor eficiencia operativa promedio es {estado_mayor_rentabilidad} con una rentabilidad de {rentabilidad_maxima:.2f}!")
print("\nEstrategias para replicar el éxito en otros estados:")
print("- Analizar los costos operativos en el estado más eficiente e identificar factores clave de éxito.")
print("- Mejorar estrategias de fijación de precios con base en la relación precio de venta/MMR.")
print("- Evaluar las preferencias del mercado en el estado más eficiente y replicar la oferta en otros estados.")
print("- Optimizar la gestión de inventario y reducir costos operativos en estados con menor eficiencia.")
print("- Explorar alianzas estratégicas con concesionarios locales para mejorar la distribución y ventas.")


state
3vwd17aj0fm227318         NaN
3vwd17aj2fm258506         NaN
3vwd17aj2fm261566         NaN
3vwd17aj2fm285365         NaN
3vwd17aj3fm259017         NaN
                       ...   
tx                   0.977011
ut                   0.919664
va                   0.972402
wa                   1.044988
wi                   0.957270
Name: eficiencia_operativa, Length: 64, dtype: float64
El estado con la mayor eficiencia operativa promedio es nm con una rentabilidad de 1.10!

Estrategias para replicar el éxito en otros estados:
- Analizar los costos operativos en el estado más eficiente e identificar factores clave de éxito.
- Mejorar estrategias de fijación de precios con base en la relación precio de venta/MMR.
- Evaluar las preferencias del mercado en el estado más eficiente y replicar la oferta en otros estados.
- Optimizar la gestión de inventario y reducir costos operativos en estados con menor eficiencia.
- Explorar alianzas estratégicas con concesionarios locales para mejorar l

## 12. Análisis por Tipo de Transmisión (en lugar de Sales Method)

a) Agrupa el dataset por `transmission` y calcula:
   - La suma de `sellingprice` para cada tipo.
   - El promedio de `sellingprice` para cada tipo.

b) Caso de negocio: ¿Qué tipo de transmisión (automática vs. manual) genera mayores ingresos y qué implicaciones tiene para la estrategia comercial?

In [104]:
data['sellingprice'] = pd.to_numeric(data['sellingprice'], errors='coerce')
transmision_estado = data.groupby('transmission')['sellingprice'].sum()
transmision_mayor_ventas = transmision_estado.idxmax()
ventas_maximas = transmision_estado.max()
print(f"El tipo de transmisión con mayores ventas es: {transmision_mayor_ventas}, con un total de ventas de ${ventas_maximas:.2f}.")
print("\nEstrategia Comercial:")
print("1. Potenciar la disponibilidad del tipo de transmisión más vendido en las regiones de mayor demanda.")
print("2. Ajustar campañas de marketing para resaltar las ventajas de la transmisión más popular.")
print("3. Considerar incentivos o promociones para potenciar la venta de modelos con transmisiones menos populares.")
print("4. Asegurar suficiente inventario y opciones para la transmisión más vendida.")

El tipo de transmisión con mayores ventas es: automatic, con un total de ventas de $6443933789.00.

Estrategia Comercial:
1. Potenciar la disponibilidad del tipo de transmisión más vendido en las regiones de mayor demanda.
2. Ajustar campañas de marketing para resaltar las ventajas de la transmisión más popular.
3. Considerar incentivos o promociones para potenciar la venta de modelos con transmisiones menos populares.
4. Asegurar suficiente inventario y opciones para la transmisión más vendida.


## 13. Segmentación por Producto Líder

a) Identifica el producto (utiliza la columna `model` como proxy) con mayor cantidad de unidades vendidas. Agrupa por `model` y usa el conteo de registros.

b) Caso de negocio: Si un producto lidera en ventas, ¿cómo ajustarías el inventario y las promociones para maximizar las ganancias?

In [110]:
data['sellingprice'] = pd.to_numeric(data['sellingprice'], errors='coerce')
ventas_producto = data.groupby('model')['sellingprice'].sum()
producto_mas_vendido = ventas_producto.idxmax()
ventas_maximas_producto = ventas_producto.max()
print("estrategias:")
print(f"El producto con mayores ventas es: {producto_mas_vendido}, con un total de ventas de ${ventas_maximas_producto:,.2f}.")
print("1. Asegurar suficiente inventario del producto líder para evitar quiebres de stock.")
print("2. Explorar oportunidades para ofrecer versiones premium o con características adicionales del producto líder.")
print("3. Evaluar la demanda y ajustar los precios estratégicamente para maximizar ingresos sin afectar la competitividad.")
print("4. Ofrecer promociones cruzadas, combinando el producto líder con otros de menor demanda para aumentar las ventas globales.")
print("5. Expandir la distribución del producto a nuevas regiones con alta demanda potencial.")

estrategias:
El producto con mayores ventas es: F-150, con un total de ventas de $272,669,759.00.
1. Asegurar suficiente inventario del producto líder para evitar quiebres de stock.
2. Explorar oportunidades para ofrecer versiones premium o con características adicionales del producto líder.
3. Evaluar la demanda y ajustar los precios estratégicamente para maximizar ingresos sin afectar la competitividad.
4. Ofrecer promociones cruzadas, combinando el producto líder con otros de menor demanda para aumentar las ventas globales.
5. Expandir la distribución del producto a nuevas regiones con alta demanda potencial.


## 14. Comparación Crítica entre Retailers

a) Compara dos retailers usando la columna `seller` en cuanto a volumen de ventas y margen de beneficio (usa `profit` como proxy).

b) Caso de negocio: Si un retailer muestra mayores unidades vendidas pero un margen inferior, ¿qué estrategia recomendarías (por ejemplo, optimización de costos, cambio en política de descuentos, etc.)? Justifica tu propuesta.

**Paso a paso:**
1. Agrupa por `seller` y calcula la suma de `sellingprice` y el promedio de `profit`.
2. Ordena los resultados para identificar los líderes en volumen y analiza el margen.
3. Propón una estrategia basada en los resultados.

In [138]:
seller_summary = data.groupby("seller").agg(
    total_sellingprice=("sellingprice", "sum"),avg_profit=("profit", "mean"))
seller_summary = seller_summary.sort_values(by="total_sellingprice", ascending=False)
print(seller_summary)
top_2_sellers = seller_summary.head(2)
print(top_2_sellers)
print("\nEstrategias sugeridas:")
print("ford motor credit company llc tiene bajo margen de ganancia. Se recomienda optimizar costos, reducir descuentos o mejorar la eficiencia logística")
print("nissan infiniti lt tiene un margen saludable. Se recomienda expandirlo")

                                  total_sellingprice   avg_profit
seller                                                           
ford motor credit company llc            340960125.0  -216.393122
nissan-infiniti lt                       272104560.0    70.225969
the hertz corporation                    250863168.0  -189.344063
nissan infiniti lt                       216158321.0   -92.654989
avis corporation                         203432330.0    20.590510
...                                              ...          ...
bell auto sales                                200.0  -250.000000
alberta truck & auto liquidators               200.0  -150.000000
beaverton honda                                200.0 -1100.000000
bcaa/company cars                              200.0  -600.000000
kfl llc                                          0.0          NaN

[14263 rows x 2 columns]
                               total_sellingprice  avg_profit
seller                                                

## 15. Caso Integrador: Estrategia Comercial Global

a) **Paso 1:** Identifica cada criterio basado en los análisis anteriores:
   - **Retailer con mayores ventas totales:** Usa la columna `seller` del resumen de retailers.
   - **Estado con mayores ventas totales:** Del agrupamiento por `state`.
   - **Producto con mayor unidades vendidas:** Usa la columna `model`.
   - **Tipo de transmisión con mayores ventas totales:** Agrupa por `transmission`.

b) **Paso 2:** Filtra el dataset original usando cada uno de estos criterios, uno a uno, y luego combínalos en un filtro final.

c) Con base en el análisis combinado, redacta un breve informe (3-4 líneas) proponiendo una estrategia comercial integral para maximizar la rentabilidad, considerando inversión en canales, promociones específicas y optimización de inventario.

d) Caso de negocio: Utiliza la integración de estos criterios para definir en qué segmento enfocar la estrategia global.

In [139]:
sellers_summary = data.groupby('seller').agg({'sellingprice': 'sum'}).reset_index()
state_summary = data.groupby('state').agg({'sellingprice': 'sum'}).reset_index()
product_summary = data.groupby('model').agg({'sellingprice': 'sum'}).reset_index()
transmission_summary = data.groupby('transmission').agg({'sellingprice': 'sum'}).reset_index()
top_seller = sellers_summary.loc[sellers_summary['sellingprice'].idxmax()]
top_state = state_summary.loc[state_summary['sellingprice'].idxmax()]
top_product = product_summary.loc[product_summary['sellingprice'].idxmax()]
top_transmission = data['transmission'].mode()[0]
print(f"Retailer con mayores ventas: {top_seller['seller']} con ${top_seller['sellingprice']:.2f} en ventas totales.")
print(f"Estado con mayores ventas: {top_state['state']} con ventas de ${top_state['sellingprice']:.2f}")
print(f"Producto con mayores ventas: {product_summary.iloc[0].name} con ventas de ${product_summary['sellingprice'].max():.2f}")
print(f"Tipo de transmisión más vendido: {top_transmission}")
filtered_seller = data[data['seller'] == top_seller['seller']]
filtered_state = data[data['state'] == top_state['state']]
filtered_product = data[data['transmission'] == top_transmission]
print("\nEstrategia Comercial Recomendada:")
print(f"- Se recomienda enfocarse en el retailer con mayores ventas ({top_seller['seller']}) para reforzar la relación comercial.")
print(f"- Se observa que el estado con mayor demanda es {top_state['state']}. Invertir en estrategias de promoción dirigidas a esta región.")
print(f"- El producto más vendido es de tipo {top_transmission}. Se recomienda priorizar su producción y optimizar el inventario.")

Retailer con mayores ventas: ford motor credit company llc con $340960125.00 en ventas totales.
Estado con mayores ventas: fl con ventas de $1151064556.00
Producto con mayores ventas: 0 con ventas de $272669759.00
Tipo de transmisión más vendido: automatic

Estrategia Comercial Recomendada:
- Se recomienda enfocarse en el retailer con mayores ventas (ford motor credit company llc) para reforzar la relación comercial.
- Se observa que el estado con mayor demanda es fl. Invertir en estrategias de promoción dirigidas a esta región.
- El producto más vendido es de tipo automatic. Se recomienda priorizar su producción y optimizar el inventario.
