# Análisis EDA y Decisiones de Negocio en Ventas de Automóviles

Este notebook contiene 15 ejercicios que combinan análisis exploratorio de datos (EDA) y reflexiones críticas de negocio. Cada punto incluye instrucciones detalladas, paso a paso, para realizar agrupaciones y filtros, de modo que se guíe al estudiante en cada parte del proceso.

La estructura del dataset es la siguiente:

```
year, make, model, trim, body, transmission, vin, state, condition, odometer, color, interior, seller, mmr, sellingprice, saledate
```

¡Comienza el análisis y sigue cada paso para proponer estrategias de negocio basadas en los resultados!

In [2]:
# Descargar y descomprimir el dataset
!wget https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
!unzip -o cars_dataset.zip

--2025-03-13 20:05:15--  https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
Resolving github.com (github.com)... 140.82.112.3
Connecting to github.com (github.com)|140.82.112.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip [following]
--2025-03-13 20:05:16--  https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.110.133, 185.199.111.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 19753181 (19M) [application/zip]
Saving to: ‘cars_dataset.zip.1’


2025-03-13 20:05:16 (129 MB/s) - ‘cars_dataset.zip.1’ saved [19753181/19753181]

Archive:  cars_dataset.zip
  inflating: car_prices.csv          


## 1. Dimensiones y Representatividad del Dataset

a) Carga el dataset (desde un archivo CSV) y muestra sus dimensiones (número de filas y columnas).

b) Describe brevemente qué representa cada fila y reflexiona: ¿Crees que el dataset es representativo del mercado de ventas de automóviles? Justifica tu respuesta.

###Respuesta

Cada fila representa las ventas de diferentes automoviles con su respectiva  información de modelo, caracteristicas, atributos, precio y cuando se vendio. El dataset es significativo ya que brinda datos importantes para el negocio y con los cuales puede diseñar estrategias para potenciar la venta de autos  

In [4]:
import pandas as pd

data = pd.read_csv('car_prices.csv')


In [5]:
data.shape

(558837, 16)

## 2. Ventas Totales y Promedio

a) Calcula la suma total y el promedio de la columna `sellingprice`.

b) Caso de negocio: Si el precio promedio es bajo, ¿qué estrategias de precio o promociones sugerirías para aumentar la rentabilidad? Explica tu respuesta.

###Respuesta
Si el precio promedio es bajo, la rentabilidad podria aumentarse por medio de la implementación de estrategias como ofrecer paquetes de servicios o productos incluidos en la venta del carro (mantenimiento programado o accesorios) y ofrecer incentivos especiales como opciones de financimiento a tasas bajas o bonos que se puedan intercambiar en el negocio de carros por un tiempo limitado

In [6]:
data['sellingprice'].sum()

7606367587.0

In [7]:
data['sellingprice'].mean()

13611.358810003132

## 3. Distribución de Ventas por Marca

a) Utiliza `value_counts()` para determinar cuántas ventas se registraron por cada marca (`make`).

b) Caso de negocio: ¿Qué marcas parecen dominar el mercado? Basado en esta distribución, ¿en qué marcas invertirías en publicidad y por qué?

###Respuesta
Las marcas que dominan el mercado son Ford con 93.554, Chevrolet con 60.197 y Nissan con 53.946. Invertiria en la publicidad principalmente de estas 3 marcas ya que tienen una base de clientes sólida y se podria aumentar sus ventas más facilmente. Además, invertiria en Toyota ya que a pesar de que no esta en el top 3 se podria reforzar la presencia de esta marca y captar nuevos clientes

In [12]:
data['make'].value_counts(ascending=False)

Unnamed: 0_level_0,count
make,Unnamed: 1_level_1
Ford,93554
Chevrolet,60197
Nissan,53946
Toyota,39871
Dodge,30710
...,...
airstream,1
ford tk,1
chev truck,1
hyundai tk,1


## 4. Segmentación de Clientes por Kilometraje

a) Crea un DataFrame filtrado que incluya únicamente las ventas donde el `odometer` es menor a 20,000 millas. Cuantos Vehiculos tiene este dataset?

b) Caso de negocio: Este segmento de vehículos con bajo uso puede tener mayor valor percibido. ¿Cómo ajustarías la estrategia de marketing para este grupo?

###Respuesta

Para este grupo considero que la estrategia de marketing debe estar enfocada en destacar el buen estado de estos autos, su calidad y valor agregado al representar una buena inversión para alguien que quiere un buen carro a un precio asequible

In [9]:
data_filtered = data[data['odometer'] < 20000]
data_filtered.shape

(84206, 16)

## 5. Agrupación por Marca: Precio y Volumen

a) Agrupa el dataset por `make` y calcula:
   - El promedio de `sellingprice`.
   - La cantidad de ventas por marca (usa el conteo de registros como proxy).

b) Caso de negocio: Si una marca tiene alto volumen pero precios bajos, ¿qué medidas recomendarías para mejorar el margen?

**Paso a paso:**
1. Realiza la agrupación.
2. Renombra las columnas para que sean claras.
3. Interpreta el resultado antes de pasar al siguiente filtro o análisis.

###Resultado
Si una marca tiene alto volumen pero precios bajos, recomendaría que se optimicen los costos de esta, ofrecer servicios adicionales complementarios y aumentar el valor percibido de la marca por medio del branding


In [21]:
data.groupby('make').agg({'sellingprice': 'mean', 'make':'count'}).rename(columns={'sellingprice':'precio venta promedio','make':'numero ventas'})

Unnamed: 0_level_0,precio venta promedio,numero ventas
make,Unnamed: 1_level_1,Unnamed: 2_level_1
Acura,14017.268260,5901
Aston Martin,54812.000000,25
Audi,19915.432782,5869
BMW,21441.895748,20719
Bentley,74367.672414,116
...,...,...
subaru,3710.416667,60
suzuki,4810.000000,5
toyota,7339.105263,95
volkswagen,6145.833333,24


## 6. Análisis de Rentabilidad por Marca

a) Crea una nueva columna `profit` que sea la diferencia entre `mmr` y `sellingprice`.
b) Agrupa por `make` y calcula el beneficio promedio para cada marca.

c) Caso de negocio: Identifica las 5 marcas con mayor beneficio promedio y explica qué acciones estratégicas implementarías (por ejemplo, renegociar precios o invertir en calidad).

### Respuesta
Implementaria publicidad donde se destaque la calidad para que estas marcas mantengan una buena imagen, me enfocaria en mejorar la experiencia y satisfacción del cliente y le aumentaria los precios de manera gradual


In [22]:
data['profit'] = data['mmr'] - data['sellingprice']

In [24]:
data

Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate,profit
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,white,black,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-1000.0
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,white,beige,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-700.0
2,2014,BMW,3 Series,328i SULEV,Sedan,automatic,wba3c1c51ek116351,ca,45.0,1331.0,gray,black,financial services remarketing (lease),31900.0,30000.0,Thu Jan 15 2015 04:30:00 GMT-0800 (PST),1900.0
3,2015,Volvo,S60,T5,Sedan,automatic,yv1612tb4f1310987,ca,41.0,14282.0,white,black,volvo na rep/world omni,27500.0,27750.0,Thu Jan 29 2015 04:30:00 GMT-0800 (PST),-250.0
4,2014,BMW,6 Series Gran Coupe,650i,Sedan,automatic,wba6b2c57ed129731,ca,43.0,2641.0,gray,black,financial services remarketing (lease),66000.0,67000.0,Thu Dec 18 2014 12:30:00 GMT-0800 (PST),-1000.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
558832,2015,Kia,K900,Luxury,Sedan,,knalw4d4xf6019304,in,45.0,18255.0,silver,black,avis corporation,35300.0,33000.0,Thu Jul 09 2015 07:00:00 GMT-0700 (PDT),2300.0
558833,2012,Ram,2500,Power Wagon,Crew Cab,automatic,3c6td5et6cg112407,wa,5.0,54393.0,white,black,i -5 uhlmann rv,30200.0,30800.0,Wed Jul 08 2015 09:30:00 GMT-0700 (PDT),-600.0
558834,2012,BMW,X5,xDrive35d,SUV,automatic,5uxzw0c58cl668465,ca,48.0,50561.0,black,black,financial services remarketing (lease),29800.0,34000.0,Wed Jul 08 2015 09:30:00 GMT-0700 (PDT),-4200.0
558835,2015,Nissan,Altima,2.5 S,sedan,automatic,1n4al3ap0fc216050,ga,38.0,16658.0,white,black,enterprise vehicle exchange / tra / rental / t...,15100.0,11100.0,Thu Jul 09 2015 06:45:00 GMT-0700 (PDT),4000.0


In [23]:
data.groupby('make').agg({'profit': 'mean'}).sort_values('profit',ascending=False).head(5)

Unnamed: 0_level_0,profit
make,Unnamed: 1_level_1
Fisker,2638.888889
Ferrari,2000.0
Plymouth,1577.5
Bentley,1560.775862
porsche,1419.736842


## 7. Análisis Temporal: Ventas del Año 2015

a) Filtra el dataset para obtener únicamente las ventas del año 2015 y muestra las primeras 10 filas. Cuantos Vehiculos tiene esta dataset


b) Caso de negocio: Si 2015 muestra comportamientos atípicos en comparación con otros años, ¿deberías ajustar la estrategia basándote en tendencias actuales? Explica tu criterio.

###Respuesta
a)Hay 9437 vehiculos
b)Si se debería ajustar la estrategia teniendo en cuenta las tendencias actuales para tomar decisiones más acertadas y adaptarse a los cambios en el mercado automotriz. Si se ignoran las preferencias de los consumidores y las condiciones del entorno actual, se pueden tomar decisiones que pongan en riesgo la rentabilidad del negocio


In [31]:
data_2015 = data[data['year']==2015]
data_2015.head(10)

Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate,profit
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,white,black,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-1000.0
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,white,beige,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-700.0
3,2015,Volvo,S60,T5,Sedan,automatic,yv1612tb4f1310987,ca,41.0,14282.0,white,black,volvo na rep/world omni,27500.0,27750.0,Thu Jan 29 2015 04:30:00 GMT-0800 (PST),-250.0
5,2015,Nissan,Altima,2.5 S,Sedan,automatic,1n4al3ap1fn326013,ca,1.0,5554.0,gray,black,enterprise vehicle exchange / tra / rental / t...,15350.0,10900.0,Tue Dec 30 2014 12:00:00 GMT-0800 (PST),4450.0
11,2015,Kia,Optima,LX,Sedan,automatic,5xxgm4a73fg353538,ca,48.0,2034.0,red,tan,kia motors finance,15150.0,17700.0,Tue Dec 16 2014 12:00:00 GMT-0800 (PST),-2550.0
12,2015,Ford,Fusion,SE,Sedan,automatic,3fa6p0hdxfr145753,ca,2.0,5559.0,white,beige,enterprise vehicle exchange / tra / rental / t...,15350.0,12000.0,Tue Jan 13 2015 12:00:00 GMT-0800 (PST),3350.0
13,2015,Kia,Sorento,LX,SUV,automatic,5xyktca66fg561407,ca,5.0,14634.0,silver,black,kia motors america inc,20600.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-900.0
15,2015,Nissan,Altima,2.5 S,Sedan,automatic,1n4al3ap5fc124223,ca,2.0,11398.0,black,black,enterprise vehicle exchange / tra / rental / t...,14750.0,14100.0,Tue Dec 23 2014 12:00:00 GMT-0800 (PST),650.0
16,2015,Hyundai,Sonata,SE,Sedan,automatic,5npe24af4fh001562,ca,,8311.0,red,—,avis tra,15200.0,4200.0,Tue Dec 16 2014 13:00:00 GMT-0800 (PST),11000.0
20,2015,Chevrolet,Impala,LTZ,Sedan,automatic,2g1165s30f9103921,ca,19.0,14538.0,silver,black,enterprise vehicle exchange / tra / rental / t...,24300.0,7200.0,Tue Jul 07 2015 09:30:00 GMT-0700 (PDT),17100.0


In [32]:
data_2015.shape

(9437, 17)

## 8. Comparación por Tipo de Carrocería

a) Agrupa por la columna `body` y calcula el promedio de `sellingprice` para cada tipo.

b) Caso de negocio: Determina qué tipo de carrocería tiene mayor precio promedio y argumenta cómo podrías aprovechar esta información para posicionar una línea premium o ajustar el inventario.

###Respuesta
Gran Turismo tiene el tipo de carroceria con mayor precio promedio, esta información es relevante ya que se podria posicionar una linea premium destacando el alto valor de la carroceria, sus caracteristicas y beneficios mientras se obtienen más ganancias al poder salir al mercado con un precio más elevado. Tambien se podria diversificar la oferta para llegar a más clientes potenciales

In [33]:
data.groupby('body').agg({'sellingprice': 'mean'}).sort_values('sellingprice',ascending=False)

Unnamed: 0_level_0,sellingprice
body,Unnamed: 1_level_1
granturismo convertible,79041.666667
GranTurismo Convertible,74000.000000
CTS-V Wagon,50500.000000
cts-v coupe,39707.142857
CTS-V Coupe,38425.750000
...,...
Xtracab,5818.750000
xtracab,5250.000000
Club Cab,4650.064103
Cab Plus,2825.000000


## 9. Filtros Combinados para un Caso Específico

a) **Paso 1:** Agrupa los datos por `state`, `model` y calcula el promedio de `sellingprice` para ver cuál es el precio promedio por combinación.

b) **Paso 2:** Utiliza el resultado del agrupamiento para filtrar el dataset original. Por ejemplo, filtra los registros de un estado ('ca') y un modelo ('Sorento') cuyo `sellingprice` supere el precio promedio calculado.

c) Caso de negocio: Analiza este segmento y plantea qué acciones implementarías para potenciar las ventas en California, considerando el modelo y el segmento premium.

###Respuestas
Las acciones que implementaria para potenciar las ventas en Florida son realizar campañas de marketing dirigidas a un segmento especifico de clientes potenciales para el modelo i8, realizar eventos de lanzamiento para el segmento premium donde se genere interes y exclusividad

In [34]:
data.groupby(['state','model']).agg({'sellingprice': 'mean'}).sort_values('sellingprice',ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,sellingprice
state,model,Unnamed: 2_level_1
fl,458 Italia,183000.000000
fl,i8,162000.000000
fl,Ghost,160333.333333
fl,SLS AMG GT,156500.000000
ca,i8,154250.000000
...,...,...
mi,G20,200.000000
pr,Sable,150.000000
ca,Paseo,150.000000
hi,Freestar,100.000000


In [45]:
data[(data["state"]=="fl")&(data["model"]=="i8")&(data["sellingprice"]>154250.000000)]

Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate,profit
239357,2014,BMW,i8,Base,Coupe,automatic,wby2z2c5xevx64349,fl,5.0,530.0,gray,brown,auto plaza motor sports llc,170000.0,159000.0,Tue Feb 10 2015 04:00:00 GMT-0800 (PST),11000.0
283534,2014,BMW,i8,Base,Coupe,automatic,wby2z2c57evx64261,fl,5.0,154.0,white,beige,american bank auto liquidators,170000.0,165000.0,Tue Feb 10 2015 04:00:00 GMT-0800 (PST),5000.0


## 10. Ventas Totales por Estado

a) Agrupa por `state` y calcula la suma de `sellingprice` para cada estado.

b) Caso de negocio: Identifica el estado con mayores ventas totales y discute cómo enfocar campañas de marketing o ampliar la red de distribución en ese estado.

###Respuesta

El estado con mayores ventas totales es Florida, en este lugar se podria enfocar las campañas de marketing personalizandolas para los clientes más fieles de este estado y usando los canales de distribución más efectivos para llegar a este público. También se podria colocar nuevos puntos de venta en ubicaciones estrategicas o asociarse con distribuidores para llegar a más clientes

In [46]:
data.groupby('state').agg({'sellingprice': 'sum'}).sort_values('sellingprice',ascending=False)

Unnamed: 0_level_0,sellingprice
state,Unnamed: 1_level_1
fl,1.151065e+09
ca,1.061078e+09
pa,8.612346e+08
tx,6.064954e+08
ga,4.489274e+08
...,...
3vwd17aj2fm258506,1.330000e+04
3vwd17aj4fm201708,1.320000e+04
3vwd17aj3fm276741,1.320000e+04
3vwd17aj5fm225953,1.320000e+04


## 11. Rentabilidad por Estado

a) Agrupa por `state` y calcula el promedio de eficiencia operativa. Como no contamos con 'Operating Margin', usa como proxy `profit/sellingprice`.

b) Caso de negocio: Identifica el estado con mayor eficiencia operativa y sugiere estrategias para replicar ese éxito en otros mercados.

###Respuesta
El estado con mayor eficiencia operativa es Nuevo Mexico, para replicar el éxito de este en otros mercados es necesario estudiar a fondo las practicas de Nuevo Mexico y adaptarlas de manera gradual a las condiciones de cada estado, incentivar la innovación y mejora continua de la eficiencia operativa, fomentar la colaboración entre los distintos estados y hacer seguimiento al progreso para tomar acciones de mejora.

In [54]:
data['profit/sellingprice'] = data['profit']/data['sellingprice']

In [58]:
data['profit/sellingprice']

Unnamed: 0,profit/sellingprice
0,-0.046512
1,-0.032558
2,0.063333
3,-0.009009
4,-0.014925
...,...
558832,0.069697
558833,-0.019481
558834,-0.123529
558835,0.360360


In [57]:
data.groupby('state').agg({'profit/sellingprice': 'mean'}).sort_values('profit/sellingprice',ascending=False)

Unnamed: 0_level_0,profit/sellingprice
state,Unnamed: 1_level_1
nm,1.178797
tx,0.565770
hi,0.429630
ny,0.320112
md,0.292650
...,...
3vwd17aj7fm326640,
3vwd17aj8fm239622,
3vwd17aj8fm298895,
3vwd17aj9fm219766,


## 12. Análisis por Tipo de Transmisión (en lugar de Sales Method)

a) Agrupa el dataset por `transmission` y calcula:
   - La suma de `sellingprice` para cada tipo.
   - El promedio de `sellingprice` para cada tipo.

b) Caso de negocio: ¿Qué tipo de transmisión (automática vs. manual) genera mayores ingresos y qué implicaciones tiene para la estrategia comercial?

###Respuesta
La transmisión que genera mayores ingresos es la automática. Para la estrategia comercial esto significa que se deben tener más carros automaticos en el inventario que manuales ya que la gente los prefiere, destacar las ventajas de este autos de transmisión automatica y tener variedad de modelos para todos los gustos con este tipo de transmisión

In [59]:
data.groupby('transmission').agg({'sellingprice': ['sum','mean']})

Unnamed: 0_level_0,sellingprice,sellingprice
Unnamed: 0_level_1,sum,mean
transmission,Unnamed: 1_level_2,Unnamed: 2_level_2
Sedan,150550.0,13686.363636
automatic,6443934000.0,13540.406866
manual,196693600.0,11211.448358
sedan,204750.0,13650.0


## 13. Segmentación por Producto Líder

a) Identifica el producto (utiliza la columna `model` como proxy) con mayor cantidad de unidades vendidas. Agrupa por `model` y usa el conteo de registros.

b) Caso de negocio: Si un producto lidera en ventas, ¿cómo ajustarías el inventario y las promociones para maximizar las ganancias?

###Respuestas
Si un producto lidera en ventas en el inventario se debe aumentar el stock y priorizar el reabastecimiento de este agilizando la cadena de suministro, en las promociones se debe ser estrategico y usar los canales más efectivos para impulsar las ventas

In [62]:
data.groupby('model').agg({'model':'count'}).rename(columns={'model':'count'}).sort_values('count',ascending=False)

Unnamed: 0_level_0,count
model,Unnamed: 1_level_1
Altima,19349
F-150,14479
Fusion,12946
Camry,12545
Escape,11861
...,...
Paseo,1
Q3,1
Ram Van,1
Regency,1


## 14. Comparación Crítica entre Retailers

a) Compara dos retailers usando la columna `seller` en cuanto a volumen de ventas y margen de beneficio (usa `profit` como proxy).

b) Caso de negocio: Si un retailer muestra mayores unidades vendidas pero un margen inferior, ¿qué estrategia recomendarías (por ejemplo, optimización de costos, cambio en política de descuentos, etc.)? Justifica tu propuesta.

**Paso a paso:**
1. Agrupa por `seller` y calcula la suma de `sellingprice` y el promedio de `profit`.
2. Ordena los resultados para identificar los líderes en volumen y analiza el margen.
3. Propón una estrategia basada en los resultados.

###Respuesta
Si un retailer vende más unidades pero con un margen bajo, debe optimizar su rentabilidad. Puede promover aquellos productos con mayor margen, aplicar estrategias de precios dinámicos y eliminar descuentos poco rentables. También puede reducir costos operativos negociando con proveedores y mejorando la logística. Además, puede fidelizar clientes con programas de lealtad y marketing personalizado


In [63]:
data.groupby('seller').agg({'sellingprice': 'sum','profit': 'mean'}).sort_values('sellingprice',ascending=False)

Unnamed: 0_level_0,sellingprice,profit
seller,Unnamed: 1_level_1,Unnamed: 2_level_1
ford motor credit company llc,340960125.0,216.393122
nissan-infiniti lt,272104560.0,-70.225969
the hertz corporation,250863168.0,189.344063
nissan infiniti lt,216158321.0,92.654989
avis corporation,203432330.0,-20.590510
...,...,...
bell auto sales,200.0,250.000000
alberta truck & auto liquidators,200.0,150.000000
beaverton honda,200.0,1100.000000
bcaa/company cars,200.0,600.000000


## 15. Caso Integrador: Estrategia Comercial Global

a) **Paso 1:** Identifica cada criterio basado en los análisis anteriores:
   - **Retailer con mayores ventas totales:** Usa la columna `seller` del resumen de retailers.
   - **Estado con mayores ventas totales:** Del agrupamiento por `state`.
   - **Producto con mayor unidades vendidas:** Usa la columna `model`.
   - **Tipo de transmisión con mayores ventas totales:** Agrupa por `transmission`.

b) **Paso 2:** Filtra el dataset original usando cada uno de estos criterios, uno a uno, y luego combínalos en un filtro final.

c) Con base en el análisis combinado, redacta un breve informe (3-4 líneas) proponiendo una estrategia comercial integral para maximizar la rentabilidad, considerando inversión en canales, promociones específicas y optimización de inventario.

Para mejorar la rentabilidad, se debe enfocar la estrategia en optimizar el inventario del modelo "Altima" con transmisión automática, promoviendo su venta con campañas de marketing dirigidas al estado de Florida a través del retailer "Ford Motor Credit Company LLC". Además, es clave lanzar promociones exclusivas para este modelo, potenciando las ventas en todos los canales. Adicionalmete, se debe ajustar el stock de acuerdo con la demanda para reducir costos y evitar excesos de inventario.

d) Caso de negocio: Utiliza la integración de estos criterios para definir en qué segmento enfocar la estrategia global.
La estrategia global debe enfocarse en clientes de Florida interesados en el  Altima de transmisión automático, a través del retailer "ford motor credit company llc".



In [77]:
top_seller=data.groupby('seller').agg({'sellingprice': 'sum'}).sort_values('sellingprice',ascending=False)
top_seller

Unnamed: 0_level_0,sellingprice
seller,Unnamed: 1_level_1
ford motor credit company llc,340960125.0
nissan-infiniti lt,272104560.0
the hertz corporation,250863168.0
nissan infiniti lt,216158321.0
avis corporation,203432330.0
...,...
bell auto sales,200.0
alberta truck & auto liquidators,200.0
beaverton honda,200.0
bcaa/company cars,200.0


In [78]:
top_state = data.groupby('state').agg({'sellingprice': 'sum'}).sort_values('sellingprice',ascending=False)
top_state

Unnamed: 0_level_0,sellingprice
state,Unnamed: 1_level_1
fl,1.151065e+09
ca,1.061078e+09
pa,8.612346e+08
tx,6.064954e+08
ga,4.489274e+08
...,...
3vwd17aj2fm258506,1.330000e+04
3vwd17aj4fm201708,1.320000e+04
3vwd17aj3fm276741,1.320000e+04
3vwd17aj5fm225953,1.320000e+04


In [79]:
top_model=data.groupby('model').agg({'model':'count'}).rename(columns={'model':'count'}).sort_values('count',ascending=False)
top_model

Unnamed: 0_level_0,count
model,Unnamed: 1_level_1
Altima,19349
F-150,14479
Fusion,12946
Camry,12545
Escape,11861
...,...
Paseo,1
Q3,1
Ram Van,1
Regency,1


In [80]:
top_transmission=data.groupby('transmission').agg({'sellingprice': 'sum'}).sort_values('sellingprice',ascending=False)
top_transmission


Unnamed: 0_level_0,sellingprice
transmission,Unnamed: 1_level_1
automatic,6443934000.0
manual,196693600.0
sedan,204750.0
Sedan,150550.0


In [96]:
final_filter = data[(data["top_seller"] == "ford motor credit company llc") & (data["top_state"] == "fl") & (data["top_model"] == "Altima") & (data["top_transmision"] == "automatic")].reset_index(drop=True)


KeyError: 'top_seller'

In [99]:
data['top_seller'] = "ford motor credit company llc"
data['top_state'] = "fl"
data['top_model'] = "Altima"
data['top_transmision'] = "automatic"

# Now, the filter should work correctly:
final_filter = data[(data["top_seller"] == "ford motor credit company llc") & (data["top_state"] == "fl") & (data["top_model"] == "Altima") & (data["top_transmision"] == "automatic")].reset_index(drop=True)

In [100]:
final_filter

Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,...,seller,mmr,sellingprice,saledate,profit,profit/sellingprice,top_seller,top_state,top_model,top_transmision
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,...,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-1000.0,-0.046512,ford motor credit company llc,fl,Altima,automatic
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,...,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-700.0,-0.032558,ford motor credit company llc,fl,Altima,automatic
2,2014,BMW,3 Series,328i SULEV,Sedan,automatic,wba3c1c51ek116351,ca,45.0,1331.0,...,financial services remarketing (lease),31900.0,30000.0,Thu Jan 15 2015 04:30:00 GMT-0800 (PST),1900.0,0.063333,ford motor credit company llc,fl,Altima,automatic
3,2015,Volvo,S60,T5,Sedan,automatic,yv1612tb4f1310987,ca,41.0,14282.0,...,volvo na rep/world omni,27500.0,27750.0,Thu Jan 29 2015 04:30:00 GMT-0800 (PST),-250.0,-0.009009,ford motor credit company llc,fl,Altima,automatic
4,2014,BMW,6 Series Gran Coupe,650i,Sedan,automatic,wba6b2c57ed129731,ca,43.0,2641.0,...,financial services remarketing (lease),66000.0,67000.0,Thu Dec 18 2014 12:30:00 GMT-0800 (PST),-1000.0,-0.014925,ford motor credit company llc,fl,Altima,automatic
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
558832,2015,Kia,K900,Luxury,Sedan,,knalw4d4xf6019304,in,45.0,18255.0,...,avis corporation,35300.0,33000.0,Thu Jul 09 2015 07:00:00 GMT-0700 (PDT),2300.0,0.069697,ford motor credit company llc,fl,Altima,automatic
558833,2012,Ram,2500,Power Wagon,Crew Cab,automatic,3c6td5et6cg112407,wa,5.0,54393.0,...,i -5 uhlmann rv,30200.0,30800.0,Wed Jul 08 2015 09:30:00 GMT-0700 (PDT),-600.0,-0.019481,ford motor credit company llc,fl,Altima,automatic
558834,2012,BMW,X5,xDrive35d,SUV,automatic,5uxzw0c58cl668465,ca,48.0,50561.0,...,financial services remarketing (lease),29800.0,34000.0,Wed Jul 08 2015 09:30:00 GMT-0700 (PDT),-4200.0,-0.123529,ford motor credit company llc,fl,Altima,automatic
558835,2015,Nissan,Altima,2.5 S,sedan,automatic,1n4al3ap0fc216050,ga,38.0,16658.0,...,enterprise vehicle exchange / tra / rental / t...,15100.0,11100.0,Thu Jul 09 2015 06:45:00 GMT-0700 (PDT),4000.0,0.360360,ford motor credit company llc,fl,Altima,automatic
