# Análisis EDA y Decisiones de Negocio en Ventas de Automóviles

Este notebook contiene 15 ejercicios que combinan análisis exploratorio de datos (EDA) y reflexiones críticas de negocio. Cada punto incluye instrucciones detalladas, paso a paso, para realizar agrupaciones y filtros, de modo que se guíe al estudiante en cada parte del proceso.

La estructura del dataset es la siguiente:

```
year, make, model, trim, body, transmission, vin, state, condition, odometer, color, interior, seller, mmr, sellingprice, saledate
```

¡Comienza el análisis y sigue cada paso para proponer estrategias de negocio basadas en los resultados!

In [1]:
# Descargar y descomprimir el dataset
!wget https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
!unzip -o cars_dataset.zip

--2025-03-13 20:04:13--  https://github.com/javierherrera1996/lecture_analytics/raw/main/cars_dataset.zip
Resolving github.com (github.com)... 20.27.177.113
Connecting to github.com (github.com)|20.27.177.113|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip [following]
--2025-03-13 20:04:14--  https://raw.githubusercontent.com/javierherrera1996/lecture_analytics/main/cars_dataset.zip
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.111.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.111.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 19753181 (19M) [application/zip]
Saving to: ‘cars_dataset.zip’


2025-03-13 20:04:18 (32.2 MB/s) - ‘cars_dataset.zip’ saved [19753181/19753181]

Archive:  cars_dataset.zip
  inflating: car_prices.csv          


## 1. Dimensiones y Representatividad del Dataset

a) Carga el dataset (desde un archivo CSV) y muestra sus dimensiones (número de filas y columnas).

b) Describe brevemente qué representa cada fila y reflexiona: ¿Crees que el dataset es representativo del mercado de ventas de automóviles? Justifica tu respuesta.

In [2]:
import pandas as pd

data = pd.read_csv('car_prices.csv')


In [5]:
data.shape

(558837, 16)

In [4]:
data.head()



Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,white,black,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST)
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,white,beige,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST)
2,2014,BMW,3 Series,328i SULEV,Sedan,automatic,wba3c1c51ek116351,ca,45.0,1331.0,gray,black,financial services remarketing (lease),31900.0,30000.0,Thu Jan 15 2015 04:30:00 GMT-0800 (PST)
3,2015,Volvo,S60,T5,Sedan,automatic,yv1612tb4f1310987,ca,41.0,14282.0,white,black,volvo na rep/world omni,27500.0,27750.0,Thu Jan 29 2015 04:30:00 GMT-0800 (PST)
4,2014,BMW,6 Series Gran Coupe,650i,Sedan,automatic,wba6b2c57ed129731,ca,43.0,2641.0,gray,black,financial services remarketing (lease),66000.0,67000.0,Thu Dec 18 2014 12:30:00 GMT-0800 (PST)


In [6]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 558837 entries, 0 to 558836
Data columns (total 16 columns):
 #   Column        Non-Null Count   Dtype  
---  ------        --------------   -----  
 0   year          558837 non-null  int64  
 1   make          548536 non-null  object 
 2   model         548438 non-null  object 
 3   trim          548186 non-null  object 
 4   body          545642 non-null  object 
 5   transmission  493485 non-null  object 
 6   vin           558833 non-null  object 
 7   state         558837 non-null  object 
 8   condition     547017 non-null  float64
 9   odometer      558743 non-null  float64
 10  color         558088 non-null  object 
 11  interior      558088 non-null  object 
 12  seller        558837 non-null  object 
 13  mmr           558799 non-null  float64
 14  sellingprice  558825 non-null  float64
 15  saledate      558825 non-null  object 
dtypes: float64(4), int64(1), object(11)
memory usage: 68.2+ MB


In [7]:
data.describe()

Unnamed: 0,year,condition,odometer,mmr,sellingprice
count,558837.0,547017.0,558743.0,558799.0,558825.0
mean,2010.038927,30.672365,68320.017767,13769.377495,13611.35881
std,3.966864,13.402832,53398.542821,9679.967174,9749.501628
min,1982.0,1.0,1.0,25.0,1.0
25%,2007.0,23.0,28371.0,7100.0,6900.0
50%,2012.0,35.0,52254.0,12250.0,12100.0
75%,2013.0,42.0,99109.0,18300.0,18200.0
max,2015.0,49.0,999999.0,182000.0,230000.0


si es represetativo, por que en el dataset se nos muestra el año, el modelo, el precio y la fecha en que fue vendido, por ende si es representativo del mercado de ventas

## 2. Ventas Totales y Promedio

a) Calcula la suma total y el promedio de la columna `sellingprice`.

b) Caso de negocio: Si el precio promedio es bajo, ¿qué estrategias de precio o promociones sugerirías para aumentar la rentabilidad? Explica tu respuesta.

In [8]:
total_selling_price = data['sellingprice'].sum()
average_selling_price = data['sellingprice'].mean()

print(f"Total selling price: {total_selling_price}")
print(f"Average selling price: {average_selling_price}")


Total selling price: 7606367587.0
Average selling price: 13611.358810003132


las estrategias de precio o promociones para aumtar la retabildiad peuden ser las siguientes:

ofrecer promociones por timepo limitados apra llamra la ateción de los clientes

acompañar la venta de los vehiculos por un servicio especial seguros u ofrecer servicoo de mecanica futuros

ofrecer financiamiento a los compradores que no tengan el dinero completo

recibir otros vehiculos como parte de pago


## 3. Distribución de Ventas por Marca

a) Utiliza `value_counts()` para determinar cuántas ventas se registraron por cada marca (`make`).

b) Caso de negocio: ¿Qué marcas parecen dominar el mercado? Basado en esta distribución, ¿en qué marcas invertirías en publicidad y por qué?

In [10]:
make_counts = data['make'].value_counts()
make_counts

Unnamed: 0_level_0,count
make,Unnamed: 1_level_1
Ford,93554
Chevrolet,60197
Nissan,53946
Toyota,39871
Dodge,30710
...,...
airstream,1
ford tk,1
chev truck,1
hyundai tk,1


las marcas que dominan el mercado son ford, Chevrolet y Nissan

en la marcas que invertiria publicidad son el las marcas que tines menor flujo de ventas, para asi atraer mas clientes y tener mas vetas en esas marcas




## 4. Segmentación de Clientes por Kilometraje

a) Crea un DataFrame filtrado que incluya únicamente las ventas donde el `odometer` es menor a 20,000 millas. Cuantos Vehiculos tiene este dataset?

b) Caso de negocio: Este segmento de vehículos con bajo uso puede tener mayor valor percibido. ¿Cómo ajustarías la estrategia de marketing para este grupo?

In [20]:
data_filtered = data[data['odometer'] < 20000]
print(data_filtered.head())
print(data_filtered.columns)

   year   make                model        trim   body transmission  \
0  2015    Kia              Sorento          LX    SUV    automatic   
1  2015    Kia              Sorento          LX    SUV    automatic   
2  2014    BMW             3 Series  328i SULEV  Sedan    automatic   
3  2015  Volvo                  S60          T5  Sedan    automatic   
4  2014    BMW  6 Series Gran Coupe        650i  Sedan    automatic   

                 vin state  condition  odometer  color interior  \
0  5xyktca69fg566472    ca        5.0   16639.0  white    black   
1  5xyktca69fg561319    ca        5.0    9393.0  white    beige   
2  wba3c1c51ek116351    ca       45.0    1331.0   gray    black   
3  yv1612tb4f1310987    ca       41.0   14282.0  white    black   
4  wba6b2c57ed129731    ca       43.0    2641.0   gray    black   

                                   seller      mmr  sellingprice  \
0                 kia motors america  inc  20500.0       21500.0   
1                 kia motors ameri

la estrategia de marketing que ajustaria para estos vehiculos que tines un menor nuemro de millas es:

promocionar su bajo kilometraje dando a entender que tendra una vida util mayor a los demas autos con mayor numero de millas

ofrecer promociones exclusivas como: una garatia de mas tiempo



## 5. Agrupación por Marca: Precio y Volumen

a) Agrupa el dataset por `make` y calcula:
   - El promedio de `sellingprice`.
   - La cantidad de ventas por marca (usa el conteo de registros como proxy).

b) Caso de negocio: Si una marca tiene alto volumen pero precios bajos, ¿qué medidas recomendarías para mejorar el margen?

**Paso a paso:**
1. Realiza la agrupación.
2. Renombra las columnas para que sean claras.
3. Interpreta el resultado antes de pasar al siguiente filtro o análisis.

In [26]:
make_stats = data.groupby('make')['sellingprice'].agg(['mean', 'count'])

make_stats = make_stats.rename(columns={
    'mean': 'average_selling_price',
    'count': 'sales_volume'
})
make_stats

Unnamed: 0_level_0,average_selling_price,sales_volume
make,Unnamed: 1_level_1,Unnamed: 2_level_1
Acura,14017.268260,5901
Aston Martin,54812.000000,25
Audi,19915.432782,5869
BMW,21441.895748,20719
Bentley,74367.672414,116
...,...,...
subaru,3710.416667,60
suzuki,4810.000000,5
toyota,7339.105263,95
volkswagen,6145.833333,24


intepretacion:

si una marca vende muchos carros baratos puede que sus ganancias no sean las mejores
entonces podría subir un poco los precios si el mercado lo permite o hacer los carros de mejor calidad para que la gente esté dispuesta a pagar más

tambien se  puede enfocar en clientes con más poder adquisitivo o agregar extras y servicios que aumenten el valor de cada venta. Y si subir precios no es viable, reducir costos ayudaría a mejorar las ganancias sin afectar la competitividad


se peude observar que los que tienes mayor precio tine menor nuemro de ventas porque son marcas mas exlucivas los cuales los clientes son mas escasos

## 6. Análisis de Rentabilidad por Marca

a) Crea una nueva columna `profit` que sea la diferencia entre `mmr` y `sellingprice`.
b) Agrupa por `make` y calcula el beneficio promedio para cada marca.

c) Caso de negocio: Identifica las 5 marcas con mayor beneficio promedio y explica qué acciones estratégicas implementarías (por ejemplo, renegociar precios o invertir en calidad).

In [22]:
data['profit'] = data['mmr'] - data['sellingprice']

benefi_prom= data.groupby('make')['profit'].mean()
print(benefi_prom)


top_5_brands = benefi_prom.sort_values(ascending=False).head(5)
print("\nTop 5 brands with the highest average profit:")
top_5_brands

make
Acura             59.544992
Aston Martin   -1252.000000
Audi             164.781053
BMW              133.652058
Bentley         1560.775862
                   ...     
subaru           201.250000
suzuki            -5.000000
toyota            28.526316
volkswagen      -161.458333
vw               175.000000
Name: profit, Length: 96, dtype: float64

Top 5 brands with the highest average profit:


Unnamed: 0_level_0,profit
make,Unnamed: 1_level_1
Fisker,2638.888889
Ferrari,2000.0
Plymouth,1577.5
Bentley,1560.775862
porsche,1419.736842


estrategias:

subir la calidad: Si tienen buena ganancia pero venden poco, mejorar la calidad de los autos puede atraer más clientes dispuestos a pagar

si los precios están muy bajos para lo que ganan, subirlos un poco sin perder competitividad podría ser una buena movida

tener un buen servicio después de la venta para que los clientes queden satisfechos y recomienden la marca

no bajar la calidad y no confiarse de la venats y seguir con el mismo proceso y mejador cada detalle

## 7. Análisis Temporal: Ventas del Año 2015

a) Filtra el dataset para obtener únicamente las ventas del año 2015 y muestra las primeras 10 filas. Cuantos Vehiculos tiene esta dataset


b) Caso de negocio: Si 2015 muestra comportamientos atípicos en comparación con otros años, ¿deberías ajustar la estrategia basándote en tendencias actuales? Explica tu criterio.

In [31]:
sales_total_2015 = data[data['year'] == 2015]
print(sales_total_2015.head(10))
num_vehiculos_2015 = len(sales_total_2015)
print(f"\nNúmero de vehículos vendidos en 2015: {num_vehiculos_2015}")

    year       make    model   trim   body transmission                vin  \
0   2015        Kia  Sorento     LX    SUV    automatic  5xyktca69fg566472   
1   2015        Kia  Sorento     LX    SUV    automatic  5xyktca69fg561319   
3   2015      Volvo      S60     T5  Sedan    automatic  yv1612tb4f1310987   
5   2015     Nissan   Altima  2.5 S  Sedan    automatic  1n4al3ap1fn326013   
11  2015        Kia   Optima     LX  Sedan    automatic  5xxgm4a73fg353538   
12  2015       Ford   Fusion     SE  Sedan    automatic  3fa6p0hdxfr145753   
13  2015        Kia  Sorento     LX    SUV    automatic  5xyktca66fg561407   
15  2015     Nissan   Altima  2.5 S  Sedan    automatic  1n4al3ap5fc124223   
16  2015    Hyundai   Sonata     SE  Sedan    automatic  5npe24af4fh001562   
20  2015  Chevrolet   Impala    LTZ  Sedan    automatic  2g1165s30f9103921   

   state  condition  odometer   color interior  \
0     ca        5.0   16639.0   white    black   
1     ca        5.0    9393.0   white    

## 8. Comparación por Tipo de Carrocería

a) Agrupa por la columna `body` y calcula el promedio de `sellingprice` para cada tipo.

b) Caso de negocio: Determina qué tipo de carrocería tiene mayor precio promedio y argumenta cómo podrías aprovechar esta información para posicionar una línea premium o ajustar el inventario.

In [34]:
body_price = data.groupby('body')['sellingprice'].mean()
print(body_price)

max_body_price = body_price.idxmax()
print(f"\nEl tipo de carrocería con mayor precio promedio es: {max_body_price}")

body
Access Cab            13262.500000
Beetle Convertible    18070.192308
CTS Coupe             22758.527132
CTS Wagon             17811.538462
CTS-V Coupe           38425.750000
                          ...     
transit van           22707.142857
tsx sport wagon       18118.750000
van                   15009.742105
wagon                 10551.605442
xtracab                5250.000000
Name: sellingprice, Length: 87, dtype: float64

El tipo de carrocería con mayor precio promedio es: granturismo convertible


esto de se peude aprovechar resaltando características como tecnología avanzada, materiales de alta calidad y un rendimiento superior en la publicidad

usa anuncios dirigidos a clientes con mayor poder adquisitivo  resaltando el estatus y la exclusividad del modelo

tambien otras estrategias para ajutar la ventas

 para modelo premium es venderlos con margenes altos con un buen financiamiento

y para los modelo de menor precios ofrecer mas promociones o paquetes

## 9. Filtros Combinados para un Caso Específico

a) **Paso 1:** Agrupa los datos por `state`, `model` y calcula el promedio de `sellingprice` para ver cuál es el precio promedio por combinación.

b) **Paso 2:** Utiliza el resultado del agrupamiento para filtrar el dataset original. Por ejemplo, filtra los registros de un estado ('ca') y un modelo ('Sorento') cuyo `sellingprice` supere el precio promedio calculado.

c) Caso de negocio: Analiza este segmento y plantea qué acciones implementarías para potenciar las ventas en California, considerando el modelo y el segmento premium.

In [35]:
grouped_data = data.groupby(['state', 'model'])['sellingprice'].mean().reset_index()
grouped_data = grouped_data.rename(columns={'sellingprice': 'average_sellingprice'})


average_price_ca_sorento = grouped_data[(grouped_data['state'] == 'ca') & (grouped_data['model'] == 'Sorento')]['average_sellingprice'].iloc[0]

filtered_data = data[
    (data['state'] == 'ca') &
    (data['model'] == 'Sorento') &
    (data['sellingprice'] > average_price_ca_sorento)
]

filtered_data

Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate,profit
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,white,black,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-1000.0
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,white,beige,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-700.0
13,2015,Kia,Sorento,LX,SUV,automatic,5xyktca66fg561407,ca,5.0,14634.0,silver,black,kia motors america inc,20600.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-900.0
32,2015,Kia,Sorento,LX,SUV,automatic,5xyktca60fg565226,ca,5.0,13757.0,red,black,kia motors america inc,20600.0,20750.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-150.0
34,2015,Kia,Sorento,LX,SUV,automatic,5xyktca68fg559481,ca,44.0,12862.0,gray,black,kia motors america inc,20700.0,21000.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-300.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
523501,2012,Kia,Sorento,LX,suv,automatic,5xykt4a2xcg275994,ca,36.0,32296.0,silver,black,kia motors finance,15300.0,16300.0,Tue Jun 16 2015 05:30:00 GMT-0700 (PDT),-1000.0
523504,2012,Kia,Sorento,SX,suv,automatic,5xykw4a24cg300606,ca,36.0,41758.0,gray,gray,kia motors finance,19450.0,19000.0,Tue Jun 16 2015 05:30:00 GMT-0700 (PDT),450.0
532270,2014,Kia,Sorento,EX,suv,automatic,5xyku4a77eg525106,ca,5.0,15983.0,blue,beige,kia motors finance,23000.0,24400.0,Tue Jun 16 2015 05:30:00 GMT-0700 (PDT),-1400.0
532276,2014,Kia,Sorento,LX,suv,automatic,5xykt4a66eg458136,ca,31.0,20919.0,blue,silver,crb auto finance,16950.0,16400.0,Wed Jun 17 2015 05:30:00 GMT-0700 (PDT),550.0


analisis:

 esto nos muestra datos de la Kia Sorento, especialmente en versiones LX, EX y SX, es un modelo recurrente en el mercado de California, nos enseña como suprecio varia segun sus millas


acciones a implementar:

las acciones que se pueden hacer para potenciar las ventas en california considerando el modelo y el segmento premium son:

destacar el segmento premium
esto se pedue hacer mediante una promocion a las carateristcas que hacen premium al vehiculo

Ofrecer planes de financiamiento atractivos para clientes que buscan SUVs con mayor calidad

invertir en publicidad seccionada para personas que busques este tipo de carateristicas en su vehiculo a comprar








## 10. Ventas Totales por Estado

a) Agrupa por `state` y calcula la suma de `sellingprice` para cada estado.

b) Caso de negocio: Identifica el estado con mayores ventas totales y discute cómo enfocar campañas de marketing o ampliar la red de distribución en ese estado.

In [37]:
data = data[data['state'].str.len() == 2]
data_grouped = data.groupby('state', as_index=False)['sellingprice'].sum()
data_grouped.rename(columns={'sellingprice': 'total_sellingprice'}, inplace=True)
print(data_grouped)

   state  total_sellingprice
0     ab        1.036765e+07
1     al        2.377000e+05
2     az        1.009105e+08
3     ca        1.061078e+09
4     co        1.234499e+08
5     fl        1.151065e+09
6     ga        4.489274e+08
7     hi        1.508005e+07
8     il        3.472900e+08
9     in        4.634485e+07
10    la        2.305286e+07
11    ma        4.526425e+07
12    md        8.267062e+07
13    mi        2.309001e+08
14    mn        1.292545e+08
15    mo        2.316471e+08
16    ms        2.081288e+07
17    nc        1.891986e+08
18    ne        5.045528e+07
19    nj        3.781154e+08
20    nm        1.075900e+06
21    ns        6.230000e+05
22    nv        1.915152e+08
23    ny        6.482348e+07
24    oh        3.108228e+08
25    ok        4.981000e+05
26    on        6.131105e+07
27    or        1.335005e+07
28    pa        8.612346e+08
29    pr        2.564435e+07
30    qc        1.654975e+07
31    sc        4.389656e+07
32    tn        3.554186e+08
33    tx      

el estado con mayores ventas totales el Florida

campañas de marketing o ampliar la red de distribución en ese estado:

aumentar la presecia de concesionarios para ampliar su red de venta

Optimización del inventario: Mantener un stock variado de versiones premium y modelos con menor kilometraje para atraer clientes exigentes

enfocarse tambien en el alto flujo de turistas y haciendo alienzasa con empresass que renten autos


## 11. Rentabilidad por Estado

a) Agrupa por `state` y calcula el promedio de eficiencia operativa. Como no contamos con 'Operating Margin', usa como proxy `profit/sellingprice`.

b) Caso de negocio: Identifica el estado con mayor eficiencia operativa y sugiere estrategias para replicar ese éxito en otros mercados.

In [39]:
data['operating_efficiency'] = data['profit'] / data['sellingprice']
efficiency_by_state = data.groupby('state')['operating_efficiency'].mean().reset_index()
efficiency_by_state.rename(columns={'operating_efficiency': 'avg_operating_efficiency'}, inplace=True)
print(efficiency_by_state)


   state  avg_operating_efficiency
0     ab                  0.070770
1     al                  0.169054
2     az                  0.108662
3     ca                  0.164543
4     co                  0.022271
5     fl                  0.069392
6     ga                  0.247233
7     hi                  0.429630
8     il                  0.063233
9     in                  0.209087
10    la                  0.219902
11    ma                  0.291411
12    md                  0.292650
13    mi                  0.061924
14    mn                  0.031394
15    mo                  0.040832
16    ms                  0.223003
17    nc                  0.032058
18    ne                  0.068946
19    nj                  0.115883
20    nm                  1.178797
21    ns                  0.104358
22    nv                  0.082634
23    ny                  0.320112
24    oh                  0.136039
25    ok                  0.208784
26    on                  0.018810
27    or            

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  data['operating_efficiency'] = data['profit'] / data['sellingprice']


el estado con mayor eficiencia operativa es nuevo mexico


estrategias para replicar ese éxito en otros mercados:

viendo desde el incio el proceso y los comportamientos de los consumidores en ese estado

analizar el mercado de nuevo mexico y ver que cosas se peuden implemetar en los demas estados



## 12. Análisis por Tipo de Transmisión (en lugar de Sales Method)

a) Agrupa el dataset por `transmission` y calcula:
   - La suma de `sellingprice` para cada tipo.
   - El promedio de `sellingprice` para cada tipo.

b) Caso de negocio: ¿Qué tipo de transmisión (automática vs. manual) genera mayores ingresos y qué implicaciones tiene para la estrategia comercial?

In [43]:
transmission_stats = data.groupby('transmission')['sellingprice'].agg(['sum', 'mean'])

transmission_stats = transmission_stats.rename(columns={
    'sum': 'total_sellingprice',
    'mean': 'average_sellingprice'
})


transmission_stats

Unnamed: 0_level_0,total_sellingprice,average_sellingprice
transmission,Unnamed: 1_level_1,Unnamed: 2_level_1
automatic,6443934000.0,13540.406866
manual,196693600.0,11211.448358


la trasmision auntomatica es la que genera mayores ingresos


Si es lo que más se vende, hay que tener más stock donde más los compran

la gente quiere facilidad al manejar, así que hay que resaltar eso

tener siempre suficientes modelos automáticos disponibles para no perder ventas

facilitar el financiamiento para que más personas puedan comprarlos sin problema.

## 13. Segmentación por Producto Líder

a) Identifica el producto (utiliza la columna `model` como proxy) con mayor cantidad de unidades vendidas. Agrupa por `model` y usa el conteo de registros.

b) Caso de negocio: Si un producto lidera en ventas, ¿cómo ajustarías el inventario y las promociones para maximizar las ganancias?

In [44]:
model_counts = data.groupby('model')['model'].count().sort_values(ascending=False)
print(model_counts.head(1))


model
Altima    19349
Name: model, dtype: int64


de ese producto se debe tener mas stock apra asegurar que no se va a agotar

ya que es el producto estrellas, siempre tener promociones y servicios despues de la venta como garantias extedidas, financiamiento  y una mejor expericias al momento de comprarlo

 publicitando e las características que más atraen a los compradores y usar testimonios reales


## 14. Comparación Crítica entre Retailers

a) Compara dos retailers usando la columna `seller` en cuanto a volumen de ventas y margen de beneficio (usa `profit` como proxy).

b) Caso de negocio: Si un retailer muestra mayores unidades vendidas pero un margen inferior, ¿qué estrategia recomendarías (por ejemplo, optimización de costos, cambio en política de descuentos, etc.)? Justifica tu propuesta.

**Paso a paso:**
1. Agrupa por `seller` y calcula la suma de `sellingprice` y el promedio de `profit`.
2. Ordena los resultados para identificar los líderes en volumen y analiza el margen.
3. Propón una estrategia basada en los resultados.

In [46]:
seller_stats = data.groupby('seller').agg({'sellingprice': 'sum', 'profit': 'mean'})

seller_stats = seller_stats.rename(columns={'sellingprice': 'total_sales', 'profit': 'average_profit'})


seller_stats = seller_stats.sort_values(by='total_sales', ascending=False)

seller_stats

Unnamed: 0_level_0,total_sales,average_profit
seller,Unnamed: 1_level_1,Unnamed: 2_level_1
ford motor credit company llc,340960125.0,216.393122
nissan-infiniti lt,272104560.0,-70.225969
the hertz corporation,250863168.0,189.344063
nissan infiniti lt,216158321.0,92.654989
avis corporation,203432330.0,-20.590510
...,...,...
alberta truck & auto liquidators,200.0,150.000000
district 24c lions charity,200.0,325.000000
republic finance llc/pearl,200.0,150.000000
preston ford inc,200.0,750.000000


la estrategia que yo recomedaria es:

ajustaría los costos y los descuentos para no regalar margen enfocándome en promos mas estratégicas. tambien segmentaria precios segun la demanda, meteria opciones premium y complementarias para subir el ticket de venta, y ofreceria mejores planes de pago en vez de bajar precios sin control .

## 15. Caso Integrador: Estrategia Comercial Global

a) **Paso 1:** Identifica cada criterio basado en los análisis anteriores:
   - **Retailer con mayores ventas totales:** Usa la columna `seller` del resumen de retailers.
   - **Estado con mayores ventas totales:** Del agrupamiento por `state`.
   - **Producto con mayor unidades vendidas:** Usa la columna `model`.
   - **Tipo de transmisión con mayores ventas totales:** Agrupa por `transmission`.

b) **Paso 2:** Filtra el dataset original usando cada uno de estos criterios, uno a uno, y luego combínalos en un filtro final.

c) Con base en el análisis combinado, redacta un breve informe (3-4 líneas) proponiendo una estrategia comercial integral para maximizar la rentabilidad, considerando inversión en canales, promociones específicas y optimización de inventario.

d) Caso de negocio: Utiliza la integración de estos criterios para definir en qué segmento enfocar la estrategia global.

In [48]:
top_seller = data.groupby('seller')['sellingprice'].sum().idxmax()



top_state = data.groupby('state')['sellingprice'].sum().idxmax()


top_model = data['model'].value_counts().idxmax()


top_transmission = data.groupby('transmission')['sellingprice'].sum().idxmax()

df_filtrado = data[
    (data['seller'] == top_seller) &
    (data['state'] == top_state) &
    (data['model'] == top_model) &
    (data['transmission'] == top_transmission)
]

data_filtered.head(10)



Unnamed: 0,year,make,model,trim,body,transmission,vin,state,condition,odometer,color,interior,seller,mmr,sellingprice,saledate,profit
0,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg566472,ca,5.0,16639.0,white,black,kia motors america inc,20500.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-1000.0
1,2015,Kia,Sorento,LX,SUV,automatic,5xyktca69fg561319,ca,5.0,9393.0,white,beige,kia motors america inc,20800.0,21500.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-700.0
2,2014,BMW,3 Series,328i SULEV,Sedan,automatic,wba3c1c51ek116351,ca,45.0,1331.0,gray,black,financial services remarketing (lease),31900.0,30000.0,Thu Jan 15 2015 04:30:00 GMT-0800 (PST),1900.0
3,2015,Volvo,S60,T5,Sedan,automatic,yv1612tb4f1310987,ca,41.0,14282.0,white,black,volvo na rep/world omni,27500.0,27750.0,Thu Jan 29 2015 04:30:00 GMT-0800 (PST),-250.0
4,2014,BMW,6 Series Gran Coupe,650i,Sedan,automatic,wba6b2c57ed129731,ca,43.0,2641.0,gray,black,financial services remarketing (lease),66000.0,67000.0,Thu Dec 18 2014 12:30:00 GMT-0800 (PST),-1000.0
5,2015,Nissan,Altima,2.5 S,Sedan,automatic,1n4al3ap1fn326013,ca,1.0,5554.0,gray,black,enterprise vehicle exchange / tra / rental / t...,15350.0,10900.0,Tue Dec 30 2014 12:00:00 GMT-0800 (PST),4450.0
6,2014,BMW,M5,Base,Sedan,automatic,wbsfv9c51ed593089,ca,34.0,14943.0,black,black,the hertz corporation,69000.0,65000.0,Wed Dec 17 2014 12:30:00 GMT-0800 (PST),4000.0
8,2014,Audi,A4,2.0T Premium Plus quattro,Sedan,automatic,wauffafl3en030343,ca,42.0,9557.0,white,black,audi mission viejo,32100.0,32250.0,Thu Dec 18 2014 12:00:00 GMT-0800 (PST),-150.0
9,2014,Chevrolet,Camaro,LT,Convertible,automatic,2g1fb3d37e9218789,ca,3.0,4809.0,red,black,d/m auto sales inc,26300.0,17500.0,Tue Jan 20 2015 04:00:00 GMT-0800 (PST),8800.0
10,2014,Audi,A6,3.0T Prestige quattro,Sedan,automatic,wauhgafc0en062916,ca,48.0,14414.0,black,black,desert auto trade,47300.0,49750.0,Tue Dec 16 2014 12:30:00 GMT-0800 (PST),-2450.0



c)Para sacarle el maximo provecho a las ventas, hay que enfocarse en los carros que se venden bien y dejan buena ganancia, como el Nissan Altima. En lugar de hacer descuentos a lo loco, mejor ajustar precios según la demanda y ofrecer promos estrategicas
 Tambien vale la pena meterle más a las ventas online y dar opciones de pago más flexibles para enganchar más clientes


d)el segmento enfocar la estrategia global es en sedanes de gama media y alta que se mueven rápido y generan buena plata, como el Altima y algunos BMW. La clave está en ajustar descuentos, dar mejores opciones de financiamiento y resaltar lo que hace especiales estos carros, como su tecnología y consumo eficiente.