# ANÁLISIS EXPLORATORIO

In [20]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
import matplotlib.pyplot as plt

In [21]:
df = pd.read_csv('./datos.csv')

In [22]:
df.shape

(1148, 6)

In [23]:
df.columns

Index(['model', 'price', 'year', 'km', 'color', 'country'], dtype='object')

### 1. Distribución de precios de los coches

In [25]:
fig1 = px.histogram(
    df,
    x='price', 
    nbins=30, 
    title='Distribución de precios de los coches por modelo',
    labels={'price': 'Precio (€)', 'model': 'Modelo'},
    color='model',
    barmode='overlay',
    color_discrete_sequence=px.colors.qualitative.Set1
)
fig1.update_layout(xaxis_title='Precio (€)', yaxis_title='Cantidad de coches')
fig1.show()


### 2. Cantidad de coches por año

In [26]:
cars_per_year = df['year'].value_counts().sort_index()
fig2 = go.Figure()
fig2.add_trace(go.Bar(x=cars_per_year.index, y=cars_per_year.values, name='Coches por año'))
fig2.update_layout(
    title='Cantidad de coches por año',
    xaxis_title='Año',
    yaxis_title='Cantidad de coches'
)
fig2.show()

### 3. Cantidad de coches por modelo

In [27]:
cars_per_model = df['model'].value_counts()
fig3 = px.bar(
    cars_per_model, 
    x=cars_per_model.index, 
    y=cars_per_model.values, 
    title='Cantidad de coches por modelo',
    labels={'x': 'Modelo', 'y': 'Cantidad de coches'},
    color_discrete_sequence=['darkorange']
)
fig3.show()


### 4. Distribución del kilometraje de los coches

In [28]:
fig4 = px.box(
    df, 
    y='km', 
    color='model',
    title='Distribución del kilometraje de los coches por modelo',
    labels={'km': 'Kilometraje (km)', 'model': 'Modelo'},
    color_discrete_sequence=px.colors.qualitative.Set2
)
fig4.show()

### 5. Cantidad de coches por color

In [29]:
cars_per_color = df['color'].value_counts()
fig5 = px.bar(
    cars_per_color, 
    x=cars_per_color.index, 
    y=cars_per_color.values, 
    title='Cantidad de coches por color',
    labels={'x': 'Color', 'y': 'Cantidad de coches'},
    color_discrete_sequence=['purple']
)
fig5.show()

### 6. Cantidad de coches por país

In [30]:
cars_per_country = df['country'].value_counts()
fig6 = px.bar(
    cars_per_country, 
    x=cars_per_country.index, 
    y=cars_per_country.values, 
    title='Cantidad de coches por país',
    labels={'x': 'País', 'y': 'Cantidad de coches'},
    color_discrete_sequence=['red']
)
fig6.show()

### 7. Precio promedio por año y modelo

In [31]:
avg_price_per_year_model = df.groupby(['year', 'model'])['price'].mean().reset_index()
fig7 = px.line(
    avg_price_per_year_model, 
    x='year', 
    y='price', 
    color='model', 
    title='Precio promedio por año y modelo',
    labels={'year': 'Año', 'price': 'Precio promedio (€)', 'model': 'Modelo'}
)
fig7.show()

### 8. Relación entre precio y kilometraje

In [32]:

fig8 = px.scatter(
    df, 
    x='km', 
    y='price', 
    color='model', 
    title='Relación entre precio y kilometraje por modelo',
    labels={'km': 'Kilometraje (km)', 'price': 'Precio (€)', 'model': 'Modelo'},
    size='price',
    hover_data=['year']
)
fig8.show()

### 9. Precio promedio por país y modelo

In [33]:
avg_price_per_country_model = df.groupby(['country', 'model'])['price'].mean().reset_index()
fig9 = px.bar(
    avg_price_per_country_model, 
    x='country', 
    y='price', 
    color='model', 
    barmode='group',
    title='Precio promedio por país y modelo',
    labels={'country': 'País', 'price': 'Precio promedio (€)', 'model': 'Modelo'}
)
fig9.show()

### 10. Combinación de color y modelo

In [34]:
cars_per_color_model = df.groupby(['color', 'model']).size().reset_index(name='count')
fig10 = px.bar(
    cars_per_color_model, 
    x='color', 
    y='count', 
    color='model', 
    title='Cantidad de coches por combinación de color y modelo',
    labels={'color': 'Color', 'count': 'Cantidad de coches', 'model': 'Modelo'},
    barmode='stack'
)
fig10.show()