In [5]:
import pandas as pd
import plotly.express as px

# --- 1. Cargar el archivo de datos ---
car_data = pd.read_csv('/Users/DALINA/proyecto_7/vehicles_us.csv')

# --- 2. Manejar los valores nulos ---
# Imputar los valores nulos en 'model_year' y 'odometer' con la mediana
car_data['model_year'].fillna(car_data['model_year'].median(), inplace=True)
car_data['odometer'].fillna(car_data['odometer'].median(), inplace=True)

# --- 3. Definir traducciones y paleta de colores ---
# Traducir los valores de la columna 'condition' a español
traducciones_condicion = {
    'new': 'nuevo',
    'like new': 'casi nuevo',
    'excellent': 'excelente',
    'good': 'bueno',
    'fair': 'justo',
    'salvage': 'rescatado'
}
car_data['condition'] = car_data['condition'].map(traducciones_condicion)

# Paleta de colores elegante y sutil
colores_sutiles = {
    'nuevo': '#607D8B',         # Gris Pizarra
    'casi nuevo': '#4DB6AC',    # Turquesa
    'excelente': '#81C784',     # Verde Pastel
    'bueno': '#FFB74D',         # Naranja Ámbar
    'justo': '#FF8A65',         # Naranja Coral
    'rescatado': '#E57373'      # Rojo Suave
}

# --- 4. Generar y mostrar los gráficos ---

# Gráfico 1: Histograma del año del modelo por condición
print("📊 Histograma de Años del Modelo por Condición")
print("Este gráfico muestra la distribución de los vehículos por año, ayudando a identificar la antigüedad de la mayoría de los coches en el mercado.")
fig1 = px.histogram(car_data, x='model_year', color='condition',
                   title='Distribución de Años del Modelo por Condición',
                   labels={'model_year': 'Año del Modelo', 'count': 'Cantidad', 'condition': 'Condición'},
                   color_discrete_map=colores_sutiles)

fig1.update_layout(
    title_font_size=16,
    title_x=0.5,
    plot_bgcolor='white',
    paper_bgcolor='white'
)
fig1.show()

# ---
# Gráfico 2: Gráfico de dispersión: Precio vs Kilometraje
print("\n🔍 Gráfico de Dispersión: Precio vs Kilometraje")
print("Este gráfico muestra la relación entre el precio del vehículo y su kilometraje. La línea de tendencia ayuda a visualizar cómo el precio tiende a disminuir con el kilometraje.")
fig2 = px.scatter(car_data, x='odometer', y='price', color='condition',
                  title='Relación entre Precio y Kilometraje por Condición',
                  labels={'odometer': 'Kilometraje', 'price': 'Precio ($)', 'condition': 'Condición'},
                  trendline='ols', opacity=0.7,
                  color_discrete_map=colores_sutiles)

fig2.update_layout(
    title_font_size=16,
    title_x=0.5,
    plot_bgcolor='white',
    paper_bgcolor='white'
)
fig2.show()

# ---
# Gráfico 3: Histograma de la condición de los vehículos
print("\n🚗 Histograma de la Condición de los Vehículos")
print("Este gráfico te permite ver la cantidad de vehículos disponibles según su condición, lo cual es útil para entender la calidad general de la oferta.")
fig3 = px.histogram(car_data, x='condition', color='condition',
                   title='Distribución de la Condición de los Vehículos',
                   labels={'condition': 'Condición', 'count': 'Cantidad'},
                   category_orders={'condition': ['nuevo', 'casi nuevo', 'excelente', 'bueno', 'justo', 'rescatado']},
                   color_discrete_map=colores_sutiles)

fig3.update_layout(
    title_font_size=16,
    title_x=0.5,
    plot_bgcolor='white',
    paper_bgcolor='white',
    showlegend=False
)
fig3.show()

# ---
# Gráfico 4: Gráfico de barras: Precio promedio por modelo
print("\n📈 Precio Promedio por Modelo")
print("Este gráfico compara el precio promedio de los vehículos por marca y modelo, ayudando a los usuarios a evaluar el valor relativo de cada uno.")

# Calcular el precio promedio por modelo y ordenar para mejor visualización
precio_promedio_modelo = car_data.groupby('model')['price'].mean().reset_index().sort_values('price', ascending=False)

fig4 = px.bar(precio_promedio_modelo, x='model', y='price',
              title='Precio Promedio por Modelo',
              labels={'model': 'Modelo del Vehículo', 'price': 'Precio Promedio ($)'},
              color='price', color_continuous_scale=px.colors.sequential.Teal)

fig4.update_layout(
    title_font_size=16,
    title_x=0.5,
    plot_bgcolor='white',
    paper_bgcolor='white'
)
fig4.show()

📊 Histograma de Años del Modelo por Condición
Este gráfico muestra la distribución de los vehículos por año, ayudando a identificar la antigüedad de la mayoría de los coches en el mercado.



🔍 Gráfico de Dispersión: Precio vs Kilometraje
Este gráfico muestra la relación entre el precio del vehículo y su kilometraje. La línea de tendencia ayuda a visualizar cómo el precio tiende a disminuir con el kilometraje.



🚗 Histograma de la Condición de los Vehículos
Este gráfico te permite ver la cantidad de vehículos disponibles según su condición, lo cual es útil para entender la calidad general de la oferta.



📈 Precio Promedio por Modelo
Este gráfico compara el precio promedio de los vehículos por marca y modelo, ayudando a los usuarios a evaluar el valor relativo de cada uno.
