In [None]:
# EDA.ipynb - Análisis exploratorio de datos

# Importar bibliotecas necesarias
import pandas as pd
import plotly.express as px

# Cargar los datos
df = pd.read_csv('vehicles_us.csv')

# Mostrar las primeras filas del dataframe
df.head(50)

# Mostrar el encabezado
print("### Análisis de Anuncios de Venta de Vehículos")

# Mostrar las primeras filas de los datos
print("### Primeros 50 vehículos")
df.head(50)

# Mostrar un resumen de las columnas y sus tipos
print("### Información sobre las columnas y tipos de datos")
df.info()

# Crear un histograma interactivo con Plotly Express
import plotly.express as px
from ipywidgets import interact

print("### Distribución de Precios de los Vehículos")

# Establecer el rango de precios
min_price = int(df['price'].min())
max_price = int(df['price'].max())

# Usar un slider interactivo para seleccionar el rango de precios
def plot_price_histogram(min_price, max_price):
    filtered_df = df[(df['price'] >= min_price) & (df['price'] <= max_price)]

    fig = px.histogram(
        filtered_df,
        x='price',
        nbins=50,
        color_discrete_sequence=['indigo'],
        title=f'Distribución de Precios (${min_price} - ${max_price})'
    )

    fig.update_layout(
        xaxis_title='Precio (USD)',
        yaxis_title='Número de vehículos',
        bargap=0.1,
        plot_bgcolor='rgba(0,0,0,0)',
        paper_bgcolor='rgba(0,0,0,0)',
        title_x=0.5
    )
    fig.show()

# Llamar a la función interactiva de precios
interact(plot_price_histogram, min_price=(min_price, max_price, 1000), max_price=(min_price, max_price, 1000))

# Mostrar análisis de dispersión: Precio vs Kilometraje por Transmisión
print("### Análisis de Precio vs Kilometraje por tipo de Transmisión")

# Crear el gráfico de dispersión
def plot_scatter():
    scatter_fig = px.scatter(
        df,
        x='odometer',
        y='price',
        color='transmission',
        title='Precio vs. Kilometraje (por tipo de transmisión)',
        labels={'odometer': 'Kilometraje', 'price': 'Precio (USD)', 'transmission': 'Transmisión'},
        opacity=0.6,
        color_discrete_map={
            'manual': 'blue',
            'automatic': 'red',
            'other': 'green'
        }
    )

    scatter_fig.update_traces(marker=dict(size=8))

    scatter_fig.show()

# Llamar la función para mostrar el gráfico de dispersión
plot_scatter()
