# Notebook para probar los diferentes gráficos #

### Histograma presentado en el curso sobre el odómetro ###

In [1]:
import pandas as pd
import plotly.graph_objects as go # Importación de plotly.graph_objects como go

# Leer los datos del archivo CSV
car_data = pd.read_csv("../vehicles_us.csv")

# Crear un histograma utilizando plotly.graph_objects
# Se crea una figura vacía y luego se añade un rastro de histograma
fig = go.Figure(data=[go.Histogram(x=car_data['odometer'])])

# Opcional: Puedes añadir un título al gráfico si lo deseas
fig.update_layout(title_text='Distribución del Odómetro')

# Mostrar el gráfico Plotly
fig.show()

### Gráfico de dispersión odómetro-año-condición ###

In [2]:
import pandas as pd
import plotly.express as px

# Leer los datos del archivo CSV y crear columna 'manufacturer' a partir de la columna 'model'

car_data = pd.read_csv("../vehicles_us.csv")
car_data["manufacturer"] = car_data["model"].str.split().str[0]

# Definir orden de aparición y colores de la columna 'condition'

condition_order = ['new','like new','excellent','good','fair','salvage']
condition_color = {'new':'blue','like new':'turquoise','excellent':'green','good':'gold','fair':'orange','salvage':'red'}

# Se crea el gráfico de dispersión

fig = px.scatter(car_data, x="model_year", y="odometer", color="condition",title="Gráfico de disperción sobre la relación entre el odómetro, el año del auto y su estado", category_orders={'condition':condition_order}, color_discrete_map=condition_color)

# Mostrar el gráfico Plotly

fig.show()

### Prueba sobre si se ve bien seleccionando solo un manufacturador: NO

#select_manuf = ['hyundai']
#car_select_manuf = car_data[car_data['manufacturer'].isin(select_manuf)]

#fig_2 = px.scatter(car_select_manuf, x='model_year', y='odometer', color='condition', category_orders={'condition':condition_order}, color_discrete_map=condition_color)
#fig_2.show()

### Gráfico tipo Long Format Data para mostrar vehículos por manufacturador diferenciado por tipo ###

In [3]:
import pandas as pd
import plotly.express as px

# Leer los datos del archivo CSV
car_data = pd.read_csv("../vehicles_us.csv")

# Aislar los manufacturadores desde la variable de modelo

car_data["manufacturer"] = car_data["model"].str.split().str[0]
car_data_model = car_data.groupby(['manufacturer', 'type'], as_index=False)['model'].count()
#print(type(car_data_model))

### Para contabilizar solo los que han aparecido más de 1000 veces (usado en la app)

conteo_manuf = car_data['manufacturer'].value_counts(ascending=True)
frecuentes_manuf = conteo_manuf[conteo_manuf > 1000].index
manuf_1000 = car_data[car_data['manufacturer'].isin(frecuentes_manuf)]

#print(manuf_1000)

# Crear un Long Format Data con px
#print(car_data_model)

fig = px.bar(car_data_model, x="manufacturer", y="model", color="type", title="Vehicle types by manufacturer")
fig.show()

### Histograma de condición del vehículo vs el año del modelo ###

In [4]:
import pandas as pd
import plotly.express as px

# Leer los datos del archivo CSV
car_data = pd.read_csv('../vehicles_us.csv')

# Crear un histograma 
fig = px.histogram(car_data, x='model_year', color='condition',title='Histogram of condition vs model year')

# Mostrar el gráfico Plotly
fig.show()

### Histograma sobre la comparación de la distribución de precios entre manufacturadores ###

In [5]:
import pandas as pd
import plotly.express as px

# Leer los datos del archivo CSV
car_data = pd.read_csv("../vehicles_us.csv")

# Aislar los manufacturadores desde la variable de modelo

car_data["manufacturer"] = car_data["model"].str.split().str[0]

# Crear un histograma 
fig = px.histogram(car_data, x='price', color='manufacturer',title='Compare price distribution between manufacturers')

# Mostrar el gráfico Plotly
fig.show()

### Histogramas e histogramas normalizados sobre la comparaciónn de la distribución de precios entre manufacturadores ###

In [6]:
# import plotly.graph_objects as go
import plotly.express as px
import pandas as pd

# Leer los datos del archivo CSV
car_data = pd.read_csv("../vehicles_us.csv")

# Aislar los manufacturadores desde la variable de modelo

car_data["manufacturer"] = car_data["model"].str.split().str[0]

# Crear un histograma normalizado con la variable 'percent'

fig = px.histogram(x=car_data['price'], histnorm="percent", color=car_data["manufacturer"], title="Normalized Histogram (percent)")
fig.show()

# Crear un DataFrame con solo dos manufacturadores

comparacion_manuf = car_data[car_data['manufacturer'].isin(['chevrolet','hyundai'])]

# Crear histograma normalizado

fig_2 = px.histogram(x=comparacion_manuf['price'], histnorm="percent", color=comparacion_manuf['manufacturer'], title="Histograma de distribución de precios entre manufacturadores", labels={'x':'precio','y':'porcentaje'})
fig_2.show()

# Crear histograma

fig_3 = px.histogram(x=comparacion_manuf['price'],color=comparacion_manuf['manufacturer'], title="Histograma de distribución de precios entre manufacturadores", labels={'x':'precio','y':'cuenta'})
fig_3.show()
