# Proyecto de Aplicación Web con Streamlit y Análisis de Datos

Este notebook documenta los pasos del proyecto, que incluyen la configuración, la descarga de datos, el análisis exploratorio, el desarrollo de la aplicación web y el despliegue en Render.

## Paso 1: Configuración

- Crea una cuenta en GitHub y configura un repositorio con los archivos `README.md` y `.gitignore` (plantilla Python).
- Crea un entorno virtual (por ejemplo, `vehicles_env`) e instala las siguientes librerías:
  - pandas
  - plotly_express
  - streamlit
- Configura el intérprete de Python en VS Code usando el entorno virtual.


## Paso 2: Descarga del Archivo de Datos

Coloca el archivo CSV (por ejemplo, `train.csv` o `vehicles_us.csv`) en la raíz del proyecto.

In [3]:
# Verificar la carga del dataset
import pandas as pd

df = pd.read_csv("train.csv")  # Asegúrate de que la ruta sea correcta
print(df.head())

   battery_power  blue  clock_speed  dual_sim  fc  four_g  int_memory  m_dep  \
0            842     0          2.2         0   1       0           7    0.6   
1           1021     1          0.5         1   0       1          53    0.7   
2            563     1          0.5         1   2       1          41    0.9   
3            615     1          2.5         0   0       0          10    0.8   
4           1821     1          1.2         0  13       1          44    0.6   

   mobile_wt  n_cores  ...  px_height  px_width   ram  sc_h  sc_w  talk_time  \
0        188        2  ...         20       756  2549     9     7         19   
1        136        3  ...        905      1988  2631    17     3          7   
2        145        5  ...       1263      1716  2603    11     2          9   
3        131        6  ...       1216      1786  2769    16     8         11   
4        141        2  ...       1208      1212  1411     8     2         15   

   three_g  touch_screen  wifi  price_

In [9]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2000 entries, 0 to 1999
Data columns (total 21 columns):
 #   Column         Non-Null Count  Dtype  
---  ------         --------------  -----  
 0   battery_power  2000 non-null   int64  
 1   blue           2000 non-null   int64  
 2   clock_speed    2000 non-null   float64
 3   dual_sim       2000 non-null   int64  
 4   fc             2000 non-null   int64  
 5   four_g         2000 non-null   int64  
 6   int_memory     2000 non-null   int64  
 7   m_dep          2000 non-null   float64
 8   mobile_wt      2000 non-null   int64  
 9   n_cores        2000 non-null   int64  
 10  pc             2000 non-null   int64  
 11  px_height      2000 non-null   int64  
 12  px_width       2000 non-null   int64  
 13  ram            2000 non-null   int64  
 14  sc_h           2000 non-null   int64  
 15  sc_w           2000 non-null   int64  
 16  talk_time      2000 non-null   int64  
 17  three_g        2000 non-null   int64  
 18  touch_sc

## Paso 3: Análisis Exploratorio de Datos (EDA)

Utiliza **pandas** y **plotly-express** para explorar y visualizar el dataset. Por ejemplo, puedes generar un histograma y un gráfico de dispersión.

In [10]:
import plotly.express as px

# Crear un histograma de la columna 'clock_speed' o, si no existe, de la primera columna
if 'clock_speed' in df.columns:
    fig_hist = px.histogram(df, x='clock_speed', title='Histograma de Velocidad del Reloj')
else:
    fig_hist = px.histogram(df, x=df.columns[0], title=f'Histograma de {df.columns[0]}')
fig_hist.show()

# Crear un gráfico de dispersión (scatter plot) entre 'odometer' y 'price' si existen
if 'battery_power' in df.columns and 'mobile_wt' in df.columns:
    fig_scatter = px.scatter(df, x='battery_power', y='mobile_wt', title='Precio vs Odómetro')
    fig_scatter.show()
else:
    print("No se encontraron las columnas 'odometer' y 'price' para crear el scatter plot.")

## Paso 4: Desarrollo del Cuadro de Mandos de la Aplicación Web

Se desarrolla una aplicación web con **Streamlit** que incluye:

- Un encabezado con título descriptivo.
- Botones (o casillas de verificación) para generar visualizaciones como el histograma y el scatter plot.

El siguiente ejemplo muestra cómo podría ser el código de la aplicación (este código debe estar en un archivo `app.py`, pero se muestra aquí para ilustrar los pasos):

In [6]:
import streamlit as st
import pandas as pd
import plotly.express as px

# Leer el dataset
df = pd.read_csv("train.csv")

# Encabezado de la aplicación
st.header("Análisis Exploratorio de Datos de Vehículos")

# Botón para construir un histograma
if st.button("Construir Histograma"):
    st.write("Histograma de la columna 'odometer'")
    if 'odometer' in df.columns:
        fig = px.histogram(df, x='odometer', title='Histograma de Odómetro')
    else:
        fig = px.histogram(df, x=df.columns[0], title=f'Histograma de {df.columns[0]}')
    st.plotly_chart(fig, use_container_width=True)

# Botón para construir un gráfico de dispersión
if st.button("Construir Scatter Plot"):
    st.write("Gráfico de dispersión: Precio vs Odómetro")
    if 'odometer' in df.columns and 'price' in df.columns:
        fig2 = px.scatter(df, x='odometer', y='price', title='Precio vs Odómetro')
        st.plotly_chart(fig2, use_container_width=True)
    else:
        st.write("Las columnas necesarias para el scatter plot no están disponibles.")

2025-09-11 15:14:28.928 
  command:

    streamlit run C:\Users\lilia\AppData\Roaming\Python\Python312\site-packages\ipykernel_launcher.py [ARGUMENTS]


## Paso 5: Despliegue en Render

Para desplegar la aplicación en Render, sigue estos pasos:

- Crea el archivo `requirements.txt` con las dependencias necesarias.
```
pandas
plotly_express
streamlit
```
- Crea un archo README.md para dar una introducción a tu notebook. Un ejemplo sería:
```
# Proyecto de Análisis de Datos de Vehículos

Este proyecto tiene como objetivo poner en práctica tareas habituales de ingeniería de software y análisis de datos. Se ha trabajado un conjunto de datos de anuncios de venta de coches (en este caso, se utiliza `train.csv` como dataset) y se ha desarrollado una aplicación web con Streamlit que permite visualizar un histograma y un gráfico de dispersión interactivos.

## Funcionalidades de la aplicación web

- Encabezado con descripción del proyecto.
- Botón para generar un histograma (por ejemplo, de la columna `odometer`).
- Botón para generar un gráfico de dispersión (por ejemplo, relacionando `odometer` y `price`).

```
- Añade un archivo de configuración para Streamlit en `.streamlit/config.toml` con el siguiente contenido:

  ```toml
  [server]
  headless = true
  port = 10000

  [browser]
  serverAddress = "0.0.0.0"
  serverPort = 10000
  ```

- Configura en Render el Build Command:
  ```
  pip install --upgrade pip 
  pip install -r requirements.txt
  ```

- Y el Start Command:
  ```
  streamlit run app.py
  ```

Finalmente, realiza el despliegue y comprueba que la aplicación sea accesible a través de la URL asignada por Render.

## Conclusión

Este notebook resume los pasos fundamentales para desarrollar y desplegar una aplicación web basada en Streamlit, desde la configuración inicial hasta el despliegue en Render. Utilízalo como guía durante el desarrollo de tu proyecto.