<a href="https://colab.research.google.com/github/fmezacr/Machine-Learning-ND/blob/master/Datasets_for_ANN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# DATASET 1: Predicción de Admisiones Estudiantiles con Keras 🎓

## Introducción
Dataset que contiene información sobre las solicitudes de admisión a programas de posgrado. El objetivo es predecir si un estudiante será admitido en función de algunas características clave, como sus calificaciones y su rendimiento académico.  

---

## Descripción del Dataset 📊

El dataset incluye información sobre **400 solicitudes** y consta de las siguientes columnas:

- **GRE Score:**  
  Puntuación obtenida por el estudiante en el examen **GRE** (Graduate Record Examination).  
  **Rango:** 260 a 340 puntos.

- **GPA Score:**  
  Promedio de calificaciones (GPA) obtenido por el estudiante durante la licenciatura.  
  **Rango:** 0.0 a 4.0.

- **Class Rank:**  
  Categoría del rango de clase del estudiante, agrupado en 4 niveles:  
  **1:** Mejor rendimiento, **4:** Peor rendimiento.

- **Admitido (Label):**  
  Variable binaria que indica si el estudiante fue admitido o no:  
  **1** – Admitido  
  **0** – No admitido

---



In [5]:
import pandas as pd

# Cargar el dataset desde una URL alternativa
grades = "https://stats.idre.ucla.edu/stat/data/binary.csv"

try:
    bike_data = pd.read_csv(grades)
    print("Dataset cargado con éxito.")
    print(bike_data.head())
except Exception as e:
    print(f"Ocurrió un error al cargar el dataset: {e}")


Dataset cargado con éxito.
   admit  gre   gpa  rank
0      0  380  3.61     3
1      1  660  3.67     3
2      1  800  4.00     1
3      1  640  3.19     4
4      0  520  2.93     4


# DATASET 2: Predicción de Uso de Bicicletas Compartidas 🚴‍♂️

## Introducción
El **Bike Sharing Dataset** se usa para analizar y predecir la demanda de bicicletas compartidas en diferentes momentos del día en Washington D.C. Este dataset es ideal para explorar **regresión y análisis de series temporales** debido a la naturaleza horaria de los datos.

El objetivo principal será construir un modelo para predecir la cantidad de bicicletas alquiladas, utilizando tanto **factores climáticos** como información **temporal**. Además, exploraremos patrones que nos ayudarán a entender la demanda en diferentes condiciones.

---

## Descripción del Dataset 📊

El **Bike Sharing Dataset** contiene datos **agregados por hora y por día**. Los datos por hora son especialmente útiles para entender patrones de uso diarios, mientras que los datos diarios ayudan a observar tendencias a lo largo del tiempo.

### **Columnas Principales:**

| **Columna**      | **Descripción**                                          |
|------------------|-----------------------------------------------------------|
| `instant`        | Índice del registro.                                      |
| `dteday`         | Fecha del registro.                                       |
| `season`         | Temporada (1: Invierno, 2: Primavera, 3: Verano, 4: Otoño). |
| `yr`             | Año (0: 2011, 1: 2012).                                   |
| `mnth`           | Mes (1 a 12).                                             |
| `hr`             | Hora del día (0 a 23).                                    |
| `holiday`        | ¿Es un día festivo? (0: No, 1: Sí).                       |
| `weekday`        | Día de la semana (0: Domingo, 6: Sábado).                 |
| `workingday`     | ¿Es un día laboral? (0: No, 1: Sí).                       |
| `weathersit`     | Condiciones climáticas (1: Claro, 4: Lluvia intensa).     |
| `temp`           | Temperatura normalizada (valor entre 0 y 1).              |
| `atemp`          | Sensación térmica normalizada (valor entre 0 y 1).        |
| `hum`            | Humedad relativa (valor entre 0 y 1).                     |
| `windspeed`      | Velocidad del viento normalizada (valor entre 0 y 1).     |
| `casual`         | Número de usuarios casuales (no registrados).             |
| `registered`     | Número de usuarios registrados.                           |
| `cnt`            | Total de bicicletas alquiladas (casual + registered).     |

---

## Objetivo del Proyecto 🚀

El objetivo es construir un modelo de **regresión** que prediga el número total de bicicletas alquiladas en función de variables como la **hora del día**, **temperatura**, **condiciones meteorológicas** y **día de la semana**. Con esto, aprenderemos a:

1. **Preparar los datos** para su análisis y modelado.
2. **Visualizar patrones** en el uso de bicicletas según diferentes variables.
3. **Entrenar y validar un modelo de regresión** para hacer predicciones.
4. **Evaluar el desempeño** del modelo y ajustar sus hiperparámetros.

---


In [6]:
import pandas as pd

# Cargar el dataset desde una URL alternativa
bikes = "https://raw.githubusercontent.com/fmezacr/DataScienceTEC/refs/heads/master/hour.csv"

try:
    bike_data = pd.read_csv(bikes)
    print("Dataset cargado con éxito.")
    print(bike_data.head())
except Exception as e:
    print(f"Ocurrió un error al cargar el dataset: {e}")



Dataset cargado con éxito.
   instant      dteday  season  yr  mnth  hr  holiday  weekday  workingday  \
0        1  2011-01-01       1   0     1   0        0        6           0   
1        2  2011-01-01       1   0     1   1        0        6           0   
2        3  2011-01-01       1   0     1   2        0        6           0   
3        4  2011-01-01       1   0     1   3        0        6           0   
4        5  2011-01-01       1   0     1   4        0        6           0   

   weathersit  temp   atemp   hum  windspeed  casual  registered  cnt  
0           1  0.24  0.2879  0.81        0.0       3          13   16  
1           1  0.22  0.2727  0.80        0.0       8          32   40  
2           1  0.22  0.2727  0.80        0.0       5          27   32  
3           1  0.24  0.2879  0.75        0.0       3          10   13  
4           1  0.24  0.2879  0.75        0.0       0           1    1  
