# Ejemplo de uso de `hummingbird-ml`
### Comparación de predicción en CPU vs GPU usando RandomForest

**Repositorio GitHub:** *(añadir enlace aquí)*  
**Versión de Python:** 3.12  
**Librería principal:** `hummingbird-ml`

---

## Descripción

Este repositorio muestra un ejemplo práctico del uso de **`hummingbird-ml`** para convertir un modelo
`RandomForestClassifier` entrenado en **scikit-learn (CPU)** a una representación en **PyTorch**, permitiendo
ejecutar la inferencia en **GPU (CUDA)**.

El objetivo principal es **comparar el rendimiento de inferencia** entre:
- Predicción tradicional en CPU (scikit-learn)
- Predicción acelerada en GPU usando `hummingbird-ml`

---

## Referencia

Este experimento está basado en el siguiente post de LinkedIn:

> *We found a way to run a Random Forest model on GPU*  
> https://www.linkedin.com/posts/daily-dose-of-ds_we-found-a-way-to-run-a-random-forest-model-activity-7414886110931300352-lh6y

---

## Notas importantes

- El uso de GPU es especialmente beneficioso para **datasets grandes** y **predicciones en batch**.
- Para datasets pequeños, el overhead de transferencia a GPU puede hacer que la CPU sea más rápida.
- La compatibilidad con Python 3.12 puede variar según el sistema y las dependencias (PyTorch, CUDA).

---

## Objetivo

Evaluar de forma empírica **cuándo y por qué** el uso de GPU con `hummingbird-ml` puede ofrecer ventajas
sobre la inferencia tradicional en CPU.


In [None]:
!pip install hummingbird-ml

In [None]:
from sklearn.datasets import make_classification

X, y = make_classification(
    n_samples=1_000_000,   # 1 millón de filas
    n_features=50,
    n_informative=30,
    n_redundant=10,
    n_classes=3,
    random_state=42
)

print( X.shape, y.shape )

((1000000, 50), (1000000,))

In [None]:
from sklearn.ensemble import RandomForestClassifier
rf_model = RandomForestClassifier(max_depth=5).fit(X,y)
rf_model.score(X,y)

0.709816

In [19]:
%timeit rf_model.predict(X)

288 ms ± 5.57 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [None]:
from hummingbird.ml import convert
rf_model_gpu = convert(rf_model, 'pytorch').to('cuda')

In [21]:
%timeit rf_model_gpu.predict(X)

32.4 ms ± 1.2 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
