# Bubble Sort: Ordenando por Precio los Muebles de IKEA

<div style = "text-align: center;">
    <img src = "images/ikea.jpg"
    style = "width:100%;height:400px;d"
    alt = "Imagen">

</div>

## 1. Introducción

En este pequeño proyecto, nos enfocaremos en el algoritmo Bubble Sort, uno de los métodos más básicos de ordenación de datos. En primer lugar, hablaremos sobre en qué consiste el algoritmo, lo implementaremos en código y lo ilustraremos con un ejemplo sencillo.

A continuación, trataremos de aplicarlo a un ejemplo real. Tomaremos un conjunto de datos de muebles de IKEA con la idea de que el usuario final pueda elegir la categoría de mueble y verlos listados con los precios ordenados de mayor a menor.

## 2. Bubble Sort Algorithm

El algoritmo **Bubble Sort** funciona comparando elementos adyacentes en una lista e intercambiándolos si están en el orden incorrecto. Es decir, si se compara el primer elemento con el segundo y el primero es mayor, se intercambian. Este proceso se repite hasta que la lista está completamente ordenada.

<div style="text-align: center;">
    <img src="https://upload.wikimedia.org/wikipedia/commons/c/c8/Bubble-sort-example-300px.gif" width="400">
</div>



**¿Por qué el nombre?** Esto se debe a la forma en que los elementos suben por la lista durante los intercambios, como si fueran burbujas.

A continuación se muestra un ejemplo sencillo del algoritmo.

In [1]:
def bubble_sort(lista):
    for i in range(len(lista)): # Recorremos la lista
        for j in range(len(lista) - i - 1):
            if lista[j] > lista[j + 1]: # Si el elemento actual es mayor que el siguiente
                lista[j], lista[j + 1] = lista[j + 1], lista[j] # Intercambiamos los elementos de posición

    return lista

`Ejemplo:`

Dado un arreglo desordenado: [5, 3, 8, 4, 2]

Iteración 1: (se comparan e intercambian elementos adyacentes)
 * Comparar 5 y 3 → Intercambiar → [3, 5, 8, 4, 2] 
 * Comparar 5 y 8 → No intercambiar
 * Comparar 8 y 4 → Intercambiar → [3, 5, 4, 8, 2]
 * Comparar 8 y 2 → Intercambiar → [3, 5, 4, 2, 8]

Iteración 2:
 * Comparar 3 y 5 → No intercambiar
 * Comparar 5 y 4 → Intercambiar → [3, 4, 5, 2, 8]
 * Comparar 5 y 2 → Intercambiar → [3, 4, 2, 5, 8]

Iteración 3:
 * Comparar 3 y 4 → No intercambiar
 * Comparar 4 y 2 → Intercambiar → [3, 2, 4, 5, 8]

Iteración 4:
 * Comparar 3 y 2 → Intercambiar → [2, 3, 4, 5, 8]

Lista ordenada: [2, 3, 4, 5, 8]

In [2]:
print(bubble_sort([5, 3, 8, 4, 2]))

[2, 3, 4, 5, 8]


No es el algoritmo más eficiente para grandes volúmenes de datos, pues, como podemos apreciar con el anidamiento de bucles, la complejidad computacional del algoritmo crece de manera cuadrática, es decir, $O(n^2)$. 

## 3. Aplicación

### 3.1 Importación de Bibliotecas Necesarias

In [3]:
%pip install kagglehub
%pip install ipywidgets

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [4]:
import kagglehub
import os
import pandas as pd
import ipywidgets as widgets
from IPython.display import display

### 3.2 Carga de datos

In [5]:
# Download latest version
path = kagglehub.dataset_download("thedevastator/ikea-product")

Descarga el conjunto de datos en un directorio en local.

In [6]:
files = os.listdir(path)
print("Archivos disponibles:", files)

Archivos disponibles: ['ikea.csv']


Tomamos el archivo que queremos, en este caso solamente hay uno en la lista.

In [7]:
csv_file = files[0]

Abrimos el csv como un dataframe

In [8]:
df = pd.read_csv(os.path.join(path, csv_file))
display(df.head())

Unnamed: 0.1,Unnamed: 0,item_id,name,category,price,old_price,sellable_online,link,other_colors,short_description,designer,depth,height,width
0,0,90420332,FREKVENS,Bar furniture,265.0,No old price,True,https://www.ikea.com/sa/en/p/frekvens-bar-tabl...,No,"Bar table, in/outdoor, 51x51 cm",Nicholai Wiig Hansen,,99.0,51.0
1,1,368814,NORDVIKEN,Bar furniture,995.0,No old price,False,https://www.ikea.com/sa/en/p/nordviken-bar-tab...,No,"Bar table, 140x80 cm",Francis Cayouette,,105.0,80.0
2,2,9333523,NORDVIKEN / NORDVIKEN,Bar furniture,2095.0,No old price,False,https://www.ikea.com/sa/en/p/nordviken-nordvik...,No,Bar table and 4 bar stools,Francis Cayouette,,,
3,3,80155205,STIG,Bar furniture,69.0,No old price,True,https://www.ikea.com/sa/en/p/stig-bar-stool-wi...,Yes,"Bar stool with backrest, 74 cm",Henrik Preutz,50.0,100.0,60.0
4,4,30180504,NORBERG,Bar furniture,225.0,No old price,True,https://www.ikea.com/sa/en/p/norberg-wall-moun...,No,"Wall-mounted drop-leaf table, ...",Marcus Arvonen,60.0,43.0,74.0


In [9]:
print(df.info()) 

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3694 entries, 0 to 3693
Data columns (total 14 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   Unnamed: 0         3694 non-null   int64  
 1   item_id            3694 non-null   int64  
 2   name               3694 non-null   object 
 3   category           3694 non-null   object 
 4   price              3694 non-null   float64
 5   old_price          3694 non-null   object 
 6   sellable_online    3694 non-null   bool   
 7   link               3694 non-null   object 
 8   other_colors       3694 non-null   object 
 9   short_description  3694 non-null   object 
 10  designer           3694 non-null   object 
 11  depth              2231 non-null   float64
 12  height             2706 non-null   float64
 13  width              3105 non-null   float64
dtypes: bool(1), float64(4), int64(2), object(7)
memory usage: 378.9+ KB
None


### 3.3 Implementación del Ejemplo

In [10]:
categorias = df['category'].dropna().unique()
categorias.sort()

In [11]:
categoria_selector = widgets.Dropdown(
    options=categorias,
    description="Categoría:",
    continuous_update=False
)

In [12]:
def mostrar_muebles(categoria):
    df_filtrado = df[df['category'] == categoria].dropna()
    
    if df_filtrado.empty:
        print("No hay muebles en esta categoría.")
        return
    
    # Convertir DataFrame a lista de tuplas (nombre, precio)
    muebles_lista = df_filtrado[['name', 'price']].values.tolist()
    
    # Aplicar Bubble Sort
    muebles_ordenados = bubble_sort(muebles_lista)
    
    # Convertir a DataFrame ordenado
    df_ordenado = pd.DataFrame(muebles_ordenados, columns=['name', 'price'])
    
    display(df_ordenado)

En este caso, no estamos tratando con una lista numérica simple, sino con una lista donde cada elemento es, a su vez, otra lista. Por ello, es necesario hacer una pequeña modificación al algoritmo que vimos anteriormente para que ordene los elementos de la lista según la segunda componente de cada sublista.

In [13]:
def bubble_sort(lista):
    for i in range(len(lista)):
        for j in range(len(lista) - i - 1):
            if lista[j][1] > lista[j + 1][1]:  # Comparar precios en la tupla
                lista[j], lista[j + 1] = lista[j + 1], lista[j]  # Intercambiar
    return lista

In [14]:
widgets.interactive(mostrar_muebles, categoria=categoria_selector)

interactive(children=(Dropdown(description='Categoría:', options=('Bar furniture', 'Beds', 'Bookcases & shelvi…

## 4. Referencias

* https://es.wikipedia.org/wiki/Ordenamiento_de_burbuja
* Conjunto de datos: https://www.kaggle.com/datasets/thedevastator/ikea-product