# üõçÔ∏è Base de Datos Vectorial de Productos de Moda con Milvus

Este notebook demuestra c√≥mo cargar y usar una base de datos vectorial completa con **30,000 productos de moda** de Flipkart.

## üéØ Caracter√≠sticas principales:
- **B√∫squeda sem√°ntica**: Encuentra productos usando lenguaje natural
- **Filtrado avanzado**: Por precio, marca, categor√≠a, rating, etc.
- **Embeddings vectoriales**: Representaci√≥n sem√°ntica de productos
- **Escalabilidad**: Maneja grandes vol√∫menes de datos eficientemente

## üìä Dataset:
- **Fuente**: Flipkart Fashion Products Dataset 
- **Total productos**: 30,000 pero solo se cargaron 100 por la limitantes de Milvus
- **Campos**: T√≠tulo, descripci√≥n, marca, categor√≠a, precios, ratings, etc.
- **Modelo de embeddings**: sentence-transformers (768 dimensiones)


## üîß Paso 1: Instalaci√≥n y Configuraci√≥n


In [1]:
%pip install -U pymilvus pymilvus-model tqdm pandas 

Note: you may need to restart the kernel to use updated packages.


# Importar Librerias

In [2]:
# Importar librer√≠as
from pymilvus import MilvusClient, model
import pandas as pd
import json
from typing import List, Dict

print("‚úÖ Dependencias instaladas correctamente")

  from .autonotebook import tqdm as notebook_tqdm
None of PyTorch, TensorFlow >= 2.0, or Flax have been found. Models won't be available and only tokenizers, configuration and file/data utilities can be used.


‚úÖ Dependencias instaladas correctamente


In [7]:
# Instalar dependencias necesarias
%pip install -U pymilvus pymilvus-model tqdm pandas 

# Importar librer√≠as
from pymilvus import MilvusClient, model
import pandas as pd
import json
from typing import List, Dict

print("‚úÖ Dependencias instaladas correctamente")


Note: you may need to restart the kernel to use updated packages.


  from .autonotebook import tqdm as notebook_tqdm
None of PyTorch, TensorFlow >= 2.0, or Flax have been found. Models won't be available and only tokenizers, configuration and file/data utilities can be used.


‚úÖ Dependencias instaladas correctamente


# Conexi√≥n y B√∫squedas Sem√°nticas

Una vez que los datos est√°n cargados, puedes realizar b√∫squedas sem√°nticas avanzadas.


In [4]:
# Configurar conexi√≥n a Milvus
client = MilvusClient(
    uri="https://in03-fc51ec1067f53e7.serverless.gcp-us-west1.cloud.zilliz.com",
    token="e1a5f13be33e07ef22a239ffbc7ddffb08ada6250f4c7edfa0221784b304ac41627ed2db02a0e8be6e26c4e2f6b0db0d2ba2da09"
)

# Inicializar modelo de embeddings
embedding_fn = model.DefaultEmbeddingFunction()
collection_name = "flipkart_fashion_sample"

# Verificar que la colecci√≥n existe
if client.has_collection(collection_name):
    print(f"‚úÖ Conectado a la colecci√≥n '{collection_name}'")
    
    # Obtener estad√≠sticas b√°sicas
    sample = client.query(
        collection_name=collection_name,
        filter="id >= 0",
        output_fields=["id"],
        limit=1
    )
    
    print(f"üìä Base de datos lista para b√∫squedas")
else:
    print("‚ùå La colecci√≥n no existe. Ejecuta primero el paso de carga de datos.")


‚úÖ Conectado a la colecci√≥n 'flipkart_fashion_sample'
üìä Base de datos lista para b√∫squedas


In [5]:
# Funci√≥n helper para b√∫squedas sem√°nticas
def search_products(query: str, limit: int = 5, filters: str = None):
    """
    Realiza b√∫squeda sem√°ntica de productos
    """
    print(f"üîç Buscando: '{query}'")
    print("-" * 60)
    
    # Generar vector de la consulta
    query_vector = embedding_fn.encode_queries([query])
    
    # Realizar b√∫squeda
    results = client.search(
        collection_name=collection_name,
        data=query_vector,
        limit=limit,
        filter=filters,
        output_fields=[
            "title", "description", "brand", "category", 
            "sub_category", "selling_price", "actual_price", 
            "average_rating", "discount", "out_of_stock"
        ]
    )
    
    if results and len(results[0]) > 0:
        print(f"‚úÖ Encontrados {len(results[0])} resultados:\n")
        
        for i, result in enumerate(results[0], 1):
            product = result['entity']
            similarity = 1 - result['distance']  # Convertir distancia a similitud
            
            print(f"#{i} {product.get('title', 'Sin t√≠tulo')}")
            print(f"    üè∑Ô∏è  Marca: {product.get('brand', 'N/A')}")
            print(f"    üìÅ Categor√≠a: {product.get('category', 'N/A')} > {product.get('sub_category', 'N/A')}")
            print(f"    üí∞ Precio: ${product.get('selling_price', 0):.0f} (antes: ${product.get('actual_price', 0):.0f})")
            print(f"    üéØ Descuento: {product.get('discount', 'N/A')}")
            print(f"    ‚≠ê Rating: {product.get('average_rating', 0)}")
            print(f"    üì¶ Stock: {'‚ùå Agotado' if product.get('out_of_stock', False) else '‚úÖ Disponible'}")
            print(f"    üéØ Similitud: {similarity:.3f}")
            
            # Mostrar descripci√≥n truncada
            desc = product.get('description', '')
            if desc:
                desc_short = desc[:100] + "..." if len(desc) > 100 else desc
                print(f"    üìù Descripci√≥n: {desc_short}")
            
            print()
    else:
        print("‚ùå No se encontraron resultados")

print("‚úÖ Funci√≥n de b√∫squeda configurada")


‚úÖ Funci√≥n de b√∫squeda configurada


## üéØ Ejemplos de B√∫squeda Sem√°ntica

Ahora puedes realizar b√∫squedas usando lenguaje natural. La base de datos entender√° el contexto y encontrar√° productos similares.


In [7]:
# Ejemplo 1: B√∫squeda b√°sica
search_products("camisa azul para hombre", limit=10)


üîç Buscando: 'camisa azul para hombre'
------------------------------------------------------------
‚úÖ Encontrados 10 resultados:

#1 Striped Collared Neck Casual Men Brown, Black Sweater
    üè∑Ô∏è  Marca: Man
    üìÅ Categor√≠a: Clothing and Accessories > Winter Wear
    üí∞ Precio: $399 (antes: $2199)
    üéØ Descuento: 81  off
    ‚≠ê Rating: 3.8
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.694
    üìù Descripci√≥n: MANRA present you stylish wollen ponchos, shawls,Cardgan, Pullovers which can be wear in any occasio...

#2 Solid V Neck Casual Men Purple Sweater
    üè∑Ô∏è  Marca: Man
    üìÅ Categor√≠a: Clothing and Accessories > Winter Wear
    üí∞ Precio: $499 (antes: $2199)
    üéØ Descuento: 77  off
    ‚≠ê Rating: 3.0
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.711
    üìù Descripci√≥n: MANRA present you stylish wollen ponchos, shawls,Cardgan, Pullovers which can be wear in any occasio...

#3 Striped Collared Neck Casual Men Black Sweater
    üè∑Ô

In [8]:
# Ejemplo 2: B√∫squeda con filtros de precio
search_products("zapatos deportivos", limit=3, filters="selling_price < 1000")


üîç Buscando: 'zapatos deportivos'
------------------------------------------------------------
‚úÖ Encontrados 3 resultados:

#1 Solid Men Black Track Pants
    üè∑Ô∏è  Marca: SMART ATTRACTI
    üìÅ Categor√≠a: Clothing and Accessories > Bottomwear
    üí∞ Precio: $288 (antes: $1199)
    üéØ Descuento: 75  off
    ‚≠ê Rating: 4.7
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.796
    üìù Descripci√≥n: SMART ATTRACTION AIR Jogger Trackpants for men - for a sporty move gear up, get fit and enjoy a heal...

#2 Aztec Men Round or Crew Green, Black T-Shirt
    üè∑Ô∏è  Marca: Fairdea
    üìÅ Categor√≠a: Clothing and Accessories > Topwear
    üí∞ Precio: $284 (antes: $1299)
    üéØ Descuento: 78  off
    ‚≠ê Rating: 2.6
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.803

#3 Sporty Men Round Neck Black T-Shirt
    üè∑Ô∏è  Marca: REEB
    üìÅ Categor√≠a: Clothing and Accessories > Topwear
    üí∞ Precio: $919 (antes: $1899)
    üéØ Descuento: 51  off
    ‚≠ê Rating: 3

In [9]:
# Ejemplo 3: B√∫squedas m√°s espec√≠ficas
search_products("vestido elegante para fiesta", limit=2)
print("\n" + "="*60 + "\n")
search_products("ropa c√≥moda de algod√≥n", limit=2)


üîç Buscando: 'vestido elegante para fiesta'
------------------------------------------------------------
‚úÖ Encontrados 2 resultados:

#1 nu-Lite Satin Tie   Cufflink (Red)
    üè∑Ô∏è  Marca: 
    üìÅ Categor√≠a: Clothing and Accessories > Clothing Accessories
    üí∞ Precio: $599 (antes: $3299)
    üéØ Descuento: 81  off
    ‚≠ê Rating: 2.7
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.753
    üìù Descripci√≥n: Wearing an elegant man tie is an effective way to make you look charming and energetic. nu-Lite incl...

#2 nu-Lite Satin Tie   Cufflink (Red)
    üè∑Ô∏è  Marca: 
    üìÅ Categor√≠a: Clothing and Accessories > Clothing Accessories
    üí∞ Precio: $499 (antes: $3299)
    üéØ Descuento: 84  off
    ‚≠ê Rating: 2.7
    üì¶ Stock: ‚úÖ Disponible
    üéØ Similitud: 0.754
    üìù Descripci√≥n: Wearing an elegant man tie is an effective way to make you look charming and energetic. nu-Lite incl...



üîç Buscando: 'ropa c√≥moda de algod√≥n'
----------------------