# Exploración de Vectores en LanceDB

Este notebook te permite visualizar y explorar los embeddings vectoriales almacenados en la base de datos LanceDB utilizada por el agente Agno.

## 1. Configuración Inicial

Primero, importamos las bibliotecas necesarias y conectamos con la base de datos LanceDB.

In [1]:
import os
import lancedb
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from dotenv import load_dotenv

# # Cargar variables de entorno
# load_dotenv()

## 2. Conexión a LanceDB

Conectamos con la base de datos y abrimos la tabla que contiene los embeddings.

In [2]:
# Conexión a la base de datos LanceDB
db = lancedb.connect("tmp/lancedb")
table = db.open_table("agno_docs")

# Obtener los datos como DataFrame
data = table.to_pandas()

# Mostrar información general
print(f"Total de vectores almacenados: {len(data)}")
print("\nColumnas disponibles:")
for col in data.columns:
    print(f"- {col}")

Total de vectores almacenados: 2

Columnas disponibles:
- vector
- id
- payload


[90m[[0m2025-06-09T15:11:35Z [33mWARN [0m lance::dataset::scanner[90m][0m nprobes is not set because nearest has not been called yet


In [6]:
data.head()

Unnamed: 0,vector,id,payload
0,"[-0.048345234, 0.042083047, -0.012682365, -0.0...",fdc652b8510cca61dbf36f6cfc2a81f1,"{""name"": ""introduction.md"", ""meta_data"": {""url..."
1,"[-0.019085087, 0.006491682, 0.012516942, 0.000...",4602be29482ab1252435eb703eba14e2,"{""name"": ""introduction.md"", ""meta_data"": {""url..."


## 3. Exploración de Metadatos

Vamos a examinar los metadatos asociados con los vectores (sin mostrar los vectores completos).

In [3]:
# Ver un ejemplo completo (sin mostrar el vector completo)
sample = data.iloc[0].to_dict()

# Mostrar metadatos y texto, pero resumir el vector
for key, value in sample.items():
    if key == "vector":
        print(f"- {key}: [vector de dimensión {len(value)}]")
        # Mostrar solo las primeras 5 dimensiones como ejemplo
        print(f"  Primeras 5 dimensiones: {value[:5]}")
    else:
        # Para textos largos, mostrar resumen
        if isinstance(value, str) and len(value) > 100:
            print(f"- {key}: {value[:100]}... (texto truncado)")
        else:
            print(f"- {key}: {value}")

- vector: [vector de dimensión 1536]
  Primeras 5 dimensiones: [-0.04834523  0.04208305 -0.01268237 -0.00139948  0.01182778]
- id: fdc652b8510cca61dbf36f6cfc2a81f1
- payload: {"name": "introduction.md", "meta_data": {"url": "https://docs.agno.com/introduction.md", "chunk": 1... (texto truncado)
