## Configuración y Conexión a Pinecone

En este bloque de código, se establece la conexión con el servicio de Pinecone, una plataforma de vector search que permite gestionar y consultar índices de manera eficiente. Este proceso es esencial para almacenar y recuperar información de manera óptima, especialmente al trabajar con datos de alta dimensionalidad, como embeddings de texto o imágenes. A continuación, se describen las operaciones realizadas:

1. **Importación de Librerías**:
   - Se importan las bibliotecas necesarias: 
     - `os` para manejar variables de entorno y la configuración del sistema.
     - `Pinecone` y `ServerlessSpec` para interactuar con la API de Pinecone.
     - `dotenv` para cargar las variables de entorno desde un archivo `.env`.

2. **Carga de Variables de Entorno**:
   - La función `load_dotenv()` se utiliza para cargar las variables de entorno definidas en un archivo `.env`, permitiendo acceder a credenciales sensibles, como la clave API de Pinecone.

3. **Creación de una Instancia de Pinecone**:
   - Se obtiene la clave API utilizando `os.getenv("key")`, que permite autenticar la conexión con el servicio de Pinecone.
   - Se crea una instancia de `Pinecone` usando la clave API, estableciendo una conexión que permitirá realizar operaciones en la plataforma.

4. **Creación del Índice**:
   - Se verifica si ya existe un índice llamado **'series'** utilizando `pc.list_indexes().names()`. Si no existe, se procede a crearlo.
   - La creación del índice se realiza con las siguientes especificaciones:
     - **Nombre del Índice**: 'series'
     - **Dimensión**: 384, que representa la dimensionalidad de los vectores que se almacenarán en el índice.
     - **Métrica**: `euclidean`, que se utilizará para calcular la distancia entre los vectores.
     - **Especificaciones del Servidor**: Se elige la opción de **Serverless** en la nube de AWS, con la región establecida en **us-east-1**. Esto proporciona flexibilidad y escalabilidad en el manejo de los datos.

5. **Conexión al Índice**:
   - Finalmente, se conecta al índice **'series'** creando una instancia de `index` que permitirá realizar operaciones de inserción y consulta sobre los datos almacenados.

Este proceso de configuración es crucial para preparar el entorno de trabajo y garantizar que se pueda interactuar con Pinecone de manera eficiente, permitiendo el almacenamiento y búsqueda de embeddings de manera escalable.


In [1]:
import os
from pinecone import Pinecone, ServerlessSpec

from dotenv import load_dotenv, find_dotenv

load_dotenv()
# Crea una instancia de Pinecone
API_key = os.getenv("key")
pc = Pinecone(api_key = API_key)
# Crear un índice llamado 'books'
if 'series' not in pc.list_indexes().names():
    pc.create_index(
        name='series',
        dimension=384,  
        metric='euclidean',  
        spec=ServerlessSpec(
            cloud='aws',  
            region='us-east-1'  
        )
    )


# Conectar al índice
index = pc.Index('series')

In [7]:
from sentence_transformers import SentenceTransformer

# Cargar el modelo
model = SentenceTransformer('all-MiniLM-L6-v2')  # Ejemplo con un modelo

# Generar embeddings para algunas muestras de texto
embeddings = model.encode(["Ejemplo de texto para verificar la dimensión"])

# Imprimir la forma del array de embeddings
print(f"Dimensión del embedding: {embeddings.shape[1]}")


Dimensión del embedding: 384
