In [3]:
    import boto3
    import json
    from sqlalchemy import create_engine, Column, Integer, Text
    from sqlalchemy.orm import sessionmaker, declarative_base
    from pgvector.sqlalchemy import Vector
    
    bedrock_runtime = boto3.client(
        service_name='bedrock-runtime',
        region_name='us-east-1'
    )
    

In [4]:
def embed_body(chunk_message: str):
    return json.dumps({
        'inputText': chunk_message,
    })

def embed_call(chunk_message: str):
    model_id = "amazon.titan-embed-text-v2:0"
    body = embed_body(chunk_message)

    response = bedrock_runtime.invoke_model(
        body=body,
        modelId=model_id,
        contentType='application/json',
        accept='application/json'
    )
    return json.loads(response['body'].read().decode('utf-8'))


In [5]:
DATABASE_URL = "postgresql://postgres:postgres72861001@sandbox-ia.ccnrq57mco3x.us-east-1.rds.amazonaws.com:5432/clau"
engine = create_engine(DATABASE_URL)
Session = sessionmaker(bind=engine)
Base = declarative_base()

In [6]:
class Fragmento(Base):
    __tablename__ = 'fragmento'
    id = Column(Integer, primary_key=True)
    text_content = Column(Text, nullable=False)
    embedding = Column(Vector(1024), nullable=False)  

Base.metadata.create_all(engine)

In [7]:
def insert_fragment(text):
    session = Session()
    embedding = embed_call(text)['embedding']  
    fragment = Fragmento(text_content=text, embedding=embedding)
    session.add(fragment)
    session.commit()
    session.close()

def search_similar_fragments(query_text, top_k=3):
    session = Session()
    query_embedding = embed_call(query_text)['embedding']
    results = (
        session.query(Fragmento)
        .order_by(Fragmento.embedding.l2_distance(query_embedding))
        .limit(top_k)
        .all()
    )
    session.close()
    return results


In [8]:
if __name__ == "__main__":
    sentences = [
        "El sol brilla en el cielo.",
        "El gato está sobre la mesa.",
        "La luna es blanca y brillante.",
        "La computadora está encendida.",
        "Hoy es un gran día para aprender.",
        "Las aves vuelan alto en el cielo.",
        "El río fluye hacia el mar.",
        "El café es mi bebida favorita.",
        "El perro duerme bajo el árbol.",
        "Ayer llovió mucho en la ciudad."
    ]

    for sentence in sentences:
        insert_fragment(sentence)

    query = "¿Dónde está el gato?"
    results = search_similar_fragments(query)

    for result in results:
        print(f"ID: {result.id}, Texto: {result.text_content}")


ID: 2, Texto: El gato está sobre la mesa.
ID: 12, Texto: El gato está sobre la mesa.
ID: 9, Texto: El perro duerme bajo el árbol.
