In [None]:
!pip install -q google-generativeai
!pip install -q qdrant-client
!pip install -q python-dotenv
!pip install -q sentence-transformers

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/337.3 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m81.9/337.3 kB[0m [31m2.7 MB/s[0m eta [36m0:00:01[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━[0m [32m327.7/337.3 kB[0m [31m4.7 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m337.3/337.3 kB[0m [31m4.0 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
import google.generativeai as genai
from qdrant_client import QdrantClient
from qdrant_client.models import PointStruct
from dotenv import load_dotenv
import os
from typing import List, Dict
from sentence_transformers import SentenceTransformer

# --- Variáveis de Configuração ---
QDRANT_URL = "https://6a0fc4ef-705b-49c4-a183-a14bd938b5e0.us-west-2-0.aws.cloud.qdrant.io:6333"
QDRANT_API_KEY = "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJhY2Nlc3MiOiJtIn0.IcL99F_UYsDmw1vj93Xp4aPfsOAO-LfX7WqCoOxo1tM"
COLLECTION_NAME = "chunkLuis"

# --- Chave da API do Gemini
GEMINI_API_KEY_DIRETA = "AIzaSyCMpKoG-MuCWsAeGDhmbxOmut8yE2F6ClI"

# --- Funções de Inicialização e Embedding ---
def initialize_qdrant() -> QdrantClient:
    """Inicializa e retorna o cliente Qdrant usando a URL e a API Key."""
    client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
    return client

def get_embedding(text: str) -> List[float]:
    """Gera um embedding para o texto usando o modelo de embeddings do Sentence-Transformers."""
    # O modelo é inicializado aqui para garantir que a dimensão seja a mesma da coleção
    embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
    embedding = embedding_model.encode(text)
    return embedding.tolist()


load_dotenv()
genai.configure(api_key=GEMINI_API_KEY_DIRETA)

# --- Classe RAGSystem ---
class RAGSystem:
    def __init__(self):
        self.qdrant_client = initialize_qdrant()
        self.gemini_model = genai.GenerativeModel('gemini-1.5-flash-latest')

    def retrieve_documents(self, query: str, top_k: int = 6) -> List[str]:
        """Busca documentos relevantes no Qdrant baseados na query."""
        query_embedding = get_embedding(query)

        search_result = self.qdrant_client.search(
            collection_name=COLLECTION_NAME,
            query_vector=query_embedding,
            limit=top_k
        )

        # Extrai o texto dos documentos recuperados, acessando 'payload' e 'content'
        relevant_texts = [
            hit.payload.get('content')
            for hit in search_result
            if hit.payload and 'content' in hit.payload
        ]
        return relevant_texts

    def generate_response(self, query: str, retrieved_texts: List[str]) -> str:
        """Gera uma resposta usando o Gemini, aumentada com os documentos recuperados."""
        if not retrieved_texts:
            prompt = f"Com base no seu conhecimento, responda à seguinte pergunta: {query}"
        else:
            context = "\n".join(retrieved_texts)
            prompt = (
                f"Você é um assistente de IA que fornece respostas concisas e informativas baseadas no contexto fornecido.\n\n"
                f"Contexto:\n{context}\n\n"
                f"Pergunta: {query}\n\n"
                f"Resposta: "
            )

        try:
            response = self.gemini_model.generate_content(prompt)
            return response.text
        except Exception as e:
            return f"Erro ao gerar resposta com Gemini: {e}"

    def query_rag(self, query: str) -> str:
        """Executa o processo completo de RAG."""
        print(f"\nBuscando documentos para a query: '{query}'...")
        retrieved_texts = self.retrieve_documents(query)

        if retrieved_texts:
            print("\nDocumentos recuperados:")
            for i, text in enumerate(retrieved_texts):
                print(f"- {text}")
        else:
            print("\nNenhum documento relevante encontrado no Qdrant.")

        print("\nGerando resposta com Gemini...")
        response = self.generate_response(query, retrieved_texts)
        return response

if __name__ == "__main__":

    rag_system = RAGSystem()

    print("Bem-vindo ao sistema RAG de conceitos de IA!")
    print("Digite 'sair' para encerrar.")

    while True:
        user_query = input("\nSua pergunta: ")
        if user_query.lower() == 'sair':
            print("Encerrando o sistema RAG.")
            break

        final_answer = rag_system.query_rag(user_query)
        print("\n--- Resposta Final ---")
        print(final_answer)
        print("----------------------")


Bem-vindo ao sistema RAG de conceitos de IA!
Digite 'sair' para encerrar.

Buscando documentos para a query: 'O que e citros'...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/612 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

  search_result = self.qdrant_client.search(



Documentos recuperados:
- 187Citros B-100, 20223.4. Citros(Genero Citrus)Jose Antonio Quaggio (1)Dirceu Mattos Jr. (1)Rodrigo Marcelli Boaretto (1)Fernando Cesar Bachiega Zambrosi (1)Heitor Cantarella (1)1. Consideracoes gerais Acitricultura contribui com o maior volume da producao brasileira de frutas (cerca de 55% do volume das oito principais frutiferas), obtido com alta produtividade, resultado da adocao de tecnologias como adensamento de plantio, adubacao, irrigacao e fertirrigacao. Os citros compreendem um grande grupo de plantas do genero Citrus spp. (laranjas, tangerinas, mexericas, limoes, limas acidas como o Tahiti e o Galego, e doces como a Lima--da-persia, pomelo, cidra, laranja-azeda e toranjas) e outros generos correlatos (Fortunella e Poncirus) ou hibridos da familia Rutaceae. Devido a importancia da citricultura para o agronegocio paulista e o volume de informacoes geradas pela pesquisa, as recomendacoes de manejo de calagem e adubacao dos citros sao apresentadas em um