<a href="https://colab.research.google.com/github/tathianamb/widat/blob/main/widat_handson2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [16]:
%%capture
! sudo apt update && sudo apt install pciutils lshw

In [18]:
%%capture
!curl -fsSL https://ollama.com/install.sh | sh

In [19]:
%%capture
!nohup ollama serve > ollama.log 2>&1 &

In [20]:
%%capture
! ollama pull gemma3:4b

In [21]:
%%capture
!ollama pull nomic-embed-text

In [22]:
%%capture
! pip install langchain langchain-community faiss-cpu ollama

In [11]:
import ollama
import numpy as np
from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.vectorstores import FAISS
from langchain.schema import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter
import warnings
warnings.filterwarnings("ignore")

class ImprovedDogRAG:
    def __init__(self):
        print("üêï Inicializando Sistema RAG Melhorado...")

        self.client = ollama.Client()
        self.embeddings = OllamaEmbeddings(model="nomic-embed-text")

        # Configura√ß√£o do text splitter
        self.text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=300,
            chunk_overlap=50,
            separators=["\n\n", "\n", ".", "!", "?", ",", " ", ""]
        )

        # Cria base de conhecimento detalhada
        self.create_knowledge_base()
        self.create_vector_store()

        print("‚úÖ Sistema RAG pronto!")

    def create_knowledge_base(self):
        """Cria base de conhecimento estruturada"""
        self.knowledge_base = [
            {
                "title": "Quantidade de Ra√ß√£o por Peso",
                "content": """
                QUANTIDADE DE RA√á√ÉO DI√ÅRIA POR PESO DO C√ÉO:

                C√ÉES PEQUENOS (at√© 10kg):
                - 1/2 a 1 x√≠cara de ra√ß√£o por dia
                - Dividir em 2-3 refei√ß√µes

                C√ÉES M√âDIOS (10-25kg):
                - 1 a 2 x√≠caras de ra√ß√£o por dia
                - Dividir em 2 refei√ß√µes

                C√ÉES GRANDES (25-45kg):
                - 2 a 4 x√≠caras de ra√ß√£o por dia
                - Dividir em 2 refei√ß√µes

                C√ÉES GIGANTES (acima de 45kg):
                - 4 a 6 x√≠caras de ra√ß√£o por dia
                - Dividir em 2-3 refei√ß√µes menores

                OBSERVA√á√ÉO: Sempre verificar a tabela do fabricante da ra√ß√£o e ajustar conforme atividade f√≠sica do animal.
                """
            },
            {
                "title": "Frequ√™ncia de Alimenta√ß√£o",
                "content": """
                FREQU√äNCIA DE REFEI√á√ïES POR IDADE:

                FILHOTES (2-4 meses):
                - 4 refei√ß√µes por dia
                - Ra√ß√£o espec√≠fica para filhotes
                - Quantidade: seguir tabela do fabricante

                FILHOTES (4-6 meses):
                - 3 refei√ß√µes por dia
                - Transi√ß√£o gradual para ra√ß√£o adulta

                FILHOTES (6-12 meses):
                - 2-3 refei√ß√µes por dia
                - Ra√ß√£o para filhotes ou adultos jovens

                ADULTOS (1-7 anos):
                - 2 refei√ß√µes por dia
                - Ra√ß√£o para adultos
                - Hor√°rios fixos (manh√£ e tarde/noite)

                SENIORES (7+ anos):
                - 2 refei√ß√µes menores por dia
                - Ra√ß√£o espec√≠fica para idosos
                - Digest√£o mais lenta
                """
            },
            {
                "title": "Alimentos T√≥xicos para C√£es",
                "content": """
                ALIMENTOS PROIBIDOS PARA C√ÉES:

                EXTREMAMENTE T√ìXICOS:
                - Chocolate (principalmente amargo)
                - Uvas e passas
                - Cebola e alho
                - Abacate
                - Xilitol (ado√ßante)
                - √Ålcool
                - Cafe√≠na

                PERIGOSOS:
                - Ossos cozidos (podem quebrar)
                - Nozes macad√¢mia
                - Frutas com caro√ßo (p√™ssego, ameixa)
                - Massa de p√£o crua
                - Sal em excesso
                - Alimentos muito condimentados

                EM CASO DE INGEST√ÉO: Procure veterin√°rio imediatamente.
                """
            },
            {
                "title": "Calend√°rio de Vacina√ß√£o",
                "content": """
                PROTOCOLO B√ÅSICO DE VACINA√á√ÉO:

                PRIMEIRA VACINA√á√ÉO (6-8 semanas):
                - V8 ou V10 (m√∫ltipla)
                - Protege contra: cinomose, hepatite, parainfluenza, parvovirose, etc.

                SEGUNDA VACINA√á√ÉO (10-12 semanas):
                - V8 ou V10 (refor√ßo)
                - Intervalo de 3-4 semanas da primeira

                TERCEIRA VACINA√á√ÉO (14-16 semanas):
                - V8 ou V10 (refor√ßo final)
                - Antirr√°bica (primeira dose)

                REFOR√áO ANUAL:
                - V8 ou V10 (anual)
                - Antirr√°bica (anual)

                VACINAS OPCIONAIS:
                - Leishmaniose (3 doses)
                - Giard√≠ase
                - Gripe canina

                IMPORTANTE: N√£o sair na rua at√© completar protocolo.
                """
            },
            {
                "title": "Exerc√≠cios por Ra√ßa",
                "content": """
                NECESSIDADES DE EXERC√çCIO POR TIPO DE C√ÉO:

                RA√áAS DE BAIXA ENERGIA (30-45 minutos/dia):
                - Bulldog Ingl√™s e Franc√™s
                - Pug
                - Basset Hound
                - Shih Tzu
                - Pequin√™s
                Atividades: caminhadas curtas, brincadeiras leves

                RA√áAS DE ENERGIA MODERADA (60-90 minutos/dia):
                - Golden Retriever
                - Labrador
                - Beagle
                - Cocker Spaniel
                - Setter
                Atividades: caminhadas longas, nata√ß√£o, buscar bola

                RA√áAS DE ALTA ENERGIA (2+ horas/dia):
                - Border Collie
                - Pastor Alem√£o
                - Husky Siberiano
                - Jack Russell Terrier
                - Weimaraner
                Atividades: corrida, trilhas, agility, exerc√≠cios mentais

                DICAS IMPORTANTES:
                - Evitar exerc√≠cios 1-2 horas ap√≥s refei√ß√µes
                - Filhotes: 5 minutos por m√™s de idade, 2x ao dia
                - Dias quentes: exercitar no in√≠cio da manh√£ ou final da tarde
                """
            },
            {
                "title": "Sinais de Emerg√™ncia",
                "content": """
                SITUA√á√ïES DE EMERG√äNCIA VETERIN√ÅRIA:

                PROCURE VETERIN√ÅRIO IMEDIATAMENTE:
                - Dificuldade respirat√≥ria severa
                - Convuls√µes ou tremores incontrol√°veis
                - V√¥mitos com sangue
                - Diarreia com sangue ou muito aquosa
                - Abd√¥men inchado e r√≠gido (tor√ß√£o g√°strica)
                - Temperatura acima de 40¬∞C ou abaixo de 37¬∞C
                - Ferimentos profundos
                - Suspeita de envenenamento
                - N√£o consegue urinar
                - Colapso ou desmaio

                AGENDAR CONSULTA URGENTE:
                - Perda de apetite por mais de 24 horas
                - Letargia extrema
                - V√¥mitos frequentes (sem sangue)
                - Diarreia persistente
                - Dificuldade para defecar
                - Mudan√ßas dr√°sticas no comportamento
                - Claudica√ß√£o persistente

                PAR√ÇMETROS NORMAIS:
                - Temperatura: 38-39¬∞C
                - Frequ√™ncia card√≠aca: 60-120 bpm
                - Respira√ß√£o: 10-30 por minuto (em repouso)
                """
            },
            {
                "title": "Higiene e Cuidados",
                "content": """
                ROTINA DE HIGIENE CANINA:

                BANHOS:
                - C√£es de pelo curto: a cada 4-6 semanas
                - C√£es de pelo longo: a cada 2-3 semanas
                - C√£es com problemas de pele: conforme veterin√°rio
                - Usar sempre shampoo espec√≠fico para c√£es
                - √Ågua morna, enxaguar bem

                ESCOVA√á√ÉO:
                - Pelo curto: 2-3 vezes por semana
                - Pelo longo: diariamente
                - Pelo crespo: diariamente com produtos espec√≠ficos
                - Remove pelos mortos e previne n√≥s

                CUIDADOS ESPEC√çFICOS:
                - Dentes: escova√ß√£o 2-3 vezes por semana
                - Unhas: corte mensal ou quando fazem ru√≠do
                - Orelhas: limpeza semanal com produto espec√≠fico
                - Olhos: limpeza di√°ria se necess√°rio (ra√ßas braquicef√°licas)

                SINAIS DE ALERTA:
                - Mau odor persistente
                - Coceira excessiva
                - Vermelhid√£o ou irrita√ß√£o
                - Secre√ß√µes anormais
                """
            }
        ]

        print(f"üìö Base de conhecimento: {len(self.knowledge_base)} documentos")

    def create_vector_store(self):
        """Cria vector store otimizado"""
        all_documents = []

        # Processa cada documento da base
        for doc_data in self.knowledge_base:
            # Documento completo
            full_doc = Document(
                page_content=f"{doc_data['title']}\n\n{doc_data['content']}",
                metadata={
                    "title": doc_data["title"],
                    "type": "full_document"
                }
            )
            all_documents.append(full_doc)

            chunks = self.text_splitter.split_text(doc_data['content'])
            for i, chunk in enumerate(chunks):
                chunk_doc = Document(
                    page_content=f"Sobre {doc_data['title']}: {chunk}",
                    metadata={
                        "title": doc_data["title"],
                        "type": "chunk",
                        "chunk_id": i
                    }
                )
                all_documents.append(chunk_doc)

            title_doc = Document(
                page_content=doc_data['title'],
                metadata={
                    "title": doc_data["title"],
                    "type": "title_only"
                }
            )
            all_documents.append(title_doc)

        self.vector_store = FAISS.from_documents(all_documents, self.embeddings)
        print(f"üìä √çndice criado com {len(all_documents)} documentos/chunks")

    def search_knowledge(self, query: str, k: int = 5):
        """Busca melhorada com m√∫ltiplas estrat√©gias"""
        docs = self.vector_store.similarity_search(query, k=k)

        seen_titles = set()
        unique_docs = []

        for doc in docs:
            title = doc.metadata.get('title', '')
            if title not in seen_titles:
                seen_titles.add(title)
                unique_docs.append(doc)

        return unique_docs[:3]

    def generate_answer(self, question: str):
        """Gera√ß√£o de resposta melhorada"""

        relevant_docs = self.search_knowledge(question)

        if relevant_docs:

            context = "INFORMA√á√ïES RELEVANTES DA BASE DE CONHECIMENTO:\n\n"
            for i, doc in enumerate(relevant_docs, 1):
                title = doc.metadata.get('title', 'Documento')
                context += f"{i}. {title}\n{doc.page_content}\n\n"

            print(f"üìö Encontrados {len(relevant_docs)} documentos relevantes:")
            for doc in relevant_docs:
                print(f"   ‚Ä¢ {doc.metadata.get('title', 'Sem t√≠tulo')}")
        else:
            context = "Nenhuma informa√ß√£o espec√≠fica encontrada na base de conhecimento."
            print("‚ÑπÔ∏è Nenhum documento espec√≠fico encontrado, usando conhecimento geral")

        system_prompt = """Voc√™ √© um veterin√°rio especialista em cuidados caninos.
        Use PRIORITARIAMENTE as informa√ß√µes da base de conhecimento fornecida.
        Se as informa√ß√µes n√£o forem suficientes, complemente com conhecimento geral, mas sempre indique isso.
        Seja pr√°tico, educado e direto. Sempre recomende consultar veterin√°rio para casos espec√≠ficos."""

        user_prompt = f"""{context}

PERGUNTA: {question}

Responda de forma clara e pr√°tica, usando as informa√ß√µes fornecidas:"""

        try:
            response = self.client.chat(
                model='gemma3:4b',
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": user_prompt}
                ],
                options={
                    "temperature": 0.7,
                    "num_predict": 400,
                    "top_p": 0.9,
                    "stop": ["PERGUNTA:", "\n\nPERGUNTA:"]
                }
            )

            return response['message']['content'].strip()

        except Exception as e:
            return f"‚ùå Erro ao gerar resposta: {e}"

In [23]:
def run_chatbot():
    """Executa chat melhorado"""
    try:
        print("üîÑ Inicializando sistema RAG melhorado...")
        rag = ImprovedDogRAG()

        print("\n" + "="*60)
        print("üêï ASSISTENTE VETERIN√ÅRIO RAG MELHORADO")
        print("="*60)
        print("Comandos especiais:")
        print("‚Ä¢ 'sair' - encerrar chat")
        print("‚Ä¢ 'topics' - ver t√≥picos dispon√≠veis")
        print("‚Ä¢ 'test' - executar perguntas de teste")
        print("="*60)

        while True:
            question = input("\nüêï Voc√™: ").strip()

            if not question:
                continue

            print(f"\nü§ñ Assistente: ", end="")
            answer = rag.generate_answer(question)
            print(answer)

    except Exception as e:
        print(f"‚ùå Erro: {e}")

In [None]:
run_chatbot()

üîÑ Inicializando sistema RAG melhorado...
üêï Inicializando Sistema RAG Melhorado...
üìö Base de conhecimento: 7 documentos
üìä √çndice criado com 44 documentos/chunks
‚úÖ Sistema RAG pronto!

üêï ASSISTENTE VETERIN√ÅRIO RAG MELHORADO
Comandos especiais:
‚Ä¢ 'sair' - encerrar chat
‚Ä¢ 'topics' - ver t√≥picos dispon√≠veis
‚Ä¢ 'test' - executar perguntas de teste

üêï Voc√™: eu quero saber sobre alimenta√ß√£o do cachorro

ü§ñ Assistente: üìö Encontrados 2 documentos relevantes:
   ‚Ä¢ Frequ√™ncia de Alimenta√ß√£o
   ‚Ä¢ Alimentos T√≥xicos para C√£es
Ol√°! Como veterin√°rio especialista em cuidados caninos, posso te dar algumas orienta√ß√µes sobre alimenta√ß√£o do seu c√£o, baseadas nas informa√ß√µes que tenho.

**Frequ√™ncia de Alimenta√ß√£o:**

A frequ√™ncia ideal de alimenta√ß√£o para c√£es varia de acordo com a idade, tamanho e n√≠vel de atividade. Filhotes geralmente precisam de 3-4 refei√ß√µes por dia, enquanto c√£es adultos podem se beneficiar de duas refei√ß√µes di√°rias.