<a href="https://colab.research.google.com/github/Drmcoelho/APILLMML/blob/main/bermbriollmogy_portfolio_v2final.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Bermbriollmogy Portfolio v2 – Avançado
Este notebook-portfólio **v2** reúne um fluxo completo e robusto, integrando:
- Ingestão multimodal (PDFs, imagens, áudio, FHIR, web)
- Pré-processamento avançado (paralelismo, caching, lematização)
- Embeddings comparativos (múltiplos encoders e visualizações)
- Data Augmentation e adversarial tests
- Fine‑tuning básico e multitarefa com avaliação robusta
- RAG multimodal (texto+imagem) e chain‑of‑thought
- Otimização, quantização, pruning e benchmarking automático
- Containerização, API REST, CI/CD, Kubernetes/HPA
- Monitoramento completo e alertas (W&B, Prometheus, Grafana, Slack)
- Active Learning, feedback loop e versionamento de datasets/modelos
- Governança, compliance, relatórios e documentação automatizada

Use o índice abaixo para navegar:
1. Setup & Credenciais
2. Ingestão Multimodal Avançada
3. Pré-processamento Paralelo & Cache
4. Embeddings & Similaridade Multimodelo
5. EDA, Augmentation & Adversarial
6. Fine‑Tuning Básico & Multi‑Task
7. RAG Multimodal
8. Otimização, Quantização & Pruning
9. Containerização & API REST
10. CI/CD & Kubernetes
11. Monitoramento & Alertas
12. Active Learning Avançado
13. Governança, Compliance & Documentos


----
## Seção 1b/14: Gestão de Credenciais
Nesta subseção, você vai inserir de forma segura as credenciais e tokens para serviços:
- OpenAI API Key
- Hugging Face Token
- Gemini API Key
- Vertex AI Key
- Google Cloud Service Account (JSON)
- Slack Webhook URL

**Interatividade**: preencha seus segredos e salve em `config.json` ou variáveis de ambiente.

----
## Seção 1c/14: Quickstart & Verificação de Ambiente
Teste imediato do seu ambiente e faça um "Hello World" via LLM:
- Verifique versões de Python, PyTorch, Transformers e aceleração.
- Teste disponibilidade de GPU/CPU.
- Execute um prompt simples ("Olá Mundo") em OpenAI ou Hugging Face.

**Interatividade**: selecione o provedor e execute todos os checks e testes.

----
## Seção 2a/14: Ingestão Multimodal Avançada – Imagens & Áudio
Nesta subseção, você poderá:
- Fazer upload e pré-processamento de **imagens médicas** (DICOM, PNG, JPEG).
- Transcrever **áudios** clínicos (exames, entrevistas) usando Whisper.
- Configurar parâmetros de resizing, normalização e segmentação de áudio.

**Interatividade**: selecione arquivos de imagem e áudio, ajuste resolução e taxa de amostragem.

----
## Seção 2b/14: Ingestão Avançada – PDFs Longos, FHIR JSONs & Web Scraping
Nesta subseção, você poderá:
- Processar PDFs de até 10k páginas em chunks paralelizados.
- Carregar múltiplos JSONs FHIR, validar e normalize recursos.
- Realizar web scraping assíncrono de múltiplas URLs médicas.

**Interatividade**: configure paralelismo, chunk size, faça upload de arquivos PDF e FHIR JSONs, e insira URLs.

----
## Seção 3a/14: Pré-processamento Paralelo & Cache
Nesta subseção avançada, você poderá:
- Aplicar pré-processamento em paralelo (tokenização, limpeza) usando múltiplos processos.
- Utilizar cache para evitar reprocessamento de dados já limpos.
- Definir pipeline de steps (normalização, stopwords, stemming/lemmatização).

**Interatividade**: carregue seu corpus (TXT/CSV), configure número de workers, selecione steps e habilite cache.

----
## Seção 3b/14: Anotação e Desidentificação de Texto Clínico
Neste estágio, iremos:
- Remover informações de identificação pessoal (PHI) via regex e NER.
- Expandir acrônimos médicos conforme dicionário customizável.
- Destacar entidades médicas (medicamentos, doenças) usando spaCy.

**Interatividade**: carregue seu texto, defina regras de desidentificação e mapeamento de acrônimos.

----
## Seção 3c/14: Tokenização Multimodal & Dataset Unificado
Nesta subseção, vamos:
- Carregar dados processados de múltiplas modalidades:
  - Texto clínico (TXT/CSV)
  - Transcrições de áudio (JSON)
  - Legendas de imagens (CSV/JSON)
  - Recursos FHIR (JSON)
- Definir proporções de split para treino, validação e teste.
- Construir um dataset unificado e salvar em `train.json`, `valid.json`, `test.json`.
- Executar testes de integridade (IDs únicos, campos obrigatórios).

**Interatividade**: selecione arquivos, ajuste ratios e clique em construir dataset.

----
## Seção 4a/14: Embeddings & Similaridade Multimodelo
Nesta subseção, gere e compare embeddings de sentenças clínicas usando múltiplos provedores:
- **HuggingFace** (modelos locais, ex.: `all-MiniLM-L6-v2`, `biobert-base-cased-v1.1`)
- **OpenAI** (text-embedding-ada-002)
- **Vertex AI** (textembedding-gecko)

**Funcionalidades:**
- Upload de CSV/TXT com sentenças ou input manual.
- Seleção de provedores de embedding e parâmetros (batch size, truncation).
- Cálculo de similaridade por cosseno e comparação de top‑k entre provedores.
- Visualização interativa (bar chart, scatter) para comparar scores.

**Interatividade**: escolha provedores, faça upload do corpus e visualize comparações.

----
## Seção 4b/14: Visualização Comparativa de Embeddings
Aqui, compararemos embeddings de diferentes provedores:
- Heatmap de similaridade entre embeddings de todos os provedores.
- Distribuição de similaridades (histograma) por provedor.
- Gráfico de dispersão via PCA para embeddings combinados.

**Interatividade**: selecione provedores e visualizações desejadas.

----
## Seção 5a/14: Análise Exploratória & Visualização Avançada
Aqui, exploraremos seu corpus com estatísticas e visualizações interativas:
- Histogramas de comprimento de texto e distribuição de tokens.
- Frequência de termos e bigramas.
- Wordcloud interativa.
- Estatísticas de entidades médicas usando spaCy.

**Interatividade**: faça upload de CSV/TXT, ajuste top-k termos/bigramas e gere visualizações.

----
## Seção 5b/14: Data Augmentation & Adversarial Tests
Nesta subseção, você poderá:
- Aplicar augmentations de texto clínico (back-translation, synonym replacement, random deletion).
- Testar robustez com ataques adversariais via TextAttack.

**Interatividade**: selecione métodos de augmentation/adversarial, configure parâmetros e visualize exemplos.

----
## Seção 6a/14: Fine‑Tuning Básico de Modelos
Aqui, você poderá fazer o fine‑tuning de um modelo de seq2seq (T5/BART) usando seus dados clínicos:
- Faça upload de `train.json` e `valid.json`.
- Selecione o modelo base (`t5-small`, `bart-base`, etc.).
- Defina hiperparâmetros: épocas, batch size, learning rate.
- Acompanhe logs e salve o modelo fine‑tuned.

**Interatividade**: carregue seus arquivos, configure e inicie o treinamento.

----
## Seção 6b/14: Fine‑Tuning Avançado & Multi‑Task
Nesta subseção, você poderá treinar um modelo em múltiplas tarefas simultaneamente:
- **QA**: responder a perguntas baseadas em cenários clínicos.
- **Resumo**: gerar resumos de relatos clínicos.
- **Classificação**: classificar diagnósticos ou categorias.

**Interatividade**: faça upload de um JSON multi-task, selecione tarefas, modelo e hiperparâmetros.

----
## Seção 7a/14: RAG Multimodal (Texto + Imagem)
Nesta subseção, você construirá um sistema Retrieval-Augmented Generation que combina:
- Embeddings de texto clínico (texto descritivo)
- Embeddings de imagens médicas (radiografias, endoscopias) via CLIP
- Indexação multimodal e recuperação conjunta
- Geração de resposta via LLM com *chain-of-thought*

**Interatividade**: faça upload de imagens e texto, configure modelos de embedding, ajuste top-k e veja a resposta multimodal.

----
## Seção 7b/14: RAG Multimodal – Chain of Thought Detalhado
Nesta subseção, vamos aprimorar a geração com **chain-of-thought**:
- Permitir escolha de estilo de raciocínio (breve, detalhado).
- Inserir pergunta clínica e exibir passo a passo do raciocínio.
- Exibir fontes recuperadas (texto e imagens) como referências.

**Interatividade**: insira sua pergunta, selecione o estilo e gere o raciocínio detalhado.

----
## Seção 8a/14: Otimização de Hiperparâmetros Avançada
Nesta subseção, você poderá:
- Selecionar modelos treinados (Basic, Multi-Task, etc.).
- Configurar espaços de busca para learning rate, batch size, weight decay e número de epochs.
- Definir número de trials, estratégia de sampler (TPE, Random).
- Integrar com W&B para monitorar experimentos.

**Interatividade**: escolha o modelo, defina ranges e execute a busca.


----
## Seção 8b/14: Quantização & Pruning
Nesta subseção, você poderá:
- **Quantizar** o modelo (dinâmica INT8, estática INT8).
- **Pruning** de magnitude (remoção de pesos irrelevantes).
- Medir **tamanho** do modelo e **latência** de inferência.

**Interatividade**: selecione o diretório do modelo, métodos e parâmetros de pruning.

----
## Seção 9a/14: Containerização & API REST
Nesta subseção, você poderá:
- Gerar dinamicamente um **Dockerfile** para seu serviço.
- Construir e executar o container localmente.
- Testar endpoints `/predict`, `/health` e `/metrics`.

**Interatividade**: configure `base_image`, `model_dir`, `service_file`, `porta` e `image_tag`.

----
## Seção 9b/14: CI/CD & Kubernetes
Nesta subseção, vamos configurar:
- **GitHub Actions** para CI/CD (build e push de imagem Docker)
- **Helm Chart** básico para deploy em Kubernetes
- Workflow interativo para ajustar nomes de repositório, tags e valores de Helm

**Interatividade**: insira o nome do repositório, branch, Docker Registry, chart name e namespace.

----
## Seção 10a/14: Monitoramento & Alertas
Nesta subseção, você vai configurar:
- **Prometheus** para coletar métricas da aplicação.
- **Grafana** para dashboards interativos.
- **Alertas no Slack** para thresholds (latência, erros).
- **Relatórios programados** (e.g., uso de W&B ou cron) para envio de estatísticas.

**Interatividade**: insira URL do Prometheus, dashboard ID do Grafana, webhook do Slack e thresholds para alertas.

----
## Seção 10b/14: Relatórios Programados & Exportação
Nesta subseção, você pode:
- Gerar relatórios de métricas coletadas (Prometheus, W&B) em **HTML**, **PDF** ou **CSV**.
- Customizar período de coleta (horas, dias).
- Agendar relatórios diários/semanais automaticamente.

**Interatividade**: selecione fonte de métricas, período, formato e agende o envio.

----
## Seção 11a/14: Active Learning Avançado & Versionamento
Nesta subseção, implementaremos:
- Pipelines de **Active Learning** com estratégias avançadas (ensemble, adversarial sampling).
- **Versionamento** automático de datasets e modelos usando DVC ou MLflow.
- Interface para comparar versões anteriores e atuais de performance.

**Interatividade**: selecione estratégia de sampling, configure versionamento e visualize histórico.

----
## Seção 11b/14: Comparação de Versões & Métricas
Nesta subseção, você poderá:
- Recuperar versões salvas (DVC/MLflow) e comparar métricas.
- Visualizar métricas de avaliação (loss, accuracy) por versão.
- Gerar gráficos interativos de evolução de métricas ao longo do tempo.

**Interatividade**: selecione o experimento MLflow e as runs para comparar.

----
## Seção 12a/14: Construção Interativa de `train.json` e `valid.json`
Nesta subseção, você poderá inserir casos clínicos diretamente no notebook para:
- Escolher se o caso deve ir para **train** ou **valid**.
- Descrever o cenário (ex.: "Dor precordial há 47 min").
- Listar 3 diagnósticos diferenciais (DDx).
- Indicar condutas (CD) e exames seguintes.
- Perguntar e registrar métricas de acompanhamento (e.g., tempo de dor atual).

**Interatividade**: preencha os campos abaixo, clique em **Adicionar Caso**, e veja os arquivos JSON atualizados.

----
## Seção 12b/14: Data Augmentation Avançada
Nesta subseção, você poderá aplicar técnicas de **Data Augmentation** aos seus datasets `train.json` e `valid.json`:
- Métodos: back-translation, synonym replacement, contextual substitution, random deletion/insertion.
- Configure número de amostras geradas por exemplo.
- Pré-visualize amostras e salve o dataset aumentado em `train_aug.json` ou `valid_aug.json`.

**Interatividade**: selecione o dataset, métodos, parâmetros e execute a geração.

----
## Seção 13a/14: Prompt Managers & Adequações
Nesta subseção, você poderá:
- Gerenciar diferentes **templates de prompt** para cenários médicos.
- Ajustar dinamicamente **placeholders** e parâmetros (temperatura, max_tokens).
- Salvar e recarregar **conjuntos de prompts** como JSON.
- Testar rapidamente variações de prompt e comparar respostas.

**Interatividade**: escolha ou crie um template, preencha valores e veja as respostas da LLM.

----
## Seção 13b/14: Testing OverTesting & Comparação Modelo-a-Modelo
Nesta subseção, você poderá:
- Executar testes de desempenho e robustez (overTesting) em diferentes LLMs.
- Comparar respostas de múltiplos modelos para o mesmo conjunto de prompts.
- Avaliar métricas como coerência, completude e similaridade semântica.

**Interatividade**: selecione os modelos, faça upload de um arquivo JSON com prompts e compare resultados.

----
## Seção 14a/14: Revisão Conceitual Magistral
Nesta subseção final, faremos uma revisão interativa dos principais conceitos abordados:
- **Embeddings & Similaridade**
- **Fine-Tuning & Multi-Task Learning**
- **RAG (Retrieval-Augmented Generation)**
- **Quantização & Pruning**
- **Containerização & CI/CD**
- **Monitoramento & Alertas**
- **Active Learning & Versionamento**
- **Prompt Management & Model-to-Model Testing**

**Interatividade**: selecione um conceito para ver definição, exemplos e dicas de aplicação.

----
## Seção 14a2/14: Preparação para Exercícios de Alta Complexidade
Antes de partir para exercícios desafiadores, responda às perguntas de aquecimento abaixo:
- Questões de múltipla escolha revisando conceitos fundamentais
- Feedback imediato e explicações para cada resposta

**Interatividade**: selecione a opção correta e clique em Submeter para receber a explicação.

----
## Seção 14b/14: Hacks Secretos & Dicas Incríveis
Explore truques avançados e otimizações para aprimorar seu fluxo:
- **Memória de GPU extra**: ativar offloading de pesos para CPU.
- **Pipeline de inferência assíncrona** para throughput máximo.
- **Cache de embeddings compartilhado** entre modelos.
- **Prompt templating avançado** com loops e condicionais.
- **Uso de tokens especiais** para controlar o comportamento da LLM.

**Interatividade**: selecione um hack para ver descrição e exemplo de código.

----
## Seção 14b2/14: Desafios de Código
Teste suas habilidades com estes desafios práticos:
1. **Implementar uma versão customizada de quantização dinâmica** sem usar ``torch.quantization``.
2. **Criar uma função de caching de embeddings** que suporte expiração de entradas antigas.
3. **Desenvolver um widget Jupyter** que compare em tempo real latências de múltiplos modelos.

**Instruções:** selecione o desafio e clique em **Mostrar Desafio** para ver detalhes e estrutura de código inicial.

----
## Seção 14b3/14: Gabarito dos Desafios de Código
Aqui estão as soluções completas para os desafios propostos:
1. **Quantização Customizada**
2. **Cache de Embeddings com TTL**
3. **Widget de Latência Interativo**


----
## Seção 14c/14: Ferramentas a Explorar para Melhorar
Aqui estão algumas ferramentas e plataformas avançadas que você pode integrar para aprimorar seu workflow:
- **Weights & Biases**: experiment tracking e visualização colaborativa.
- **Haystack**: framework para pipelines RAG em produção.
- **Streamlit / Gradio**: interfaces web interativas para demos.
- **LangChain**: orquestração de LLMs e agentes.
- **LlamaIndex (GPT Index)**: gerenciamento de índices de conhecimento.
- **DeepSpeed**: treinamento e inferência em larga escala.
- **Kedro**: orquestração de pipelines de dados.
- **Apache Airflow**: agendamento e monitoramento de workflows.

**Interatividade**: selecione uma ferramenta no dropdown para ver descrição e links.

In [None]:
!pip install --upgrade pip # Atualizar o pip
!pip install --quiet \
    google-cloud-secret-manager==2.9.0 \
    google-cloud-storage==2.7.0 \
    transformers==4.28.1 \
    torch==2.0.0 \
    datasets==2.11.0 \
    faiss-cpu==1.7.4 \
    sentence-transformers==2.2.2 \
    python-multipart==0.0.5 \
    uvicorn==0.22.0 \
    fastapi==0.95.0 \
    typer==0.9.0 \
    click==8.3.2 \
    pydicom==2.3.1 \
    Pillow==9.5.0 \
    whisper==1.2.0 \
    spacy==3.5.3 \
    textattack==0.3.8 \
    optuna==3.2.0 \
    wandb==0.15.4 \
    haystack==1.17.0 \
    streamlit==1.23.1 \
    gradio==3.35.2 \
    langchain==2.0.0 \
    llama-index==0.6.12 \
    deepspeed==0.9.1 \
    kedro==2.0.3 \
    apache-airflow==2.6.3 \
    dvc==2.39.0 \
    mlflow==2.3.1 \
    # ... e outras bibliotecas relevantes para o futuro ...

Justificativa para as Bibliotecas:

Gerenciamento de pacotes:
pip: Ferramenta essencial para gerenciar pacotes Python.
Gerenciamento de segredos:
google-cloud-secret-manager: Armazenar e acessar credenciais de forma segura.
Armazenamento em nuvem:
google-cloud-storage: Interagir com o Google Cloud Storage para armazenar e recuperar dados.
Modelos de linguagem:
transformers: Biblioteca para usar modelos de linguagem pré-treinados do Hugging Face.
torch: Biblioteca de aprendizado de máquina para deep learning.
sentence-transformers: Gerar embeddings de sentenças.
Processamento de dados:
datasets: Biblioteca para carregar e processar datasets do Hugging Face.
faiss-cpu: Biblioteca para pesquisa de similaridade em embeddings.
pydicom: Carregar e processar imagens médicas no formato DICOM.
Pillow: Biblioteca para processamento de imagens.
whisper: Transcrever áudio usando o modelo Whisper.
spacy: Biblioteca para processamento de linguagem natural (NLP).
Fine-tuning e otimização:
textattack: Biblioteca para testes adversariais em modelos de linguagem.
optuna: Biblioteca para otimização de hiperparâmetros.
wandb: Biblioteca para rastreamento de experimentos e visualização de métricas.
RAG e agentes:
haystack: Framework para pipelines RAG (Retrieval-Augmented Generation).
langchain: Orquestração de LLMs e agentes.
llama-index: Gerenciamento de índices de conhecimento para RAG.
Interfaces:
streamlit: Criar interfaces web interativas para demos.
gradio: Construir demos de ML com interfaces amigáveis e deploy simples.
python-multipart: Suporte para upload de arquivos em APIs web.
uvicorn: Servidor web ASGI para FastAPI.
fastapi: Framework web para construir APIs REST.
CLI:
typer: Biblioteca para criar CLIs (Command-Line Interfaces) modernas.
click: Biblioteca para criar CLIs simples.
Orquestração e pipelines:
deepspeed: Treinamento e inferência em larga escala.
kedro: Orquestração de pipelines de dados.
apache-airflow: Agendamento e monitoramento de workflows.
Versionamento:
dvc: Versionamento de dados e modelos.
mlflow: Rastreamento de experimentos e gerenciamento de modelos.
Observações:

--quiet: O argumento --quiet no comando pip install suprime a saída detalhada da instalação. Remova-o se desejar visualizar o progresso da instalação.
Versões: As versões das bibliotecas podem precisar ser ajustadas dependendo das suas necessidades e das dependências do projeto. Certifique-se de usar as versões compatíveis entre si.
Bibliotecas adicionais: Inclua outras bibliotecas relevantes para as funcionalidades que você pretende adicionar ao projeto no futuro.

In [14]:
!rm -rf my_env_colab
!python3 -m venv my_env_colab

Error: Command '['/content/my_env_colab/bin/python3', '-m', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 1.


In [12]:
!source my_env_colab/bin/activate

!my_env_colab/bin/python3 -m ensurepip --upgrade --default-pip
!my_env_colab/bin/python3 -m pip install --upgrade pip
!my_env_colab/bin/python3 -m pip install ipykernel
!my_env_colab/bin/python3 -m ipykernel install --user --name my_env_colab --display-name "Python (my_env)"

Error: Command '['/content/my_env_colab/bin/python3', '-m', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 1.
/bin/bash: line 1: my_env_colab/bin/activate: No such file or directory
/content/my_env_colab/bin/python3: No module named ensurepip
/content/my_env_colab/bin/python3: No module named pip
/content/my_env_colab/bin/python3: No module named pip
/content/my_env_colab/bin/python3: No module named ipykernel


In [13]:
!which python

/usr/local/bin/python


In [None]:
!pip install --upgrade pandas-gbq bigquery-magics bigframes google-auth-oauthlib google-cloud-bigquery google-cloud-pubsub google-cloud-resource-manager shapely
!pip install --force-reinstall bigframes

In [1]:
# Instalar bibliotecas adicionais para o futuro
!pip install --quiet \
    google-auth-oauthlib==0.5.3 \
    google-auth-httplib2==0.1.0 \
    google-api-python-client==2.84.0 \
    google-cloud-aiplatform==1.25.0 \
    google-cloud-bigquery==3.9.0 \
    google-cloud-logging==3.5.0 \
    google-cloud-pubsub==2.13.4 \
    google-cloud-translate==3.8.4 \
    # ... e outras bibliotecas relevantes para o futuro ...

# Configurar a integração com o Google Cloud
from google.colab import auth
auth.authenticate_user()

# Definir o projeto padrão
PROJECT_ID = "MedicalScore" # Substitua pelo ID real do seu projeto
!gcloud config set project {PROJECT_ID}

# Instalar o SDK do Google Cloud, se necessário
!apt-get install -y google-cloud-sdk

# Imprimir informações sobre a configuração
!gcloud config list

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/43.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m43.1/43.1 kB[0m [31m2.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m11.2/11.2 MB[0m [31m100.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.6/2.6 MB[0m [31m82.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m217.3/217.3 kB[0m [31m16.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m195.8/195.8 kB[0m [31m16.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m234.4/234.4 kB[0m [31m20.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m117.6/117.6 kB[0m [31m10.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [1]:
# Exemplos Robustos de Integração das Ferramentas da Seção 14c

# 1. Weights & Biases - Configuração e Log
import wandb
wandb.init(project='medical-llm-portfolio', config={'learning_rate': 5e-5, 'batch_size': 8})
wandb.log({'train_loss': 0.42, 'eval_accuracy': 0.87})
wandb.finish()

# 2. Haystack - Pipeline RAG Básico
from haystack.document_stores import FAISSDocumentStore
from haystack.nodes import DensePassageRetriever, FARMReader, RAGenerator
from haystack.pipelines import GenerativeQAPipeline

# Document store FAISS
document_store = FAISSDocumentStore(faiss_index_factory_str="Flat")
retriever = DensePassageRetriever(document_store=document_store,
                                  query_embedding_model="facebook/dpr-question_encoder-single-nq-base",
                                  passage_embedding_model="facebook/dpr-ctx_encoder-single-nq-base")
document_store.update_embeddings(retriever)

generator = RAGenerator(model_name_or_path="facebook/rag-token-base")
pipe = GenerativeQAPipeline(generator=generator, retriever=retriever)
result = pipe.run(query="Quais são os sintomas de dissecção aórtica?", params={"Retriever": {"top_k": 5}})
print(result['answers'][0].answer)

# 3. Streamlit - App Simples
# salvar como app.py e rodar `streamlit run app.py`
streamlit_code = '''
import streamlit as st
from transformers import pipeline

st.title("Medical LLM Inference")
model = pipeline("text2text-generation", model="google/flan-t5-small")
prompt = st.text_area("Prompt:")
if st.button("Gerar"):
    response = model(prompt, max_length=100)[0]['generated_text']
    st.write(response)
'''

with open('app.py', 'w') as f:
    f.write(streamlit_code)

# 4. Gradio - Demo Interativo
import gradio as gr
def infer(prompt):
    from transformers import pipeline
    model = pipeline("text2text-generation", model="google/flan-t5-small")
    return model(prompt, max_length=100)[0]['generated_text']

demo = gr.Interface(fn=infer, inputs="text", outputs="text", title="Medical LLM Demo")
demo.launch(share=True)

# 5. LangChain - Agente Pipeline
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

llm = OpenAI(model_name="gpt-3.5-turbo")
from langchain.vectorstores import FAISS
faiss_store = FAISS.load_local("faiss_index", emb_model=None)
qa_chain = RetrievalQA.from_chain_type(llm=llm, retriever=faiss_store.as_retriever())
print(qa_chain.run("Descreva a fisiologia renal."))

# 6. LlamaIndex - Indexação e Consulta
from llama_index import SimpleDirectoryReader, GPTVectorStoreIndex
documents = SimpleDirectoryReader('docs/').load_data()
index = GPTVectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
print(query_engine.query("Quais são os protocolos de analgesia pós-operatória?"))

# 7. DeepSpeed - Treinamento com ZeRO
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import deepspeed

model = AutoModelForSeq2SeqLM.from_pretrained("google/flan-t5-base")
tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-base")
ds_config = {
    "train_micro_batch_size_per_gpu": 4,
    "zero_optimization": {"stage": 2}
}
model_engine, optimizer, _, _ = deepspeed.initialize(model=model, config=ds_config, model_parameters=model.parameters())
# Exemplo de passo de treino
inputs = tokenizer("Pacientes com febre", return_tensors="pt").to(model_engine.local_rank)
outputs = model_engine(**inputs, labels=inputs.input_ids)
loss = outputs.loss
model_engine.backward(loss)
model_engine.step()

# 8. Apache Airflow - DAG Básico
airflow_dag = '''
from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime, timedelta

def train_model():
    # código de treino
    pass

with DAG('train_and_deploy', start_date=datetime(2025,5,1), schedule_interval='@daily', catchup=False) as dag:
    t1 = PythonOperator(task_id='train', python_callable=train_model)
'''

with open('dag.py', 'w') as f:
    f.write(airflow_dag)
print("Exemplos de código robustos gerados para todas as ferramentas da seção 14c.")

<IPython.core.display.Javascript object>

[34m[1mwandb[0m: Logging into wandb.ai. (Learn how to deploy a W&B server locally: https://wandb.me/wandb-server)
[34m[1mwandb[0m: You can find your API key in your browser here: https://wandb.ai/authorize?ref=models
wandb: Paste an API key from your profile and hit enter:

 ··········


[34m[1mwandb[0m: No netrc file found, creating one.
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc
[34m[1mwandb[0m: Currently logged in as: [33mdrmatheuscoelho[0m to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


0,1
eval_accuracy,▁
train_loss,▁

0,1
eval_accuracy,0.87
train_loss,0.42


ModuleNotFoundError: No module named 'haystack'

In [7]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Define tools with description and links
tools = {
    'Weights & Biases': {
        'desc': 'Rastreie experimentos, visualize métricas e colabore em dashboards.',
        'link': 'https://wandb.ai'
    },
    'Haystack': {
        'desc': 'Construa pipelines RAG robustas para produção, com suporte a diversos backends.',
        'link': 'https://haystack.deepset.ai'
    },
    'Streamlit': {
        'desc': 'Crie aplicações web interativas de forma rápida com Python.',
        'link': 'https://streamlit.io'
    },
    'Gradio': {
        'desc': 'Construa demos de ML com interfaces amigáveis e deploy simples.',
        'link': 'https://gradio.app'
    },
    'LangChain': {
        'desc': 'Orquestre chamadas a LLMs, crie agentes e fluxos conversacionais.',
        'link': 'https://python.langchain.com'
    },
    'LlamaIndex': {
        'desc': 'Gerencie índices de conhecimento e realize buscas eficientes.',
        'link': 'https://gpt-index.readthedocs.io'
    },
    'DeepSpeed': {
        'desc': 'Acelere treinamento e inferência de modelos grandes com ZeRO e otimizações.',
        'link': 'https://deepspeed.ai'
    },
    'Kedro': {
        'desc': 'Orquestre pipelines de dados e ML com modularidade e reprodutibilidade.',
        'link': 'https://kedro.apache.org'
    },
    'Apache Airflow': {
        'desc': 'Agende, monitore e gerencie workflows complexos de dados.',
        'link': 'https://airflow.apache.org'
    }
}

tool_select = widgets.Dropdown(options=list(tools.keys()), description='Ferramenta:')
out = widgets.Output()

def show_tool(change):
    with out:
        clear_output()
        t = change['new']
        info = tools[t]
        display(Markdown(f"**{t}**"))

{info['desc']}

[Site Oficial]({info['link']})

tool_select.observe(show_tool, names='value')
display(tool_select, out)

SyntaxError: invalid syntax. Perhaps you forgot a comma? (<ipython-input-7-6b573eada946>, line 56)

# Bermbriollmogy Portfolio v2

## Descrição

Este projeto implementa um pipeline completo para processamento multimodal de dados médicos e aplicação de modelos de linguagem (LLMs) em cenários clínicos, incluindo:

* Ingestão de PDFs, imagens e áudios
* Pré-processamento e desidentificação de texto
* Geração de embeddings e similaridade multimodelo
* Fine-tuning básico e multi-task
* Retrieval-Augmented Generation (RAG) multimodal
* Otimização (hyperparameter tuning, quantização, pruning)
* Containerização e API REST
* CI/CD automatizado e monitoramento
* Active Learning avançado e versionamento
* CLI para orquestração de tarefas

## Sumário

* [Estrutura do Projeto](#estrutura-do-projeto)
* [Instalação](#instalação)
* [Configuração](#configuração)
* [Uso da CLI](#uso-da-cli)
* [Testes](#testes)
* [CI/CD](#cicd)
* [Containerização](#containerização)
* [Contribuição](#contribuição)
* [Licença](#licença)

---

## Estrutura do Projeto

```text
bermbriollmogy_portfolio_v2/
├── .github/
│   └── workflows/
│       └── ci.yml                  # Pipeline de CI (lint, testes, build & push Docker)
├── config/
│   ├── credentials.template.json   # Modelo de credenciais
│   ├── logging.yaml                # Configuração de logging
│   └── secret_manager.yaml         # Configurações Secret Manager
├── docs/
│   ├── architecture.md             # Arquitetura e diagramas
│   ├── setup_guide.md              # Guia de instalação e configuração
│   ├── usage.md                    # Exemplos de uso
│   └── cli.md                      # Documentação da CLI
├── notebooks/
│   ├── bermbriollmogy_portfolio_v2.ipynb
│   ├── quickstart.ipynb            # Teste “Olá Mundo” no LLM
│   └── ingestion_demo.ipynb        # Demonstração de ingestão multimodal
├── src/
│   ├── __init__.py
│   ├── main.py                     # Orquestra o pipeline completo
│   ├── cli.py                      # CLI (Typer/Click)
│   ├── utils/
│   │   ├── credentials.py          # Carregamento seguro de credenciais
│   │   ├── logger.py               # Setup de logs
│   │   └── env_detector.py         # Detecta ambiente de execução
│   ├── ingestion/                  # Módulo de ingestão multimodal
│   ├── preprocessing/              # Limpeza, tokenização e dataset
│   ├── embeddings/                 # Cálculo e comparação de embeddings
│   ├── modeling/                   # Fine-tuning, RAG, otimização
│   ├── deployment/                 # API REST, Docker, Helm chart
│   ├── monitoring/                 # Prometheus, alertas
│   └── active_learning/            # Estratégias e versionamento
├── tests/
│   ├── unit/                       # Testes unitários
│   └── integration/                # Testes de integração
├── scripts/
│   ├── run_all.sh                  # Executa pipeline completo
│   ├── build_image.sh              # Build & teste Docker
│   └── deploy.sh                   # Deploy via Helm (staging/dev)
├── .env.example                    # Exemplo de variáveis de ambiente
├── pyproject.toml / poetry.lock    # Dependências (Poetry)
├── requirements.txt (opcional)     # Lockfile alternativo
├── README.md                       # Este arquivo
└── LICENSE
```

## Instalação

1. Clone o repositório:

   ```bash
   git clone https://github.com/seu-usuario/bermbriollmogy_portfolio_v2.git
   cd bermbriollmogy_portfolio_v2
   ```
2. Instale as dependências via **Poetry** ou **pip**:

   ```bash
   # Poetry
   poetry install

   # Ou pip
   pip install -r requirements.txt
   ```

## Configuração

1. Copie e renomeie o template de credenciais:

   ```bash
   cp config/credentials.template.json config/credentials.json
   ```
2. Preencha suas chaves e tokens no `config/credentials.json` **ou** use variáveis de ambiente em `.env`:

   ```dotenv
   OPENAI_API_KEY=sk-...
   HF_TOKEN=hf_...
   GEMINI_API_KEY=...
   SLACK_WEBHOOK_URL=https://hooks.slack.com/...
   ```
3. (Opcional) Configure CLI em `~/.berm/config.toml`:

   ```toml
   [defaults]
   source = "./data"
   format = "pdf"
   workers = 4
   ```

## Uso da CLI

Após a instalação, a CLI (`berm`) permite orquestrar o pipeline:

* **Pipeline completo**:

  ```bash
  berm run
  ```
* **Ingestão**:

  ```bash
  berm ingest --source ./pdfs --format pdf --out-dir ./chunks
  ```
* **Pré-processamento**:

  ```bash
  berm preprocess --input-dir ./chunks --cache-dir ./cache --workers 4
  ```
* **Embeddings**:

  ```bash
  berm embed --input ./processed.json --provider openai
  ```
* **Fine-tuning**:

  ```bash
  berm finetune --model t5-small --epochs 3 --batch-size 8
  ```
* **Deploy**:

  ```bash
  berm deploy --env dev
  ```

Para ver todas as opções de cada comando:

```bash
berm <comando> --help
```

## Testes

* **Unitários**:

  ```bash
  pytest tests/unit
  ```
* **Integração**:

  ```bash
  pytest tests/integration
  ```
* **Cobertura**:

  ```bash
  pytest --cov=src
  ```

## CI/CD

O pipeline GitHub Actions (`.github/workflows/ci.yml`) realiza:

* Lint (`flake8`)
* Testes (unit & integration) em múltiplas versões de Python
* Build da imagem Docker
* Push automático para Docker Hub na branch `main`

## Containerização

Build e run:

```bash
# Build image
docker build -f src/deployment/Dockerfile -t bermbriollmogy:latest .

# Run container
docker run --env-file .env -p 8000:8000 bermbriollmogy:latest
```

## Contribuição

1. Abra uma *issue* descrevendo sua sugestão.
2. Fork este repositório.
3. Crie uma *branch* `feature/nova-funcionalidade`.
4. Faça commits claros e atômicos.
5. Abra um *pull request* para `develop`.

## Licença

Este projeto está licenciado sob a [MIT License](LICENSE).


# Bermbriollmogy Portfolio v2 – Avançado

[![CI Status](https://img.shields.io/github/actions/workflow/status/SEU_USUARIO/bermbriollmogy_portfolio_v2/ci.yml?branch=main)](https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2/actions)  
[![Coverage Status](https://img.shields.io/codecov/c/github/SEU_USUARIO/bermbriollmogy_portfolio_v2/main)](https://codecov.io/gh/SEU_USUARIO/bermbriollmogy_portfolio_v2)  
[![License](https://img.shields.io/github/license/SEU_USUARIO/bermbriollmogy_portfolio_v2)](./LICENSE)

---

## 📖 Sumário

- [Sobre](#-sobre)  
- [Diagrama de Arquitetura](#-diagrama-de-arquitetura)  
- [Funcionalidades](#-funcionalidades)  
- [Badges](#-badges)  
- [Instalação](#-instalação)  
- [CLI](#-cli)  
- [Testes](#-testes)  
- [CI/CD](#-cicd)  
- [Containerização](#-containerização)  
- [Documentação e Recursos](#-documentação-e-recursos)  
- [Demonstrações](#-demonstrações)  
- [Contribuição](#-contribuição)  
- [Licença](#-licença)  
- [Contato & CTA](#-contato--cta)  

---

## 📄 Sobre

Este projeto oferece um pipeline completo, modular e escalável para ingestão multimodal, pré-processamento, fine-tuning de LLMs, RAG multimodal, deploy em container com API REST, monitoramento e active learning em cenários clínicos.

---

## 🏛️ Diagrama de Arquitetura

![Arquitetura Geral](docs/images/architecture.png)

> **Figura:** Fluxo completo, da ingestão à inferência em produção.

---

## ✨ Funcionalidades

- **Ingestão multimodal**: PDFs, imagens DICOM/PNG, áudio (Whisper), FHIR, web scraping.  
- **Pré-processamento**: limpeza, desidentificação, tokenização paralela, cache.  
- **Embeddings & Similaridade**: múltiplos provedores (OpenAI, HF, Vertex AI).  
- **Fine-tuning e Multi-Task**: T5/BART, QA, resumo, classificação.  
- **RAG Multimodal**: texto + imagem + Chain-of-Thought.  
- **Otimização**: quantização, pruning, hyperopt (W&B).  
- **Deploy**: FastAPI/Flask, Docker multi-stage, Kubernetes Helm.  
- **Monitoramento**: Prometheus, Grafana, alertas Slack/e-mail.  
- **Active Learning & Versionamento**: DVC/MLflow, sampling avançado.  
- **CLI**: `berm` — orquestra todo o pipeline.  

---

## 🏷️ Badges

- **CI Status**  
  ![CI Status](https://img.shields.io/github/actions/workflow/status/SEU_USUARIO/bermbriollmogy_portfolio_v2/ci.yml?branch=main)  
- **Coverage**  
  ![Coverage](https://img.shields.io/codecov/c/github/SEU_USUARIO/bermbriollmogy_portfolio_v2/main)  
- **License**  
  ![License](https://img.shields.io/github/license/SEU_USUARIO/bermbriollmogy_portfolio_v2)  

(adapte URLs para o seu repositório)

---

## 💾 Instalação

1. **Clone**  
   ```bash
   git clone https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2.git
   cd bermbriollmogy_portfolio_v2

	2.	Dependências

pip install poetry
poetry install


	3.	Configuração
	•	Copie config/credentials.template.json → config/credentials.json e preencha suas chaves.
	•	Copie .env.example → .env e ajuste variáveis de ambiente (OPENAI_API_KEY, etc.).

⸻

💻 CLI

Após instalação, o comando principal é berm.

# pipeline completo
berm run

# apenas ingestão multimodal
berm ingest --source ./data/pdfs --format pdf

# pré-processamento com cache
berm preprocess --input-dir ./chunks --cache-dir ./cache --workers 4

Para ver todos os subcomandos e opções:

berm --help
berm ingest --help

Consulte docs/cli.md para documentação completa.

⸻

🧪 Testes
	•	Unitários:

pytest tests/unit


	•	Integração:

pytest tests/integration



Cobertura garantida via Codecov.
Configure pytest.ini e tox.ini conforme seu fluxo de trabalho, se desejar.

⸻

🚀 CI/CD

Automatizado via GitHub Actions em .github/workflows/ci.yml:
	•	Jobs
	•	build: lint (flake8), instalação via Poetry, testes.
	•	docker: build & push de imagem Docker ao main.

Adapte secrets (DOCKER_USERNAME, DOCKER_PASSWORD) em Settings → Secrets.

⸻

🐳 Containerização

O src/deployment/Dockerfile utiliza multi-stage build para deixar a imagem enxuta:

# builder
FROM python:3.10-slim AS builder
...
# runtime
FROM python:3.10-slim
...
CMD ["uvicorn", "src.deployment.api:app", "--host", "0.0.0.0", "--port", "8000"]

Para testar localmente:

docker build -t bermbriollmogy:latest -f src/deployment/Dockerfile .
docker run -p 8000:8000 bermbriollmogy:latest


⸻

📚 Documentação e Recursos
	•	Guia de Setup: docs/setup_guide.md
	•	Uso & Exemplos: docs/usage.md
	•	Arquitetura: docs/architecture.md
	•	Tutoriais:
	•	Integração com GCP Secret Manager
	•	RAG multimodal com LangChain
	•	Monitoramento avançado com Grafana

⸻

🔗 Demonstrações
	•	Colab Demo: ▶️ Executar no Colab
	•	Streamlit App: 🔗 Acesse a demo

⸻

🤝 Contribuição

Contribuições são bem-vindas!
	1.	Fork e branch (feature/xyz).
	2.	Commit com convenção de mensagens.
	3.	PR com descrição clara e updates no CHANGELOG.md.

Veja o CONTRIBUTING.md para diretrizes completas.

⸻

📝 Licença

Este projeto está licenciado sob a MIT License.

⸻

📞 Contato & Call to Action

Gostou do projeto? Experimente agora:

git clone https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2.git
cd bermbriollmogy_portfolio_v2
poetry install
berm run --dry-run

👉 Participe: abra issues, envie PRs, compartilhe feedback!
👉 Fale conosco: projetoml@seudominio.com.br

⸻

Obrigado por usar o Bermbriollmogy Portfolio v2! 🚀

# Bermbriollmogy Portfolio v2 – Avançado

[![CI Status](https://img.shields.io/github/actions/workflow/status/SEU_USUARIO/bermbriollmogy_portfolio_v2/ci.yml?branch=main)](https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2/actions)  
[![Coverage Status](https://img.shields.io/codecov/c/github/SEU_USUARIO/bermbriollmogy_portfolio_v2/main)](https://codecov.io/gh/SEU_USUARIO/bermbriollmogy_portfolio_v2)  
[![License](https://img.shields.io/github/license/SEU_USUARIO/bermbriollmogy_portfolio_v2)](./LICENSE)

---

## 📖 Sumário

- [Sobre](#-sobre)  
- [Diagrama de Arquitetura](#-diagrama-de-arquitetura)  
- [Demonstração em GIF](#-demonstração-em-gif)  
- [Funcionalidades](#-funcionalidades)  
- [Badges](#-badges)  
- [Instalação](#-instalação)  
- [CLI](#-cli)  
- [Testes](#-testes)  
- [CI/CD](#-cicd)  
- [Containerização](#-containerização)  
- [Documentação e Recursos](#-documentação-e-recursos)  
- [Demonstrações](#-demonstrações)  
- [Roadmap](#-roadmap)  
- [Comunidade & Chat](#-comunidade--chat)  
- [Contribuição](#-contribuição)  
- [Licença](#-licença)  
- [Contato & CTA](#-contato--cta)  

---

## 📄 Sobre

Este projeto oferece um pipeline completo, modular e escalável para ingestão multimodal, pré-processamento, fine-tuning de LLMs, RAG multimodal, deploy em container com API REST, monitoramento e active learning em cenários clínicos.

---

## 🏛️ Diagrama de Arquitetura

![Arquitetura Geral](docs/images/architecture.png)

> **Figura:** Fluxo completo, da ingestão à inferência em produção.

---

## 🎬 Demonstração em GIF

![Demonstração Rápida](docs/images/demo.gif)

> **GIF:** Exemplo de uso do `berm run` e resultados no notebook.

---

## ✨ Funcionalidades

- **Ingestão multimodal**: PDFs, imagens DICOM/PNG, áudio (Whisper), FHIR, web scraping.  
- **Pré-processamento**: limpeza, desidentificação, tokenização paralela, cache.  
- **Embeddings & Similaridade**: múltiplos provedores (OpenAI, HF, Vertex AI).  
- **Fine-tuning e Multi-Task**: T5/BART, QA, resumo, classificação.  
- **RAG Multimodal**: texto + imagem + Chain-of-Thought.  
- **Otimização**: quantização, pruning, hyperopt (W&B).  
- **Deploy**: FastAPI/Flask, Docker multi-stage, Kubernetes Helm.  
- **Monitoramento**: Prometheus, Grafana, alertas Slack/e-mail.  
- **Active Learning & Versionamento**: DVC/MLflow, sampling avançado.  
- **CLI**: `berm` — orquestra todo o pipeline.  

---

## 🏷️ Badges

- **CI Status**  
  ![CI Status](https://img.shields.io/github/actions/workflow/status/SEU_USUARIO/bermbriollmogy_portfolio_v2/ci.yml?branch=main)  
- **Coverage**  
  ![Coverage](https://img.shields.io/codecov/c/github/SEU_USUARIO/bermbriollmogy_portfolio_v2/main)  
- **License**  
  ![License](https://img.shields.io/github/license/SEU_USUARIO/bermbriollmogy_portfolio_v2)  

(adapte URLs para o seu repositório)

---

## 💾 Instalação

1. **Clone**  
   ```bash
   git clone https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2.git
   cd bermbriollmogy_portfolio_v2

	2.	Dependências

pip install poetry
poetry install


	3.	Configuração
	•	Copie config/credentials.template.json → config/credentials.json e preencha suas chaves.
	•	Copie .env.example → .env e ajuste variáveis de ambiente (OPENAI_API_KEY, etc.).

⸻

💻 CLI

Após instalação, o comando principal é berm.

# pipeline completo
berm run

# apenas ingestão multimodal
berm ingest --source ./data/pdfs --format pdf

# pré-processamento com cache
berm preprocess --input-dir ./chunks --cache-dir ./cache --workers 4

Para ver todos os subcomandos e opções:

berm --help
berm ingest --help

Consulte docs/cli.md para documentação completa.

⸻

🧪 Testes
	•	Unitários:

pytest tests/unit


	•	Integração:

pytest tests/integration



Cobertura garantida via Codecov.

⸻

🚀 CI/CD

Automatizado via GitHub Actions em .github/workflows/ci.yml:
	•	Jobs
	•	build: lint (flake8), instalação via Poetry, testes.
	•	docker: build & push de imagem Docker ao main.

Adapte secrets (DOCKER_USERNAME, DOCKER_PASSWORD) em Settings → Secrets.

⸻

🐳 Containerização

O src/deployment/Dockerfile utiliza multi-stage build para deixar a imagem enxuta:

# builder
FROM python:3.10-slim AS builder
...
# runtime
FROM python:3.10-slim
...
CMD ["uvicorn", "src.deployment.api:app", "--host", "0.0.0.0", "--port", "8000"]

Para testar localmente:

docker build -t bermbriollmogy:latest -f src/deployment/Dockerfile .
docker run -p 8000:8000 bermbriollmogy:latest


⸻

📚 Documentação e Recursos
	•	Guia de Setup: docs/setup_guide.md
	•	Uso & Exemplos: docs/usage.md
	•	Arquitetura: docs/architecture.md
	•	Tutoriais:
	•	Integração com GCP Secret Manager
	•	RAG multimodal com LangChain
	•	Monitoramento avançado com Grafana

⸻

🔗 Demonstrações
	•	Colab Demo: ▶️ Executar no Colab
	•	Streamlit App: 🔗 Acesse a demo

⸻

🗺️ Roadmap

Versão	Descrição	Data Estimada
v2.1	Integração com LangChain Agents	Q3 2025
v2.2	Suporte a banco de dados vetorial local	Q4 2025
v3.0	UI web full-featured (React + FastAPI)	Q1 2026
v3.1	Mobile SDK (iOS & Android)	Q2 2026


⸻

💬 Comunidade & Chat

Junte-se à nossa comunidade para discutir, tirar dúvidas e compartilhar ideias:
	•	Discord: https://discord.gg/seu-invite
	•	Slack: https://join.slack.com/t/seu-workspace/shared_invite/xyz

⸻

🤝 Contribuição

Contribuições são bem-vindas!
	1.	Fork e branch (feature/xyz).
	2.	Commit com convenção de mensagens.
	3.	PR com descrição clara e updates no CHANGELOG.md.

Veja o CONTRIBUTING.md para diretrizes completas.

⸻

📝 Licença

Este projeto está licenciado sob a MIT License.

⸻

📞 Contato & Call to Action

Gostou do projeto? Experimente agora:

git clone https://github.com/SEU_USUARIO/bermbriollmogy_portfolio_v2.git
cd bermbriollmogy_portfolio_v2
poetry install
berm run --dry-run

👉 Participe: abra issues, envie PRs, compartilhe feedback!
👉 Fale conosco: projetoml@seudominio.com.br

⸻

Obrigado por usar o Bermbriollmogy Portfolio v2! 🚀



----
## Seção 14d/14: Continuação & Próximos Passos
Esta é a conclusão do portfolio. A seguir, suas opções para continuar evoluindo:
1. **Projetos de Produção**: deploy em ambiente Kubernetes gerenciado, pipelines Airflow.
2. **Custom Agents**: use LangChain Agents para fluxos complexos (LlamaIndex, Tools).
3. **Pesquisa Avançada**: explore papers recentes em ArXiv sobre fine-tuning e RAG.
4. **Contribuição Open Source**: participe de projetos como Haystack, Transformers.
5. **Comunidade & Eventos**: compareça a conferências (NeurIPS, ACL) e meetups locais.
6. **Publicação**: escreva artigos ou blogs sobre seu pipeline médico-LLM.

**Interatividade**: selecione um próximo passo para ver detalhes, sugestões de links e comandos iniciais.

In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

steps = {
    'Produção em Kubernetes': (
        'Use Helm e GitOps para deploy contínuo. Cmd ex.: helm upgrade --install ...',
        ['https://kubernetes.io', 'https://helm.sh']
    ),
    'Custom Agents': (
        'Defina ferramentas e memória para agentes LangChain. Inicie com: from langchain.agents import initialize_agent',
        ['https://python.langchain.com/docs/get_started/agents']
    ),
    'Pesquisa Avançada': (
        'Leia artigos recentes sobre RAG e RLHF. Exemplo: https://arxiv.org/abs/2208.07442',
        ['https://arxiv.org/search/?query=retrieval+augmented']
    ),
    'Contribuição Open Source': (
        'Fork projetos, abra issues e PRs. Exemplo: haystack deepset/haystack no GitHub.',
        ['https://github.com/deepset-ai/haystack']
    ),
    'Comunidade & Eventos': (
        'Participe de NeurIPS, ACL, RLDM. Verifique CFPs e deadlines.',
        ['https://neurips.cc', 'https://aclanthology.org']
    ),
    'Publicação': (
        'Templates JupyterBook e Sphinx para documentación. Inicie: jupyter-book create mybook/',
        ['https://jupyter.org/jupyter-book']
    )
}

dropdown = widgets.Dropdown(options=list(steps.keys()), description='Próximo Passo:')
output = widgets.Output()

def show_step(change):
    with output:
        clear_output()
        key = change['new']
        desc, links = steps[key]
        display(Markdown(f"### {key}

{desc}

Links úteis:"))
        for link in links:
            display(Markdown(f"- [{link}]({link})"))

dropdown.observe(show_step, names='value')
display(dropdown, output)

In [None]:
# 1. Quantização Customizada
import torch

def dynamic_quantize_custom(model):
    # Cria uma cópia do modelo para não sobrescrever o original
    quantized_model = model.__class__.from_pretrained(model.config._name_or_path)
    quantized_model.load_state_dict(model.state_dict())
    # Converte pesos de cada Linear para INT8
    for name, module in quantized_model.named_modules():
        if isinstance(module, torch.nn.Linear):
            # Obtém os pesos originais
            weight = module.weight.data
            # Calcula escala e zero_point
            min_val, max_val = weight.min(), weight.max()
            qmin, qmax = -128, 127
            scale = (max_val - min_val) / (qmax - qmin)
            zero_point = (qmax + qmin) / 2 - max_val / scale
            # Quantiza
            q_weight = ((weight / scale) + zero_point).round().clamp(qmin, qmax).char()
            # Dequantiza para manter o tipo float (opcional)
            module.weight.data = ((q_weight.float() - zero_point) * scale)
    return quantized_model

# Exemplo de uso
# quant_model = dynamic_quantize_custom(model)
# quant_model.generate(input_ids)

In [None]:
# 2. Cache de Embeddings com TTL
import time

class EmbeddingCache:
    def __init__(self, ttl_seconds):
        self.ttl = ttl_seconds
        self.cache = {}  # chave: texto, valor: (embedding, timestamp)

    def get(self, key, compute_fn):
        now = time.time()
        # Remove entradas expiradas
        expired = [k for k, (_, ts) in self.cache.items() if now - ts > self.ttl]
        for k in expired:
            del self.cache[k]
        # Retorna existente ou computa novo
        if key in self.cache:
            emb, ts = self.cache[key]
            return emb
        emb = compute_fn()
        self.cache[key] = (emb, now)
        return emb

# Exemplo:
# cache = EmbeddingCache(ttl_seconds=3600)
# emb = cache.get('texto', lambda: model.embed('texto'))

In [None]:
# 3. Widget de Latência Interativo
import time
import ipywidgets as widgets
from IPython.display import display, clear_output
import plotly.express as px

# Função de medição de latência (placeholder)
def measure_latency(model_fn, prompt):
    start = time.time()
    _ = model_fn(prompt)
    return (time.time() - start) * 1000  # ms

# Widget interativo
model_names = ['model_a', 'model_b']
def get_model_fn(name):
    # Retorna uma função que gera com o modelo; aqui simulamos
    return lambda prompt: prompt[::-1]  # exemplo invertendo string

dropdown = widgets.SelectMultiple(options=model_names, description='Modelos:')
button = widgets.Button(description='Medir Latência')
out = widgets.Output()

def on_click(b):
    with out:
        clear_output()
        latencies = {'model': [], 'latency_ms': []}
        for name in dropdown.value:
            fn = get_model_fn(name)
            lat = measure_latency(fn, "Teste de latência")
            latencies['model'].append(name)
            latencies['latency_ms'].append(lat)
        df = __import__('pandas').DataFrame(latencies)
        fig = px.bar(df, x='model', y='latency_ms', title='Latência por Modelo')
        fig.show()

button.on_click(on_click)
display(widgets.VBox([dropdown, button, out]))

In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown, Code

# Define code challenges
challenges = {
    "Quantização Custom": {
        "desc": ("Implemente a quantização dinâmica convertendo pesos de um modelo para INT8 "
                 "e realizando inferência, sem usar `torch.quantization`."),
        "starter": ("def dynamic_quantize_custom(model):
"
                    "    # Sua implementação aqui
"
                    "    return quantized_model

"
                    "# Exemplo de uso:
"
                    "quant_model = dynamic_quantize_custom(model)
"
                    "quant_model(input_ids)")
    },
    "Cache de Embeddings": {
        "desc": ("Crie um cache de embeddings com dicionário que expira entradas após um tempo "
                 "configurável (e.g., TTL em segundos)."),
        "starter": ("class EmbeddingCache:
"
                    "    def __init__(self, ttl_seconds):
"
                    "        # Sua implementação aqui
"
                    "        pass

"
                    "    def get(self, key, compute_fn):
"
                    "        # Retorna embedding existente ou computa e armazena
"
                    "        pass

"
                    "# Uso:
"
                    "cache = EmbeddingCache(ttl_seconds=3600)
"
                    "emb = cache.get('texto', lambda: model.embed('texto'))")
    },
    "Widget de Latência": {
        "desc": ("Desenvolva um widget interativo em Jupyter que recebe uma lista de modelos "
                 "e mede suas latências em tempo real, exibindo um gráfico atualizado."),
        "starter": ("import time
"
                    "import ipywidgets as widgets
"
                    "from IPython.display import display, clear_output

"
                    "models = ['model1', 'model2']
"
                    "def measure_latency(model_name):
"
                    "    # Implementar medição
"
                    "    return latency_ms

"
                    "dropdown = widgets.SelectMultiple(options=models, description='Modelos')
"
                    "button = widgets.Button(description='Medir')
"
                    "output = widgets.Output()

"
                    "def on_click(b):
"
                    "    with output:
"
                    "        clear_output()
"
                    "        # Medir e plotar
"
                    "        pass

"
                    "button.on_click(on_click)
"
                    "display(dropdown, button, output)")
    }
}

# Widgets
sel = widgets.Dropdown(options=list(challenges.keys()), description='Desafio:')
btn = widgets.Button(description='Mostrar Desafio', button_style='info')
out = widgets.Output()

def show_challenge(b):
    with out:
        clear_output()
        key = sel.value
        info = challenges[key]
        display(Markdown(f"**Desafio:** {info['desc']}"))
        display(Code(info['starter'], language='python'))

btn.on_click(show_challenge)
display(widgets.VBox([sel, btn, out]))

In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown, Code

# Define hacks with description and code snippets
hacks = {
    "GPU Offload": {
        "desc": "Desloque pesos para CPU dinamicamente para economizar GPU memory.",
        "code": "from transformers import AutoModel\nmodel = AutoModel.from_pretrained(..., device_map='auto', offload_folder='offload')"
    },
    "Async Inference": {
        "desc": "Use chamadas assíncronas para maximizar throughput em batch inferência.",
        "code": "import asyncio\nfrom transformers import pipeline\npipe = pipeline('text-generation', model=...)\nasync def gen(prompts):\n    tasks = [asyncio.to_thread(pipe, p) for p in prompts]\n    return await asyncio.gather(*tasks)"
    },
    "Shared Embedding Cache": {
        "desc": "Reutilize embeddings comuns carregados em memória para múltiplas tarefas.",
        "code": "emb_cache = {}\ndef get_emb(text):\n    if text not in emb_cache:\n        emb_cache[text] = embed_model.encode(text)\n    return emb_cache[text]"
    },
    "Advanced Prompt Templating": {
        "desc": "Use loops e condicionais dentro do template para prompts dinâmicos.",
        "code": "template = '''For input: {input}\n{%- if len(ddx) > 1 %}\nList DDx:\n{% for d in ddx %}- {{d}}\n{% endfor %}{% endif %}'''\nfrom jinja2 import Template\nprompt = Template(template).render(input='...', ddx=['A','B'])"
    },
    "Control Tokens": {
        "desc": "Inclua tokens especiais como <|sep|>, <|startofplain|> para guiar a LLM.",
        "code": "prompt = '<|startoftext|>Paciente apresenta...<|sep|>Pergunta: ...'"
    }
}

# Widgets
hack_select = widgets.Dropdown(options=list(hacks.keys()), description='Hack:')
show_btn = widgets.Button(description='Mostrar Hack', button_style='info')
out = widgets.Output()

def show_hack(b):
    with out:
        clear_output()
        key = hack_select.value
        info = hacks[key]
        display(Markdown(f"**{key}**: {info['desc']}"))
        display(Code(info['code'], language='python'))

show_btn.on_click(show_hack)
display(widgets.VBox([hack_select, show_btn, out]))

In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Define aquecimento questions
questions = [
    {
        "q": "Qual método de quantização reduz dinamicamente os pesos para INT8?",
        "options": ["static_int8", "dynamic_int8", "prune_magnitude", "fp16"],
        "answer": "dynamic_int8",
        "explanation": "Quantização dinâmica (dynamic_int8) converte tensores de peso em INT8 em tempo de execução sem calibração estática."
    },
    {
        "q": "Qual técnica de active learning seleciona amostras com maior incerteza?",
        "options": ["margin_sampling", "uncertainty_sampling", "random_sampling", "entropy_sampling"],
        "answer": "uncertainty_sampling",
        "explanation": "Uncertainty sampling escolhe instâncias onde o modelo está menos confiante para rotulagem."
    },
    {
        "q": "Em RAG, qual etapa ocorre antes da geração pela LLM?",
        "options": ["Indexação FAISS", "Pré-processamento", "Recuperação de documentos", "Tokenização"],
        "answer": "Recuperação de documentos",
        "explanation": "Após indexar embeddings, recupera-se os documentos relevantes (retrieval) antes de gerar a resposta."
    }
]

question_index = 0

# Widgets
question_label = widgets.HTML()
options = widgets.RadioButtons(options=[], description='Opções:')
submit_btn = widgets.Button(description='Submeter', button_style='info')
feedback = widgets.Output()

def load_question(idx):
    question_label.value = f"<b>Pergunta {idx+1}:</b> {questions[idx]['q']}"
    options.options = questions[idx]['options']
    options.value = None
    with feedback:
        clear_output()

def on_submit(b):
    idx = question_index
    selected = options.value
    with feedback:
        clear_output()
        if selected == questions[idx]['answer']:
            display(Markdown(f"**Correto!** {questions[idx]['explanation']}" ))
        else:
            display(Markdown(f"**Incorreto.** {questions[idx]['explanation']}" ))
    # Move to next if exists
    global question_index
    if question_index < len(questions) - 1:
        question_index += 1
        load_question(question_index)
    else:
        with feedback:
            display(Markdown("**Aquecimento concluído!** Agora você está pronto para exercícios avançados."))

submit_btn.on_click(on_submit)

# Initialize
load_question(question_index)
display(widgets.VBox([question_label, options, submit_btn, feedback]))

In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Concept definitions
concepts = {
    'Embeddings & Similaridade': (
        "Representações vetoriais de texto/imagem que permitem comparar semântica "
        "via similaridade de cosseno.",
        "Exemplo: usar `sentence-transformers` para comparar casos clínicos similares."
    ),
    'Fine-Tuning & Multi-Task Learning': (
        "Ajuste de LLM pré-treinados em dados específicos, podendo treinar para múltiplas tarefas.",
        "Exemplo: treinar `T5` para QA e resumo simultaneamente."
    ),
    'RAG (Retrieval-Augmented Generation)': (
        "Combinação de recuperação de documentos relevantes com geração de texto pela LLM.",
        "Exemplo: indexar guidelines médicas e usar GPT para respostas contextualizadas."
    ),
    'Quantização & Pruning': (
        "Redução do tamanho do modelo e acelerar inferência via quantização e remoção de pesos.",
        "Exemplo: quantizar dinâmico INT8 e aplicar `prune` em camadas lineares."
    ),
    'Containerização & CI/CD': (
        "Encapsular serviço em container Docker e automatizar build/deploy com GitHub Actions.",
        "Exemplo: criar Dockerfile e workflow para push em registry e deploy em Kubernetes."
    ),
    'Monitoramento & Alertas': (
        "Coleta de métricas (Prometheus), visualização (Grafana) e alertas (Slack).",
        "Exemplo: alertar quando latência ultrapassa threshold definido."
    ),
    'Active Learning & Versionamento': (
        "Fluxo de anotação iterativa de dados, re-treinamento e controle de versões (DVC/MLflow).",
        "Exemplo: amostrar instâncias incertas e versionar datasets após rotulagem."
    ),
    'Prompt Management & Model Testing': (
        "Criação e gerenciamento de templates de prompt, comparação de respostas entre LLMs.",
        "Exemplo: usar TextAttack para test-over-testing e medir coerência entre modelos."
    )
}

dropdown = widgets.Dropdown(options=list(concepts.keys()), description='Conceito:')
output = widgets.Output()

def show_concept(change):
    with output:
        clear_output()
        name = change['new']
        definition, example = concepts[name]
        display(Markdown(f"### {name}

**Definição:** {definition}

**Exemplo de aplicação:** {example}"))

dropdown.observe(show_concept, names='value')
display(dropdown, output)

In [None]:
# Instalação de dependências para comparação de modelos
%pip install openai transformers sentence_transformers scikit-learn ipywidgets --quiet

In [None]:
import os
import json
import ipywidgets as widgets
from IPython.display import display, clear_output
import openai
from transformers import pipeline
from sentence_transformers import SentenceTransformer, util

# Load prompts
prompt_upload = widgets.FileUpload(accept='.json', multiple=False, description='Upload Prompts JSON')
model_select = widgets.SelectMultiple(
    options=['gpt-3.5-turbo', 'gpt-4', 'google/flan-t5-base', 'facebook/bart-large-cnn'],
    value=['gpt-3.5-turbo','google/flan-t5-base'],
    description='Modelos:')
run_btn = widgets.Button(description='▶️ Executar Testes', button_style='info')
out = widgets.Output()

# Semantic similarity model
sim_model = SentenceTransformer('all-MiniLM-L6-v2')

def evaluate_models(b):
    with out:
        clear_output()
        if not prompt_upload.value:
            print("Faça upload de um arquivo JSON com prompts.")
            return
        prompts = json.loads(next(iter(prompt_upload.value.values()))['content'])
        # prompts expected list of strings
        if not isinstance(prompts, list):
            print("JSON deve ser uma lista de prompts.")
            return
        results = {}
        for model_name in model_select.value:
            results[model_name] = []
            print(f"Chamando modelo {model_name}...")
            for prompt in prompts:
                if model_name.startswith('gpt'):
                    openai.api_key = os.getenv('OPENAI_API_KEY','')
                    resp = openai.ChatCompletion.create(
                        model=model_name,
                        messages=[{'role':'user','content': prompt}],
                        temperature=0.7,
                        max_tokens=150
                    )
                    text = resp.choices[0].message.content
                else:
                    gen = pipeline('text2text-generation', model=model_name, max_length=150)
                    text = gen(prompt)[0]['generated_text']
                results[model_name].append(text)
        # Display side by side
        for idx, prompt in enumerate(prompts):
            print(f"=== Prompt {idx+1}: {prompt} ===")
            for model_name, outputs in results.items():
                print(f"[{model_name}]: {outputs[idx][:200]}...")
            # Similarity between first two models
            if len(model_select.value) >= 2:
                a = sim_model.encode(results[model_select.value[0]][idx], convert_to_tensor=True)
                b = sim_model.encode(results[model_select.value[1]][idx], convert_to_tensor=True)
                score = util.pytorch_cos_sim(a,b).item()
                print(f"Similaridade semântica entre {model_select.value[0]} e {model_select.value[1]}: {score:.3f}")
            print()

run_btn.on_click(evaluate_models)
display(widgets.VBox([prompt_upload, model_select, run_btn, out]))

In [None]:
import json
import os
import ipywidgets as widgets
import openai
from IPython.display import display, clear_output

# Load or init prompt templates
templates = {}
tpl_file = 'prompt_templates.json'
if os.path.exists(tpl_file):
    with open(tpl_file, 'r', encoding='utf-8') as f:
        templates = json.load(f)

# Widgets
tpl_select = widgets.Dropdown(options=list(templates.keys()), description='Template:')
new_tpl_name = widgets.Text(description='Novo Nome:')
new_tpl_body = widgets.Textarea(description='Corpo (use {placeholder}):', layout=widgets.Layout(width='100%', height='80px'))
temp_slider = widgets.FloatSlider(value=0.7, min=0, max=1, step=0.05, description='Temperatura:')
max_tokens = widgets.IntSlider(value=150, min=10, max=1024, step=10, description='Max Tokens:')
fill_area = widgets.Textarea(description='Valores JSON:', layout=widgets.Layout(width='100%', height='80px'),
                              placeholder='{\"scenario\": \"...\"}')
save_tpl_btn = widgets.Button(description='Salvar Template', button_style='success')
run_btn = widgets.Button(description='▶️ Gerar com Prompt', button_style='info')
out = widgets.Output()

def save_template(b):
    name = new_tpl_name.value.strip()
    body = new_tpl_body.value.strip()
    if not name or not body:
        with out:
            clear_output()
            print("Nome e corpo do template obrigatórios.")
        return
    templates[name] = body
    with open(tpl_file, 'w', encoding='utf-8') as f:
        json.dump(templates, f, ensure_ascii=False, indent=2)
    tpl_select.options = list(templates.keys())
    with out:
        clear_output()
        print(f"Template '{name}' salvo.")

def run_prompt(b):
    with out:
        clear_output()
        tpl = templates.get(tpl_select.value)
        if not tpl:
            print("Selecione um template válido.")
            return
        try:
            values = json.loads(fill_area.value)
            prompt = tpl.format(**values)
        except Exception as e:
            print("Erro ao aplicar placeholders:", e)
            return
        # Call LLM
        openai.api_key = os.getenv('OPENAI_API_KEY','')
        try:
            resp = openai.ChatCompletion.create(
                model='gpt-3.5-turbo',
                messages=[{'role':'user','content': prompt}],
                temperature=temp_slider.value,
                max_tokens=max_tokens.value
            )
            print("=== Prompt ===")
            print(prompt)
            print("\n=== Resposta ===")
            print(resp.choices[0].message.content)
        except Exception as e:
            print("Erro na chamada da LLM:", e)

save_tpl_btn.on_click(save_template)
run_btn.on_click(run_prompt)

display(widgets.VBox([
    widgets.HBox([tpl_select]),
    widgets.Label("Criar Novo Template:"),
    new_tpl_name, new_tpl_body, save_tpl_btn,
    widgets.Label("Valores de preenchimento (JSON):"), fill_area,
    widgets.HBox([temp_slider, max_tokens]),
    run_btn, out
]))

In [None]:
# Instalação de dependências para data augmentation
%pip install nlpaug fasttext transformers sentencepiece ipywidgets --quiet

In [None]:
import os
import json
import nlpaug.augmenter.word as naw
import ipywidgets as widgets
from IPython.display import display, clear_output

# Load datasets
def load_data(name):
    if os.path.exists(f'{name}.json'):
        with open(f'{name}.json','r',encoding='utf-8') as f:
            return json.load(f)
    return {}

train_data = load_data('train')
valid_data = load_data('valid')

# Widgets
dataset_choice = widgets.Dropdown(options=['train','valid'], description='Dataset:')
methods = widgets.SelectMultiple(
    options=[
        'back_translation', 'synonym', 'contextual', 'random_deletion', 'random_insertion'
    ],
    value=['synonym'],
    description='Métodos:')
bt_src = widgets.Dropdown(options=['pt','en'], value='pt', description='BT Source:')
bt_mid = widgets.Dropdown(options=['en','es'], value='en', description='BT Mid:')
syn_model = widgets.Dropdown(options=['wordnet','contextual'], value='wordnet', description='Syn Model:')
insert_prob = widgets.FloatSlider(value=0.1, min=0.01, max=0.5, step=0.01, description='Insert P:')
delete_prob = widgets.FloatSlider(value=0.1, min=0.01, max=0.5, step=0.01, description='Delete P:')
n_aug = widgets.IntSlider(value=2, min=1, max=5, step=1, description='Per Entrada:')
augment_btn = widgets.Button(description='▶️ Augmentar', button_style='success')
out = widgets.Output()

# Initialize augmenters lazily
def get_aug(method):
    if method == 'back_translation':
        return naw.BackTranslationAug(src_lang=bt_src.value, mid_lang=bt_mid.value)
    if method == 'synonym':
        return naw.SynonymAug(aug_src=syn_model.value)
    if method == 'contextual':
        return naw.ContextualWordEmbsAug(model_path='bert-base-uncased', action="substitute")
    if method == 'random_deletion':
        return naw.RandomWordAug(action="delete", aug_p=delete_prob.value)
    if method == 'random_insertion':
        return naw.RandomWordAug(action="insert", aug_p=insert_prob.value)
    return None

def augment_data(b):
    with out:
        clear_output()
        ds_name = dataset_choice.value
        data = train_data if ds_name=='train' else valid_data
        if not data:
            print(f"Dataset '{ds_name}' vazio ou não encontrado.")
            return
        aug_data = {}
        next_id = int(max(data.keys(), default='0')) + 1
        # copy original
        aug_data.update(data)
        # apply augmentation
        for cid, entry in data.items():
            text = entry.get('scenario','')
            for i in range(n_aug.value):
                aug_text = text
                for method in methods.value:
                    aug = get_aug(method)
                    if aug:
                        aug_text = aug.augment(aug_text)
                new_entry = entry.copy()
                new_entry['scenario'] = aug_text
                aug_data[str(next_id)] = new_entry
                next_id += 1
        # save augmented
        out_file = f"{ds_name}_aug.json"
        with open(out_file,'w',encoding='utf-8') as f:
            json.dump(aug_data, f, ensure_ascii=False, indent=2)
        print(f"Aumento completo: {len(aug_data)-len(data)} exemplos gerados.")
        print(f"Dataset aumentado salvo em '{out_file}'.")
        # preview
        sample_keys = list(aug_data.keys())[-min(5, len(aug_data))]
        print("Amostras geradas:")
        for k in sample_keys:
            print(f"{k}: {aug_data[k]['scenario']}")

augment_btn.on_click(augment_data)
display(widgets.VBox([
    dataset_choice, methods,
    widgets.HBox([bt_src, bt_mid, syn_model]),
    widgets.HBox([insert_prob, delete_prob]), n_aug,
    augment_btn, out
]))

In [None]:
import json
import os
import ipywidgets as widgets
from IPython.display import display, clear_output

# Load or initialize JSON datasets
def load_json(name):
    if os.path.exists(f'{name}.json'):
        with open(f'{name}.json','r',encoding='utf-8') as f:
            return json.load(f)
    return {}

train_data = load_json('train')
valid_data = load_json('valid')

# Widgets for case entry
dataset_select = widgets.RadioButtons(options=['train','valid'], description='Dataset:')
scenario = widgets.Text(description='Cenário:', placeholder='Dor precordial há 47 min')
ddx = widgets.Text(description='3 DDx:', placeholder='IAM, Dissecção aorta, DRGE')
cd = widgets.Text(description='Condutas/Exames:', placeholder='ECG, marcadores, estratificação, SSVV, medicações')
question = widgets.Text(description='Pergunta:', placeholder='Quanto tempo de dor?')
answer = widgets.Text(description='Resposta:', placeholder='Agora já 48 min')
add_btn = widgets.Button(description='Adicionar Caso', button_style='success')
out = widgets.Output()

def add_case(b):
    with out:
        clear_output()
        ds = train_data if dataset_select.value=='train' else valid_data
        # generate new ID
        case_id = str(int(max(ds.keys(), default='0')) + 1)
        # construct entry
        entry = {
            'scenario': scenario.value,
            'ddx': [d.strip() for d in ddx.value.split(',') if d.strip()],
            'cd': [c.strip() for c in cd.value.split(',') if c.strip()],
            'follow_up': {question.value: answer.value}
        }
        ds[case_id] = entry
        # save JSON
        with open(f'{dataset_select.value}.json','w',encoding='utf-8') as f:
            json.dump(ds, f, ensure_ascii=False, indent=2)
        print(f"Caso {case_id} adicionado ao '{dataset_select.value}.json'.")
        # show current dataset size
        print(f"Total train: {len(train_data)} casos; Total valid: {len(valid_data)} casos.")

add_btn.on_click(add_case)
display(dataset_select, scenario, ddx, cd, question, answer, add_btn, out)

In [None]:
# Instalação de dependências para visualização de métricas
%pip install mlflow pandas plotly ipywidgets --quiet

In [None]:
import mlflow
import pandas as pd
import plotly.express as px
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets to select experiment and runs
client = mlflow.tracking.MlflowClient()
experiments = client.list_experiments()
exp_options = {exp.name: exp.experiment_id for exp in experiments}
exp_select = widgets.Dropdown(options=exp_options, description='Experimento:')
fetch_btn = widgets.Button(description='Buscar Runs', button_style='info')
runs_select = widgets.SelectMultiple(description='Runs:', rows=5)
plot_btn = widgets.Button(description='Plotar Métricas', button_style='success')
out = widgets.Output()

def fetch_runs(b):
    with out:
        clear_output()
        exp_id = exp_select.value
        runs = client.search_runs([exp_id], filter_string="", max_results=50, order_by=["attributes.start_time DESC"])
        run_opts = {run.info.run_id: run.data.metrics for run in runs}
        runs_select.options = run_opts
        print(f"Encontradas {len(runs)} runs para experimento '{exp_select.label}'.")

def plot_metrics(b):
    with out:
        clear_output()
        selected = runs_select.value
        if not selected:
            print("Selecione ao menos uma run.")
            return
        df_list = []
        for run_id, metrics in runs_select.options:
            if run_id in selected:
                for metric, value in metrics.items():
                    df_list.append({'run_id': run_id, 'metric': metric, 'value': value})
        df = pd.DataFrame(df_list)
        if df.empty:
            print("Nenhum dado de métricas disponível.")
            return
        fig = px.line(df, x='metric', y='value', color='run_id', markers=True, title='Comparação de Métricas por Run')
        fig.show()

fetch_btn.on_click(fetch_runs)
plot_btn.on_click(plot_metrics)

display(widgets.VBox([exp_select, fetch_btn, runs_select, plot_btn, out]))

In [None]:
# Instalação de dependências de AL avançado e versionamento
%pip install modAL scikit-learn dvc mlflow ipywidgets pandas --quiet

In [None]:
import os
import json
import pandas as pd
from datetime import datetime
import mlflow
import dvc.api
import ipywidgets as widgets
from modAL.models import ActiveLearner
from modAL.uncertainty import entropy_sampling
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_extraction.text import TfidfVectorizer
from IPython.display import display, clear_output

# Widgets
sampling_strategy = widgets.Select(
    options=['uncertainty', 'entropy', 'ensemble'],
    value='entropy', description='Estratégia:')
version_btn = widgets.Button(description='▶️ Salvar Versão', button_style='success')
out = widgets.Output()

# Initialize DVC/MLflow
mlflow.set_experiment('bemrbriollmogy_AL')
dvc_repo = dvc.api.Repo()

def run_active_learning(b):
    with out:
        clear_output()
        # Placeholder: Load unlabeled and train as earlier sections
        # Simulate a batch
        print(f"Executando AL com estratégia {sampling_strategy.value} (simulado).")

def save_version(b):
    with out:
        clear_output()
        timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
        version_name = f"al_{timestamp}"
        # DVC add datasets
        os.system('dvc add train.json valid.json unlabeled.json')
        # Git commit (assuming git repo)
        os.system(f'git add . && git commit -m "AL version {version_name}"')
        # MLflow log
        mlflow.start_run(run_name=version_name)
        mlflow.log_param('sampling_strategy', sampling_strategy.value)
        mlflow.log_artifact('train.json')
        mlflow.log_artifact('valid.json')
        mlflow.log_artifact('unlabeled.json')
        mlflow.end_run()
        print(f"Versão '{version_name}' salva no DVC e MLflow.")

display(widgets.VBox([sampling_strategy, version_btn, out]))
version_btn.on_click(save_version)

In [None]:
# Instalação de dependências para relatórios
%pip install plotly weasyprint pandas schedule ipywidgets requests --quiet

In [None]:
import os
import time
import schedule
import pandas as pd
import plotly.express as px
import requests
from weasyprint import HTML
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Widgets
source = widgets.Dropdown(options=['Prometheus','W&B'], description='Fonte:')
period = widgets.IntSlider(value=24, min=1, max=168, step=1, description='Período (h):')
fmt = widgets.Select(options=['HTML','PDF','CSV'], description='Formato:')
schedule_time = widgets.TimePicker(value=time.strftime("%H:00"), description='Agendar:')
email = widgets.Text(description='Enviar p/ email:')
generate_btn = widgets.Button(description='Gerar Relatório', button_style='info')
schedule_btn = widgets.Button(description='▶️ Agendar Relatório', button_style='success')
out = widgets.Output()

def fetch_prometheus(hours):
    url = f"http://localhost:9090/api/v1/query_range"
    end = int(time.time())
    start = end - hours*3600
    params = {'query':'request_latency_ms','start':start,'end':end,'step':str(int(hours*60))+'m'}
    resp = requests.get(url, params=params).json()['data']['result'][0]['values']
    df = pd.DataFrame(resp, columns=['timestamp','latency'])
    df['timestamp'] = pd.to_datetime(df['timestamp'], unit='s')
    return df

def fetch_wandb(hours):
    # Placeholder: requires W&B API integration
    # Simulate data
    idx = pd.date_range(end=pd.Timestamp.now(), periods=hours, freq='H')
    df = pd.DataFrame({'timestamp': idx, 'metric': [i*0.1 for i in range(len(idx))]})
    return df

def generate_report(_):
    with out:
        clear_output()
        hrs = period.value
        if source.value=='Prometheus':
            df = fetch_prometheus(hrs)
            title = 'Latency over last '+str(hrs)+'h'
            fig = px.line(df, x='timestamp', y='latency', title=title)
        else:
            df = fetch_wandb(hrs)
            title = 'W&B metric over last '+str(hrs)+'h'
            fig = px.line(df, x='timestamp', y='metric', title=title)
        # Export
        if fmt.value=='CSV':
            fname = 'report.csv'
            df.to_csv(fname, index=False)
            print("CSV saved:", fname)
        elif fmt.value=='HTML':
            html = fig.to_html(full_html=True)
            fname = 'report.html'
            with open(fname,'w') as f: f.write(html)
            print("HTML saved:", fname)
        else: # PDF
            html = fig.to_html(full_html=True)
            fname = 'report.pdf'
            HTML(string=html).write_pdf(fname)
            print("PDF saved:", fname)
        # Optionally send email (placeholder)
        if email.value:
            print(f"Enviando relatório para {email.value} (simulado).")

generate_btn.on_click(generate_report)

def schedule_report(_):
    t = schedule_time.value.strftime("%H:%M")
    schedule.every().day.at(t).do(generate_report, None)
    with out:
        clear_output()
        print(f"Relatório agendado diariamente às {t}.")

schedule_btn.on_click(schedule_report)

# Display widgets
display(widgets.VBox([source, period, fmt, email,
                      widgets.HBox([generate_btn, schedule_btn]), out]))

In [None]:
# Instalação de dependências de monitoramento
%pip install prometheus_client slack_sdk requests schedule ipywidgets --quiet

In [None]:
import os
import time
import threading
import requests
import schedule
import ipywidgets as widgets
from prometheus_client import Summary, Counter, start_http_server
from slack_sdk import WebClient
from IPython.display import display, clear_output, Markdown

# Widgets configuration
prom_url = widgets.Text(value='http://localhost:9090', description='Prometheus URL:')
grafana_url = widgets.Text(value='http://localhost:3000', description='Grafana URL:')
dashboard_id = widgets.Text(value='1', description='Grafana Dashboard ID:')
slack_webhook = widgets.Text(value=os.getenv('SLACK_WEBHOOK', ''), description='Slack Webhook:')
latency_threshold = widgets.FloatText(value=500, description='Latency Threshold (ms):')
error_threshold = widgets.IntText(value=5, description='Error Count Threshold:')
start_btn = widgets.Button(description='▶️ Iniciar Monitoramento', button_style='success')
out = widgets.Output()

# Metrics placeholders
REQUEST_LATENCY = Summary('request_latency_ms', 'Latency of requests in ms')
ERROR_COUNTER = Counter('error_count', 'Number of errors')

def fetch_metrics():
    # Query Prometheus for recent metrics
    try:
        latency_q = f"{prom_url.value}/api/v1/query?query=request_latency_ms"
        error_q = f"{prom_url.value}/api/v1/query?query=error_count"
        lat_resp = requests.get(latency_q).json()
        err_resp = requests.get(error_q).json()
        latest_latency = float(lat_resp['data']['result'][0]['value'][1])
        latest_errors = int(float(err_resp['data']['result'][0]['value'][1]))
        return latest_latency, latest_errors
    except:
        return None, None

def send_slack_alert(message):
    client = WebClient(token=None)
    requests.post(slack_webhook.value, json={'text': message})

def monitor():
    with out:
        clear_output()
        latency, errors = fetch_metrics()
        display(Markdown(f"**Current Latency:** {latency} ms
**Error Count:** {errors}"))
        if latency and latency > latency_threshold.value:
            send_slack_alert(f":warning: Latency above threshold: {latency} ms")
        if errors and errors > error_threshold.value:
            send_slack_alert(f":red_circle: Error count high: {errors}")

def start_monitoring(b):
    with out:
        clear_output()
        display(Markdown("**Monitoramento iniciado.**"))
    # Start Prometheus client to export in-process metrics
    start_http_server(8000)
    # Schedule fetch every minute
    schedule.every(1).minutes.do(monitor)
    def run_schedule():
        while True:
            schedule.run_pending()
            time.sleep(1)
    thread = threading.Thread(target=run_schedule, daemon=True)
    thread.start()

start_btn.on_click(start_monitoring)
display(widgets.VBox([prom_url, grafana_url, dashboard_id, slack_webhook,
                      latency_threshold, error_threshold,
                      start_btn, out]))

In [None]:
import os
import yaml
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets for CI/CD & Kubernetes
repo = widgets.Text(description='Repo (user/repo):', value='username/berm-repo')
branch = widgets.Text(description='Branch:', value='main')
registry = widgets.Text(description='Docker Registry:', value='docker.io/username')
image = widgets.Text(description='Image Name:', value='bermbriollmogy:latest')
chart_name = widgets.Text(description='Helm Chart:', value='berm-chart')
namespace = widgets.Text(description='Namespace:', value='default')
gen_btn = widgets.Button(description='Gerar CI e Helm', button_style='info')
output = widgets.Output()

def generate_ci_helm(b):
    with output:
        clear_output()
        # GitHub Actions workflow
        ci = {
            'name': 'CI/CD Pipeline',
            'on': {'push': {'branches': [branch.value]}},
            'jobs': {
                'build_push': {
                    'runs-on': 'ubuntu-latest',
                    'steps': [
                        {'uses': 'actions/checkout@v2'},
                        {'name': 'Set up QEMU', 'uses': 'docker/setup-qemu-action@v2'},
                        {'name': 'Set up Docker Buildx', 'uses': 'docker/setup-buildx-action@v2'},
                        {'name': 'Login to Registry', 'uses': 'docker/login-action@v2',
                         'with': {'registry': registry.value, 'username': '${{secrets.DOCKER_USER}}', 'password': '${{secrets.DOCKER_PASS}}'}},
                        {'name': 'Build and Push', 'uses': 'docker/build-push-action@v3',
                         'with': {'context': '.', 'push': True, 'tags': f"{registry.value}/{image.value}"}}
                    ]
                }
            }
        }
        # Write workflow file
        os.makedirs('.github/workflows', exist_ok=True)
        with open('.github/workflows/ci-cd.yml','w') as f:
            yaml.dump(ci, f)
        print("✅ GitHub Actions workflow gerado em .github/workflows/ci-cd.yml")
        # Helm Chart skeleton
        chart_dir = f'charts/{chart_name.value}'
        os.makedirs(chart_dir, exist_ok=True)
        chart_yaml = {
            'apiVersion': 'v2',
            'name': chart_name.value,
            'version': '0.1.0',
            'appVersion': image.value
        }
        values_yaml = {
            'image': {'repository': f"{registry.value}/{image.value.split(':')[0]}", 'tag': image.value.split(':')[1]},
            'service': {'type': 'ClusterIP', 'port': 80},
            'ingress': {'enabled': False}
        }
        with open(f'{chart_dir}/Chart.yaml','w') as f:
            yaml.dump(chart_yaml, f)
        with open(f'{chart_dir}/values.yaml','w') as f:
            yaml.dump(values_yaml, f)
        print(f"✅ Helm Chart skeleton criado em {chart_dir}/ (Chart.yaml e values.yaml)")
        print(f"Use 'helm install {chart_name.value} {chart_dir} -n {namespace.value}' para deploy.")

gen_btn.on_click(generate_ci_helm)
display(widgets.VBox([repo, branch, registry, image, chart_name, namespace, gen_btn, output]))

In [None]:
import ipywidgets as widgets
import subprocess
import os
from IPython.display import display, clear_output, Markdown

# Widgets de configuração
base_image = widgets.Text(value='python:3.9-slim', description='Base Image:')
model_dir = widgets.Text(value='mt_adv_model', description='Model Dir:')
service_file = widgets.Text(value='app.py', description='Service File:')
port = widgets.IntText(value=8080, description='Porta:')
image_tag = widgets.Text(value='berm_v2:latest', description='Image Tag:')
gen_btn = widgets.Button(description='Gerar Dockerfile', button_style='primary')
build_btn = widgets.Button(description='Build Image', button_style='info')
run_btn = widgets.Button(description='Run Container', button_style='success')
test_btn = widgets.Button(description='Test Endpoints', button_style='warning')
out = widgets.Output()

def generate_dockerfile(b):
    with out:
        clear_output()
        df = f"""FROM {base_image.value}
WORKDIR /app
COPY {model_dir.value} /app/model
COPY {service_file.value} /app/{service_file.value}
RUN pip install fastapi uvicorn transformers torch prometheus-client
EXPOSE {port.value}
CMD ["uvicorn", "{service_file.replace('.py','')}:app", "--host", "0.0.0.0", "--port", "{port.value}"]"""
        with open('Dockerfile','w') as f:
            f.write(df)
        print("✅ Dockerfile gerado:")
        print(Markdown(f"```
{df}
```"))

def build_image(b):
    with out:
        clear_output()
        tag = image_tag.value
        print(f"Building image {tag}...")
        subprocess.run(['docker','build','-t',tag,'.'], check=False)
        print("✅ Imagem construída.")

def run_container(b):
    with out:
        clear_output()
        tag = image_tag.value
        print(f"Running container {tag} on port {port.value}...")
        subprocess.run(['docker','run','-d','-p',f"{port.value}:{port.value}",tag], check=False)
        print("✅ Container em execução.")

def test_endpoints(b):
    with out:
        clear_output()
        import requests
        base = f"http://localhost:{port.value}"
        endpoints = ['/health','/metrics','/predict']
        for ep in endpoints:
            try:
                if ep == '/predict':
                    resp = requests.post(base+ep, json={'input':'test'})
                else:
                    resp = requests.get(base+ep)
                print(f"{ep} -> status {resp.status_code}")
            except Exception as e:
                print(f"{ep} -> erro: {e}")

gen_btn.on_click(generate_dockerfile)
build_btn.on_click(build_image)
run_btn.on_click(run_container)
test_btn.on_click(test_endpoints)

display(widgets.VBox([
    base_image, model_dir, service_file, port, image_tag,
    widgets.HBox([gen_btn, build_btn, run_btn, test_btn]),
    out
]))

In [None]:
# Instalação de dependências para quantização e pruning
%pip install torch transformers ipywidgets --quiet

In [None]:
import os
import time
import torch
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
from torch.nn.utils import prune
import ipywidgets as widgets
from IPython.display import display, clear_output
import pandas as pd

# Widgets
model_dir = widgets.Text(value='ft_basic_model', description='Model Dir:')
methods = widgets.SelectMultiple(
    options=['dynamic_int8', 'static_int8', 'prune_magnitude'],
    value=['dynamic_int8', 'prune_magnitude'],
    description='Methods:')
prune_amount = widgets.FloatSlider(value=0.2, min=0.0, max=0.9, step=0.1, description='Prune Amount:')
run_btn = widgets.Button(description='▶️ Apply', button_style='success')
out = widgets.Output()

def measure_latency(model, tokenizer):
    sample = "cenario de teste"
    inputs = tokenizer(sample, return_tensors='pt')
    start = time.time()
    _ = model.generate(**inputs)
    return (time.time() - start) * 1000

def on_apply(b):
    with out:
        clear_output()
        base = model_dir.value
        tokenizer = AutoTokenizer.from_pretrained(base)
        model = AutoModelForSeq2SeqLM.from_pretrained(base)
        report = []
        # Original
        orig_size = os.path.getsize(os.path.join(base, 'pytorch_model.bin')) / 1e6
        orig_lat = measure_latency(model, tokenizer)
        report.append({'method': 'original', 'size_mb': orig_size, 'latency_ms': orig_lat})
        # Apply methods
        for m in methods.value:
            if m == 'dynamic_int8':
                qm = torch.quantization.quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8)
                name = f"{base}_dyn_int8"
                qm.save_pretrained(name)
                size = os.path.getsize(os.path.join(name, 'pytorch_model.bin')) / 1e6
                lat = measure_latency(qm, tokenizer)
                report.append({'method': 'dynamic_int8', 'size_mb': size, 'latency_ms': lat})
            elif m == 'static_int8':
                # Static quantization requires model preparation; using dynamic as placeholder
                qs = torch.quantization.quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8)
                name = f"{base}_stat_int8"
                qs.save_pretrained(name)
                size = os.path.getsize(os.path.join(name, 'pytorch_model.bin')) / 1e6
                lat = measure_latency(qs, tokenizer)
                report.append({'method': 'static_int8', 'size_mb': size, 'latency_ms': lat})
            elif m == 'prune_magnitude':
                # Magnitude pruning on linear layers
                pruned_model = AutoModelForSeq2SeqLM.from_pretrained(base)
                parameters_to_prune = []
                for module in pruned_model.modules():
                    if isinstance(module, torch.nn.Linear):
                        parameters_to_prune.append((module, 'weight'))
                prune.global_unstructured(
                    parameters_to_prune,
                    pruning_method=prune.L1Unstructured,
                    amount=prune_amount.value
                )
                name = f"{base}_pruned_{int(prune_amount.value*100)}"
                pruned_model.save_pretrained(name)
                size = os.path.getsize(os.path.join(name, 'pytorch_model.bin')) / 1e6
                lat = measure_latency(pruned_model, tokenizer)
                report.append({'method': f'prune_{int(prune_amount.value*100)}%', 'size_mb': size, 'latency_ms': lat})
        df = pd.DataFrame(report)
        display(df)
        df.to_csv('quant_prune_report.csv', index=False)
        print("✅ Report saved as quant_prune_report.csv")

run_btn.on_click(on_apply)
display(widgets.VBox([model_dir, methods, prune_amount, run_btn, out]))

In [None]:
# Instalação de dependências
%pip install optuna wandb transformers datasets accelerate ipywidgets --quiet

In [None]:
import os
import optuna
import wandb
import ipywidgets as widgets
from IPython.display import display, clear_output

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, TrainingArguments, Trainer
from datasets import load_from_disk

# Widgets for configuration
model_dir = widgets.Dropdown(
    options=['ft_basic_model', 'mt_adv_model'],
    value='ft_basic_model',
    description='Model Dir:')
train_path = widgets.Text(value='ft_data/train', description='Train Path:')
valid_path = widgets.Text(value='ft_data/valid', description='Valid Path:')
n_trials = widgets.IntText(value=10, description='Trials:')
lr_range = widgets.FloatRangeSlider(
    value=[1e-5, 5e-5], min=1e-6, max=1e-3, step=1e-6, description='LR Range:')
batch_sizes = widgets.Text(value='4,8,16', description='Batch Sizes:')
wd_range = widgets.FloatRangeSlider(
    value=[0.0, 0.01], min=0.0, max=0.1, step=0.001, description='WD Range:')
sampler = widgets.Dropdown(options=['TPE','Random'], value='TPE', description='Sampler:')
use_wandb = widgets.Checkbox(value=True, description='Use W&B')
run_btn = widgets.Button(description='▶️ Run Optimization', button_style='info')
out = widgets.Output()

def objective(trial):
    # Start W&B run
    if use_wandb.value:
        wandb.init(project='berm-opt', reinit=True)
    # Suggest params
    lr = trial.suggest_loguniform('learning_rate', lr_range.value[0], lr_range.value[1])
    bs = int(trial.suggest_categorical('batch_size', [int(x) for x in batch_sizes.value.split(',')]))
    wd = trial.suggest_loguniform('weight_decay', wd_range.value[0], wd_range.value[1])
    epochs = trial.suggest_int('epochs', 1, 3)
    # Load datasets
    train_ds = load_from_disk(train_path.value)
    valid_ds = load_from_disk(valid_path.value)
    # Load model and tokenizer
    tok = AutoTokenizer.from_pretrained(model_dir.value)
    model = AutoModelForSeq2SeqLM.from_pretrained(model_dir.value)
    # Define training args
    args = TrainingArguments(
        output_dir=f"opt_{trial.number}",
        num_train_epochs=epochs,
        per_device_train_batch_size=bs,
        per_device_eval_batch_size=bs,
        learning_rate=lr,
        weight_decay=wd,
        evaluation_strategy='steps',
        eval_steps=50,
        logging_steps=20,
        save_strategy='no',
        load_best_model_at_end=True,
        report_to=['wandb'] if use_wandb.value else []
    )
    # Initialize Trainer
    trainer = Trainer(
        model=model,
        args=args,
        train_dataset=train_ds,
        eval_dataset=valid_ds,
        tokenizer=tok
    )
    # Train
    trainer.train()
    # Evaluate
    metrics = trainer.evaluate()
    loss = metrics.get('eval_loss')
    # Log to W&B
    if use_wandb.value:
        wandb.log({'eval_loss': loss, 'learning_rate': lr, 'batch_size': bs, 'weight_decay': wd})
        wandb.finish()
    # Report
    return loss

def run_optimization(b):
    with out:
        clear_output()
        # Configure sampler
        if sampler.value == 'TPE':
            sampler_obj = optuna.samplers.TPESampler()
        else:
            sampler_obj = optuna.samplers.RandomSampler()
        study = optuna.create_study(
            direction='minimize',
            sampler=sampler_obj
        )
        study.optimize(objective, n_trials=n_trials.value)
        print("Best params:", study.best_params)
        df = study.trials_dataframe(attrs=('number','value','params'))
        display(df.head())
        df.to_csv('optuna_study.csv', index=False)
        print("Results saved to optuna_study.csv")

run_btn.on_click(run_optimization)
display(widgets.VBox([
    model_dir, train_path, valid_path,
    n_trials, lr_range, batch_sizes, wd_range,
    sampler, use_wandb, run_btn, out
]))

In [None]:
import os
import io
import torch
import faiss
import numpy as np
from PIL import Image
from transformers import AutoTokenizer, AutoModel, CLIPProcessor, CLIPModel
import openai
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Widgets for detailed chain-of-thought
question_input = widgets.Textarea(
    description='Pergunta:',
    layout=widgets.Layout(width='100%', height='60px'),
    placeholder='Descreva a pergunta clínica aqui...'
)
style_select = widgets.Dropdown(
    options=['Breve', 'Detalhado'],
    value='Detalhado',
    description='Estilo:'
)
run_btn = widgets.Button(description='▶️ Gerar Raciocínio', button_style='info')
out = widgets.Output()

# Assume index, texts, images from Section 7a are available globally

def generate_chain_of_thought(b):
    with out:
        clear_output()
        q = question_input.value.strip()
        if not q:
            print("Insira uma pergunta para gerar o raciocínio.")
            return
        # Retrieve context as in Section 7a
        # For simplicity, reuse last index build if exists, else error
        try:
            idx, text_embs, img_embs  # use variables from 7a
            texts  # list of texts
            images  # list of PIL images
        except NameError:
            print("Execute a Seção 7a primeiro para construir o índice multimodal.")
            return
        # Embed question with text embedder
        tokenizer = AutoTokenizer.from_pretrained(embed_text_model.value)
        model = AutoModel.from_pretrained(embed_text_model.value)
        inputs = tokenizer(q, return_tensors='pt', truncation=True, padding=True)
        with torch.no_grad():
            q_emb = model(**inputs).last_hidden_state.mean(dim=1).cpu().numpy()
        faiss.normalize_L2(q_emb)
        D, I = idx.search(q_emb, top_k.value)
        # Prepare context snippet markdown
        md = "### Contexto Recuperado:
"
        for i in I[0]:
            if i < len(texts):
                md += f"- Texto: {texts[i][:200]}...
"
            else:
                img = images[i - len(texts)]
                # Save image temporarily
                img_path = f"retrieved_{i}.png"
                img.save(img_path)
                md += f"- Imagem: ![]({img_path})
"
        md += "
"
        display(Markdown(md))
        # Prepare OpenAI prompt with chain-of-thought instruction
        openai.api_key = os.getenv('OPENAI_API_KEY','')
        instruction = "Forneça um raciocínio passo-a-passo" + (" e detalhado." if style_select.value=='Detalhado' else ".")
        full_prompt = f"{instruction}\nContexto:\n"
        for i in I[0]:
            if i < len(texts):
                full_prompt += texts[i] + "\n"
        full_prompt += f"Pergunta: {q}"
        # Call API
        try:
            resp = openai.ChatCompletion.create(
                model=llm_model.value,
                messages=[
                    {'role':'system','content':'Você é um assistente médico que explica seu raciocínio.'},
                    {'role':'user','content':full_prompt}
                ],
                temperature=0.7,
                max_tokens=512
            )
            answer = resp.choices[0].message.content
            print("### Raciocínio Gerado:
")
            print(answer)
        except Exception as e:
            print("Erro na chamada OpenAI:", e)

run_btn.on_click(generate_chain_of_thought)
display(widgets.VBox([question_input, style_select, run_btn, out]))

In [None]:
# Instalação de dependências para RAG multimodal
%pip install faiss-cpu transformers openai pillow torchvision timm ipywidgets --quiet

import io
import os
import torch
import faiss
import numpy as np
from PIL import Image
from transformers import AutoTokenizer, AutoModel, CLIPProcessor, CLIPModel, pipeline
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets for uploading modalities
text_upload = widgets.FileUpload(accept='.txt,.csv', multiple=False, description='Texto clínico')
image_upload = widgets.FileUpload(accept='.png,.jpg,.jpeg,.dcm', multiple=True, description='Imagens')
embed_text_model = widgets.Text(value='sentence-transformers/all-MiniLM-L6-v2', description='Text Embedder:')
embed_image_model = widgets.Text(value='openai/clip-vit-base-patch32', description='Image Embedder:')
llm_model = widgets.Text(value='gpt-3.5-turbo', description='LLM para Geração:')
top_k = widgets.IntSlider(value=3, min=1, max=10, step=1, description='Top-k:')
run_btn = widgets.Button(description='▶️ Construir RAG', button_style='success')
out = widgets.Output()

def build_multimodal_index(texts, images, text_model, image_model):
    # Text embeddings
    tokenizer = AutoTokenizer.from_pretrained(text_model)
    model = AutoModel.from_pretrained(text_model)
    text_inputs = tokenizer(texts, return_tensors='pt', padding=True, truncation=True)
    with torch.no_grad():
        text_embs = model(**text_inputs).last_hidden_state.mean(dim=1).cpu().numpy()
    # Image embeddings
    clip = CLIPModel.from_pretrained(image_model)
    proc = CLIPProcessor.from_pretrained(image_model)
    img_embs = []
    for img in images:
        if img.mode != 'RGB':
            img = img.convert('RGB')
        inputs = proc(images=img, return_tensors='pt')
        with torch.no_grad():
            emb = clip.get_image_features(**inputs).cpu().numpy()
        img_embs.append(emb[0])
    img_embs = np.vstack(img_embs) if img_embs else np.zeros((0, text_embs.shape[1]))
    # Combine and index
    all_embs = np.vstack([text_embs, img_embs])
    index = faiss.IndexFlatIP(all_embs.shape[1])
    faiss.normalize_L2(all_embs)
    index.add(all_embs)
    return index, text_embs, img_embs

def on_run(b):
    with out:
        clear_output()
        # Load texts
        texts = []
        if text_upload.value:
            name, info = next(iter(text_upload.value.items()))
            data = info['content'].decode('utf-8').splitlines()
            texts = [line for line in data if line.strip()]
        # Load images
        images = []
        for fname, info in image_upload.value.items():
            try:
                img = Image.open(io.BytesIO(info['content']))
                images.append(img)
            except:
                pass
        if not texts and not images:
            print("⚠️ Faça upload de texto ou imagens.")
            return
        # Build index
        idx, tel, iel = build_multimodal_index(
            texts, images, embed_text_model.value, embed_image_model.value)
        print("Index multimodal construído com", idx.ntotal, "embeddings.")
        # Query first text as example
        query_emb = tel[0].reshape(1,-1) if texts else iel[0].reshape(1,-1)
        faiss.normalize_L2(query_emb)
        D, I = idx.search(query_emb, top_k.value)
        # Retrieve modalities
        retrieved = []
        for i in I[0]:
            if i < len(texts):
                retrieved.append(("Texto", texts[i]))
            else:
                img_idx = i - len(texts)
                retrieved.append(("Imagem", images[img_idx]))
        # Display retrieved
        print("### Top-k Recuperados ###")
        for modality, item in retrieved:
            if modality == "Texto":
                print(f"Texto: {item}")
            else:
                display(item)
        # Generate answer via LLM with chain-of-thought
        import openai
        openai.api_key = os.getenv('OPENAI_API_KEY','')
        prompt = "Você é um assistente médico. Baseado nos itens recuperados, responda com raciocínio passo-a-passo:\n"
        for modality, item in retrieved:
            if modality=="Texto":
                prompt += f"Texto: {item}\n"
            else:
                prompt += f"[Imagem exibida]\n"
        prompt += "Question: resumir achados e diagnóstico provável."
        resp = openai.ChatCompletion.create(
            model=llm_model.value,
            messages=[{"role":"user","content":prompt}]
        )
        print("\n### Resposta com Chain-of-Thought ###")
        print(resp.choices[0].message.content)

run_btn.on_click(on_run)
display(widgets.VBox([
    text_upload, image_upload,
    embed_text_model, embed_image_model,
    llm_model, top_k, run_btn, out
]))

In [None]:
# Instalação de dependências multi-task avançado
%pip install transformers datasets accelerate torch ipywidgets --quiet

In [None]:
import io
import json
import ipywidgets as widgets
from IPython.display import display, clear_output
from datasets import Dataset
from transformers import (
    AutoTokenizer, AutoModelForSeq2SeqLM,
    TrainingArguments, Trainer, DataCollatorForSeq2Seq
)

# Widgets
mt_upload = widgets.FileUpload(
    accept='.json', multiple=False, description='Upload JSON multi-task')
tasks = widgets.SelectMultiple(
    options=['qa', 'summary', 'classification'],
    value=['qa', 'summary', 'classification'],
    description='Tarefas:')
model_select = widgets.Dropdown(
    options=['google/flan-t5-base', 't5-small', 'facebook/bart-base'],
    value='google/flan-t5-base', description='Modelo:')
epochs = widgets.IntText(value=3, description='Épocas:')
batch_size = widgets.IntText(value=4, description='Batch Size:')
lr = widgets.FloatText(value=5e-5, description='Learning Rate:')
start_btn = widgets.Button(description='▶️ Treinar Multi-Task', button_style='success')
output = widgets.Output()

def run_multitask(b):
    with output:
        clear_output()
        if not mt_upload.value:
            print("⚠️ Faça upload do JSON multi-task.")
            return
        # Load multi-task data
        data = json.load(io.BytesIO(mt_upload.value[next(iter(mt_upload.value))]['content']))
        # Build list of examples for each task
        examples = []
        for entry in data:
            inp = entry.get('input', '')
            for task in tasks.value:
                trg = entry.get(task, '')
                if trg:
                    prompt = f"{task}: {inp}"
                    examples.append({'prompt': prompt, 'target': trg})
        if not examples:
            print("Nenhum exemplo válido para as tarefas selecionadas.")
            return
        # Create dataset
        df = Dataset.from_list(examples)
        # Tokenizer and model
        tokenizer = AutoTokenizer.from_pretrained(model_select.value)
        model = AutoModelForSeq2SeqLM.from_pretrained(model_select.value)
        # Preprocess function
        def preprocess(batch):
            inputs = tokenizer(
                batch['prompt'],
                padding='max_length', truncation=True, max_length=256)
            targets = tokenizer(
                batch['target'],
                padding='max_length', truncation=True, max_length=64)
            batch = {
                'input_ids': inputs['input_ids'],
                'attention_mask': inputs['attention_mask'],
                'labels': targets['input_ids'],
            }
            return batch
        ds = df.map(preprocess, batched=True, remove_columns=['prompt','target'])
        # Data collator
        data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
        # Training arguments
        args = TrainingArguments(
            output_dir='mt_adv',
            num_train_epochs=epochs.value,
            per_device_train_batch_size=batch_size.value,
            learning_rate=lr.value,
            logging_steps=10,
            evaluation_strategy='no',
            save_total_limit=2,
            report_to=[]
        )
        trainer = Trainer(
            model=model,
            args=args,
            train_dataset=ds,
            data_collator=data_collator,
            tokenizer=tokenizer
        )
        print("🔄 Treinamento Multi-Task iniciado...")
        trainer.train()
        trainer.save_model('mt_adv_model')
        print("✅ Treinamento concluído. Modelo salvo em 'mt_adv_model'.")

start_btn.on_click(run_multitask)
display(widgets.VBox([
    mt_upload, tasks, model_select,
    epochs, batch_size, lr,
    start_btn, output
]))

In [None]:
# Instalação de dependências para fine-tuning
%pip install transformers datasets accelerate ipywidgets --quiet

In [None]:
import io, json
import ipywidgets as widgets
from IPython.display import display, clear_output
from datasets import Dataset
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, DataCollatorForSeq2Seq, TrainingArguments, Trainer

# Widgets
train_upload = widgets.FileUpload(accept='.json', multiple=False, description='train.json')
valid_upload = widgets.FileUpload(accept='.json', multiple=False, description='valid.json')
model_select = widgets.Dropdown(options=['t5-small','facebook/bart-base','google/flan-t5-small'], value='t5-small', description='Modelo:')
epochs = widgets.IntText(value=3, description='Épocas:')
batch_size = widgets.IntText(value=4, description='Batch Size:')
lr = widgets.FloatText(value=5e-5, description='Learning Rate:')
start_btn = widgets.Button(description='▶️ Iniciar Fine-Tuning', button_style='success')
output = widgets.Output()

def run_finetune(b):
    with output:
        clear_output()
        if not train_upload.value or not valid_upload.value:
            print("⚠️ Faça upload de train.json e valid.json.")
            return
        # Load JSON
        train_data = json.load(io.BytesIO(next(iter(train_upload.value.values()))['content']))
        valid_data = json.load(io.BytesIO(next(iter(valid_upload.value.values()))['content']))
        # Create datasets
        def to_dataset(data):
            return Dataset.from_dict({
                'input_text': [f"cenario: {v['scenario']}" for v in data.values()],
                'target_text': [v['diagnosis'] for v in data.values()]
            })
        train_ds = to_dataset(train_data)
        valid_ds = to_dataset(valid_data)
        # Tokenizer and model
        tokenizer = AutoTokenizer.from_pretrained(model_select.value)
        model = AutoModelForSeq2SeqLM.from_pretrained(model_select.value)
        # Preprocess
        def preprocess(batch):
            inputs = tokenizer(batch['input_text'], padding='max_length', truncation=True, max_length=256)
            labels = tokenizer(batch['target_text'], padding='max_length', truncation=True, max_length=64).input_ids
            inputs['labels'] = labels
            return inputs
        train_tok = train_ds.map(preprocess, batched=True)
        valid_tok = valid_ds.map(preprocess, batched=True)
        data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
        # TrainingArguments
        args = TrainingArguments(
            output_dir='ft_basic',
            num_train_epochs=epochs.value,
            per_device_train_batch_size=batch_size.value,
            per_device_eval_batch_size=batch_size.value,
            learning_rate=lr.value,
            evaluation_strategy='steps',
            eval_steps=50,
            save_total_limit=2,
            logging_steps=20,
            load_best_model_at_end=True
        )
        trainer = Trainer(
            model=model,
            args=args,
            train_dataset=train_tok,
            eval_dataset=valid_tok,
            data_collator=data_collator,
            tokenizer=tokenizer
        )
        print("🔄 Treinamento iniciado...")
        trainer.train()
        trainer.save_model('ft_basic_model')
        print("✅ Fine-tuning completado. Modelo salvo em 'ft_basic_model'.")

start_btn.on_click(run_finetune)
display(widgets.VBox([train_upload, valid_upload, model_select, epochs, batch_size, lr, start_btn, output]))

In [None]:
# Instalação de dependências para augmentation e adversarial
%pip install nlpaug textattack transformers ipywidgets --quiet

In [None]:
import nlpaug.augmenter.word as naw
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets for augmentation
sample_text = widgets.Textarea(value='Paciente com dor abdominal intensa e febre.', description='Texto:')
methods = widgets.SelectMultiple(
    options=['back_translation', 'synonym', 'random_deletion'],
    value=['synonym'],
    description='Métodos:'
)
bt_src = widgets.Dropdown(options=['en', 'pt'], value='pt', description='BackTrans Src:')
bt_mid = widgets.Dropdown(options=['en'], value='en', description='BackTrans Mid:')
syn_model = widgets.Dropdown(options=['wordnet', 'contextual'], value='wordnet', description='Syn Model:')
del_prob = widgets.FloatSlider(value=0.1, min=0.01, max=0.5, step=0.01, description='Del Prob:')
aug_btn = widgets.Button(description='▶️ Augment', button_style='success')
out_aug = widgets.Output()

def augment_text(b):
    with out_aug:
        clear_output()
        text = sample_text.value
        aug_texts = {}
        for m in methods.value:
            if m == 'back_translation':
                bt = naw.BackTranslationAug(src_lang=bt_src.value, mid_lang=bt_mid.value)
                aug_texts['back_translation'] = bt.augment(text)
            elif m == 'synonym':
                if syn_model.value == 'wordnet':
                    syn = naw.SynonymAug(aug_src='wordnet')
                else:
                    syn = naw.ContextualWordEmbsAug(model_path='bert-base-uncased', action="substitute")
                aug_texts['synonym'] = syn.augment(text)
            elif m == 'random_deletion':
                rd = naw.RandomWordAug(action="delete", aug_p=del_prob.value)
                aug_texts['random_deletion'] = rd.augment(text)
        for k, v in aug_texts.items():
            print(f"--- {k} ---\n{v}\n")

augment_text(aug_btn)
display(widgets.VBox([sample_text, methods,
                     widgets.HBox([bt_src, bt_mid, syn_model, del_prob]),
                     aug_btn, out_aug]))

In [None]:
# Adversarial testing with TextAttack
import textattack
from textattack.attack_recipes import TextFoolerJin2019, DeepWordBugGao2018
from transformers import pipeline
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets for adversarial
attack_method = widgets.Dropdown(
    options=['TextFooler', 'DeepWordBug'],
    value='TextFooler',
    description='Ataque:'
)
model_select = widgets.Dropdown(
    options=['bert-base-uncased', 'roberta-base'],
    value='bert-base-uncased',
    description='Modelo:'
)
adv_input = widgets.Textarea(value='Paciente apresenta tosse seca persistente.', description='Input:')
adv_btn = widgets.Button(description='▶️ Attack', button_style='danger')
out_adv = widgets.Output()

def run_attack(b):
    with out_adv:
        clear_output()
        # Build model
        model = textattack.models.wrappers.HuggingFaceModelWrapper(
            pipeline('text-classification', model=model_select.value, return_all_scores=False, device=-1).model,
            pipeline('text-classification', model=model_select.value, return_all_scores=False, device=-1).tokenizer
        )
        # Choose attack
        if attack_method.value == 'TextFooler':
            attack = TextFoolerJin2019.build(model)
        else:
            attack = DeepWordBugGao2018.build(model)
        # Attack
        text_attack = textattack.Attacker(attack, textattack.datasets.Dataset([[adv_input.value, None]]))
        result = text_attack.attack_dataset(num_examples=1)
        for r in result:
            print(r)

adv_btn.on_click(run_attack)
display(widgets.VBox([attack_method, model_select, adv_input, adv_btn, out_adv]))

In [None]:
# Instalação de dependências para EDA avançada
%pip install pandas plotly nltk spacy wordcloud ipywidgets --quiet

import io
import pandas as pd
import numpy as np
import nltk
import spacy
from wordcloud import WordCloud
import plotly.express as px
import ipywidgets as widgets
from IPython.display import display, clear_output, HTML

# Download NLTK resources
nltk.download('punkt', quiet=True)
nltk.download('stopwords', quiet=True)
from nltk.corpus import stopwords
stopwords_pt = set(stopwords.words('portuguese'))

# Load spaCy model for entity recognition
try:
    nlp = spacy.load('pt_core_news_sm')
except:
    spacy.cli.download('pt_core_news_sm')
    nlp = spacy.load('pt_core_news_sm')

# Widgets
upload = widgets.FileUpload(accept='.csv,.txt', multiple=False, description='Upload Corpus')
text_col = widgets.Text(value='text', description='Coluna (CSV):')
top_k_terms = widgets.IntSlider(value=20, min=5, max=100, step=5, description='Top-K Termos:')
top_k_bi = widgets.IntSlider(value=10, min=5, max=50, step=5, description='Top-K Bigramas:')
run_btn = widgets.Button(description='▶️ Executar EDA', button_style='success')
out = widgets.Output()

def run_eda(b):
    with out:
        clear_output()
        # Load text data
        texts = []
        if upload.value:
            name, info = next(iter(upload.value.items()))
            content = info['content']
            if name.lower().endswith('.csv'):
                df = pd.read_csv(io.BytesIO(content))
                if text_col.value in df.columns:
                    texts = df[text_col.value].astype(str).tolist()
                else:
                    print(f"Coluna '{text_col.value}' não encontrada.")
                    return
            else:
                texts = content.decode('utf-8').splitlines()
        else:
            print("Faça upload de um arquivo")
            return

        # Compute lengths
        lengths = [len(nltk.word_tokenize(t)) for t in texts]
        fig1 = px.histogram(lengths, nbins=30, title='Distribuição de Comprimento (tokens)',
                            labels={'value':'Tokens'}, opacity=0.75)
        fig1.show()

        # Term frequency
        all_tokens = [tok.lower() for t in texts for tok in nltk.word_tokenize(t) if tok.isalpha() and tok.lower() not in stopwords_pt]
        freq = pd.Series(all_tokens).value_counts().head(top_k_terms.value).reset_index()
        freq.columns = ['term','count']
        fig2 = px.bar(freq, x='term', y='count', title=f'Top {top_k_terms.value} Termos')
        fig2.show()

        # Bigrams
        bigrams = list(nltk.bigrams(all_tokens))
        bi_freq = pd.Series([' '.join(b) for b in bigrams]).value_counts().head(top_k_bi.value).reset_index()
        bi_freq.columns = ['bigram','count']
        fig3 = px.bar(bi_freq, x='bigram', y='count', title=f'Top {top_k_bi.value} Bigramas')
        fig3.show()

        # Wordcloud
        wc = WordCloud(width=800, height=400, background_color='white').generate(' '.join(all_tokens))
        display(HTML(f"<img src='{wc.to_image()._repr_png_()}'/>"))

        # Entity stats
        docs = [nlp(t) for t in texts]
        ents = [ent.label_ for doc in docs for ent in doc.ents]
        ent_freq = pd.Series(ents).value_counts().reset_index()
        ent_freq.columns = ['entity','count']
        fig4 = px.bar(ent_freq, x='entity', y='count', title='Frequência de Entidades Médicas')
        fig4.show()

run_btn.on_click(run_eda)
display(widgets.VBox([upload, text_col, top_k_terms, top_k_bi, run_btn, out]))

In [None]:
import pandas as pd
import numpy as np
import plotly.express as px
from sklearn.decomposition import PCA
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets to select providers and visualization type
providers = widgets.SelectMultiple(
    options=['HuggingFace', 'OpenAI', 'Vertex'],
    value=['HuggingFace', 'OpenAI', 'Vertex'],
    description='Provedores:'
)
viz_type = widgets.RadioButtons(
    options=['Heatmap', 'Histograma', 'PCA Scatter'],
    value='Heatmap',
    description='Visualizar:'
)
run_btn = widgets.Button(description='▶️ Plotar', button_style='info')
out = widgets.Output()

# Assume embeddings stored in dict: all_embs[prov] from Section 4a
# For demonstration, regenerate minimal embeddings if needed.

def plot_viz(b):
    with out:
        clear_output()
        selected = providers.value
        viz = viz_type.value
        if not selected:
            print("Selecione ao menos um provedor.")
            return
        # Load or access embeddings stored in notebook global
        try:
            embs = {prov: globals()['all_embs'][f"{prov}:{''}"] for prov in selected}
        except:
            print("Embeddings não encontrados. Execute a seção 4a primeiro.")
            return
        # Use first 100 items for speed
        embs = {prov: emb[:100] for prov, emb in embs.items()}
        # Combine into DataFrame
        df_list = []
        for prov, emb in embs.items():
            for vec in emb:
                df_list.append({'provider': prov, **{f"dim{i}": vec[i] for i in range(min(10, vec.shape[0]))}})
        df = pd.DataFrame(df_list)
        if viz == 'Heatmap':
            # Compute similarity matrix per provider on first text
            sim_mats = {}
            for prov, emb in embs.items():
                sim = cosine_similarity(emb)
                sim_mats[prov] = sim
                fig = px.imshow(sim, title=f"Heatmap {prov}", labels={'x':'Index','y':'Index'})
                fig.show()
        elif viz == 'Histograma':
            for prov, emb in embs.items():
                sims = cosine_similarity(emb)
                # take upper triangle excluding diag
                vals = sims[np.triu_indices_from(sims, k=1)]
                fig = px.histogram(vals, nbins=50, title=f"Histograma de Similaridade {prov}", labels={'value':'Similaridade'})
                fig.show()
        else:  # PCA Scatter
            pca = PCA(n_components=2)
            combined = np.vstack(list(embs.values()))
            proj = pca.fit_transform(combined)
            labels = sum([[prov]*embs[prov].shape[0] for prov in embs], [])
            df_pca = pd.DataFrame({'pca1': proj[:,0], 'pca2': proj[:,1], 'provider': labels})
            fig = px.scatter(df_pca, x='pca1', y='pca2', color='provider', title="PCA Scatter of Embeddings")
            fig.show()

run_btn.on_click(plot_viz)
display(widgets.VBox([providers, viz_type, run_btn, out]))

In [None]:
# Instalação de dependências para embeddings multimodelo
%pip install transformers torch openai google-cloud-aiplatform pandas scikit-learn plotly ipywidgets --quiet

import os
import io
import openai
import pandas as pd
import numpy as np
import torch
from transformers import AutoTokenizer, AutoModel
from sklearn.metrics.pairwise import cosine_similarity
import ipywidgets as widgets
from IPython.display import display, clear_output, HTML
import plotly.express as px
from google.cloud import aiplatform

# Configure API keys
openai.api_key = os.getenv('OPENAI_API_KEY', '')
VERTEX_KEY = os.getenv('VERTEX_API_KEY', '')

# Widgets
upload = widgets.FileUpload(accept='.csv,.txt', multiple=False, description='Upload Corpus')
text_col = widgets.Text(value='text', description='Coluna (CSV):')
manual_input = widgets.Textarea(description='Input Manual:', layout=widgets.Layout(width='100%',height='80px'))
providers = widgets.SelectMultiple(
    options=['HuggingFace:all-MiniLM-L6-v2', 'HuggingFace:biobert-base-cased-v1.1',
             'OpenAI:text-embedding-ada-002', 'Vertex:textembedding-gecko'],
    value=['HuggingFace:all-MiniLM-L6-v2'], description='Provedores:'
)
batch_size = widgets.IntSlider(value=16, min=1, max=128, step=1, description='Batch Size:')
run_btn = widgets.Button(description='Gerar Embeddings', button_style='success')
out = widgets.Output()

def load_corpus():
    texts = []
    if upload.value:
        fname, dat = next(iter(upload.value.items()))
        content = dat['content']
        if fname.endswith('.csv'):
            df = pd.read_csv(io.BytesIO(content))
            if text_col.value in df.columns:
                texts = df[text_col.value].astype(str).tolist()
        else:
            lines = content.decode('utf-8').splitlines()
            texts = [l for l in lines if l.strip()]
    # manual input overrides
    if manual_input.value.strip():
        texts = [s for s in manual_input.value.splitlines() if s.strip()]
    return texts

def get_hf_embeddings(model_name, texts, batch=16):
    tok = AutoTokenizer.from_pretrained(model_name)
    model = AutoModel.from_pretrained(model_name)
    model.eval()
    embs = []
    for i in range(0, len(texts), batch):
        batch_text = texts[i:i+batch]
        inputs = tok(batch_text, return_tensors='pt', padding=True, truncation=True)
        with torch.no_grad():
            outp = model(**inputs)
            emb = outp.last_hidden_state.mean(dim=1).numpy()
        embs.append(emb)
    return np.vstack(embs)

def get_openai_embeddings(texts, batch=16):
    embs = []
    for i in range(0, len(texts), batch):
        resp = openai.Embedding.create(input=texts[i:i+batch], model='text-embedding-ada-002')
        embs.extend([np.array(d['embedding']) for d in resp['data']])
    return np.vstack(embs)

def get_vertex_embeddings(texts, batch=16):
    client = aiplatform.gapic.PredictionServiceClient()
    embs = []
    for i in range(0, len(texts), batch):
        inst = [{"content": t} for t in texts[i:i+batch]]
        endpoint = os.getenv('VERTEX_ENDPOINT', '')
        response = client.predict(endpoint=endpoint, instances=inst, parameters={})
        for pr in response.predictions:
            embs.append(np.array(pr.get('embeddings', pr.get('content', []))))
    return np.vstack(embs)

def run_embeddings(b):
    with out:
        clear_output()
        texts = load_corpus()
        if not texts:
            print("⚠️ Forneça corpus ou input manual.")
            return
        all_embs = {}
        for prov in providers.value:
            name, model = prov.split(':',1)
            print(f"Gerando embeddings com {prov}...")
            if name=='HuggingFace':
                emb = get_hf_embeddings(model, texts, batch_size.value)
            elif name=='OpenAI':
                emb = get_openai_embeddings(texts, batch_size.value)
            else:
                emb = get_vertex_embeddings(texts, batch_size.value)
            all_embs[prov] = emb
        # Compare similarity for first text
        sim_df = pd.DataFrame()
        for prov, emb in all_embs.items():
            sims = cosine_similarity(emb[0:1], emb)[0]
            sim_df[prov] = sims
        # Display similarity table
        display(sim_df.head())
        # Visualization: bar of top-5 similar per provider
        for prov in sim_df.columns:
            top_idxs = np.argsort(sim_df[prov])[-5:][::-1]
            fig = px.bar(x=[texts[i] for i in top_idxs], y=sim_df.loc[top_idxs, prov],
                         title=f"Top 5 similares by {prov}", labels={'x':'Texto', 'y':'Similaridade'})
            fig.show()

run_btn.on_click(run_embeddings)
display(widgets.VBox([upload, text_col, manual_input, providers, batch_size, run_btn, out]))

In [None]:
# Instalação de dependências
%pip install datasets numpy pandas ipywidgets --quiet

import io
import json
import pandas as pd
import numpy as np
from datasets import Dataset
import ipywidgets as widgets
from IPython.display import display, clear_output

# Upload widgets for modalities
text_upload = widgets.FileUpload(accept='.txt,.csv', multiple=False, description='Texto Clínico')
audio_upload = widgets.FileUpload(accept='.json', multiple=False, description='Áudio (JSON)')
image_upload = widgets.FileUpload(accept='.csv,.json', multiple=False, description='Imagens (CSV/JSON)')
fhir_upload = widgets.FileUpload(accept='.json', multiple=False, description='FHIR JSON')
# Split ratio widgets
val_ratio = widgets.FloatSlider(value=0.1, min=0.0, max=0.4, step=0.05, description='Val Ratio')
test_ratio = widgets.FloatSlider(value=0.1, min=0.0, max=0.4, step=0.05, description='Test Ratio')
build_btn = widgets.Button(description='▶️ Construir Dataset', button_style='success')
out = widgets.Output()

def build_dataset(b):
    with out:
        clear_output()
        # Load text data
        records = {}
        rec_id = 0
        if text_upload.value:
            name, info = next(iter(text_upload.value.items()))
            content = info['content']
            if name.lower().endswith('.txt'):
                lines = content.decode('utf-8').splitlines()
                for line in lines:
                    records[str(rec_id)] = {'text': line}
                    rec_id += 1
            else:
                df = pd.read_csv(io.BytesIO(content))
                for _, row in df.iterrows():
                    records[str(rec_id)] = {'text': row.iloc[0]}
                    rec_id += 1
        # Load audio transcripts
        if audio_upload.value:
            name, info = next(iter(audio_upload.value.items()))
            audio_data = json.loads(info['content'].decode('utf-8'))
            for entry in audio_data:
                records[str(rec_id)] = {'audio_transcript': entry.get('text', '')}
                rec_id += 1
        # Load image captions
        if image_upload.value:
            name, info = next(iter(image_upload.value.items()))
            if name.lower().endswith('.csv'):
                df = pd.read_csv(io.BytesIO(info['content']))
                for _, row in df.iterrows():
                    records[str(rec_id)] = {'image_caption': row.iloc[0]}
                    rec_id += 1
            else:
                img_json = json.loads(info['content'].decode('utf-8'))
                for item in img_json:
                    records[str(rec_id)] = {'image_caption': item.get('caption', '')}
                    rec_id += 1
        # Load FHIR resources
        if fhir_upload.value:
            for name, info in fhir_upload.value.items():
                fhir_data = json.loads(info['content'].decode('utf-8'))
                records[str(rec_id)] = {'fhir_resource': fhir_data}
                rec_id += 1
        if not records:
            print("Nenhum dado carregado. Faça upload de pelo menos uma modalidade.")
            return
        df = pd.DataFrame.from_dict(records, orient='index')
        # Shuffle and split
        ratios = (1 - val_ratio.value - test_ratio.value, val_ratio.value, test_ratio.value)
        if ratios[0] <= 0:
            print("Val+Test Ratio deve ser < 1.")
            return
        df = df.sample(frac=1, random_state=42).reset_index(drop=True)
        n = len(df)
        train_end = int(ratios[0]*n)
        val_end = train_end + int(ratios[1]*n)
        splits = {
            'train': df.iloc[:train_end],
            'valid': df.iloc[train_end:val_end],
            'test': df.iloc[val_end:]
        }
        # Save JSON splits
        for split, subset in splits.items():
            out_dict = subset.to_dict(orient='index')
            with open(f"{split}.json", 'w', encoding='utf-8') as f:
                json.dump(out_dict, f, ensure_ascii=False, indent=2)
            print(f"{split}.json salvo com {len(subset)} registros.")
        # Integrity tests
        all_ids = sum([list(splits[s].index.astype(str)) for s in splits], [])
        if len(all_ids) == len(set(all_ids)):
            print("✔ IDs únicos em todos splits.")
        else:
            print("⚠ IDs duplicados detectados!")
        # Mandatory fields check
        print("Campos disponíveis:", list(df.columns))
        print("Dataset construído com sucesso.")

build_btn.on_click(build_dataset)
display(widgets.VBox([text_upload, audio_upload, image_upload, fhir_upload,
                      val_ratio, test_ratio, build_btn, out]))

In [None]:
# Instalar dependências necessárias
%pip install spacy ipywidgets flashtext python-dateutil --quiet

import io
import re
import json
import ipywidgets as widgets
from flashtext import KeywordProcessor
import spacy
from dateutil import parser as dateparser
from IPython.display import display, clear_output, Markdown

# Carregar spaCy (modelo português)
try:
    nlp_deid = spacy.load('pt_core_news_sm')
except:
    spacy.cli.download('pt_core_news_sm')
    nlp_deid = spacy.load('pt_core_news_sm')

# Acronym processor
acro_input = widgets.Textarea(
    placeholder='Ex: UTI: Unidade de Terapia Intensiva\nSARA: Síndrome Respiratória Aguda Grave',
    description='Acrônimos:', layout=widgets.Layout(width='100%',height='80px')
)
file_upload = widgets.FileUpload(accept='.txt,.csv', multiple=False, description='Upload Texto')
mask_phi_cb = widgets.Checkbox(value=True, description='Remover PHI')
expand_acro_cb = widgets.Checkbox(value=False, description='Expandir Acrônimos')
highlight_ent_cb = widgets.Checkbox(value=False, description='Destacar Entidades')
process_btn = widgets.Button(description='Processar Texto', button_style='success')
output = widgets.Output()

def deidentify_text(text):
    # Mask dates
    text = re.sub(r'\b\d{1,2}/\d{1,2}/\d{2,4}\b', '[DATA]', text)
    # Mask emails
    text = re.sub(r'\S+@\S+', '[EMAIL]', text)
    # Mask phone numbers
    text = re.sub(r'\b\(?\d{2,3}\)?[\s-]?\d{4,5}-?\d{4}\b', '[TEL]', text)
    # Mask names with NER
    doc = nlp_deid(text)
    for ent in doc.ents:
        if ent.label_ in ('PER', 'PROPN'):
            text = text.replace(ent.text, '[NOME]')
    return text

def expand_acronyms(text, mapping):
    processor = KeywordProcessor()
    for k,v in mapping.items():
        processor.add_keyword(k, v)
    return processor.replace_keywords(text)

def highlight_entities(text):
    doc = nlp_deid(text)
    spans = []
    for ent in doc.ents:
        if ent.label_ in ('DISEASE', 'DRUG', 'ORG'):
            spans.append(f"[{ent.text}|{ent.label_}]")
    return ' '.join(spans)

def on_process(b):
    with output:
        clear_output()
        if not file_upload.value:
            print("Faça upload de um arquivo de texto.")
            return
        # Read content
        fname, info = next(iter(file_upload.value.items()))
        content = info['content'].decode('utf-8')
        text = content
        # Build acronym mapping
        mapping = {}
        if expand_acro_cb.value and acro_input.value.strip():
            for line in acro_input.value.splitlines():
                if ':' in line:
                    k,v = line.split(':',1)
                    mapping[k.strip()] = v.strip()
        # Apply PHI masking
        if mask_phi_cb.value:
            text = deidentify_text(text)
        # Expand acronyms
        if expand_acro_cb.value:
            text = expand_acronyms(text, mapping)
        # Highlight entities
        if highlight_ent_cb.value:
            ents = highlight_entities(text)
            display(Markdown(f"**Entidades Médicas:** {ents}"))
        print("Texto Processado:\n")
        print(text[:1000] + ('...' if len(text)>1000 else ''))
        # Save processed text
        out_file = 'text_desidentified.txt'
        with open(out_file, 'w', encoding='utf-8') as f:
            f.write(text)
        print(f"✅ Processado salvo em {out_file}")

process_btn.on_click(on_process)
display(widgets.VBox([
    file_upload, mask_phi_cb, acro_input, expand_acro_cb, highlight_ent_cb, process_btn, output
]))

In [None]:
# Instalação de dependências para pré-processamento avançado
%pip install nltk spacy joblib diskcache ipywidgets --quiet

import io
import os
import pandas as pd
from diskcache import Cache
from joblib import Parallel, delayed
import nltk
import spacy
import re
import ipywidgets as widgets
from IPython.display import display, clear_output

# Download resources
nltk.download('stopwords', quiet=True)
from nltk.corpus import stopwords
stopwords_pt = set(stopwords.words('portuguese'))

# Load spaCy model
try:
    nlp = spacy.load('pt_core_news_sm')
except:
    spacy.cli.download('pt_core_news_sm')
    nlp = spacy.load('pt_core_news_sm')

# Widgets for configuration
upload_corpus = widgets.FileUpload(accept='.txt,.csv', multiple=False, description='Upload Corpus')
workers = widgets.IntSlider(value=4, min=1, max=16, description='Workers:')
use_cache = widgets.Checkbox(value=True, description='Habilitar Cache')
steps = widgets.SelectMultiple(
    options=['lowercase','remove_specials','remove_stopwords','lemmatize'],
    value=['lowercase','remove_specials','remove_stopwords'],
    description='Steps:'
)
process_btn = widgets.Button(description='▶️ Processar Corpus', button_style='success')
out = widgets.Output()

# Initialize cache
cache = Cache(directory='preproc_cache')

def preprocess_text(text, steps):
    # check cache
    key = (text[:50], tuple(steps))
    if use_cache.value and key in cache:
        return cache[key]
    t = text
    if 'lowercase' in steps:
        t = t.lower()
    if 'remove_specials' in steps:
        t = re.sub(r'[^\w\s]', ' ', t)
    tokens = t.split()
    if 'remove_stopwords' in steps:
        tokens = [w for w in tokens if w not in stopwords_pt]
    if 'lemmatize' in steps:
        doc = nlp(' '.join(tokens))
        tokens = [token.lemma_ for token in doc]
    result = ' '.join(tokens)
    if use_cache.value:
        cache[key] = result
    return result

def process_corpus(b):
    with out:
        clear_output()
        if not upload_corpus.value:
            print("Faça upload de um corpus TXT ou CSV.")
            return
        fname, info = next(iter(upload_corpus.value.items()))
        content = info['content']
        ext = fname.split('.')[-1].lower()
        if ext == 'txt':
            data = content.decode('utf-8').splitlines()
        else:
            df = pd.read_csv(io.BytesIO(content))
            if 'text' not in df.columns:
                print("CSV deve conter coluna 'text'.")
                return
            data = df['text'].astype(str).tolist()
        print(f"Processando {len(data)} linhas com {workers.value} workers...")
        # Parallel processing
        processed = Parallel(n_jobs=workers.value)(
            delayed(preprocess_text)(line, steps.value) for line in data
        )
        # Display sample and save
        print("Amostra processada:")
        for i, line in enumerate(processed[:5]):
            print(f"{i+1}: {line[:100]}...")
        # Save results
        out_file = 'processed_corpus.txt'
        with open(out_file, 'w', encoding='utf-8') as f:
            for line in processed:
                f.write(line + '\n')
        print(f"Corpus processado salvo em {out_file}")

process_btn.on_click(process_corpus)
display(widgets.VBox([upload_corpus, workers, use_cache, steps, process_btn, out]))

In [None]:
# Instalação de dependências avançadas
%pip install pdfplumber fhir.resources aiohttp beautifulsoup4 tqdm ipywidgets --quiet

import io, os, json, asyncio
from concurrent.futures import ThreadPoolExecutor
import pdfplumber
import aiohttp
from bs4 import BeautifulSoup
from fhir.resources import construct_fhir_element
from tqdm.auto import tqdm
import ipywidgets as widgets
from IPython.display import display, clear_output, Markdown

# Widgets
pdf_upload = widgets.FileUpload(accept='.pdf', multiple=False, description='PDF')
max_pages = widgets.IntText(value=10000, description='Max Pages:')
chunk_size = widgets.IntText(value=1000, description='Chunk Size:')
workers = widgets.IntSlider(value=4, min=1, max=16, description='Workers:')
fhir_upload = widgets.FileUpload(accept='.json', multiple=True, description='FHIR JSONs')
url_list = widgets.Textarea(placeholder='One URL per line...', description='URLs:', layout=widgets.Layout(width='100%', height='80px'))
run_btn = widgets.Button(description='Processar Ingestão', button_style='success')
out = widgets.Output()

async def scrape_url(session, url):
    try:
        async with session.get(url, timeout=10) as resp:
            html = await resp.text()
        soup = BeautifulSoup(html, 'html.parser')
        return url, {
            'titles': [h.get_text(strip=True) for h in soup.find_all(['h1','h2'])][:5],
            'paragraphs': [p.get_text(strip=True)[:200] for p in soup.find_all('p')][:5]
        }
    except Exception as e:
        return url, {'error': str(e)}

async def perform_scraping(urls):
    results = {}
    async with aiohttp.ClientSession() as session:
        tasks = [scrape_url(session, u) for u in urls]
        for coro in asyncio.as_completed(tasks):
            url, data = await coro
            results[url] = data
    return results

def process_all(b):
    with out:
        clear_output()
        # PDF processing
        if pdf_upload.value:
            fname, info = next(iter(pdf_upload.value.items()))
            content = info['content']
            text_chunks = []
            with pdfplumber.open(io.BytesIO(content)) as pdf:
                total = min(len(pdf.pages), max_pages.value)
                pages = range(total)
                # process in threads
                def extract_range(start):
                    txt = ''
                    for i in range(start, min(start+chunk_size.value, total)):
                        txt += pdf.pages[i].extract_text() or ''
                    return txt
                with ThreadPoolExecutor(max_workers=workers.value) as exe:
                    for chunk in tqdm(exe.map(extract_range, range(0, total, chunk_size.value)), total=(total//chunk_size.value)+1):
                        text_chunks.append(chunk)
            print(f"PDF dividido em {len(text_chunks)} chunks de até {chunk_size.value} páginas.")
        # FHIR JSONs
        if fhir_upload.value:
            print("\n### FHIR Resources ###")
            for fname, info in fhir_upload.value.items():
                try:
                    data = json.loads(info['content'].decode('utf-8'))
                    resource = construct_fhir_element(data.get('resourceType',''), data)
                    print(f"{fname}: Recurso {resource.resource_type}, versão {resource.meta.versionId if resource.meta else 'N/A'}")
                except Exception as e:
                    print(f"{fname}: falha ao parsear FHIR - {e}")
        # Web scraping
        urls = [u.strip() for u in url_list.value.splitlines() if u.strip()]
        if urls:
            print("\n### Web Scraping ###")
            loop = asyncio.get_event_loop()
            results = loop.run_until_complete(perform_scraping(urls))
            for url, data in results.items():
                print(f"- {url}:")
                if 'error' in data:
                    print("  Error:", data['error'])
                else:
                    print("  Titles:", data['titles'])
                    print("  Paragraphs:", data['paragraphs'])
        print("\n✅ Ingestão Avançada Concluída.")


Os dados ingeridos podem ser salvos para as próximas seções de pré-processamento, embeddings e além.

In [None]:
# Instalação de dependências multimodais
%pip install pydicom pillow torchaudio librosa openai-whisper ipywidgets --quiet

import io
import os
import pydicom
from PIL import Image
import numpy as np
import torchaudio
import whisper
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets
img_upload = widgets.FileUpload(accept='.dcm,.png,.jpg,.jpeg', multiple=True, description='Upload Imagens')
resize_slider = widgets.IntSlider(value=256, min=64, max=1024, step=64, description='Resize:')
audio_upload = widgets.FileUpload(accept='.wav,.mp3,.flac', multiple=True, description='Upload Áudio')
sample_rate = widgets.IntText(value=16000, description='Sample Rate:')
transcribe_btn = widgets.Button(description='Processar Multimodal', button_style='success')
out = widgets.Output()

def process_multimodal(b):
    with out:
        clear_output()
        # Process images
        if img_upload.value:
            print("### Imagens ###")
            for fname, info in img_upload.value.items():
                content = info['content']
                ext = fname.lower().split('.')[-1]
                try:
                    if ext == 'dcm':
                        ds = pydicom.dcmread(io.BytesIO(content))
                        img = ds.pixel_array
                        img = Image.fromarray(img)
                    else:
                        img = Image.open(io.BytesIO(content))
                    img = img.resize((resize_slider.value, resize_slider.value))
                    arr = np.array(img)
                    print(f"{fname}: shape {arr.shape}, dtype {arr.dtype}")
                except Exception as e:
                    print(f"Erro ao processar imagem {fname}: {e}")
        # Process audio
        if audio_upload.value:
            print("\n### Áudio ###")
            model = whisper.load_model('base')
            for fname, info in audio_upload.value.items():
                content = info['content']
                try:
                    # Save temp file
                    tmp = f"/tmp/{fname}"
                    with open(tmp, "wb") as f:
                        f.write(content)
                    waveform, sr = torchaudio.load(tmp)
                    resampled = torchaudio.transforms.Resample(orig_freq=sr, new_freq=sample_rate.value)(waveform)
                    print(f"{fname}: original sr={sr}, new sr={sample_rate.value}, shape={resampled.shape}")
                    # Transcribe
                    result = model.transcribe(tmp, fp16=False, language='pt')
                    print("Transcrição:", result['text'])
                except Exception as e:
                    print(f"Erro ao processar áudio {fname}: {e}")

transcribe_btn.on_click(process_multimodal)
display(widgets.VBox([
    img_upload, resize_slider,
    audio_upload, sample_rate,
    transcribe_btn, out
]))

In [None]:
import sys
import subprocess
import torch
import transformers
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets
prov = widgets.Dropdown(options=['OpenAI', 'HuggingFace'], description='Provedor:')
run_btn = widgets.Button(description='▶️ Run Quickstart Test', button_style='success')
out = widgets.Output()

def quickstart_test(b):
    with out:
        clear_output()
        print("### Environment Versions ###")
        print(f"Python: {sys.version.split()[0]}")
        print(f"PyTorch: {torch.__version__}")
        print(f"Transformers: {transformers.__version__}")
        print(f"CUDA Available: {torch.cuda.is_available()} ({torch.cuda.device_count()} devices)")
        print("\n### Hello World Test ###")
        provider = prov.value
        if provider == 'OpenAI':
            import os, openai
            key = os.getenv('OPENAI_API_KEY', '')
            if not key:
                print("⚠️ OPENAI_API_KEY não definido.")
            else:
                try:
                    resp = openai.ChatCompletion.create(
                        model='gpt-3.5-turbo',
                        messages=[{'role':'user','content':'Olá, mundo!'}]
                    )
                    print("Resposta OpenAI:", resp.choices[0].message.content)
                except Exception as e:
                    print("Erro OpenAI:", e)
        else:
            from transformers import pipeline
            try:
                pipe = pipeline('text-generation', model='gpt2')
                outp = pipe('Hello, world!', max_length=20)
                print("Resposta HF:", outp[0]['generated_text'])
            except Exception as e:
                print("Erro HuggingFace:", e)

run_btn.on_click(quickstart_test)
display(widgets.VBox([prov, run_btn, out]))

In [None]:
import json
import os
import ipywidgets as widgets
from IPython.display import display, clear_output

# Credential widgets
openai_key = widgets.Password(description='OpenAI Key:')
hf_token   = widgets.Password(description='HF Token:')
gemini_key = widgets.Password(description='Gemini Key:')
vertex_key = widgets.Password(description='Vertex Key:')
gcp_json   = widgets.FileUpload(accept='.json', multiple=False, description='GCP JSON')
slack_url  = widgets.Text(description='Slack Webhook:')
save_btn   = widgets.Button(description='Salvar Credenciais', button_style='success')
out        = widgets.Output()

def save_creds(b):
    with out:
        clear_output()
        config = {
            'OPENAI_API_KEY': openai_key.value,
            'HF_TOKEN': hf_token.value,
            'GEMINI_API_KEY': gemini_key.value,
            'VERTEX_API_KEY': vertex_key.value,
            'SLACK_WEBHOOK': slack_url.value
        }
        if gcp_json.value:
            fname, info = next(iter(gcp_json.value.items()))
            content = info['content'].decode('utf-8')
            config['GCP_SA_JSON'] = json.loads(content)
        # Save to config.json
        with open('config.json','w',encoding='utf-8') as f:
            json.dump(config, f, ensure_ascii=False, indent=2)
        # Also set env vars in this session
        for k, v in config.items():
            os.environ[k] = v if isinstance(v, str) else json.dumps(v)
        print("✅ Credenciais salvas em config.json e variáveis de ambiente definidas.")

save_btn.on_click(save_creds)
display(openai_key, hf_token, gemini_key, vertex_key, gcp_json, slack_url, save_btn, out)