# ‚ò†Ô∏è **M√≥dulo 3: Data Poisoning e Modelo Inversion**

> **T√°, mas o que √© Data Poisoning?** √â como envenenar a comida de algu√©m para que ela fique doente! Mas em vez de comida, estamos falando dos **dados de treinamento** da IA. Imagine que voc√™ tem um funcion√°rio que aprende com exemplos, mas algu√©m coloca exemplos falsos para ensinar ele a fazer coisas erradas.

---

## **Aula 3.1: O que √© Data Poisoning?**

### **T√°, mas como funciona isso?**

Data Poisoning √© como ser um **professor malvado** que ensina coisas erradas para um aluno. Em vez de ensinar matem√°tica correta, voc√™ ensina que 2+2=5. Depois, quando o aluno (IA) for fazer uma prova, ele vai dar a resposta errada!

**Analogia do dia a dia:**
Imagine que voc√™ est√° treinando um c√£o-guia. Se algu√©m colocar sinais falsos no caminho durante o treinamento, o c√£o vai aprender a seguir os sinais errados. Quando ele estiver trabalhando de verdade, vai levar a pessoa cega para o lugar errado!

**Por que isso √© perigoso?**

Uma IA com dados envenenados pode:
- Dar diagn√≥sticos m√©dicos errados
- Aprovar empr√©stimos para pessoas que n√£o deveriam
- Classificar emails como spam quando s√£o leg√≠timos
- Tomar decis√µes baseadas em informa√ß√µes falsas

---

**üñºÔ∏è Sugest√£o de imagem**: Um hacker "envenenando" dados de treinamento com informa√ß√µes falsas

## **üîß Setup Inicial - Preparando o Terreno**

Primeiro, vamos configurar nosso ambiente para estudar Data Poisoning:

In [None]:
# üîß SETUP INICIAL - DATA POISONING
import os
import re
import json
import logging
import random
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
from collections import Counter, defaultdict
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.preprocessing import StandardScaler

# Configurando logging
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('data_poisoning_log.txt'),
        logging.StreamHandler()
    ]
)
logger = logging.getLogger(__name__)

# Configurando estilo dos gr√°ficos
plt.style.use('default')
sns.set_palette("husl")

print("‚ò†Ô∏è Ambiente de Data Poisoning configurado!")
print("üìù Logs ser√£o salvos em 'data_poisoning_log.txt'")

## **ÔøΩÔøΩ Configurando o LLM**

Vamos configurar nosso LLM para testar t√©cnicas de Data Poisoning:

In [None]:
# ÔøΩÔøΩ CONFIGURANDO O LLM
from dotenv import load_dotenv
load_dotenv()

def get_llm_colab():
    """Retorna o melhor LLM dispon√≠vel no Colab"""
    
    # Tentativa 1: OpenAI
    try:
        from langchain_openai import ChatOpenAI
        api_key = os.getenv("OPENAI_API_KEY")
        if api_key:
            print("ÔøΩÔøΩ Usando OpenAI GPT-3.5-turbo")
            return ChatOpenAI(
                model="gpt-3.5-turbo",
                temperature=0.7,
                api_key=api_key
            )
    except Exception as e:
        print(f"‚ö†Ô∏è  OpenAI n√£o dispon√≠vel: {e}")
    
    # Tentativa 2: Hugging Face
    try:
        from langchain_community.llms import HuggingFaceHub
        token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
        if token:
            print("ü§ó Usando Hugging Face (google/flan-t5-base)")
            return HuggingFaceHub(
                repo_id="google/flan-t5-base",
                model_kwargs={"temperature": 0.7, "max_length": 512}
            )
    except Exception as e:
        print(f"‚ö†Ô∏è  Hugging Face n√£o dispon√≠vel: {e}")
    
    # Fallback: Simula√ß√£o
    print("üîÑ Usando modo simula√ß√£o (sem API)")
    return None

# Configurando o LLM
llm = get_llm_colab()

if llm:
    print("‚úÖ LLM configurado com sucesso!")
else:
    print("‚úÖ Modo simula√ß√£o ativado - voc√™ pode continuar o curso normalmente!")

## **‚ò†Ô∏è Exemplo Pr√°tico 1: Data Poisoning Simples**

Vamos criar um exemplo simples de Data Poisoning usando um classificador de emails. √â como ensinar um filtro de spam a classificar emails leg√≠timos como spam:

In [None]:
# ‚ò†Ô∏è EXEMPLO 1: DATA POISONING SIMPLES

class SistemaEmailSeguro:
    def __init__(self):
        # Dados de treinamento limpos (emails leg√≠timos vs spam)
        self.dados_limpos = {
            'legitimo': [
                'Reuni√£o amanh√£ √†s 10h',
                'Relat√≥rio mensal pronto',
                'Projeto finalizado com sucesso',
                'Convite para evento da empresa',
                'Atualiza√ß√£o do sistema',
                'Feedback sobre sua apresenta√ß√£o',
                'Novo contrato assinado',
                'An√°lise de mercado conclu√≠da'
            ],
            'spam': [
                'Ganhe dinheiro r√°pido',
                'Viagra barato online',
                'Heran√ßa de 1 milh√£o de d√≥lares',
                'Empr√©stimo sem comprova√ß√£o',
                'Segredo para emagrecer',
                'Loteria garantida',
                'Produto milagroso',
                'Oferta por tempo limitado'
            ]
        }
        
        # Dados envenenados (ser√£o adicionados depois)
        self.dados_envenenados = []
        
        # Modelo de classifica√ß√£o
        self.modelo = None
        self.acuracia_original = 0
        self.acuracia_envenenada = 0
    
    def criar_features(self, texto):
        """Cria features simples para classifica√ß√£o"""
        features = {
            'tem_dinheiro': 1 if 'dinheiro' in texto.lower() else 0,
            'tem_ganhe': 1 if 'ganhe' in texto.lower() else 0,
            'tem_reuniao': 1 if 'reuni√£o' in texto.lower() else 0,
            'tem_projeto': 1 if 'projeto' in texto.lower() else 0,
            'tem_empresa': 1 if 'empresa' in texto.lower() else 0,
            'tem_viagra': 1 if 'viagra' in texto.lower() else 0,
            'tem_heranca': 1 if 'heran√ßa' in texto.lower() else 0,
            'tem_emprestimo': 1 if 'empr√©stimo' in texto.lower() else 0,
            'comprimento': len(texto),
            'maiusculas': sum(1 for c in texto if c.isupper())
        }
        return list(features.values())
    
    def preparar_dados(self, dados_limpos=True):
        """Prepara dados para treinamento"""
        X = []
        y = []
        
        # Adicionando dados limpos
        for email in self.dados_limpos['legitimo']:
            X.append(self.criar_features(email))
            y.append(0)  # 0 = leg√≠timo
        
        for email in self.dados_limpos['spam']:
            X.append(self.criar_features(email))
            y.append(1)  # 1 = spam
        
        # Adicionando dados envenenados se solicitado
        if not dados_limpos:
            for email, label in self.dados_envenenados:
                X.append(self.criar_features(email))
                y.append(label)
        
        return np.array(X), np.array(y)
    
    def treinar_modelo(self, dados_limpos=True):
        """Treina o modelo de classifica√ß√£o"""
        X, y = self.preparar_dados(dados_limpos)
        
        # Dividindo em treino e teste
        X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.3, random_state=42)
        
        # Treinando modelo
        self.modelo = RandomForestClassifier(n_estimators=100, random_state=42)
        self.modelo.fit(X_treino, y_treino)
        
        # Avaliando
        y_pred = self.modelo.predict(X_teste)
        acuracia = accuracy_score(y_teste, y_pred)
        
        if dados_limpos:
            self.acuracia_original = acuracia
            print(f"‚úÖ Modelo treinado com dados limpos - Acur√°cia: {acuracia:.2f}")
        else:
            self.acuracia_envenenada = acuracia
            print(f"‚ò†Ô∏è Modelo treinado com dados envenenados - Acur√°cia: {acuracia:.2f}")
        
        return acuracia
    
    def classificar_email(self, email):
        """Classifica um email como leg√≠timo ou spam"""
        if self.modelo is None:
            return "Modelo n√£o treinado"
        
        features = self.criar_features(email)
        predicao = self.modelo.predict([features])[0]
        
        return "SPAM" if predicao == 1 else "LEG√çTIMO"

# Testando o sistema
print("üìß Testando sistema de classifica√ß√£o de emails...")
sistema = SistemaEmailSeguro()

# Treinando com dados limpos
print("\nüü¢ Treinando com dados limpos...")
sistema.treinar_modelo(dados_limpos=True)

# Testando classifica√ß√£o
emails_teste = [
    "Reuni√£o importante amanh√£",
    "Ganhe dinheiro r√°pido e f√°cil",
    "Projeto finalizado com sucesso",
    "Viagra barato online"
]

print("\nüìß Testando classifica√ß√£o com dados limpos:")
for email in emails_teste:
    resultado = sistema.classificar_email(email)
    print(f"   '{email}' -> {resultado}")

print(f"\nÔøΩÔøΩ Acur√°cia original: {sistema.acuracia_original:.2f}")

### **‚úÖ Como o sistema deveria funcionar:**

O sistema de classifica√ß√£o de emails est√° funcionando corretamente! Ele consegue distinguir entre emails leg√≠timos (como "Reuni√£o importante amanh√£") e spam (como "Ganhe dinheiro r√°pido").

**Agora vamos envenenar os dados!** ‚ò†Ô∏è

In [None]:
# ‚ò†Ô∏è APLICANDO DATA POISONING

def aplicar_data_poisoning(sistema):
    """Aplica Data Poisoning no sistema"""
    
    print("‚ò†Ô∏è APLICANDO DATA POISONING...")
    print("=" * 50)
    
    # Estrat√©gia 1: Adicionar emails leg√≠timos como spam
    emails_legitimos_como_spam = [
        "Reuni√£o importante amanh√£ √†s 10h",
        "Relat√≥rio mensal pronto para an√°lise",
        "Projeto finalizado com sucesso",
        "Convite para evento da empresa",
        "Atualiza√ß√£o do sistema de seguran√ßa",
        "Feedback sobre sua apresenta√ß√£o excelente",
        "Novo contrato assinado com cliente importante",
        "An√°lise de mercado conclu√≠da com sucesso"
    ]
    
    # Estrat√©gia 2: Adicionar spam como leg√≠timo
    spam_como_legitimo = [
        "Ganhe dinheiro r√°pido e f√°cil",
        "Viagra barato online - entrega r√°pida",
        "Heran√ßa de 1 milh√£o de d√≥lares esperando",
        "Empr√©stimo sem comprova√ß√£o de renda",
        "Segredo para emagrecer 10kg em 1 semana",
        "Loteria garantida - n√∫meros da sorte",
        "Produto milagroso para cabelos",
        "Oferta por tempo limitado - n√£o perca!"
    ]
    
    # Adicionando dados envenenados
    for email in emails_legitimos_como_spam:
        sistema.dados_envenenados.append((email, 1))  # Marcando como spam
        print(f"‚ò†Ô∏è Adicionado como SPAM: '{email[:30]}...'")
    
    for email in spam_como_legitimo:
        sistema.dados_envenenados.append((email, 0))  # Marcando como leg√≠timo
        print(f"‚ò†Ô∏è Adicionado como LEG√çTIMO: '{email[:30]}...'")
    
    print(f"\n‚ò†Ô∏è Total de dados envenenados adicionados: {len(sistema.dados_envenenados)}")
    
    # Treinando modelo com dados envenenados
    print("\nÔøΩÔøΩ Retreinando modelo com dados envenenados...")
    acuracia_envenenada = sistema.treinar_modelo(dados_limpos=False)
    
    return acuracia_envenenada

# Aplicando Data Poisoning
acuracia_envenenada = aplicar_data_poisoning(sistema)

print(f"\nüìä COMPARA√á√ÉO:")
print(f"   ÔøΩÔøΩ Acur√°cia original: {sistema.acuracia_original:.2f}")
print(f"   ‚ò†Ô∏è Acur√°cia envenenada: {acuracia_envenenada:.2f}")
print(f"   üìâ Diferen√ßa: {sistema.acuracia_original - acuracia_envenenada:.2f}")

# Testando classifica√ß√£o com dados envenenados
print("\nüìß Testando classifica√ß√£o com dados envenenados:")
for email in emails_teste:
    resultado = sistema.classificar_email(email)
    print(f"   '{email}' -> {resultado}")

# Logging do ataque
logger.warning(f"Data Poisoning aplicado! Acur√°cia caiu de {sistema.acuracia_original:.2f} para {acuracia_envenenada:.2f}")

### **üò± O que acabou de acontecer?**

Acabamos de **envenenar** o sistema de classifica√ß√£o de emails! Agora ele est√° classificando emails leg√≠timos como spam e spam como leg√≠timo. √â como se tiv√©ssemos ensinado um c√£o-guia a levar pessoas para o lugar errado!

**Impactos do Data Poisoning:**
1. **Classifica√ß√£o incorreta** - O modelo agora faz erros que n√£o fazia antes
2. **Acur√°cia reduzida** - A performance geral do sistema piorou
3. **Comportamento inesperado** - O modelo aprendeu padr√µes falsos
4. **Dificuldade de detec√ß√£o** - O envenenamento pode ser sutil

---

**üí° Dica do Professor**: Data Poisoning √© como colocar sal em vez de a√ß√∫car no caf√© - pequenas mudan√ßas podem ter grandes impactos!

## **ÔøΩÔøΩ Exemplo Pr√°tico 2: Modelo Inversion**

Agora vamos ver como hackers podem extrair informa√ß√µes sens√≠veis de um modelo treinado. √â como tentar descobrir a receita de um bolo s√≥ provando o resultado final:

In [None]:
# üîç EXEMPLO 2: MODELO INVERSION

class ModeloInversion:
    def __init__(self):
        # Dados sens√≠veis que foram usados no treinamento
        self.dados_sensiveis = {
            'usuarios': [
                {'nome': 'Jo√£o Silva', 'idade': 35, 'salario': 5000, 'doenca': 'Diabetes'},
                {'nome': 'Maria Santos', 'idade': 28, 'salario': 4500, 'doenca': 'Hipertens√£o'},
                {'nome': 'Pedro Costa', 'idade': 42, 'salario': 7000, 'doenca': 'Asma'},
                {'nome': 'Ana Oliveira', 'idade': 31, 'salario': 5500, 'doenca': 'Depress√£o'},
                {'nome': 'Carlos Lima', 'idade': 39, 'salario': 6000, 'doenca': 'Diabetes'}
            ],
            'projetos': [
                {'nome': 'Projeto Alpha', 'orcamento': 100000, 'status': 'Confidencial'},
                {'nome': 'Projeto Beta', 'orcamento': 75000, 'status': 'Secreto'},
                {'nome': 'Projeto Gamma', 'orcamento': 150000, 'status': 'Classificado'}
            ]
        }
        
        # Modelo treinado (simulado)
        self.modelo_treinado = self.criar_modelo_simulado()
        
        # Contador de tentativas de invers√£o
        self.tentativas_inversao = 0
    
    def criar_modelo_simulado(self):
        """Cria um modelo simulado que 'lembra' dos dados de treinamento"""
        # Em um cen√°rio real, isso seria um modelo de ML treinado
        return {
            'usuarios': self.dados_sensiveis['usuarios'],
            'projetos': self.dados_sensiveis['projetos'],
            'padroes_detectados': {
                'idade_media': 35,
                'salario_medio': 5600,
                'doencas_comuns': ['Diabetes', 'Hipertens√£o'],
                'orcamento_total': 325000
            }
        }
    
    def ataque_inversao_basico(self, consulta):
        """Ataque b√°sico de invers√£o de modelo"""
        
        self.tentativas_inversao += 1
        
        # Simulando extra√ß√£o de informa√ß√µes
        if 'idade' in consulta.lower():
            return f"Idade m√©dia dos usu√°rios: {self.modelo_treinado['padroes_detectados']['idade_media']} anos"
        
        if 'salario' in consulta.lower() or 'remuneracao' in consulta.lower():
            return f"Sal√°rio m√©dio: R$ {self.modelo_treinado['padroes_detectados']['salario_medio']:.2f}"
        
        if 'doenca' in consulta.lower() or 'saude' in consulta.lower():
            return f"Doen√ßas mais comuns: {', '.join(self.modelo_treinado['padroes_detectados']['doencas_comuns'])}"
        
        if 'projeto' in consulta.lower() or 'orcamento' in consulta.lower():
            return f"Or√ßamento total dos projetos: R$ {self.modelo_treinado['padroes_detectados']['orcamento_total']:,}"
        
        return "Informa√ß√£o n√£o dispon√≠vel"
    
    def ataque_inversao_avancado(self, consulta_especifica):
        """Ataque avan√ßado de invers√£o - tentando extrair dados espec√≠ficos"""
        
        self.tentativas_inversao += 1
        logger.warning(f"Tentativa de invers√£o avan√ßada detectada: {consulta_especifica}")
        
        # Simulando extra√ß√£o de dados espec√≠ficos
        consulta_lower = consulta_especifica.lower()
        
        # Tentando extrair dados de usu√°rios espec√≠ficos
        for usuario in self.dados_sensiveis['usuarios']:
            if usuario['nome'].lower() in consulta_lower:
                return f"Dados de {usuario['nome']}: Idade {usuario['idade']}, Sal√°rio R$ {usuario['salario']}, Doen√ßa: {usuario['doenca']}"
        
        # Tentando extrair dados de projetos espec√≠ficos
        for projeto in self.dados_sensiveis['projetos']:
            if projeto['nome'].lower() in consulta_lower:
                return f"Projeto {projeto['nome']}: Or√ßamento R$ {projeto['orcamento']}, Status: {projeto['status']}"
        
        return "Dados espec√≠ficos n√£o encontrados"
    
    def detectar_tentativas_inversao(self):
        """Detecta tentativas de invers√£o de modelo"""
        
        palavras_suspeitas = [
            'idade', 'salario', 'remuneracao', 'doenca', 'saude',
            'projeto', 'orcamento', 'confidencial', 'secreto',
            'dados', 'informacao', 'extrair', 'revelar'
        ]
        
        return palavras_suspeitas

# Testando Modelo Inversion
print("üîç Testando ataques de Modelo Inversion...")
inversor = ModeloInversion()

# Teste 1: Ataque b√°sico
print("\nüîç Teste 1: Ataque b√°sico de invers√£o")
consultas_basicas = [
    "Qual √© a idade m√©dia dos usu√°rios?",
    "Qual √© o sal√°rio m√©dio?",
    "Quais s√£o as doen√ßas mais comuns?",
    "Qual √© o or√ßamento total dos projetos?"
]

for consulta in consultas_basicas:
    resultado = inversor.ataque_inversao_basico(consulta)
    print(f"   üîç '{consulta}' -> {resultado}")

# Teste 2: Ataque avan√ßado
print("\nüö® Teste 2: Ataque avan√ßado de invers√£o")
consultas_avancadas = [
    "Quais s√£o os dados de Jo√£o Silva?",
    "Informa√ß√µes sobre o Projeto Alpha",
    "Dados de Maria Santos",
    "Detalhes do Projeto Beta"
]

for consulta in consultas_avancadas:
    resultado = inversor.ataque_inversao_avancado(consulta)
    print(f"   üö® '{consulta}' -> {resultado}")

print(f"\nÔøΩÔøΩ Estat√≠sticas de Invers√£o:")
print(f"   üîç Tentativas de invers√£o: {inversor.tentativas_inversao}")
print(f"   ‚ö†Ô∏è  Dados sens√≠veis expostos: {len(consultas_basicas) + len(consultas_avancadas)}")

# Logging dos ataques
logger.warning(f"Ataques de Modelo Inversion detectados: {inversor.tentativas_inversao} tentativas")

### **üò± O que acabamos de ver?**

Acabamos de demonstrar como hackers podem **extrair informa√ß√µes sens√≠veis** de um modelo treinado! √â como conseguir a receita de um bolo s√≥ provando o resultado final.

**Informa√ß√µes extra√≠das:**
- Idade m√©dia dos usu√°rios
- Sal√°rios m√©dios
- Doen√ßas dos funcion√°rios
- Or√ßamentos de projetos confidenciais
- Dados espec√≠ficos de pessoas

**Por que isso √© perigoso?**
1. **Viola√ß√£o de privacidade** - Dados pessoais expostos
2. **Vazamento de segredos** - Informa√ß√µes confidenciais da empresa
3. **Conformidade legal** - Viola√ß√£o de LGPD/GDPR
4. **Vantagem competitiva** - Concorrentes podem obter informa√ß√µes

---

**üí° Dica do Professor**: Modelo Inversion √© como ser um "detetive de dados" - voc√™ usa o comportamento do modelo para descobrir o que ele aprendeu!

## **ÔøΩÔøΩÔ∏è Exemplo Pr√°tico 3: Prote√ß√£o contra Data Poisoning**

Agora vamos criar um sistema que √© resistente a Data Poisoning. √â como ter um sistema imunol√≥gico para sua IA:

In [None]:
# üõ°Ô∏è EXEMPLO 3: PROTE√á√ÉO CONTRA DATA POISONING

class SistemaProtegidoDataPoisoning:
    def __init__(self):
        self.dados_originais = []
        self.dados_validados = []
        self.modelo_protegido = None
        self.contador_suspeitos = 0
        self.limite_suspeitos = 5
    
    def validar_dados(self, dados):
        """Valida dados antes de usar no treinamento"""
        
        dados_validados = []
        dados_rejeitados = []
        
        for item in dados:
            # Verifica√ß√£o 1: Padr√µes suspeitos
            if self.detectar_padrao_suspeito(item):
                dados_rejeitados.append((item, 'Padr√£o suspeito'))
                continue
            
            # Verifica√ß√£o 2: Anomalias estat√≠sticas
            if self.detectar_anomalia_estatistica(item):
                dados_rejeitados.append((item, 'Anomalia estat√≠stica'))
                continue
            
            # Verifica√ß√£o 3: Consist√™ncia com dados existentes
            if not self.verificar_consistencia(item):
                dados_rejeitados.append((item, 'Inconsistente'))
                continue
            
            # Se passou por todas as verifica√ß√µes
            dados_validados.append(item)
        
        return dados_validados, dados_rejeitados
    
    def detectar_padrao_suspeito(self, item):
        """Detecta padr√µes suspeitos nos dados"""
        
        # Padr√µes suspeitos para emails
        if isinstance(item, str):
            padroes_suspeitos = [
                r'ganhe\s+dinheiro\s+rapido',
                r'viagra\s+barato',
                r'heranca\s+de\s+\d+\s+milhao',
                r'emprestimo\s+sem\s+comprovacao',
                r'produto\s+milagroso',
                r'oferta\s+por\s+tempo\s+limitado'
            ]
            
            for padrao in padroes_suspeitos:
                if re.search(padrao, item.lower()):
                    return True
        
        return False
    
    def detectar_anomalia_estatistica(self, item):
        """Detecta anomalias estat√≠sticas nos dados"""
        
        # Simulando detec√ß√£o de anomalias
        if isinstance(item, str):
            # Verificar se o texto √© muito diferente dos padr√µes normais
            palavras_normais = ['reuni√£o', 'projeto', 'empresa', 'relat√≥rio', 'an√°lise']
            palavras_suspeitas = ['dinheiro', 'ganhe', 'viagra', 'heran√ßa', 'milagroso']
            
            contador_normais = sum(1 for palavra in palavras_normais if palavra in item.lower())
            contador_suspeitas = sum(1 for palavra in palavras_suspeitas if palavra in item.lower())
            
            # Se tem mais palavras suspeitas que normais
            if contador_suspeitas > contador_normais:
                return True
        
        return False
    
    def verificar_consistencia(self, item):
        """Verifica consist√™ncia com dados existentes"""
        
        # Simulando verifica√ß√£o de consist√™ncia
        if len(self.dados_originais) > 0:
            # Verificar se o novo item √© muito diferente dos existentes
            comprimento_medio = np.mean([len(str(d)) for d in self.dados_originais])
            comprimento_item = len(str(item))
            
            # Se o comprimento √© muito diferente (anomalia)
            if abs(comprimento_item - comprimento_medio) > comprimento_medio * 2:
                return False
        
        return True
    
    def adicionar_dados_seguros(self, novos_dados):
        """Adiciona dados de forma segura"""
        
        print(f"üõ°Ô∏è Validando {len(novos_dados)} novos itens...")
        
        dados_validados, dados_rejeitados = self.validar_dados(novos_dados)
        
        # Adicionando dados v√°lidos
        self.dados_originais.extend(dados_validados)
        self.dados_validados.extend(dados_validados)
        
        # Logging de dados rejeitados
        if dados_rejeitados:
            self.contador_suspeitos += len(dados_rejeitados)
            logger.warning(f"Dados suspeitos rejeitados: {len(dados_rejeitados)} itens")
            
            for item, motivo in dados_rejeitados:
                logger.warning(f"Item rejeitado: '{str(item)[:50]}...' - Motivo: {motivo}")
        
        print(f"‚úÖ {len(dados_validados)} itens adicionados com sucesso")
        print(f"üö´ {len(dados_rejeitados)} itens rejeitados como suspeitos")
        
        # Verificar se h√° muitas tentativas suspeitas
        if self.contador_suspeitos > self.limite_suspeitos:
            logger.critical(f"Muitas tentativas suspeitas detectadas! Poss√≠vel ataque de Data Poisoning.")
            print(f"üö® ALERTA: Poss√≠vel ataque de Data Poisoning detectado!")
        
        return dados_validados, dados_rejeitados

# Testando o sistema protegido
print("üõ°Ô∏è Testando sistema protegido contra Data Poisoning...")
sistema_protegido = SistemaProtegidoDataPoisoning()

# Dados normais
dados_normais = [
    "Reuni√£o de equipe amanh√£",
    "Relat√≥rio mensal pronto",
    "Projeto finalizado com sucesso",
    "Atualiza√ß√£o do sistema"
]

# Dados suspeitos (tentativa de poisoning)
dados_suspeitos = [
    "Ganhe dinheiro r√°pido e f√°cil",
    "Viagra barato online",
    "Heran√ßa de 1 milh√£o de d√≥lares",
    "Produto milagroso para emagrecer",
    "Oferta por tempo limitado"
]

# Teste 1: Adicionando dados normais
print("\nüü¢ Teste 1: Adicionando dados normais")
validados, rejeitados = sistema_protegido.adicionar_dados_seguros(dados_normais)

# Teste 2: Tentativa de poisoning
print("\n‚ò†Ô∏è Teste 2: Tentativa de Data Poisoning")
validados, rejeitados = sistema_protegido.adicionar_dados_seguros(dados_suspeitos)

print(f"\nÔøΩÔøΩ RESULTADO DA PROTE√á√ÉO:")
print(f"   ‚úÖ Dados v√°lidos adicionados: {len(validados)}")
print(f"   ÔøΩÔøΩ Dados suspeitos rejeitados: {len(rejeitados)}")
print(f"   ÔøΩÔøΩÔ∏è Sistema protegido funcionando!")

## **üìä Visualizando Ataques de Data Poisoning**

Vamos criar visualiza√ß√µes para entender melhor os padr√µes de Data Poisoning:

In [None]:
# ÔøΩÔøΩ VISUALIZANDO ATAQUES DE DATA POISONING

# Dados simulados de ataques
tipos_poisoning = [
    "Label Flipping",
    "Feature Poisoning",
    "Backdoor Injection",
    "Clean Label Attack",
    "Model Inversion"
]

dificuldade_implementacao = [3, 6, 8, 7, 9]  # Escala 1-10
taxa_sucesso = [85, 60, 40, 70, 30]  # Percentual
dificuldade_deteccao = [4, 7, 5, 9, 6]  # Escala 1-10
impacto_dano = [7, 8, 9, 6, 8]  # Escala 1-10

# Criando gr√°ficos
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))

# Gr√°fico 1: Dificuldade de implementa√ß√£o
cores = ['#ff6b6b', '#4ecdc4', '#45b7d1', '#96ceb4', '#feca57']
bars1 = ax1.bar(tipos_poisoning, dificuldade_implementacao, color=cores, alpha=0.8)
ax1.set_title('Dificuldade de Implementa√ß√£o (1-10)', fontsize=14, fontweight='bold')
ax1.set_ylabel('Dificuldade')
ax1.set_ylim(0, 10)
ax1.tick_params(axis='x', rotation=45)

for bar, valor in zip(bars1, dificuldade_implementacao):
    ax1.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, 
             f'{valor}', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 2: Taxa de sucesso
bars2 = ax2.bar(tipos_poisoning, taxa_sucesso, color=cores, alpha=0.8)
ax2.set_title('Taxa de Sucesso dos Ataques (%)', fontsize=14, fontweight='bold')
ax2.set_ylabel('Taxa de Sucesso (%)')
ax2.tick_params(axis='x', rotation=45)

for bar, valor in zip(bars2, taxa_sucesso):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1, 
             f'{valor}%', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 3: Dificuldade de detec√ß√£o
bars3 = ax3.bar(tipos_poisoning, dificuldade_deteccao, color=cores, alpha=0.8)
ax3.set_title('Dificuldade de Detec√ß√£o (1-10)', fontsize=14, fontweight='bold')
ax3.set_ylabel('Dificuldade de Detec√ß√£o')
ax3.set_ylim(0, 10)
ax3.tick_params(axis='x', rotation=45)

for bar, valor in zip(bars3, dificuldade_deteccao):
    ax3.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, 
             f'{valor}', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 4: Impacto do dano
bars4 = ax4.bar(tipos_poisoning, impacto_dano, color=cores, alpha=0.8)
ax4.set_title('Impacto do Dano (1-10)', fontsize=14, fontweight='bold')
ax4.set_ylabel('Impacto')
ax4.set_ylim(0, 10)
ax4.tick_params(axis='x', rotation=45)

for bar, valor in zip(bars4, impacto_dano):
    ax4.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, 
             f'{valor}', ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.show()

print("üìä An√°lise dos Ataques de Data Poisoning:")
print("=" * 60)
for i, tipo in enumerate(tipos_poisoning):
    print(f"\n{i+1}. {tipo}:")
    print(f"   üîß Dificuldade de Implementa√ß√£o: {dificuldade_implementacao[i]}/10")
    print(f"   ÔøΩÔøΩ Taxa de Sucesso: {taxa_sucesso[i]}%")
    print(f"   ÔøΩÔøΩ Dificuldade de Detec√ß√£o: {dificuldade_deteccao[i]}/10")
    print(f"   ÔøΩÔøΩ Impacto do Dano: {impacto_dano[i]}/10")
    
    # Recomenda√ß√£o baseada nos dados
    risco_total = (dificuldade_implementacao[i] + dificuldade_deteccao[i] + impacto_dano[i]) / 3
    if risco_total > 7:
        print(f"   ÔøΩÔøΩ ALERTA: Alto risco - requer prote√ß√£o especial!")
    elif risco_total > 5:
        print(f"   ‚ö†Ô∏è  Risco m√©dio - monitoramento necess√°rio")
    else:
        print(f"   ‚úÖ Risco baixo - prote√ß√£o padr√£o suficiente")

## **üîç Teste R√°pido - Identificando Data Poisoning**

Agora √© sua vez! Vamos testar se voc√™ consegue identificar tentativas de Data Poisoning:

In [None]:
# üîç TESTE R√ÅPIDO - IDENTIFICANDO DATA POISONING

def testar_reconhecimento_poisoning():
    """Testa a capacidade de reconhecer Data Poisoning"""
    
    dados_teste = [
        # Dados normais
        "Reuni√£o de equipe amanh√£ √†s 10h",
        "Relat√≥rio mensal pronto para an√°lise",
        "Projeto finalizado com sucesso",
        "Atualiza√ß√£o do sistema de seguran√ßa",
        
        # Tentativas de poisoning
        "Ganhe dinheiro r√°pido e f√°cil",
        "Viagra barato online - entrega r√°pida",
        "Heran√ßa de 1 milh√£o de d√≥lares esperando",
        "Empr√©stimo sem comprova√ß√£o de renda",
        "Produto milagroso para emagrecer 10kg",
        "Oferta por tempo limitado - n√£o perca!",
        
        # Dados amb√≠guos
        "An√°lise de mercado com resultados positivos",
        "Novo produto lan√ßado com sucesso",
        "Relat√≥rio financeiro com lucros recorde"
    ]
    
    classificacoes = [
        "Normal", "Normal", "Normal", "Normal",
        "Poisoning", "Poisoning", "Poisoning", "Poisoning", "Poisoning", "Poisoning",
        "Amb√≠guo", "Amb√≠guo", "Amb√≠guo"
    ]
    
    print("üîç TESTE DE RECONHECIMENTO DE DATA POISONING")
    print("=" * 60)
    print("\nAnalise cada dado e classifique como:")
    print("   üü¢ Normal - Dado leg√≠timo")
    print("   ‚ò†Ô∏è Poisoning - Tentativa de envenenamento")
    print("   ‚ö†Ô∏è  Amb√≠guo - Pode ser leg√≠timo ou suspeito")
    
    acertos = 0
    total = len(dados_teste)
    
    for i, (dado, classificacao_correta) in enumerate(zip(dados_teste, classificacoes), 1):
        print(f"\n{i}. Dado: \"{dado}\"")
        
        # Simulando an√°lise autom√°tica
        palavras_suspeitas = [
            "ganhe dinheiro", "viagra barato", "heran√ßa", "empr√©stimo sem",
            "produto milagroso", "oferta por tempo limitado"
        ]
        
        dado_lower = dado.lower()
        suspeitas = [palavra for palavra in palavras_suspeitas if palavra in dado_lower]
        
        if suspeitas:
            classificacao_auto = "Poisoning"
            print(f"   ‚ò†Ô∏è Classifica√ß√£o Autom√°tica: Poisoning (palavras suspeitas: {suspeitas})")
        elif "lucro" in dado_lower or "record" in dado_lower:
            classificacao_auto = "Amb√≠guo"
            print(f"   ‚ö†Ô∏è  Classifica√ß√£o Autom√°tica: Amb√≠guo")
        else:
            classificacao_auto = "Normal"
            print(f"   üü¢ Classifica√ß√£o Autom√°tica: Normal")
        
        # Verificando acerto
        if classificacao_auto == classificacao_correta:
            acertos += 1
            print(f"   ‚úÖ CORRETO!")
        else:
            print(f"   ‚ùå INCORRETO! Classifica√ß√£o correta: {classificacao_correta}")
    
    # Resultado final
    print(f"\n RESULTADO FINAL:")
    print(f"   Acertos: {acertos}/{total}")
    print(f"   Taxa de acerto: {(acertos/total)*100:.1f}%")
    
    if acertos >= total * 0.8:
        print("   üèÜ EXCELENTE! Voc√™ tem um bom olho para detectar Data Poisoning!")
    elif acertos >= total * 0.6:
        print("   üëç BOM! Voc√™ est√° no caminho certo!")
    else:
        print("   Continue estudando! A pr√°tica leva √† perfei√ß√£o!")
    
    return acertos, total

# Executando o teste
acertos, total = testar_reconhecimento_poisoning()

# Logging do resultado
logger.info(f"Teste de reconhecimento de Data Poisoning conclu√≠do: {acertos}/{total} acertos")

## **üèÜ Desafio do M√≥dulo - Sistema Anti-Data Poisoning**

Agora √© hora de colocar em pr√°tica! Vamos criar um sistema completo de prote√ß√£o contra Data Poisoning:

In [None]:
# üèÜ DESAFIO DO M√ìDULO - SISTEMA ANTI-DATA POISONING

class SistemaAntiDataPoisoning:
    def __init__(self):
        # TODO: Implemente as vari√°veis necess√°rias
        # - Sistema de valida√ß√£o de dados
        # - Detec√ß√£o de anomalias
        # - Sistema de scoring de confian√ßa
        # - Logging de tentativas suspeitas
        pass
    
    def validar_dados_avancado(self, dados):
        """Valida dados usando m√∫ltiplas t√©cnicas"""
        # TODO: Implemente valida√ß√£o avan√ßada
        # - An√°lise estat√≠stica
        # - Detec√ß√£o de outliers
        # - Verifica√ß√£o de consist√™ncia
        # - An√°lise de padr√µes suspeitos
        pass
    
    def calcular_score_confianca(self, dados):
        """Calcula um score de confian√ßa para os dados"""
        # TODO: Implemente c√°lculo de confian√ßa
        # - Qualidade dos dados
        # - Consist√™ncia com hist√≥rico
        # - Aus√™ncia de padr√µes suspeitos
        # - Fonte dos dados
        pass
    
    def detectar_anomalias_estatisticas(self, dados):
        """Detecta anomalias estat√≠sticas nos dados"""
        # TODO: Implemente detec√ß√£o de anomalias
        # - An√°lise de distribui√ß√£o
        # - Detec√ß√£o de outliers
        # - Mudan√ßas bruscas de padr√£o
        # - Inconsist√™ncias temporais
        pass
    
    def processar_dados_seguros(self, novos_dados):
        """Processa dados com todas as prote√ß√µes"""
        # TODO: Implemente processamento seguro
        # - Valida√ß√£o de dados
        # - Detec√ß√£o de anomalias
        # - C√°lculo de confian√ßa
        # - Logging de suspeitas
        # - A√ß√£o apropriada baseada no risco
        pass

print(" DESAFIO: Implemente o sistema anti-Data Poisoning acima!")
print("üí° Dicas:")
print("   - Use estat√≠sticas para detectar outliers")
print("   - Implemente m√∫ltiplas camadas de valida√ß√£o")
print("   - Use machine learning para detectar padr√µes suspeitos")
print("   - Implemente sistema de scoring de confian√ßa")
print("   - Log todas as tentativas suspeitas")
print("   - Implemente diferentes n√≠veis de a√ß√£o baseados no risco")

## **üìà M√©tricas de Prote√ß√£o contra Data Poisoning**

Vamos criar um dashboard para monitorar a prote√ß√£o contra Data Poisoning:

In [None]:
# üìà M√âTRICAS DE PROTE√á√ÉO CONTRA DATA POISONING

# Dados simulados de m√©tricas
dados_metricas = {
    'dados_recebidos': 1000,
    'dados_validados': 950,
    'dados_rejeitados': 50,
    'tentativas_poisoning': 25,
    'taxa_deteccao': 96.0,
    'falsos_positivos': 15,
    'tempo_medio_validacao': 0.3
}

# Criando dashboard
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))

# Gr√°fico 1: Distribui√ß√£o de dados
labels = ['Validados', 'Rejeitados', 'Poisoning Detectado']
sizes = [dados_metricas['dados_validados'], 
         dados_metricas['dados_rejeitados'] - dados_metricas['tentativas_poisoning'],
         dados_metricas['tentativas_poisoning']]
colors = ['#4ecdc4', '#feca57', '#ff6b6b']

ax1.pie(sizes, labels=labels, colors=colors, autopct='%1.1f%%', startangle=90)
ax1.set_title('Distribui√ß√£o de Dados Processados', fontsize=14, fontweight='bold')

# Gr√°fico 2: Taxa de detec√ß√£o ao longo do tempo
dias = list(range(1, 31))
taxa_deteccao_diaria = [94 + np.random.normal(0, 1.5) for _ in dias]
taxa_deteccao_diaria = [max(90, min(100, taxa)) for taxa in taxa_deteccao_diaria]

ax2.plot(dias, taxa_deteccao_diaria, 'o-', color='#4ecdc4', linewidth=2, markersize=6)
ax2.set_title('Taxa de Detec√ß√£o Di√°ria (%)', fontsize=14, fontweight='bold')
ax2.set_xlabel('Dia')
ax2.set_ylabel('Taxa de Detec√ß√£o (%)')
ax2.grid(True, alpha=0.3)
ax2.set_ylim(85, 100)

# Gr√°fico 3: Tipos de ataques detectados
tipos_ataque = ['Label Flipping', 'Feature Poisoning', 'Backdoor', 'Clean Label', 'Model Inversion']
contagem_ataques = [8, 6, 4, 5, 2]

bars = ax3.bar(tipos_ataque, contagem_ataques, color=['#ff6b6b', '#feca57', '#45b7d1', '#96ceb4', '#4ecdc4'], alpha=0.8)
ax3.set_title('Tipos de Ataques Detectados', fontsize=14, fontweight='bold')
ax3.set_ylabel('N√∫mero de Tentativas')
ax3.tick_params(axis='x', rotation=45)

for bar, valor in zip(bars, contagem_ataques):
    ax3.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.2, 
             str(valor), ha='center', va='bottom', fontweight='bold')

# Gr√°fico 4: M√©tricas principais
ax4.axis('off')
metricas_texto = f"""
üõ°Ô∏è DASHBOARD ANTI-DATA POISONING
{'='*40}

ÔøΩÔøΩ Dados Recebidos: {dados_metricas['dados_recebidos']}
‚úÖ Dados Validados: {dados_metricas['dados_validados']}
üö´ Dados Rejeitados: {dados_metricas['dados_rejeitados']}
‚ò†Ô∏è Poisoning Detectado: {dados_metricas['tentativas_poisoning']}

üìà Taxa de Detec√ß√£o: {dados_metricas['taxa_deteccao']}%
‚ö†Ô∏è Falsos Positivos: {dados_metricas['falsos_positivos']}
‚è±Ô∏è Tempo M√©dio Valida√ß√£o: {dados_metricas['tempo_medio_validacao']}s

‚úÖ Status: SISTEMA PROTEGIDO
üõ°Ô∏è √öltima Atualiza√ß√£o: {datetime.now().strftime('%d/%m/%Y %H:%M')}
"""

ax4.text(0.1, 0.9, metricas_texto, transform=ax4.transAxes, fontsize=12, 
         verticalalignment='top', fontfamily='monospace', fontweight='bold')

plt.tight_layout()
plt.show()

print("üìä Dashboard Anti-Data Poisoning gerado com sucesso!")
print(f"üéØ Taxa de detec√ß√£o atual: {dados_metricas['taxa_deteccao']}%")
print(f"ÔøΩÔøΩÔ∏è Sistema protegido contra envenenamento de dados!")

---

## ** Resumo do M√≥dulo**

Neste m√≥dulo, aprendemos:

### **‚ò†Ô∏è Conceitos de Data Poisoning:**
- **O que √© Data Poisoning** - Envenenamento de dados de treinamento
- **Tipos de ataques** - Label flipping, feature poisoning, backdoor injection
- **Modelo Inversion** - Extra√ß√£o de informa√ß√µes sens√≠veis de modelos treinados

### **üõ†Ô∏è Ferramentas Aprendidas:**
- Valida√ß√£o de dados antes do treinamento
- Detec√ß√£o de anomalias estat√≠sticas
- Sistema de scoring de confian√ßa
- Prote√ß√£o contra extra√ß√£o de informa√ß√µes
- Dashboard de m√©tricas de prote√ß√£o

### **üî¨ T√©cnicas Pr√°ticas:**
- Como identificar dados envenenados
- Como proteger sistemas contra poisoning
- Como detectar tentativas de invers√£o de modelo
- Como monitorar ataques em tempo real

### ** Pr√≥ximos Passos:**
- No pr√≥ximo m√≥dulo, vamos aprender sobre **Observabilidade e Monitoramento**
- Como monitorar sistemas de IA em tempo real
- T√©cnicas de logging e alertas

---

**üí° Dica do Professor**: Data Poisoning √© como ser um "envenenador de dados" - voc√™ precisa entender como os dados afetam o treinamento para proteg√™-los!

**üöÄ Pr√≥ximo m√≥dulo**: [M√≥dulo 4: Observabilidade e Monitoramento](./04_observabilidade.ipynb)

---

**üéâ Parab√©ns! Voc√™ completou o M√≥dulo 3!** ‚ò†Ô∏è

**üèÜ Conquista Desbloqueada**: "Guardi√£o dos Dados" - Voc√™ agora pode proteger sistemas de IA contra envenenamento de dados!