# üîç Diff Analysis - Demo

Este notebook demonstra como usar o **Copilot-IA** para analisar diferen√ßas de c√≥digo (diffs).

## Funcionalidades

- üìù An√°lise de diffs/patches
- üîÑ Compara√ß√£o entre vers√µes de c√≥digo
- üêõ Detec√ß√£o de bugs introduzidos
- üîí Identifica√ß√£o de problemas de seguran√ßa
- üí° Sugest√µes de melhoria para as mudan√ßas


## 1. Setup Inicial


In [1]:
# Configura√ß√£o do ambiente
import sys
sys.path.insert(0, '..')

from src.utils import setup_logging
setup_logging(level="INFO")

print("‚úÖ Setup conclu√≠do!")


‚úÖ Setup conclu√≠do!


In [2]:
# Importar os m√≥dulos necess√°rios
from src.copilots import CodeReviewerCopilot
from src.tools.git_tools import GitTool

# Inicializar o Code Reviewer
reviewer = CodeReviewerCopilot()

# Inicializar ferramenta Git (opcional)
git_tool = GitTool()

print(f"üîç Code Reviewer inicializado!")
print(f"   Modelo: {reviewer.model_config.name}")
print(f"   Provider: {reviewer.model_config.provider}")


üîç Code Reviewer inicializado!
   Modelo: gpt-4o
   Provider: openai


## 2. Analisar um Diff Simples

Vamos analisar uma mudan√ßa que introduz um bug.


In [3]:
# Diff de exemplo - introduz bug de divis√£o por zero
diff_bugado = '''
--- a/calculator.py
+++ b/calculator.py
@@ -1,15 +1,12 @@
 class Calculator:
     def divide(self, a: float, b: float) -> float:
-        """Divide a por b com valida√ß√£o."""
-        if b == 0:
-            raise ValueError("Divis√£o por zero!")
+        """Divide a por b."""
         return a / b
 
     def calculate_average(self, numbers: list) -> float:
-        """Calcula m√©dia com valida√ß√£o."""
-        if not numbers:
-            return 0.0
+        """Calcula m√©dia."""
         total = sum(numbers)
-        return total / len(numbers)
+        count = len(numbers)
+        return total / count
'''

print("üìù Diff a ser analisado:")
print(diff_bugado)


üìù Diff a ser analisado:

--- a/calculator.py
+++ b/calculator.py
@@ -1,15 +1,12 @@
 class Calculator:
     def divide(self, a: float, b: float) -> float:
-        """Divide a por b com valida√ß√£o."""
-        if b == 0:
-            raise ValueError("Divis√£o por zero!")
+        """Divide a por b."""
         return a / b

     def calculate_average(self, numbers: list) -> float:
-        """Calcula m√©dia com valida√ß√£o."""
-        if not numbers:
-            return 0.0
+        """Calcula m√©dia."""
         total = sum(numbers)
-        return total / len(numbers)
+        count = len(numbers)
+        return total / count



In [4]:
# Analisar o diff
print("üîç Analisando diff...\n")

resultado = reviewer.analyze_diff(
    diff=diff_bugado,
    context="Refatora√ß√£o para simplificar o c√≥digo da calculadora"
)

if resultado.success:
    print("üìä An√°lise do Diff:\n")
    print(resultado.content)
else:
    print(f"‚ùå Erro: {resultado.content}")


üîç Analisando diff...

üìä An√°lise do Diff:

## Resumo Executivo

As altera√ß√µes no c√≥digo da classe `Calculator` visam simplificar as fun√ß√µes `divide` e `calculate_average`. No entanto, a remo√ß√£o de valida√ß√µes essenciais introduz potenciais bugs e problemas de seguran√ßa. A simplifica√ß√£o do c√≥digo deve ser feita com cuidado para n√£o comprometer a robustez e a seguran√ßa das opera√ß√µes.

## Problemas Encontrados

1. **Bugs e Erros Potenciais**
   - **Divis√£o por Zero (Alta Severidade):** A remo√ß√£o da verifica√ß√£o de divis√£o por zero na fun√ß√£o `divide` pode resultar em uma exce√ß√£o `ZeroDivisionError`, interrompendo a execu√ß√£o do programa.
   - **C√°lculo de M√©dia com Lista Vazia (M√©dia Severidade):** A remo√ß√£o da verifica√ß√£o de lista vazia na fun√ß√£o `calculate_average` pode levar a uma exce√ß√£o `ZeroDivisionError` quando `len(numbers)` for zero.

2. **Seguran√ßa**
   - **Valida√ß√£o de Entrada Insuficiente (M√©dia Severidade):** A falta de valida√ß√£

## 3. Analisar Diff com Problema de Seguran√ßa

Mudan√ßa que introduz vulnerabilidade SQL Injection.


In [5]:
# Diff que introduz vulnerabilidade de seguran√ßa
diff_inseguro = '''
--- a/user_service.py
+++ b/user_service.py
@@ -5,12 +5,10 @@ class UserService:
     def __init__(self, db):
         self.db = db
 
-    def get_user(self, user_id: int) -> dict:
-        """Busca usu√°rio de forma segura."""
-        query = "SELECT * FROM users WHERE id = ?"
-        result = self.db.execute(query, (user_id,))
+    def get_user(self, user_id) -> dict:
+        """Busca usu√°rio."""
+        query = f"SELECT * FROM users WHERE id = {user_id}"
+        result = self.db.execute(query)
         return result.fetchone()
 
-    def search_users(self, name: str) -> list:
-        """Busca usu√°rios por nome."""
-        query = "SELECT * FROM users WHERE name LIKE ?"
-        result = self.db.execute(query, (f"%{name}%",))
+    def search_users(self, name) -> list:
+        query = "SELECT * FROM users WHERE name LIKE '%" + name + "%'"
+        result = self.db.execute(query)
         return result.fetchall()
'''

print("‚ö†Ô∏è Diff com mudan√ßa de seguran√ßa:")
print(diff_inseguro)


‚ö†Ô∏è Diff com mudan√ßa de seguran√ßa:

--- a/user_service.py
+++ b/user_service.py
@@ -5,12 +5,10 @@ class UserService:
     def __init__(self, db):
         self.db = db

-    def get_user(self, user_id: int) -> dict:
-        """Busca usu√°rio de forma segura."""
-        query = "SELECT * FROM users WHERE id = ?"
-        result = self.db.execute(query, (user_id,))
+    def get_user(self, user_id) -> dict:
+        """Busca usu√°rio."""
+        query = f"SELECT * FROM users WHERE id = {user_id}"
+        result = self.db.execute(query)
         return result.fetchone()

-    def search_users(self, name: str) -> list:
-        """Busca usu√°rios por nome."""
-        query = "SELECT * FROM users WHERE name LIKE ?"
-        result = self.db.execute(query, (f"%{name}%",))
+    def search_users(self, name) -> list:
+        query = "SELECT * FROM users WHERE name LIKE '%" + name + "%'"
+        result = self.db.execute(query)
         return result.fetchall()



In [6]:
# Analisar diff de seguran√ßa
print("üîç Analisando diff de seguran√ßa...\n")

resultado = reviewer.analyze_diff(
    diff=diff_inseguro,
    context="PR de um desenvolvedor junior para 'simplificar' o c√≥digo"
)

if resultado.success:
    print("üîí An√°lise de Seguran√ßa do Diff:\n")
    print(resultado.content)
else:
    print(f"‚ùå Erro: {resultado.content}")


üîç Analisando diff de seguran√ßa...

üîí An√°lise de Seguran√ßa do Diff:

# An√°lise de C√≥digo

## Resumo Executivo

As altera√ß√µes propostas pelo desenvolvedor junior introduzem s√©rios problemas de seguran√ßa e v√£o contra boas pr√°ticas de programa√ß√£o. As mudan√ßas simplificam o c√≥digo, mas comprometem a seguran√ßa e a robustez da aplica√ß√£o.

## Problemas Encontrados

1. **Inje√ß√£o de SQL (Severidade: Alta)**
   - As altera√ß√µes removem o uso de par√¢metros preparados, substituindo-os por interpola√ß√£o direta de strings. Isso torna o c√≥digo vulner√°vel a ataques de inje√ß√£o de SQL.
   
2. **Remo√ß√£o de Tipagem (Severidade: M√©dia)**
   - A remo√ß√£o das anota√ß√µes de tipo para `user_id` e `name` reduz a legibilidade e a capacidade de manuten√ß√£o do c√≥digo, al√©m de potencialmente introduzir erros de tipo.

3. **Coment√°rio Desatualizado (Severidade: Baixa)**
   - O coment√°rio no m√©todo `get_user` ainda menciona que a busca √© feita de forma segura, o que n√£o √©

## 4. Usar com Git Real

Analisar diffs do reposit√≥rio Git atual.


In [7]:
# Obter diff do √∫ltimo commit
print("üìÇ Obtendo diff do Git...\n")

# Diff entre √∫ltimo commit e anterior
diff_real = git_tool.get_diff("HEAD~1", "HEAD")

if diff_real:
    # Mostrar primeiros 2000 caracteres
    print(f"üìù Diff do √∫ltimo commit (primeiros 2000 chars):\n")
    print(diff_real[:2000])
    if len(diff_real) > 2000:
        print(f"\n... ({len(diff_real) - 2000} caracteres omitidos)")
else:
    print("‚ö†Ô∏è N√£o foi poss√≠vel obter diff (pode n√£o haver commits suficientes)")


üìÇ Obtendo diff do Git...

‚ö†Ô∏è N√£o foi poss√≠vel obter diff (pode n√£o haver commits suficientes)


In [8]:
# Analisar diff real (se existir)
if diff_real and len(diff_real) > 0:
    print("üîç Analisando diff do Git...\n")
    
    # Limitar tamanho para n√£o estourar contexto
    diff_para_analise = diff_real[:10000] if len(diff_real) > 10000 else diff_real
    
    resultado = reviewer.analyze_diff(
        diff=diff_para_analise,
        context="√öltimo commit do reposit√≥rio"
    )
    
    if resultado.success:
        print("üìä An√°lise do Commit:\n")
        print(resultado.content)
    else:
        print(f"‚ùå Erro: {resultado.content}")
else:
    print("‚ö†Ô∏è Nenhum diff dispon√≠vel para an√°lise")


‚ö†Ô∏è Nenhum diff dispon√≠vel para an√°lise


## 5. Comparar Vers√µes de C√≥digo

Compare duas vers√µes de c√≥digo diretamente.


In [9]:
import difflib

# Vers√£o antiga do c√≥digo
codigo_antigo = '''
def processar_pedido(pedido):
    """Processa um pedido."""
    if pedido is None:
        raise ValueError("Pedido n√£o pode ser nulo")
    
    if not pedido.get("items"):
        raise ValueError("Pedido deve ter itens")
    
    total = 0
    for item in pedido["items"]:
        total += item["preco"] * item["quantidade"]
    
    if pedido.get("desconto"):
        total = total * (1 - pedido["desconto"] / 100)
    
    return {
        "total": total,
        "status": "processado"
    }
'''

# Vers√£o nova do c√≥digo (com problemas)
codigo_novo = '''
def processar_pedido(pedido):
    """Processa um pedido."""
    total = 0
    for item in pedido["items"]:
        total += item["preco"] * item["quantidade"]
    
    total = total * (1 - pedido["desconto"] / 100)
    
    return {
        "total": total,
        "status": "processado"
    }
'''

# Gerar diff
diff_gerado = difflib.unified_diff(
    codigo_antigo.splitlines(keepends=True),
    codigo_novo.splitlines(keepends=True),
    fromfile='antes.py',
    tofile='depois.py'
)

diff_texto = ''.join(diff_gerado)
print("üìù Diff gerado automaticamente:")
print(diff_texto)


üìù Diff gerado automaticamente:
--- antes.py
+++ depois.py
@@ -1,18 +1,11 @@
 
 def processar_pedido(pedido):
     """Processa um pedido."""
-    if pedido is None:
-        raise ValueError("Pedido n√£o pode ser nulo")
-
-    if not pedido.get("items"):
-        raise ValueError("Pedido deve ter itens")
-
     total = 0
     for item in pedido["items"]:
         total += item["preco"] * item["quantidade"]
 
-    if pedido.get("desconto"):
-        total = total * (1 - pedido["desconto"] / 100)
+    total = total * (1 - pedido["desconto"] / 100)
 
     return {
         "total": total,



In [10]:
# Analisar o diff gerado
print("üîç Analisando mudan√ßas...\n")

resultado = reviewer.analyze_diff(
    diff=diff_texto,
    context="Refatora√ß√£o para 'simplificar' processamento de pedidos"
)

if resultado.success:
    print("üìä An√°lise da Refatora√ß√£o:\n")
    print(resultado.content)
else:
    print(f"‚ùå Erro: {resultado.content}")


üîç Analisando mudan√ßas...

üìä An√°lise da Refatora√ß√£o:

## Resumo Executivo

A refatora√ß√£o do c√≥digo visa simplificar o processamento de pedidos, mas introduz problemas significativos que podem afetar a funcionalidade e a robustez do sistema. A remo√ß√£o de verifica√ß√µes de nulidade e de itens no pedido pode resultar em exce√ß√µes n√£o tratadas e c√°lculos incorretos. Al√©m disso, a altera√ß√£o n√£o melhora a legibilidade ou a manutenibilidade do c√≥digo.

## Problemas Encontrados

1. **Bugs e Erros Potenciais**
   - **Severidade Alta**: A remo√ß√£o das verifica√ß√µes para `pedido is None` e `pedido.get("items")` pode levar a exce√ß√µes `TypeError` ou `KeyError` se o pedido for `None` ou n√£o contiver a chave "items".
   - **Severidade M√©dia**: A remo√ß√£o da verifica√ß√£o de exist√™ncia do desconto pode resultar em um `TypeError` se a chave "desconto" n√£o estiver presente no pedido.

2. **Seguran√ßa**
   - **Severidade Baixa**: N√£o foram identificados problemas de segura

## 6. Resumo

A an√°lise de diff √© √∫til para:

| Caso de Uso | Descri√ß√£o |
|-------------|-----------|
| **Code Review** | Revisar PRs antes de merge |
| **CI/CD** | Validar mudan√ßas automaticamente |
| **Seguran√ßa** | Detectar vulnerabilidades introduzidas |
| **Qualidade** | Identificar bugs em novas mudan√ßas |

### M√©todos Dispon√≠veis

| M√©todo | Descri√ß√£o |
|--------|-----------|
| `reviewer.analyze_diff()` | Analisa um diff/patch |
| `git_tool.get_diff()` | Obt√©m diff entre commits |
| `git_tool.get_staged_diff()` | Obt√©m diff dos arquivos staged |

### Integra√ß√£o com Git

```python
# Analisar √∫ltimo commit
diff = git_tool.get_diff("HEAD~1", "HEAD")
resultado = reviewer.analyze_diff(diff)

# Analisar arquivos staged (antes do commit)
diff = git_tool.get_staged_diff()
resultado = reviewer.analyze_diff(diff)

# Analisar arquivo espec√≠fico
diff = git_tool.get_diff("main", "feature", file_path="src/main.py")
resultado = reviewer.analyze_diff(diff)
```


In [11]:
print("üéâ Demo conclu√≠da!")
print("\nüí° Dicas para Code Review:")
print("  1. Sempre revise diffs antes de fazer merge")
print("  2. Use an√°lise autom√°tica em PRs no CI/CD")
print("  3. Preste aten√ß√£o em valida√ß√µes removidas")
print("  4. Verifique se testes foram atualizados")
print("  5. Cuidado com mudan√ßas que 'simplificam' c√≥digo de seguran√ßa")


üéâ Demo conclu√≠da!

üí° Dicas para Code Review:
  1. Sempre revise diffs antes de fazer merge
  2. Use an√°lise autom√°tica em PRs no CI/CD
  3. Preste aten√ß√£o em valida√ß√µes removidas
  4. Verifique se testes foram atualizados
  5. Cuidado com mudan√ßas que 'simplificam' c√≥digo de seguran√ßa
