# PyTorch vs Scikit-learn

## 🟦 **Scikit-learn**

O **Scikit-learn** é uma das bibliotecas mais populares para aprendizado de máquina (**machine learning**) em Python. Ela oferece uma ampla variedade de algoritmos supervisionados e não supervisionados, como regressão linear e árvores de decisão. 

Sua principal vantagem é a simplicidade e facilidade de uso, com uma **API** padronizada que permite **treinar modelos com poucas linhas de código**. Além disso, é ideal para trabalhar com **dados estruturados** e tarefas de **classificação**, **regressão** e **agrupamento**. 

O Scikit-learn é amplamente utilizado em projetos de análise de dados, ciência de dados e aplicações empresariais onde modelos simples e eficientes são suficientes.

## 🟨 **PyTorch**

O **PyTorch** é um framework de **deep learning** desenvolvido pelo Facebook (**Meta**), amplamente utilizado na indústria e academia para **construir e treinar redes neurais**. Ele se destaca por sua abordagem de execução dinâmica (**define-by-run**), o que permite maior flexibilidade e controle sobre o processo de modelagem, facilitando a depuração e experimentação. 

Com suporte nativo à **aceleração em GPU**, o PyTorch é ideal para lidar com **grandes volumes** de dados e modelos complexos. É a escolha preferida de pesquisadores e engenheiros que precisam implementar soluções avançadas de visão computacional, **processamento de linguagem natural (NLP)** e aprendizado profundo personalizado.

# Comparativo 

| Aspecto | **Scikit-learn** | **PyTorch** |
|--------|------------------|-------------|
| Tipo de aprendizado | Aprendizado supervisionado e não supervisionado (Machine Learning) | Deep Learning e computação tensorial |
| Estrutura | APIs prontas e fixas | Arquiteturas flexíveis e customizáveis |
| Gráficos de computação | Não há | Gráfico dinâmico (`define-by-run`) |
| Autodiferação | Não suporta | Sim (via `autograd`) |
| Execução em GPU | Não | Sim |
| Complexidade | Baixa (ideal para iniciantes) | Média-alta (requer conhecimento de DL) |
| Frameworks associados | Pandas, Matplotlib, Seaborn | TorchVision, TorchText, Fastai |
| Desempenho em grandes dados | Adequado para datasets médios | Ideal para datasets grandes e modelos complexos |

## 1. **Tipo de Aprendizado**

### 🔹 Scikit-learn

- Foca em **machine learning clássico**
- É ideal para problemas mais simples ou bem estruturados com poucas características e conjuntos de dados moderados.
- Oferece um conjunto padronizado de métodos prontos para uso.

### 🔹 PyTorch
- Foca em **deep learning**
- Permite criar e treinar modelos altamente personalizados.
- Usado principalmente para tarefas complexas como reconhecimento de imagem, processamento de linguagem natural (NLP), geração de texto, etc.



> ✅ **Conclusão:** Use **Scikit-learn** para ML tradicional; use **PyTorch** para deep learning avançado.

## 2. **Estrutura e Flexibilidade**

### 🔹 Scikit-learn
- Tem uma API padronizada e muito intuitiva.
- Métodos como `.fit()`, `.predict()` e `.score()` são comuns a todos os modelos.
- Pouca liberdade para modificar internamente os algoritmos.

### 🔹 PyTorch
- Totalmente **flexível**: você define as camadas, funções de ativação, otimizadores e até o loop de treinamento.
- Permite implementar qualquer tipo de rede neural, incluindo arquiteturas personalizadas.
- Ideal para pesquisas e projetos que exigem inovação na arquitetura do modelo.

> ✅ **Conclusão:** Enquanto o **Scikit-learn** oferece ferramentas prontas, o **PyTorch** permite construir modelos sob medida.

## 3. **Autodiferação (Cálculo de Gradientes)**

- Gradientes são vetores que indicam a direção e a taxa de maior crescimento de uma função.
- Em machine learning e deep learning, os gradientes medem como pequenas mudanças nos parâmetros de um modelo afetam o valor da função de perda (erro).
- Em outras palavras, eles mostram quanto e em qual direção devemos ajustar os pesos do modelo para minimizar esse erro.
- Durante o treinamento de uma rede neural, o algoritmo usa o cálculo dos gradientes via **backpropagation** para atualizar automaticamente os pesos com base no erro cometido nas previsões.
- Essa informação é essencial para que o modelo aprenda gradualmente a partir dos dados.
- O conceito está profundamente ligado ao **cálculo diferencial**, já que os gradientes são basicamente derivadas parciais da função de perda em relação a cada peso do modelo .

### 🔹 Scikit-learn
- Não possui mecanismos automáticos para calcular gradientes.
- Os algoritmos já vêm com otimização embutida.

### 🔹 PyTorch
- Possui o módulo **`autograd`**, que rastreia operações feitas sobre tensores e calcula automaticamente os gradientes.
- Essencial para o treinamento de redes neurais usando backpropagation.

#### Exemplo:

In [3]:
import torch

# Definindo o tensor com requires_grad=True para calcular gradientes
x = torch.tensor(2.0, requires_grad=True)

# Definindo uma função simples: y = x^2
y = x ** 2

# Calculando gradientes usando backpropagation
y.backward()

# Imprimindo o gradiente de y em relação a x
print("Gradiente de y = x² em x=2:", x.grad.item())  # Resultado esperado: 4.0

Gradiente de y = x² em x=2: 4.0


#### Explicação

✅ **Explicação:** Aqui, o PyTorch calcula automaticamente a derivada de `y = x²` em relação a `x`.

✅ **Conclusão:** O **PyTorch** automatiza o cálculo de gradientes — algo fundamental para deep learning.

## 4. **Execução em GPU**

### 🔹 Scikit-learn
- **Não suporta** aceleração por GPU.
- Todo o processamento é feito na CPU.

### 🔹 PyTorch
- Suporte nativo à **execução em GPU (CUDA)**.
- Permite mover modelos e dados entre CPU e GPU com facilidade.
- Muito útil para lidar com grandes volumes de dados e modelos complexos.

#### Exemplo: 

In [8]:
import torch
import torch.nn as nn

# Definição de um modelo simples
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.linear = nn.Linear(10, 1)

    def forward(self, x):
        return self.linear(x)

# Instanciando o modelo e criando dados aleatórios
model = SimpleModel()
data = torch.randn(1, 10)  # Um batch com 10 features

# Escolher dispositivo
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Mover modelo e dados para GPU (se disponível)
model.to(device)
data = data.to(device)

# Fazer uma previsão
output = model(data)


print("Entrada:\n\t", data)
print("Saída:\n\t", output)


Entrada:
	 tensor([[ 0.0119, -0.1329,  1.0880, -0.8266, -1.2257, -0.4763,  0.6652, -0.2682,
          0.5577,  1.1459]])
Saída:
	 tensor([[-0.0318]], grad_fn=<AddmmBackward0>)


#### Explicação

- **super(...)** garante que o construtor da classe pai (nn.Module) também seja executado.

-  **self.linear = nn.Linear(10, 1):**  
    - Define uma camada linear (também chamada de fully connected).
    - Recebe 10 valores como entrada e produz 1 valor como saída.
    - Esta é uma rede neural extremamente simples: apenas uma camada.      
      
- O método **forward()** define como os dados fluem através do modelo.  
    - Neste caso, os dados entram em x e passam diretamente pela camada linear.
    - Este é o forward pass , ou seja, o processo de calcular uma saída com base na entrada.

- **torch.randn(...)** gera números aleatórios com distribuição normal (média 0, desvio padrão 1).

- Verifica se há suporte para **GPU** (CUDA) no sistema.
    - Se houver GPU compatível, device será "cuda".
    - Se não houver, ele usa "cpu" como fallback.

- Os dados e o modelo devem estar no mesmo lugar (CPU ou GPU), senão ocorre erro.

- A saída é um tensor com o resultado da operação realizada pelo modelo.

- A entrada tinha 10 elementos e foi transformada em 1 valor. Os pesos são inicializados aleatoriamente.

- nn.Linear(10, 1) é uma camada que transforma vetores de entrada com 10 características em 1 valor de saída , aplicando uma combinação linear dos valores de entrada com pesos aprendíveis durante o treinamento. 

## 5. **Desempenho com Grandes Dados**

### 🔹 Scikit-learn
- Bom desempenho com conjuntos de dados pequenos e médios.
- Começa a ficar lento com datasets muito grandes ou modelos complexos.

### 🔹 PyTorch
- Excelente desempenho com grandes volumes de dados.
- Pode escalar para datasets com milhões de amostras.
- Aceleração via GPU melhora drasticamente o tempo de treinamento.

## 6. **Exemplos de Aplicações Práticas**

| Aplicação | Biblioteca Recomendada |
|----------|-------------------------|
| Classificação de emails (spam/não-spam) | Scikit-learn |
| Previsão de vendas com base em histórico | Scikit-learn |
| Detecção de objetos em imagens | PyTorch |
| Tradução automática de textos (NLP) | PyTorch |
| Geração de texto (ex: chatbots) | PyTorch |
| Análise de sentimentos em redes sociais | PyTorch |
| Diagnóstico médico com imagens (raio-X, MRI) | PyTorch |

## 7. Resumo 

| Característica | Scikit-learn | PyTorch |
|---------------|--------------|---------|
| Tipo de modelagem | Machine Learning tradicional | Deep Learning |
| Flexibilidade | Baixa | Alta |
| Gráfico de computação | Estático/Sequencial | Dinâmico (define-by-run) |
| Autograd | Não | Sim |
| Suporte a GPU | Não | Sim |
| Complexidade | Baixa | Alta |
| Performance com grandes dados | Moderada | Alta |
| Ideal para | Iniciantes, ML clássico | Pesquisa, deep learning avançado |

## 🚀 Conclusão

- **Use Scikit-learn** quando:
  - Você está começando no mundo do machine learning.
  - Precisa resolver problemas clássicos de classificação, regressão ou agrupamento.
  - Trabalhar com dados estruturados e de tamanho moderado.

- **Use PyTorch** quando:
  - Quiser explorar deep learning e redes neurais.
  - Tiver acesso a GPU e desejar melhor desempenho.
  - Precisar de flexibilidade para criar modelos personalizados.
  - Estiver envolvido em pesquisa ou aplicações complexas (como visão computacional, NLP, geração de conteúdo).