<a href="https://colab.research.google.com/github/MarceloClaro/QuantumDeepClassifier/blob/main/QuantumDeepClassifier.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install qiskit
!pip install pennylane
!pip install tensorflow-quantum
!pip install matplotlib
!pip install pillow


Sim, podemos ajustar o código para visualizar as imagens das classes extraídas do arquivo ZIP. Aqui está o passo a passo para carregar e exibir as imagens:

---

### Código Ajustado para Visualizar Imagens

```python
import zipfile
import os
from PIL import Image
import matplotlib.pyplot as plt

# Caminho do arquivo zip carregado
zip_path = '/content/melanomas.zip'
extract_path = '/content/melanomas'

# Extraindo o arquivo zip
with zipfile.ZipFile(zip_path, 'r') as zip_ref:
    zip_ref.extractall(extract_path)

# Listando os arquivos extraídos
extracted_files = []
for root, dirs, files in os.walk(extract_path):
    for file in files:
        if file.endswith((".jpg", ".png")):  # Verificar tipos de arquivos de imagem
            extracted_files.append(os.path.join(root, file))

# Mostrando a estrutura dos arquivos
print(f"Número total de imagens: {len(extracted_files)}")
print("Exemplo de arquivos:", extracted_files[:10])

# Função para visualizar imagens por classe
def visualize_images(files, n=5):
    """Visualizar as primeiras N imagens de cada classe"""
    classes = {}
    for file in files:
        class_name = os.path.basename(os.path.dirname(file))
        if class_name not in classes:
            classes[class_name] = []
        classes[class_name].append(file)

    for class_name, images in classes.items():
        print(f"Classe: {class_name} | Total de imagens: {len(images)}")
        plt.figure(figsize=(15, 5))
        plt.suptitle(f"Exemplos da classe: {class_name}")
        for i, img_path in enumerate(images[:n]):
            img = Image.open(img_path)
            plt.subplot(1, n, i + 1)
            plt.imshow(img)
            plt.axis("off")
            plt.title(f"{class_name} {i+1}")
        plt.show()

# Visualizar as imagens
visualize_images(extracted_files, n=5)  # Visualiza as primeiras 5 imagens de cada classe
```

---

### Explicação do Código
1. **Extração do ZIP**:
   - O código extrai as imagens para o diretório especificado (`/content/melanomas`).
2. **Filtragem de Arquivos**:
   - Apenas arquivos com extensões de imagem (`.jpg`, `.png`) são incluídos.
3. **Organização por Classe**:
   - As imagens são agrupadas com base no nome da subpasta (representando as classes).
4. **Visualização**:
   - Para cada classe, as primeiras `n` imagens são exibidas em um gráfico.

---

### Resultados Esperados
- Para cada classe encontrada no diretório extraído, o código exibe uma linha de imagens com títulos indicando a classe e o índice da imagem.

Teste o código, e me avise se precisar de mais ajustes ou se houver dúvidas! 😊

In [None]:
import zipfile
import os
from PIL import Image
import matplotlib.pyplot as plt

# Caminho do arquivo zip carregado
zip_path = '/content/melanomas.zip'
extract_path = '/content/melanomas'

# Extraindo o arquivo zip
with zipfile.ZipFile(zip_path, 'r') as zip_ref:
    zip_ref.extractall(extract_path)

# Listando os arquivos extraídos
extracted_files = []
for root, dirs, files in os.walk(extract_path):
    for file in files:
        if file.endswith((".jpg", ".png")):  # Verificar tipos de arquivos de imagem
            extracted_files.append(os.path.join(root, file))

# Mostrando a estrutura dos arquivos
print(f"Número total de imagens: {len(extracted_files)}")
print("Exemplo de arquivos:", extracted_files[:10])

# Função para visualizar imagens por classe
def visualize_images(files, n=5):
    """Visualizar as primeiras N imagens de cada classe"""
    classes = {}
    for file in files:
        class_name = os.path.basename(os.path.dirname(file))
        if class_name not in classes:
            classes[class_name] = []
        classes[class_name].append(file)

    for class_name, images in classes.items():
        print(f"Classe: {class_name} | Total de imagens: {len(images)}")
        plt.figure(figsize=(15, 5))
        plt.suptitle(f"Exemplos da classe: {class_name}")
        for i, img_path in enumerate(images[:n]):
            img = Image.open(img_path)
            plt.subplot(1, n, i + 1)
            plt.imshow(img)
            plt.axis("off")
            plt.title(f"{class_name} {i+1}")
        plt.show()

# Visualizar as imagens
visualize_images(extracted_files, n=5)  # Visualiza as primeiras 5 imagens de cada classe


Sim, podemos ajustar o código para:

1. **Visualizar a imagem original e redimensionada**.
2. **Salvar os dados redimensionados em um DataFrame e exportá-lo para um arquivo, se necessário.**

---

### Código Ajustado para Visualização e Criação de DataFrame

```python
from PIL import Image
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Função para processar e redimensionar imagens
def process_and_visualize_image(image_path, resize_to=(64, 64)):
    """Processa a imagem, redimensiona e visualiza"""
    # Abrir a imagem
    image = Image.open(image_path)
    
    # Redimensionar a imagem
    image_resized = image.resize(resize_to)
    
    # Converter para array normalizado
    image_array = np.array(image_resized) / 255.0

    # Visualizar a imagem original e redimensionada
    plt.figure(figsize=(10, 5))
    plt.subplot(1, 2, 1)
    plt.imshow(image)
    plt.title("Imagem Original")
    plt.axis("off")

    plt.subplot(1, 2, 2)
    plt.imshow(image_resized)
    plt.title(f"Imagem Redimensionada {resize_to}")
    plt.axis("off")
    plt.show()

    return image_array

# Exemplo com a primeira imagem
sample_image_path = extracted_files[0]
processed_image = process_and_visualize_image(sample_image_path)

# Criar um DataFrame com os dados redimensionados
def create_dataframe(image_paths, resize_to=(64, 64)):
    """Processa imagens e cria um DataFrame com arrays normalizados"""
    data = []
    labels = []
    for image_path in image_paths:
        # Processar a imagem
        image_resized = Image.open(image_path).resize(resize_to)
        image_array = np.array(image_resized).flatten() / 255.0  # Achatar a matriz
        
        # Obter o rótulo da classe
        label = os.path.basename(os.path.dirname(image_path))
        
        # Adicionar ao dataset
        data.append(image_array)
        labels.append(label)
    
    # Criar o DataFrame
    df = pd.DataFrame(data)
    df['label'] = labels
    return df

# Criar o DataFrame com todas as imagens
df = create_dataframe(extracted_files)

# Visualizar parte do DataFrame
print(df.head())

# Salvar o DataFrame em um arquivo CSV
output_path = "processed_images.csv"
df.to_csv(output_path, index=False)
print(f"DataFrame salvo em: {output_path}")
```

---

### Explicação do Código

1. **Visualização da Imagem**:
   - A função `process_and_visualize_image` exibe a imagem original e a redimensionada lado a lado.

2. **Criação do DataFrame**:
   - Cada imagem é convertida para um array 1D (achatar a matriz).
   - Os arrays são armazenados como linhas no DataFrame, com uma coluna adicional para os rótulos das classes.

3. **Exportação para CSV**:
   - O DataFrame é salvo em um arquivo CSV (`processed_images.csv`), para ser reutilizado posteriormente.

---

### Resultados Esperados
- Você verá a imagem original e redimensionada para confirmar o processo de redimensionamento.
- O DataFrame conterá os dados de todas as imagens redimensionadas e seus rótulos de classe.
- O arquivo CSV permitirá reutilizar os dados sem necessidade de processar as imagens novamente.

Teste o código e informe se precisar de mais ajustes! 😊

In [None]:
from PIL import Image
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Função para processar e redimensionar imagens
def process_and_visualize_image(image_path, resize_to=(64, 64)):
    """Processa a imagem, redimensiona e visualiza"""
    # Abrir a imagem
    image = Image.open(image_path)

    # Redimensionar a imagem
    image_resized = image.resize(resize_to)

    # Converter para array normalizado
    image_array = np.array(image_resized) / 255.0

    # Visualizar a imagem original e redimensionada
    plt.figure(figsize=(10, 5))
    plt.subplot(1, 2, 1)
    plt.imshow(image)
    plt.title("Imagem Original")
    plt.axis("off")

    plt.subplot(1, 2, 2)
    plt.imshow(image_resized)
    plt.title(f"Imagem Redimensionada {resize_to}")
    plt.axis("off")
    plt.show()

    return image_array

# Exemplo com a primeira imagem
sample_image_path = extracted_files[0]
processed_image = process_and_visualize_image(sample_image_path)

# Criar um DataFrame com os dados redimensionados
def create_dataframe(image_paths, resize_to=(64, 64)):
    """Processa imagens e cria um DataFrame com arrays normalizados"""
    data = []
    labels = []
    for image_path in image_paths:
        # Processar a imagem
        image_resized = Image.open(image_path).resize(resize_to)
        image_array = np.array(image_resized).flatten() / 255.0  # Achatar a matriz

        # Obter o rótulo da classe
        label = os.path.basename(os.path.dirname(image_path))

        # Adicionar ao dataset
        data.append(image_array)
        labels.append(label)

    # Criar o DataFrame
    df = pd.DataFrame(data)
    df['label'] = labels
    return df

# Criar o DataFrame com todas as imagens
df = create_dataframe(extracted_files)

# Visualizar parte do DataFrame
print(df.head())

# Salvar o DataFrame em um arquivo CSV
output_path = "processed_images.csv"
df.to_csv(output_path, index=False)
print(f"DataFrame salvo em: {output_path}")


Aqui está o código ajustado para visualizar os processos, a normalização das imagens e salvar os dados processados em um DataFrame para análise posterior.

---

### Código Ajustado com Visualização e DataFrame

```python
import glob
import os
from PIL import Image
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Caminho das pastas para cada classe
class_dirs = [os.path.join(extract_path, "benigno"), os.path.join(extract_path, "maligno")]
image_size = (64, 64)

# Função para processar e visualizar imagens
def process_images_with_visualization(image_paths, image_size, n_visualizations=5):
    images = []
    labels = []
    visualized = 0  # Contador de imagens visualizadas
    for image_path in image_paths:
        # Identificando a classe a partir do caminho
        label = os.path.basename(os.path.dirname(image_path))
        
        # Abrindo, redimensionando e normalizando a imagem
        image = Image.open(image_path)
        image_resized = image.resize(image_size)
        image_array = np.array(image_resized) / 255.0  # Normalização
        
        # Adicionar ao dataset
        images.append(image_array)
        labels.append(label)
        
        # Visualizar algumas imagens
        if visualized < n_visualizations:
            plt.figure(figsize=(10, 5))
            plt.subplot(1, 2, 1)
            plt.imshow(image)
            plt.title("Original")
            plt.axis("off")
            plt.subplot(1, 2, 2)
            plt.imshow(image_resized)
            plt.title(f"Redimensionada ({image_size}) e Normalizada")
            plt.axis("off")
            plt.show()
            print(f"Array Normalizado ({image_array.shape}):")
            print(image_array[:5, :5, 0])  # Mostrando parte da matriz normalizada
            visualized += 1

    return np.array(images), labels

# Coletando todas as imagens do diretório
all_image_paths = [img for class_dir in class_dirs for img in glob.glob(f"{class_dir}/*.jpg")]

# Processar imagens com visualização
processed_images, labels = process_images_with_visualization(all_image_paths, image_size)

# Criar DataFrame para salvar os dados
def create_dataframe(images, labels):
    flattened_images = [img.flatten() for img in images]  # Achatar as imagens
    df = pd.DataFrame(flattened_images)
    df['label'] = labels
    return df

# Criar e salvar o DataFrame
df = create_dataframe(processed_images, labels)
print("Amostra do DataFrame:")
print(df.head())

output_path = "processed_images_with_labels.csv"
df.to_csv(output_path, index=False)
print(f"DataFrame salvo em: {output_path}")
```

---

### O Que Esse Código Faz
1. **Visualização das Imagens**:
   - Exibe as imagens originais e redimensionadas lado a lado.
   - Mostra a matriz normalizada das imagens para verificar os valores (entre 0 e 1).

2. **Processamento das Imagens**:
   - Redimensiona as imagens para \(64 \times 64\) pixels.
   - Normaliza os valores de pixel para o intervalo \([0, 1]\).

3. **Criação do DataFrame**:
   - Achata as imagens redimensionadas em vetores 1D.
   - Adiciona uma coluna com os rótulos correspondentes.

4. **Exportação para CSV**:
   - Salva o DataFrame com os dados normalizados e os rótulos em um arquivo CSV.

---

### Resultados Esperados
- Visualização de algumas imagens originais e redimensionadas.
- Matriz normalizada exibida para análise.
- DataFrame contendo:
  - Vetores de pixels normalizados (uma linha por imagem).
  - Rótulos das classes como uma coluna separada.
- Arquivo `processed_images_with_labels.csv` contendo o DataFrame para análise posterior.

Teste o código e informe os resultados! 😊

In [None]:
import glob
import os
from PIL import Image
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Caminho das pastas para cada classe
class_dirs = [os.path.join(extract_path, "benigno"), os.path.join(extract_path, "maligno")]
image_size = (64, 64)

# Função para processar e visualizar imagens
def process_images_with_visualization(image_paths, image_size, n_visualizations=5):
    images = []
    labels = []
    visualized = 0  # Contador de imagens visualizadas
    for image_path in image_paths:
        # Identificando a classe a partir do caminho
        label = os.path.basename(os.path.dirname(image_path))

        # Abrindo, redimensionando e normalizando a imagem
        image = Image.open(image_path)
        image_resized = image.resize(image_size)
        image_array = np.array(image_resized) / 255.0  # Normalização

        # Adicionar ao dataset
        images.append(image_array)
        labels.append(label)

        # Visualizar algumas imagens
        if visualized < n_visualizations:
            plt.figure(figsize=(10, 5))
            plt.subplot(1, 2, 1)
            plt.imshow(image)
            plt.title("Original")
            plt.axis("off")
            plt.subplot(1, 2, 2)
            plt.imshow(image_resized)
            plt.title(f"Redimensionada ({image_size}) e Normalizada")
            plt.axis("off")
            plt.show()
            print(f"Array Normalizado ({image_array.shape}):")
            print(image_array[:5, :5, 0])  # Mostrando parte da matriz normalizada
            visualized += 1

    return np.array(images), labels

# Coletando todas as imagens do diretório
all_image_paths = [img for class_dir in class_dirs for img in glob.glob(f"{class_dir}/*.jpg")]

# Processar imagens com visualização
processed_images, labels = process_images_with_visualization(all_image_paths, image_size)

# Criar DataFrame para salvar os dados
def create_dataframe(images, labels):
    flattened_images = [img.flatten() for img in images]  # Achatar as imagens
    df = pd.DataFrame(flattened_images)
    df['label'] = labels
    return df

# Criar e salvar o DataFrame
df = create_dataframe(processed_images, labels)
print("Amostra do DataFrame:")
print(df.head())

output_path = "processed_images_with_labels.csv"
df.to_csv(output_path, index=False)
print(f"DataFrame salvo em: {output_path}")


Para incluir visualizações, informações sobre os dados processados e salvá-los em um DataFrame após a aplicação de `LabelEncoder` e `train_test_split`, aqui está o código ajustado:

---

### Código Ajustado

```python
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
import pandas as pd
import matplotlib.pyplot as plt

# Convertendo rótulos de texto para valores numéricos
label_encoder = LabelEncoder()
encoded_labels = label_encoder.fit_transform(labels)

# Transformando imagens em vetores unidimensionais
flattened_images = processed_images.reshape(processed_images.shape[0], -1)

# Dividindo os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(flattened_images, encoded_labels, test_size=0.2, random_state=42)

# Visualização de amostras do conjunto de treino
def visualize_data_split(X, y, label_encoder, n=5):
    """Visualiza algumas imagens do conjunto de treino ou teste"""
    for i in range(n):
        image = X[i].reshape(64, 64, 3)  # Restaurar formato original
        label = label_encoder.inverse_transform([y[i]])[0]  # Decodificar rótulo numérico para texto
        plt.imshow(image)
        plt.title(f"Classe: {label}")
        plt.axis("off")
        plt.show()
        print(f"Matriz Normalizada (amostra {i+1}):")
        print(image[:5, :5, 0])  # Exibe uma parte da matriz normalizada

# Visualizar amostras do conjunto de treino
print("Amostras do conjunto de treino:")
visualize_data_split(X_train, y_train, label_encoder, n=5)

# Criar DataFrame com os dados de treino
def create_dataframe(X, y, label_encoder):
    """Cria um DataFrame com as imagens achatadas e os rótulos"""
    df = pd.DataFrame(X)
    df['label'] = label_encoder.inverse_transform(y)  # Adicionar os rótulos decodificados
    return df

# Criar DataFrames para treino e teste
train_df = create_dataframe(X_train, y_train, label_encoder)
test_df = create_dataframe(X_test, y_test, label_encoder)

# Salvar os DataFrames em arquivos CSV
train_df.to_csv("train_data.csv", index=False)
test_df.to_csv("test_data.csv", index=False)

print("DataFrame de treino salvo como 'train_data.csv'")
print("DataFrame de teste salvo como 'test_data.csv'")

# Exibir amostras dos DataFrames
print("Amostra do DataFrame de treino:")
print(train_df.head())
print("Amostra do DataFrame de teste:")
print(test_df.head())
```

---

### O Que Esse Código Faz

1. **LabelEncoder**:
   - Converte rótulos textuais (ex.: "benigno", "maligno") em valores numéricos.

2. **Flattened Images**:
   - As imagens redimensionadas \(64 \times 64 \times 3\) são transformadas em vetores unidimensionais.

3. **Divisão de Dados**:
   - Usa `train_test_split` para dividir as imagens e os rótulos em conjuntos de treino e teste.

4. **Visualização**:
   - Exibe algumas imagens do conjunto de treino com seus rótulos decodificados.
   - Mostra parte das matrizes normalizadas das imagens.

5. **Criação de DataFrames**:
   - Salva os dados de treino e teste (incluindo rótulos) em DataFrames separados.
   - Exporta os DataFrames para arquivos CSV (`train_data.csv` e `test_data.csv`).

---

### Resultados Esperados
1. **Visualização**:
   - Você verá as primeiras 5 imagens do conjunto de treino com os rótulos decodificados.
   - Matriz normalizada será exibida para cada imagem.

2. **Arquivos CSV**:
   - Os dados de treino e teste serão salvos como arquivos CSV:
     - `train_data.csv`
     - `test_data.csv`

3. **Amostra de DataFrames**:
   - Os DataFrames com os dados processados serão exibidos para confirmação.

Teste o código e me avise se precisar de mais ajustes! 😊

In [None]:
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
import pandas as pd
import matplotlib.pyplot as plt

# Convertendo rótulos de texto para valores numéricos
label_encoder = LabelEncoder()
encoded_labels = label_encoder.fit_transform(labels)

# Transformando imagens em vetores unidimensionais
flattened_images = processed_images.reshape(processed_images.shape[0], -1)

# Dividindo os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(flattened_images, encoded_labels, test_size=0.2, random_state=42)

# Visualização de amostras do conjunto de treino
def visualize_data_split(X, y, label_encoder, n=5):
    """Visualiza algumas imagens do conjunto de treino ou teste"""
    for i in range(n):
        image = X[i].reshape(64, 64, 3)  # Restaurar formato original
        label = label_encoder.inverse_transform([y[i]])[0]  # Decodificar rótulo numérico para texto
        plt.imshow(image)
        plt.title(f"Classe: {label}")
        plt.axis("off")
        plt.show()
        print(f"Matriz Normalizada (amostra {i+1}):")
        print(image[:5, :5, 0])  # Exibe uma parte da matriz normalizada

# Visualizar amostras do conjunto de treino
print("Amostras do conjunto de treino:")
visualize_data_split(X_train, y_train, label_encoder, n=5)

# Criar DataFrame com os dados de treino
def create_dataframe(X, y, label_encoder):
    """Cria um DataFrame com as imagens achatadas e os rótulos"""
    df = pd.DataFrame(X)
    df['label'] = label_encoder.inverse_transform(y)  # Adicionar os rótulos decodificados
    return df

# Criar DataFrames para treino e teste
train_df = create_dataframe(X_train, y_train, label_encoder)
test_df = create_dataframe(X_test, y_test, label_encoder)

# Salvar os DataFrames em arquivos CSV
train_df.to_csv("train_data.csv", index=False)
test_df.to_csv("test_data.csv", index=False)

print("DataFrame de treino salvo como 'train_data.csv'")
print("DataFrame de teste salvo como 'test_data.csv'")

# Exibir amostras dos DataFrames
print("Amostra do DataFrame de treino:")
print(train_df.head())
print("Amostra do DataFrame de teste:")
print(test_df.head())



### Explicação do Código

1. **Configuração do Dispositivo Quântico**:
   - Foi utilizado o dispositivo `default.qubit` com 10 qubits.
   - Os qubits servem como a base para realizar os cálculos quânticos e as simulações.

2. **Embedding Quântico (`data_embedding`)**:
   - Os valores clássicos das amostras (`features`) são incorporados no circuito quântico usando rotações \( RY \).
   - Cada qubit recebe um valor de `features`, que é convertido em uma rotação.

3. **Modelo Quântico (`quantum_model`)**:
   - Após o embedding, o circuito aplica camadas de entanglement (`BasicEntanglerLayers`), que introduzem correlações entre os qubits.
   - Finalmente, a expectativa \( \langle Z \rangle \) é medida no primeiro qubit.

4. **Função `circuit`**:
   - É um `QNode` que encapsula o modelo quântico. É usado para calcular as previsões baseadas nos pesos e nas features fornecidas.

5. **Processamento de Amostras**:
   - A função `process_samples`:
     - Executa o circuito para cada amostra de entrada.
     - Calcula a previsão (saída do circuito).
     - Calcula o resíduo, ou seja, a diferença entre a previsão e o rótulo verdadeiro.

6. **DataFrame**:
   - Cada entrada no DataFrame contém:
     - As `features` (valores normalizados da amostra).
     - O `label` (rótulo verdadeiro).
     - A `prediction` (saída do circuito quântico).
     - O `residual` (erro entre a previsão e o rótulo verdadeiro).
   - O DataFrame é salvo como `quantum_circuit_results.csv`.

7. **Histograma**:
   - A função `plot_histograms` exibe a distribuição das previsões para cada classe (0 e 1).
   - Permite verificar se há separação clara entre as classes baseada nas saídas do circuito.

8. **Circuitos das Amostras**:
   - A função `plot_circuits` desenha o circuito usado para processar algumas amostras de cada classe.
   - Utiliza `qml.draw(circuit)` para gerar a representação textual do circuito.

---

### Explicação dos Resultados

1. **DataFrame**:
   - Contém as previsões e os resíduos para cada amostra.
   - Amostras exibidas:
     - `prediction` é um número contínuo (ex.: 0.006515, 0.068560).
     - `residual` indica a diferença entre a previsão e o rótulo (valores negativos mostram subestimação do rótulo pelo modelo).

2. **Histograma**:
   - O gráfico mostra a sobreposição das distribuições de previsão para as classes 0 e 1.
   - No exemplo:
     - A classe 0 está concentrada em previsões menores.
     - A classe 1 tem algumas previsões muito maiores.

3. **Circuitos**:
   - Cada circuito mostrado inclui:
     - As rotações \( RY \) com os valores de `features`.
     - As camadas de entanglement (`BasicEntanglerLayers`) parametrizadas pelos pesos (`M0`).
   - Cada circuito é diferente, pois os valores de `features` variam entre as amostras.

---

### Próximos Passos

1. **Análise dos Resultados**:
   - Se os resíduos forem altos, o modelo pode precisar de ajustes:
     - Aumentar o número de camadas ou qubits.
     - Melhorar os pesos iniciais.

2. **Visualização Avançada**:
   - Adicionar gráficos de dispersão (predição vs rótulo).
   - Analisar resíduos em relação às classes.

3. **Treinamento**:
   - Incorporar uma etapa de otimização (treinamento) para ajustar os pesos do circuito e melhorar as previsões.

Se precisar de ajuda com esses ajustes ou mais explicações, é só avisar! 😊

In [None]:
import pennylane as qml
from pennylane import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Configuração do dispositivo quântico
n_qubits = 10
dev = qml.device("default.qubit", wires=n_qubits)

# Função de embedding quântico
def data_embedding(features, wires):
    for i, wire in enumerate(wires):
        qml.RY(features[i], wires=wire)

# Função do modelo quântico
def quantum_model(weights, features):
    data_embedding(features, range(n_qubits))
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    return qml.expval(qml.PauliZ(0))

# QNode com Pennylane
n_layers = 3
weights_shape = (n_layers, n_qubits)
weights = np.random.random(weights_shape)

@qml.qnode(dev)
def circuit(weights, features):
    return quantum_model(weights, features)

# Processar todas as amostras e armazenar no DataFrame
def process_samples(X, y, n_qubits, weights):
    data = []
    for i in range(len(X)):
        features = X[i][:n_qubits]
        features = np.pad(features, (0, n_qubits - len(features))) if len(features) < n_qubits else features[:n_qubits]
        prediction = float(circuit(weights, features))
        residual = prediction - y[i]
        data.append({"features": features.tolist(), "label": y[i], "prediction": prediction, "residual": residual})
    return pd.DataFrame(data)

# Gerar o DataFrame
df = process_samples(X_train, y_train, n_qubits, weights)

# Visualizar parte do DataFrame
print("Amostra do DataFrame:")
print(df.head())

# Salvar o DataFrame em um CSV
df.to_csv("quantum_circuit_results.csv", index=False)
print("DataFrame salvo como 'quantum_circuit_results.csv'")

# Gráficos de histograma para cada classe
def plot_histograms(df):
    plt.figure(figsize=(12, 6))
    for label in df['label'].unique():
        subset = df[df['label'] == label]
        plt.hist(subset['prediction'], bins=20, alpha=0.7, label=f"Classe {label}")
    plt.title("Distribuição das Previsões por Classe")
    plt.xlabel("Previsão")
    plt.ylabel("Frequência")
    plt.legend()
    plt.show()

# Plotar histogramas
plot_histograms(df)

# Visualizar o circuito para cada classe usando qml.draw
def plot_circuits(X, y, n_samples=2):
    for label in np.unique(y):
        indices = np.where(y == label)[0][:n_samples]
        for idx in indices:
            features = X[idx][:n_qubits]
            features = np.pad(features, (0, n_qubits - len(features))) if len(features) < n_qubits else features[:n_qubits]
            print(f"Circuito para a amostra {idx} (Classe {label}):")
            drawer = qml.draw(circuit)(weights, features)
            print(drawer)
            print()

# Plotar circuitos
plot_circuits(X_train, y_train)


Aqui está o código ajustado que implementa os próximos passos propostos, incluindo o ajuste dos pesos, visualização avançada e armazenamento dos resultados no DataFrame.

---

### Código Ajustado com Otimização e Visualização

```python
import pennylane as qml
from pennylane import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pennylane.optimize import AdamOptimizer

# Configuração do dispositivo quântico
n_qubits = 10
n_layers = 4  # Aumentar o número de camadas para maior expressividade
dev = qml.device("default.qubit", wires=n_qubits)

# Função de embedding quântico
def data_embedding(features, wires):
    for i, wire in enumerate(wires):
        qml.RY(features[i], wires=wire)

# Função do modelo quântico
def quantum_model(weights, features):
    data_embedding(features, range(n_qubits))
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    return qml.expval(qml.PauliZ(0))

# QNode com Pennylane
weights_shape = (n_layers, n_qubits)

@qml.qnode(dev)
def circuit(weights, features):
    return quantum_model(weights, features)

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)

# Inicialização de pesos
weights = np.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)

# Configuração do otimizador
opt = AdamOptimizer(stepsize=0.01)
steps = 50  # Número de iterações

# Dados de treino e teste (ajustar para suportar as dimensões corretas)
X_train_resized = X_train[:, :n_qubits]  # Usar apenas os primeiros n_qubits features
X_test_resized = X_test[:, :n_qubits]

# Treinamento
train_costs = []
test_costs = []

for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train_resized, y_train), weights)
    train_cost = cost(weights, X_train_resized, y_train)
    test_cost = cost(weights, X_test_resized, y_test)
    train_costs.append(train_cost)
    test_costs.append(test_cost)
    if step % 10 == 0:
        print(f"Step {step}/{steps}: Train Cost = {train_cost:.4f} | Test Cost = {test_cost:.4f}")

# Avaliação final
final_train_cost = cost(weights, X_train_resized, y_train)
final_test_cost = cost(weights, X_test_resized, y_test)
print(f"Custo final no conjunto de treino: {final_train_cost:.4f}")
print(f"Custo final no conjunto de teste: {final_test_cost:.4f}")

# Previsões
y_train_pred = [float(circuit(weights, x)) for x in X_train_resized]
y_test_pred = [float(circuit(weights, x)) for x in X_test_resized]

# Criação do DataFrame com resíduos
df_results = pd.DataFrame({
    "train_features": [x.tolist() for x in X_train_resized],
    "train_labels": y_train,
    "train_predictions": y_train_pred,
    "train_residuals": [pred - y for pred, y in zip(y_train_pred, y_train)],
    "test_features": [x.tolist() for x in X_test_resized],
    "test_labels": y_test,
    "test_predictions": y_test_pred,
    "test_residuals": [pred - y for pred, y in zip(y_test_pred, y_test)]
})

# Salvar os resultados no DataFrame
df_results.to_csv("quantum_model_results.csv", index=False)
print("Resultados salvos no arquivo 'quantum_model_results.csv'")

# Visualizações

# 1. Gráfico de custo durante o treinamento
plt.figure(figsize=(10, 6))
plt.plot(range(steps), train_costs, label="Custo de Treinamento", color="blue")
plt.plot(range(steps), test_costs, label="Custo de Teste", color="orange")
plt.title("Evolução do Custo Durante o Treinamento")
plt.xlabel("Passos")
plt.ylabel("Custo")
plt.legend()
plt.show()

# 2. Gráfico de dispersão (predição vs rótulo)
plt.figure(figsize=(10, 6))
plt.scatter(y_train, y_train_pred, alpha=0.7, label="Treino", color="blue")
plt.scatter(y_test, y_test_pred, alpha=0.7, label="Teste", color="orange")
plt.title("Dispersão: Previsão vs Rótulo")
plt.xlabel("Rótulo Verdadeiro")
plt.ylabel("Previsão")
plt.legend()
plt.show()

# 3. Histograma de resíduos
plt.figure(figsize=(10, 6))
plt.hist(df_results["train_residuals"], bins=20, alpha=0.7, label="Treino", color="blue")
plt.hist(df_results["test_residuals"], bins=20, alpha=0.7, label="Teste", color="orange")
plt.title("Distribuição dos Resíduos")
plt.xlabel("Resíduo")
plt.ylabel("Frequência")
plt.legend()
plt.show()
```

---

### Explicação do Código

1. **Treinamento do Modelo**:
   - Foi realizada uma etapa de otimização para ajustar os pesos do circuito quântico.
   - Usamos o custo médio quadrático como métrica de erro.

2. **Visualização**:
   - **Gráfico de Custo**: Exibe a evolução do custo durante as iterações de treinamento.
   - **Dispersão**: Mostra a relação entre as previsões do circuito e os rótulos verdadeiros.
   - **Histograma de Resíduos**: Visualiza a distribuição dos erros (resíduos) entre as previsões e os rótulos.

3. **Resultados no DataFrame**:
   - Inclui previsões, resíduos e features para treino e teste.
   - Salvo como `quantum_model_results.csv` para análise futura.

---

### Resultados Esperados

- **Custo de Treinamento**:
  - Deve diminuir com as iterações, indicando aprendizado do modelo.
  
- **Dispersão**:
  - Pontos próximos à linha \( y = x \) indicam previsões corretas.

- **Histograma**:
  - Resíduos concentrados próximos a 0 indicam bom desempenho do modelo.

Teste o código e visualize os gráficos e o DataFrame para confirmar os resultados! 😊

### Explicação do Código

O código é um pipeline para treinar e avaliar um modelo quântico de aprendizado de máquina. Ele combina métodos de otimização clássicos com computação quântica para processar dados e gerar previsões. Vamos detalhar cada etapa:

---

### **1. Configuração do Dispositivo Quântico**
```python
n_qubits = 10
n_layers = 4
dev = qml.device("default.qubit", wires=n_qubits)
```
- **`n_qubits`**: Define o número de qubits usados no circuito quântico.
- **`n_layers`**: Define o número de camadas de entanglement para maior expressividade do modelo.
- **`qml.device`**: Configura o simulador quântico (`default.qubit`), que emula o comportamento de um processador quântico.

---

### **2. Embedding Quântico**
```python
def data_embedding(features, wires):
    for i, wire in enumerate(wires):
        qml.RY(features[i], wires=wire)
```
- Os dados clássicos (`features`) são convertidos em rotações \( RY \) nos qubits. Isso "mapeia" os dados clássicos para o espaço quântico, permitindo processamento no circuito.

---

### **3. Modelo Quântico**
```python
def quantum_model(weights, features):
    data_embedding(features, range(n_qubits))
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    return qml.expval(qml.PauliZ(0))
```
- **`data_embedding`**: Insere os dados no circuito.
- **`BasicEntanglerLayers`**: Camadas parametrizadas que criam entanglement (correlações quânticas) entre os qubits. Essas camadas são ajustadas durante o treinamento.
- **`expval(qml.PauliZ(0))`**: Mede a expectativa do operador \( Z \) no primeiro qubit, gerando uma saída contínua (previsão).

---

### **4. Função do Circuito**
```python
@qml.qnode(dev)
def circuit(weights, features):
    return quantum_model(weights, features)
```
- O circuito encapsula o modelo quântico e é usado para calcular as previsões com base nos pesos e nas features fornecidas.

---

### **5. Função de Custo**
```python
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)
```
- **Erro Quadrático Médio**: Calcula o erro médio entre as previsões do circuito e os rótulos verdadeiros (`y`).
- Essa função é usada pelo otimizador para ajustar os pesos do circuito.

---

### **6. Inicialização dos Pesos e Configuração do Otimizador**
```python
weights = np.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)
opt = AdamOptimizer(stepsize=0.01)
steps = 50
```
- **`weights`**: Os pesos iniciais são aleatórios, com gradientes habilitados.
- **`AdamOptimizer`**: Otimizador que ajusta os pesos para minimizar o custo.
- **`steps`**: Define o número de iterações de treinamento.

---

### **7. Treinamento**
```python
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train_resized, y_train), weights)
```
- A cada iteração, o otimizador ajusta os pesos do circuito para minimizar o custo no conjunto de treinamento.
- Os custos de treinamento e teste são registrados em listas (`train_costs` e `test_costs`).

---

### **8. Avaliação Final**
```python
final_train_cost = cost(weights, X_train_resized, y_train)
final_test_cost = cost(weights, X_test_resized, y_test)
```
- O custo final é calculado para verificar a performance do modelo nos conjuntos de treinamento e teste.

---

### **9. Previsões e Resultados**
```python
y_train_pred = [float(circuit(weights, x)) for x in X_train_resized]
y_test_pred = [float(circuit(weights, x)) for x in X_test_resized]
```
- **Previsões**: O circuito é usado para gerar previsões para as amostras de treinamento e teste.
- **Resíduos**: A diferença entre previsão e rótulo verdadeiro é calculada e salva no DataFrame.

---

### **10. Visualizações**
#### **Gráfico de Custo**
```python
plt.plot(range(steps), train_costs, label="Custo de Treinamento", color="blue")
plt.plot(range(steps), test_costs, label="Custo de Teste", color="orange")
plt.title("Evolução do Custo Durante o Treinamento")
```
- Mostra como o custo diminui ao longo do treinamento, indicando aprendizado do modelo.

#### **Gráfico de Dispersão**
```python
plt.scatter(y_train, y_train_pred, alpha=0.7, label="Treino", color="blue")
plt.scatter(y_test, y_test_pred, alpha=0.7, label="Teste", color="orange")
plt.title("Dispersão: Previsão vs Rótulo")
```
- Compara as previsões do circuito com os rótulos verdadeiros. Pontos próximos à linha \( y = x \) indicam previsões precisas.

#### **Histograma de Resíduos**
```python
plt.hist(df_results["train_residuals"], bins=20, alpha=0.7, label="Treino", color="blue")
plt.hist(df_results["test_residuals"], bins=20, alpha=0.7, label="Teste", color="orange")
plt.title("Distribuição dos Resíduos")
```
- Visualiza a distribuição dos erros. Resíduos próximos de zero indicam bom desempenho do modelo.

---

### **11. Armazenamento dos Resultados**
```python
df_results.to_csv("quantum_model_results.csv", index=False)
```
- O DataFrame contendo as previsões, resíduos e features é salvo para análises posteriores.

---

### **Para que Serve**
Este código utiliza computação quântica para resolver problemas de aprendizado de máquina. Ele serve para:
1. Demonstrar como modelos quânticos podem ser usados para processar dados clássicos.
2. Treinar um modelo quântico que aprende a prever rótulos com base nos dados fornecidos.
3. Avaliar a performance do modelo por meio de métricas como custo, previsões e resíduos.
4. Visualizar os resultados para entender o comportamento do modelo e identificar possíveis ajustes.

---


In [None]:
import pennylane as qml
from pennylane import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pennylane.optimize import AdamOptimizer

# Configuração do dispositivo quântico
n_qubits = 10
n_layers = 4  # Aumentar o número de camadas para maior expressividade
dev = qml.device("default.qubit", wires=n_qubits)

# Função de embedding quântico
def data_embedding(features, wires):
    for i, wire in enumerate(wires):
        qml.RY(features[i], wires=wire)

# Função do modelo quântico
def quantum_model(weights, features):
    data_embedding(features, range(n_qubits))
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    return qml.expval(qml.PauliZ(0))

# QNode com Pennylane
weights_shape = (n_layers, n_qubits)

@qml.qnode(dev)
def circuit(weights, features):
    return quantum_model(weights, features)

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)

# Inicialização de pesos
weights = np.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)

# Configuração do otimizador
opt = AdamOptimizer(stepsize=0.01)
steps = 50  # Número de iterações

# Dados de treino e teste (ajustar para suportar as dimensões corretas)
X_train_resized = X_train[:, :n_qubits]  # Usar apenas os primeiros n_qubits features
X_test_resized = X_test[:, :n_qubits]

# Treinamento
train_costs = []
test_costs = []

for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train_resized, y_train), weights)
    train_cost = cost(weights, X_train_resized, y_train)
    test_cost = cost(weights, X_test_resized, y_test)
    train_costs.append(train_cost)
    test_costs.append(test_cost)
    if step % 10 == 0:
        print(f"Step {step}/{steps}: Train Cost = {train_cost:.4f} | Test Cost = {test_cost:.4f}")

# Avaliação final
final_train_cost = cost(weights, X_train_resized, y_train)
final_test_cost = cost(weights, X_test_resized, y_test)
print(f"Custo final no conjunto de treino: {final_train_cost:.4f}")
print(f"Custo final no conjunto de teste: {final_test_cost:.4f}")

# Previsões
y_train_pred = [float(circuit(weights, x)) for x in X_train_resized]
y_test_pred = [float(circuit(weights, x)) for x in X_test_resized]

# Criação do DataFrame com resíduos
df_results = pd.DataFrame({
    "train_features": [x.tolist() for x in X_train_resized],
    "train_labels": y_train,
    "train_predictions": y_train_pred,
    "train_residuals": [pred - y for pred, y in zip(y_train_pred, y_train)],
    "test_features": [x.tolist() for x in X_test_resized],
    "test_labels": y_test,
    "test_predictions": y_test_pred,
    "test_residuals": [pred - y for pred, y in zip(y_test_pred, y_test)]
})

# Salvar os resultados no DataFrame
df_results.to_csv("quantum_model_results.csv", index=False)
print("Resultados salvos no arquivo 'quantum_model_results.csv'")

# Visualizações

# 1. Gráfico de custo durante o treinamento
plt.figure(figsize=(10, 6))
plt.plot(range(steps), train_costs, label="Custo de Treinamento", color="blue")
plt.plot(range(steps), test_costs, label="Custo de Teste", color="orange")
plt.title("Evolução do Custo Durante o Treinamento")
plt.xlabel("Passos")
plt.ylabel("Custo")
plt.legend()
plt.show()

# 2. Gráfico de dispersão (predição vs rótulo)
plt.figure(figsize=(10, 6))
plt.scatter(y_train, y_train_pred, alpha=0.7, label="Treino", color="blue")
plt.scatter(y_test, y_test_pred, alpha=0.7, label="Teste", color="orange")
plt.title("Dispersão: Previsão vs Rótulo")
plt.xlabel("Rótulo Verdadeiro")
plt.ylabel("Previsão")
plt.legend()
plt.show()

# 3. Histograma de resíduos
plt.figure(figsize=(10, 6))
plt.hist(df_results["train_residuals"], bins=20, alpha=0.7, label="Treino", color="blue")
plt.hist(df_results["test_residuals"], bins=20, alpha=0.7, label="Teste", color="orange")
plt.title("Distribuição dos Resíduos")
plt.xlabel("Resíduo")
plt.ylabel("Frequência")
plt.legend()
plt.show()


In [None]:
from pennylane.optimize import AdamOptimizer

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)

# Configurando o otimizador
opt = AdamOptimizer(stepsize=0.01)
steps = 100  # Número de iterações
weights = np.random.random(weights_shape)  # Reinicializando pesos

# Treinamento
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train[:50, :n_qubits], y_train[:50]), weights)  # Usando um subset para demonstração
    if step % 10 == 0:
        c = cost(weights, X_train[:50, :n_qubits], y_train[:50])
        print(f"Step {step}: Cost = {c:.4f}")

# Avaliação
test_cost = cost(weights, X_test[:50, :n_qubits], y_test[:50])
print(f"Custo no conjunto de teste: {test_cost:.4f}")


In [None]:
print("Distribuição dos rótulos de treinamento:", np.unique(y_train[:50], return_counts=True))
print("Distribuição dos rótulos de teste:", np.unique(y_test[:50], return_counts=True))


O resultado confirma que o conjunto de treinamento contém apenas a classe \( 0 \), e a classe \( 1 \) está ausente. Isso é um problema, pois o modelo não pode aprender a diferenciar entre as classes se apenas uma delas estiver presente.

### Soluções Possíveis
1. **Verificar o Dataset Original**:
   - Certifique-se de que o dataset original contém amostras de todas as classes e que os dados foram carregados corretamente.

2. **Balancear o Dataset**:
   - Se o dataset original for desequilibrado, tente aumentar ou incluir amostras da classe \( 1 \) no conjunto de treinamento.

3. **Ajustar a Divisão dos Dados**:
   - Reavalie a divisão de dados em treinamento e teste para garantir que ambos contenham todas as classes.

4. **Código para Checar o Dataset Original**:
   Para verificar a distribuição das classes no dataset completo:
   ```python
   print("Distribuição das classes no conjunto completo:", np.unique(y_train + y_test, return_counts=True))
   ```

5. **Exemplo de Balanceamento Manual**:
   Caso o dataset original tenha classes suficientes, você pode aumentar a classe minoritária:
   ```python
   # Reamostrando manualmente
   if len(class_1_indices) > 0:
       min_class_size = min(len(class_0_indices), len(class_1_indices))
       balanced_indices = np.hstack((
           resample(class_0_indices, n_samples=min_class_size, random_state=42),
           resample(class_1_indices, n_samples=min_class_size, random_state=42)
       ))

       X_train_balanced = X_train[balanced_indices]
       y_train_balanced = y_train[balanced_indices]

       print("Distribuição balanceada:", np.unique(y_train_balanced, return_counts=True))
   else:
       print("A classe 1 não está presente no conjunto original.")
   ```

Se o problema persistir, você pode me informar sobre os detalhes do dataset original para que possamos ajustar o pipeline de pré-processamento.

In [None]:
# Verificar as classes presentes no conjunto de treinamento
print("Distribuição original dos rótulos:", np.unique(y_train, return_counts=True))

# Se não houver dados para uma classe, adicione ou corrija a amostragem
if len(class_1_indices) == 0:
    print("A classe 1 não está presente no conjunto de treinamento.")
else:
    # Balancear os dados se ambas as classes estiverem presentes
    min_class_size = min(len(class_0_indices), len(class_1_indices))
    balanced_indices = np.hstack((
        resample(class_0_indices, n_samples=min_class_size, random_state=42),
        resample(class_1_indices, n_samples=min_class_size, random_state=42)
    ))

    # Balancear X_train e y_train
    X_train_balanced = X_train[balanced_indices]
    y_train_balanced = y_train[balanced_indices]

    print("Distribuição balanceada dos rótulos de treinamento:", np.unique(y_train_balanced, return_counts=True))


In [None]:
# Reamostrando manualmente
if len(class_1_indices) > 0:
    min_class_size = min(len(class_0_indices), len(class_1_indices))
    balanced_indices = np.hstack((
        resample(class_0_indices, n_samples=min_class_size, random_state=42),
        resample(class_1_indices, n_samples=min_class_size, random_state=42)
    ))

    X_train_balanced = X_train[balanced_indices]
    y_train_balanced = y_train[balanced_indices]

    print("Distribuição balanceada:", np.unique(y_train_balanced, return_counts=True))
else:
    print("A classe 1 não está presente no conjunto original.")


O resultado indica que a classe \( 1 \) está completamente ausente no dataset, não apenas no conjunto de treinamento, mas aparentemente no conjunto original carregado. Isso pode ser causado por:

1. **Problemas no Dataset Original**:
   - O dataset fornecido contém apenas amostras da classe \( 0 \).
2. **Erro na Organização do Dataset**:
   - Pode haver uma falha no pré-processamento ou na separação das classes.

### Próximos Passos

#### 1. Verificar o Dataset Original
Certifique-se de que o dataset original contém amostras de ambas as classes. Se houver subdiretórios como "maligno" e "benigno", confirme que ambos foram processados. Use o seguinte código para listar os diretórios e a contagem de arquivos em cada um:

```python
import os

# Listar subdiretórios no dataset
for root, dirs, files in os.walk(extract_path):
    print(f"Diretório: {root}, Número de arquivos: {len(files)}")
```

#### 2. Corrigir o Pipeline de Pré-processamento
Caso o problema esteja na seleção dos dados, ajuste o pipeline para incluir todas as classes. Certifique-se de que o código está capturando ambas as classes:

```python
class_dirs = [os.path.join(extract_path, "benigno"), os.path.join(extract_path, "maligno")]

# Processar imagens de todas as classes
all_image_paths = [img for class_dir in class_dirs for img in glob.glob(f"{class_dir}/*.jpg")]
processed_images, labels = process_images(all_image_paths, image_size)

# Verificar distribuição
print("Distribuição das classes no dataset completo:", np.unique(labels, return_counts=True))
```

#### 3. Adicionar Amostras da Classe Minoritária
Se o dataset original é desequilibrado, você pode adicionar manualmente mais amostras da classe \( 1 \) (maligno). Isso pode ser feito coletando mais dados ou duplicando algumas amostras existentes para balancear.

Se precisar de ajuda para investigar o dataset ou ajustar o pipeline, avise!

In [None]:
import os

# Listar subdiretórios no dataset
for root, dirs, files in os.walk(extract_path):
    print(f"Diretório: {root}, Número de arquivos: {len(files)}")


In [None]:
class_dirs = [os.path.join(extract_path, "benigno"), os.path.join(extract_path, "maligno")]

# Processar imagens de todas as classes
all_image_paths = [img for class_dir in class_dirs for img in glob.glob(f"{class_dir}/*.jpg")]
processed_images, labels = process_images(all_image_paths, image_size)

# Verificar distribuição
print("Distribuição das classes no dataset completo:", np.unique(labels, return_counts=True))


Agora temos uma distribuição equilibrada no dataset completo:

- **500 amostras da classe "benigno"**.
- **500 amostras da classe "maligno"**.

Isso confirma que ambas as classes estão presentes e foram corretamente processadas. O problema anterior foi causado por um desequilíbrio ou erro na seleção dos dados para treinamento.

### Próximos Passos

1. **Codificar os Rótulos**:
   - Converter os rótulos `['benigno', 'maligno']` para valores numéricos \(0\) e \(1\).

   ```python
   from sklearn.preprocessing import LabelEncoder

   # Codificar os rótulos
   label_encoder = LabelEncoder()
   encoded_labels = label_encoder.fit_transform(labels)
   print("Classes codificadas:", np.unique(encoded_labels, return_counts=True))
   ```

2. **Dividir o Dataset**:
   - Separar os dados em conjuntos de treinamento e teste de forma balanceada.
   
   ```python
   from sklearn.model_selection import train_test_split

   # Dividir os dados
   X_train, X_test, y_train, y_test = train_test_split(
       processed_images.reshape(len(processed_images), -1),  # Flatten as imagens
       encoded_labels,
       test_size=0.2,
       stratify=encoded_labels,  # Garantir balanceamento
       random_state=42
   )
   print("Distribuição dos rótulos no treinamento:", np.unique(y_train, return_counts=True))
   print("Distribuição dos rótulos no teste:", np.unique(y_test, return_counts=True))
   ```

3. **Treinar o Modelo Quântico**:
   - Use os dados balanceados para treinar o modelo quântico e avaliar o desempenho.

Deseja que eu implemente essas etapas ou passe direto para o treinamento?

In [None]:
from sklearn.preprocessing import LabelEncoder

# Codificar os rótulos
label_encoder = LabelEncoder()
encoded_labels = label_encoder.fit_transform(labels)
print("Classes codificadas:", np.unique(encoded_labels, return_counts=True))


In [None]:
from sklearn.model_selection import train_test_split

# Dividir os dados
X_train, X_test, y_train, y_test = train_test_split(
    processed_images.reshape(len(processed_images), -1),  # Flatten as imagens
    encoded_labels,
    test_size=0.2,
    stratify=encoded_labels,  # Garantir balanceamento
    random_state=42
)
print("Distribuição dos rótulos no treinamento:", np.unique(y_train, return_counts=True))
print("Distribuição dos rótulos no teste:", np.unique(y_test, return_counts=True))


Agora o dataset está devidamente balanceado:

- **Treinamento**: 400 amostras de cada classe (\( 0 \) e \( 1 \)).
- **Teste**: 100 amostras de cada classe (\( 0 \) e \( 1 \)).

Com os dados preparados, podemos seguir para o treinamento do modelo quântico.

### Próximos Passos

1. **Treinar o Modelo Quântico**:
   - Ajustar os pesos do circuito para minimizar a função de custo.
   - Utilizar o conjunto de treinamento balanceado (\( X\_train \) e \( y\_train \)).

2. **Avaliar o Modelo**:
   - Calcular a precisão e a perda no conjunto de teste (\( X\_test \) e \( y\_test \)).

### Código para Treinamento
Aqui está o código atualizado para treinar e avaliar o modelo:

```python
from pennylane.optimize import AdamOptimizer

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)

# Configurando o otimizador
opt = AdamOptimizer(stepsize=0.01)
steps = 50  # Número de iterações
weights = np.random.random(weights_shape)  # Reinicializando pesos

# Treinamento
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train[:, :n_qubits], y_train), weights)
    if step % 10 == 0:
        c = cost(weights, X_train[:, :n_qubits], y_train)
        print(f"Step {step}: Cost = {c:.4f}")

# Avaliação no conjunto de teste
test_cost = cost(weights, X_test[:, :n_qubits], y_test)
print(f"Custo no conjunto de teste: {test_cost:.4f}")
```

### Explicação
1. **Função de Custo**:
   - Calcula o erro quadrático médio entre a previsão do circuito e os rótulos reais.
2. **Otimização**:
   - Usa Adam para ajustar os pesos do circuito.
3. **Avaliação**:
   - Mede o custo no conjunto de teste para verificar a generalização.

Deseja executar este código ou ajustar algum parâmetro antes de seguir?

In [None]:
import matplotlib.pyplot as plt
from IPython.display import clear_output
import time
from pennylane.optimize import AdamOptimizer

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i])**2
    return loss / len(X)

# Configurando o otimizador
opt = AdamOptimizer(stepsize=0.01)
steps = 50  # Número de iterações
weights = np.random.random(weights_shape)  # Reinicializando pesos
train_costs = []
test_costs = []

# Configurando o gráfico
plt.ion()  # Ativando o modo interativo
fig, ax = plt.subplots()
line1, = ax.plot([], [], label='Custo de Treinamento', color='blue')
line2, = ax.plot([], [], label='Custo de Teste', color='orange')
ax.set_xlim(0, steps)
ax.set_ylim(0, 1)
ax.set_xlabel("Passo")
ax.set_ylabel("Custo")
ax.legend()
plt.show()

# Treinamento
start_time = time.time()
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train[:, :n_qubits], y_train), weights)
    train_cost = cost(weights, X_train[:, :n_qubits], y_train)
    test_cost = cost(weights, X_test[:, :n_qubits], y_test)

    # Armazenar custos
    train_costs.append(train_cost)
    test_costs.append(test_cost)

    # Atualizar gráfico
    line1.set_data(range(step + 1), train_costs)
    line2.set_data(range(step + 1), test_costs)
    ax.set_ylim(0, max(train_costs + test_costs) * 1.1)  # Ajustar limites do gráfico dinamicamente
    clear_output(wait=True)
    plt.draw()
    plt.pause(0.1)

    # Print no console
    print(f"Passo {step}/{steps} | Custo de Treinamento: {train_cost:.4f} | Custo de Teste: {test_cost:.4f}")

end_time = time.time()
print(f"Treinamento concluído em {end_time - start_time:.2f} segundos.")
plt.ioff()  # Desativar o modo interativo
plt.show()

# Avaliação Final no Conjunto de Teste
final_test_cost = cost(weights, X_test[:, :n_qubits], y_test)
print(f"Custo final no conjunto de teste: {final_test_cost:.4f}")


In [None]:
from sklearn.metrics import accuracy_score

# Previsões no conjunto de teste
y_pred = [round(float(circuit(weights, x))) for x in X_test[:, :n_qubits]]
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia no conjunto de teste: {accuracy:.2%}")


In [None]:
from sklearn.metrics import classification_report

# Relatório de classificação
print(classification_report(y_test, y_pred, target_names=["Benigno", "Maligno"]))


In [None]:
import pennylane as qml
import numpy as np
from pennylane.optimize import AdamOptimizer

# Configurando o dispositivo quântico
n_qubits = 12  # Número de qubits
dev = qml.device("default.qubit", wires=n_qubits)

# Redefinir o circuito com o dispositivo atualizado
@qml.qnode(dev)
def circuit(weights, features):
    # Embedding das features no circuito usando rotações RY
    for i in range(n_qubits):
        qml.RY(features[i], wires=i)
    # Camadas parametrizadas
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    # Medida no primeiro qubit
    return qml.expval(qml.PauliZ(0))

# Parâmetros iniciais para testes
weights_shape = (4, n_qubits)  # 4 camadas e 12 qubits
weights = np.random.random(weights_shape)  # Pesos aleatórios
features = np.random.random(n_qubits)  # Exemplo de entrada

# Testando o circuito
output = circuit(weights, features)
print(f"Saída do circuito: {output}")


In [None]:
import pennylane as qml
import numpy as np
from pennylane.optimize import AdamOptimizer

# Configurando o dispositivo quântico
n_qubits = 12  # Número de qubits
dev = qml.device("default.qubit", wires=n_qubits)

# Redefinir o circuito com o dispositivo atualizado
@qml.qnode(dev)
def circuit(weights, features):
    # Embedding das features no circuito usando rotações RY
    for i in range(n_qubits):
        qml.RY(features[i], wires=i)
    # Camadas parametrizadas
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    # Medida no primeiro qubit
    return qml.expval(qml.PauliZ(0))

# Função de custo
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i]) ** 2  # Erro quadrático
    return loss / len(X)

# Configuração do treinamento
weights_shape = (4, n_qubits)  # 4 camadas e 12 qubits
weights = np.random.random(weights_shape)  # Inicialização dos pesos aleatórios
opt = AdamOptimizer(stepsize=0.01)  # Otimizador Adam
steps = 50  # Número de iterações

# Dados simulados para teste
X_train = np.random.random((100, n_qubits))  # 100 amostras, cada uma com 12 qubits
y_train = np.random.choice([0, 1], size=100)  # Rótulos binários simulados

# Treinamento
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train, y_train), weights)  # Atualizar pesos
    if step % 10 == 0:  # Exibir progresso a cada 10 iterações
        current_cost = cost(weights, X_train, y_train)
        print(f"Passo {step}/{steps} | Custo: {current_cost:.4f}")

# Resultado final
final_cost = cost(weights, X_train, y_train)
print(f"Custo final após {steps} passos: {final_cost:.4f}")


In [None]:
import pennylane.numpy as pnp  # Usar NumPy do PennyLane para suporte a gradientes

# Configuração dos pesos ajustada
weights = pnp.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)

# Ajustar rótulos para intervalo compatível
y_train = 2 * y_train - 1  # Converte 0, 1 para -1, 1

# Otimizador com taxa de aprendizado maior
opt = AdamOptimizer(stepsize=0.1)

# Treinamento com ajustes
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train, y_train), weights)
    if step % 10 == 0:
        current_cost = cost(weights, X_train, y_train)
        print(f"Passo {step}/{steps} | Custo: {current_cost:.4f}")

final_cost = cost(weights, X_train, y_train)
print(f"Custo final após {steps} passos: {final_cost:.4f}")


In [None]:
from sklearn.metrics import accuracy_score

# Previsões com transformação para -1 ou 1
y_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_train]
accuracy = accuracy_score(y_train, y_pred)
print(f"Acurácia no conjunto de treinamento: {accuracy:.2%}")


In [None]:
from sklearn.metrics import accuracy_score

# Previsões com transformação para -1 ou 1
y_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_train]
accuracy = accuracy_score(y_train, y_pred)
print(f"Acurácia no conjunto de treinamento: {accuracy:.2%}")


Aqui está o código ajustado com melhorias para aumentar a expressividade do circuito, regularização na função de custo e validação em dados de teste.

---

### Código Ajustado

```python
import pennylane as qml
import pennylane.numpy as pnp
from sklearn.metrics import accuracy_score
from pennylane.optimize import AdamOptimizer

# Configurando o dispositivo quântico
n_qubits = 12  # Número de qubits
dev = qml.device("default.qubit", wires=n_qubits)

# Redefinir o circuito com mais camadas
@qml.qnode(dev)
def circuit(weights, features):
    # Embedding das features no circuito usando rotações RY
    for i in range(n_qubits):
        qml.RY(features[i], wires=i)
    # Camadas parametrizadas
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    # Medida no primeiro qubit
    return qml.expval(qml.PauliZ(0))

# Função de custo com regularização L2
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i]) ** 2  # Erro quadrático
    reg_term = 0.01 * pnp.sum(weights**2)  # Regularização L2
    return loss / len(X) + reg_term

# Configuração do treinamento
n_layers = 6  # Aumentar o número de camadas
weights_shape = (n_layers, n_qubits)
weights = pnp.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)
opt = AdamOptimizer(stepsize=0.1)
steps = 100  # Aumentar o número de iterações

# Ajustar rótulos para intervalo compatível
y_train = 2 * y_train - 1  # Converte 0, 1 para -1, 1
y_test = 2 * y_test - 1  # Converte 0, 1 para -1, 1

# Treinamento
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train, y_train), weights)
    if step % 10 == 0:  # Exibir progresso a cada 10 iterações
        current_cost = cost(weights, X_train, y_train)
        print(f"Passo {step}/{steps} | Custo: {current_cost:.4f}")

# Resultado no conjunto de treinamento
y_train_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_train]
train_accuracy = accuracy_score(y_train, y_train_pred)
print(f"Acurácia no conjunto de treinamento: {train_accuracy:.2%}")

# Avaliação no conjunto de teste
y_test_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_test]
test_accuracy = accuracy_score(y_test, y_test_pred)
print(f"Acurácia no conjunto de teste: {test_accuracy:.2%}")
```

---

### O Que Foi Ajustado
1. **Camadas Adicionais no Circuito**:
   - O número de camadas foi aumentado para 6 para maior expressividade.
2. **Regularização L2**:
   - Adicionada regularização à função de custo para melhorar a estabilidade do modelo.
3. **Mais Iterações**:
   - O número de passos foi aumentado para 100 para permitir melhor convergência.
4. **Avaliação no Conjunto de Teste**:
   - Adicionado código para calcular a acurácia no conjunto de teste.

---

### Próximos Passos
1. **Execute o Código**:
   - Observe os custos e as acurácias no conjunto de treinamento e teste.
2. **Analise os Resultados**:
   - Verifique se há sinais de overfitting (acurácia no treino muito maior que no teste).

Se precisar de mais ajustes, estou à disposição! 😊

In [None]:
import pennylane as qml
import pennylane.numpy as pnp
from sklearn.metrics import accuracy_score
from pennylane.optimize import AdamOptimizer

# Configurando o dispositivo quântico
n_qubits = 12  # Número de qubits
dev = qml.device("default.qubit", wires=n_qubits)

# Redefinir o circuito com mais camadas
@qml.qnode(dev)
def circuit(weights, features):
    # Embedding das features no circuito usando rotações RY
    for i in range(n_qubits):
        qml.RY(features[i], wires=i)
    # Camadas parametrizadas
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    # Medida no primeiro qubit
    return qml.expval(qml.PauliZ(0))

# Função de custo com regularização L2
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i]) ** 2  # Erro quadrático
    reg_term = 0.01 * pnp.sum(weights**2)  # Regularização L2
    return loss / len(X) + reg_term

# Configuração do treinamento
n_layers = 6  # Aumentar o número de camadas
weights_shape = (n_layers, n_qubits)
weights = pnp.random.uniform(low=-0.1, high=0.1, size=weights_shape, requires_grad=True)
opt = AdamOptimizer(stepsize=0.1)
steps = 100  # Aumentar o número de iterações

# Ajustar rótulos para intervalo compatível
y_train = 2 * y_train - 1  # Converte 0, 1 para -1, 1
y_test = 2 * y_test - 1  # Converte 0, 1 para -1, 1

# Treinamento
for step in range(steps):
    weights = opt.step(lambda w: cost(w, X_train, y_train), weights)
    if step % 10 == 0:  # Exibir progresso a cada 10 iterações
        current_cost = cost(weights, X_train, y_train)
        print(f"Passo {step}/{steps} | Custo: {current_cost:.4f}")

# Resultado no conjunto de treinamento
y_train_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_train]
train_accuracy = accuracy_score(y_train, y_train_pred)
print(f"Acurácia no conjunto de treinamento: {train_accuracy:.2%}")

# Avaliação no conjunto de teste
y_test_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_test]
test_accuracy = accuracy_score(y_test, y_test_pred)
print(f"Acurácia no conjunto de teste: {test_accuracy:.2%}")


O código implementa um pipeline quântico-clássico para classificação binária usando circuitos quânticos e o otimizador Adam para ajustar os parâmetros. Aqui está uma explicação detalhada do processo quântico envolvido:

---

### 1. **Dispositivo Quântico**
```python
dev = qml.device("default.qubit", wires=n_qubits)
```
- **Descrição**: Um dispositivo quântico simulado, configurado para usar 12 qubits.
- **Papel**: Serve como o "computador quântico virtual" onde os circuitos serão executados.
- **Simulação Clássica**: O dispositivo `default.qubit` é um simulador baseado em estado vetorial.

---

### 2. **Definição do Circuito**
```python
@qml.qnode(dev)
def circuit(weights, features):
    # Embedding das features no circuito usando rotações RY
    for i in range(n_qubits):
        qml.RY(features[i], wires=i)
    # Camadas parametrizadas
    qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
    # Medida no primeiro qubit
    return qml.expval(qml.PauliZ(0))
```

#### a. **Embedding dos Dados**
```python
for i in range(n_qubits):
    qml.RY(features[i], wires=i)
```
- **O que faz**:
  - Os dados clássicos (features) são mapeados para estados quânticos usando rotações \( RY \).
  - Cada feature é usada para parametrizar uma rotação em torno do eixo \( Y \) para o qubit correspondente.
- **Papel**:
  - Cria uma representação quântica dos dados.

#### b. **Camadas Parametrizadas**
```python
qml.templates.BasicEntanglerLayers(weights, wires=range(n_qubits))
```
- **O que faz**:
  - Aplica camadas de entrelaçamento entre os qubits, usando parâmetros treináveis (\( weights \)).
  - Permite que o modelo quântico capture interdependências complexas entre as features.
- **Papel**:
  - Adiciona expressividade ao circuito, permitindo que ele represente funções mais complexas.

#### c. **Medida**
```python
return qml.expval(qml.PauliZ(0))
```
- **O que faz**:
  - Mede a expectativa do operador \( Z \) no primeiro qubit.
  - Retorna um valor contínuo no intervalo \([-1, 1]\).
- **Papel**:
  - Converte o estado quântico final em um valor clássico utilizável.

---

### 3. **Função de Custo**
```python
def cost(weights, X, y):
    loss = 0
    for i in range(len(X)):
        pred = circuit(weights, X[i])
        loss += (pred - y[i]) ** 2  # Erro quadrático
    reg_term = 0.01 * pnp.sum(weights**2)  # Regularização L2
    return loss / len(X) + reg_term
```
- **O que faz**:
  - Calcula o erro quadrático médio (\( MSE \)) entre as previsões do circuito e os rótulos reais.
  - Adiciona um termo de regularização L2 para penalizar pesos altos e evitar overfitting.
- **Papel**:
  - Orienta o treinamento para ajustar os pesos e minimizar a discrepância entre previsões e rótulos.

---

### 4. **Treinamento**
```python
weights = opt.step(lambda w: cost(w, X_train, y_train), weights)
```
- **O que faz**:
  - O otimizador Adam ajusta os pesos do circuito quântico, minimizando a função de custo.
- **Papel**:
  - Integra o aprendizado quântico ao pipeline clássico, otimizando os parâmetros do circuito.

---

### 5. **Classificação Binária**
```python
y_train_pred = [1 if float(circuit(weights, x)) >= 0 else -1 for x in X_train]
```
- **O que faz**:
  - Converte as previsões contínuas do circuito (\([-1, 1]\)) em rótulos binários (\( -1, 1 \)) usando uma função de ativação baseada em threshold.
- **Papel**:
  - Permite que o modelo faça classificações compatíveis com os rótulos ajustados.

---

### 6. **Métricas de Desempenho**
```python
accuracy = accuracy_score(y_train, y_train_pred)
```
- **O que faz**:
  - Calcula a proporção de previsões corretas.
- **Papel**:
  - Avalia o desempenho do modelo no conjunto de treinamento e teste.

---

### Resumo do Processo Quântico
1. **Embedding**:
   - Os dados clássicos são mapeados para estados quânticos usando rotações \( RY \).
2. **Camadas Parametrizadas**:
   - O circuito aprende padrões complexos nos dados ajustando os pesos.
3. **Medida**:
   - A expectativa do operador \( Z \) no primeiro qubit traduz o estado quântico final em um valor clássico.
4. **Treinamento**:
   - A função de custo e o otimizador ajustam os pesos para melhorar as previsões.
5. **Classificação**:
   - O valor contínuo retornado pelo circuito é transformado em rótulos binários.

Se precisar de mais detalhes ou ajustes no modelo, estou à disposição! 😊