### Explicação do Código

O código a seguir configura os caminhos e variáveis para processamento de arquivos:

```python
# Caminho da pasta contendo os datasets originais
pasta = r"D:\Trabalho_Super\Datasets"

# Caminho para o diretório onde os arquivos extraídos serão salvos
destino = r"D:\Trabalho_Super\Extraidos"

# Caminho para o diretório onde os arquivos de provas serão organizados
provas_path = r'D:\Trabalho_Super\Provas'

# Tipo de arquivo desejado para copiar
# Defina como 'exam' para copiar apenas arquivos de tipo 'exam'
# Defina como 'homework' para copiar apenas arquivos de tipo 'homework'
# Ou deixe como '' (string vazia) para copiar todos os tipos de arquivos
tipo_desejado = 'exam'

# Curso desejado para processamento
# Defina como 'todos' para processar todos os cursos
# Ou especifique um curso específico para filtrar os arquivos:
#(introducao a programação de computadores)
#introducao a ciencia dos computadores
curso = 'introducao a ciencia dos computadores'


In [1]:

pasta = r"../DataSets"
destino = r"../Extraidos"
provas_path = r'../Etapa_3/Processamento/Provas'
usuarios_path = r'../Etapa_3/Processamento/Usuarios'


usuarios_processamento=r'../Etapa_3/Processamento/UsuariosProcessamento'
tipo_desejado = 'exam'  # Ou deixe como '' para copiar todos

# Curso desejado (pode ser 'todos' para processar todos os cursos)
curso = 'todos'  # Ou especifique um curso específico



usuarios_unicos_pasta = r'../Etapa_3/UsuariosUnicos'



### Explicação do Código

Este trecho de código em Python é utilizado para descompactar arquivos `.tar.gz` que estão armazenados em uma pasta específica. Abaixo está a descrição detalhada de cada parte do código:

1. **Importação de Módulos**:
   - `os`: Módulo utilizado para interagir com o sistema operacional, como manipulação de diretórios e arquivos.
   - `tarfile`: Módulo utilizado para manipular arquivos TAR, incluindo descompactação de arquivos `.tar.gz`.

2. **Definição dos Caminhos**:
   - `pasta`: Caminho para a pasta onde estão localizados os arquivos `.tar.gz`.
   - `destino`: Caminho para a pasta onde o conteúdo extraído dos arquivos será armazenado.

3. **Criação da Pasta de Destino**:
   - Verifica se a pasta definida em `destino` existe. Se não existir, ela é criada utilizando `os.makedirs(destino)`.

4. **Função para Descompactar Arquivos `.tar.gz`**:
   - `descompactar_tar_gz(arquivo, pasta_destino)`: Esta função recebe o caminho do arquivo `.tar.gz` e o caminho da pasta onde o conteúdo será extraído. A função utiliza o módulo `tarfile` para abrir o arquivo e extrair todo o seu conteúdo para a pasta de destino.

5. **Iteração sobre os Arquivos na Pasta**:
   - O código percorre todos os arquivos na pasta definida em `pasta`.
   - Para cada arquivo que termina com a extensão `.tar.gz`, ele faz o seguinte:
     - Cria um caminho completo (`arquivo_path`) para o arquivo a ser descompactado.
     - Gera um nome para a nova pasta onde o conteúdo do arquivo será extraído.
     - Verifica se a pasta de destino existe; se não, ela é criada.
     - Chama a função `descompactar_tar_gz` para descompactar o arquivo.
     - Exibe uma mensagem no console informando que o arquivo foi descompactado com sucesso.

6. **Finalidade**:
   - O objetivo deste código é automatizar o processo de descompactação de múltiplos arquivos `.tar.gz`, organizando o conteúdo extraído em pastas separadas dentro de um diretório de destino.

### Exemplo de Uso

Se você tiver uma pasta com vários arquivos `.tar.gz` que deseja descompactar e organizar em subpastas, este script automatiza essa tarefa, criando subpastas correspondentes aos nomes dos arquivos sem as extensões e movendo o conteúdo extraído para essas subpastas.


In [2]:
import os
import tarfile



# Cria a pasta 'Extraidos' se não existir
if not os.path.exists(destino):
    os.makedirs(destino)

# Função para descompactar arquivos .tar.gz
def descompactar_tar_gz(arquivo, pasta_destino):
    with tarfile.open(arquivo, "r:gz") as tar:
        tar.extractall(path=pasta_destino)

# Obtém todos os arquivos .tar.gz na pasta
for arquivo in os.listdir(pasta):
    if arquivo.endswith(".tar.gz"):
        arquivo_path = os.path.join(pasta, arquivo)
        nome_pasta = os.path.splitext(os.path.splitext(arquivo)[0])[0]
        pasta_destino = os.path.join(destino, nome_pasta)

        # Cria uma pasta para o conteúdo extraído
        if not os.path.exists(pasta_destino):
            os.makedirs(pasta_destino)

        # Descompacta o arquivo
        descompactar_tar_gz(arquivo_path, pasta_destino)
        print(f"Descompactado: {arquivo_path} em {pasta_destino}")


Descompactado: ../DataSets\cb_dataset_2023_2_v1.81.tar.gz em ../Extraidos\cb_dataset_2023_2_v1.81
Descompactado: ../DataSets\cb_dataset_2024_1_v1.81.tar.gz em ../Extraidos\cb_dataset_2024_1_v1.81


In [2]:
import os
import shutil

def remover_todas_as_pastas_mousemove(caminho_base):
    for root, dirs, files in os.walk(caminho_base, topdown=False):
        for nome in dirs:
            if nome == "mousemove":
                caminho_mousemove = os.path.join(root, nome)
                try:
                    shutil.rmtree(caminho_mousemove)
                    print(f"Pasta 'mousemove' removida em: {caminho_mousemove}")
                except Exception as e:
                    print(f"Erro ao remover {caminho_mousemove}: {e}")


remover_todas_as_pastas_mousemove(destino)


# Explicação do Código Python

Este código Python tem como objetivo processar arquivos de avaliação (`.data`) localizados em diretórios específicos e copiá-los para uma estrutura de diretórios organizada com base em informações extraídas dos arquivos. O código é dividido em três funções principais:

## Funções

### 1. `remover_acento(texto)`

Esta função remove acentos e diacríticos de uma string.

**Parâmetros:**
- `texto` (str): A string da qual os acentos serão removidos.

**Retorno:**
- `str`: A string sem acentos.

**Funcionamento:**
- Usa a normalização Unicode para decompor caracteres acentuados e remove os caracteres de marcação (`Mn`).

### 2. `ler_assessment_file(filepath)`

Esta função lê um arquivo `.data` e extrai informações relevantes sobre a avaliação.

**Parâmetros:**
- `filepath` (str): O caminho do arquivo `.data` a ser lido.

**Retorno:**
- `dict`: Um dicionário com as chaves `'assessment_title'`, `'class_name'` e `'type'` preenchidas com os valores extraídos do arquivo.

**Funcionamento:**
- Abre e lê o arquivo, linha por linha.
- Extrai os valores das linhas que começam com `'---- assessment title:'`, `'---- class name:'`, e `'---- type:'`.
- Imprime o conteúdo extraído para depuração e retorna o dicionário com os dados.

### 3. `processar_assessments(destino, tipo_desejado, curso)`

Esta função organiza e copia arquivos `.data` para uma estrutura de diretórios com base nas informações extraídas e nos parâmetros fornecidos.

**Parâmetros:**
- `destino` (str): O caminho base onde a busca por pastas `assessments` começa.
- `tipo_desejado` (str): O tipo de avaliação desejado (ou uma string vazia para copiar todos os tipos).
- `curso` (str): O curso desejado (ou `'todos'` para processar todos os cursos).

**Funcionamento:**
- Cria a pasta `'Provas'` se ela não existir.
- Caminha pela árvore de diretórios a partir do `destino`, procurando pastas chamadas `'assessments'`.
- Para cada arquivo `.data`, lê as informações usando `ler_assessment_file`.
- Normaliza os nomes das classes e tipos para garantir a consistência.
- Verifica se o curso e tipo dos arquivos correspondem aos parâmetros fornecidos.
- Cria subpastas baseadas na classe e no tipo e copia os arquivos para essas subpastas.
- Imprime mensagens de depuração para rastrear o progresso.

## Exemplos de Uso

- **Copiar todos os arquivos de todos os cursos e tipos:**

  ```python
  processar_assessments('D:\\Trabalho_Super\\Extraidos', '', 'todos')


In [3]:
import os
import shutil
import unicodedata

def remover_acento(texto):
    return ''.join(c for c in unicodedata.normalize('NFD', texto)
                   if unicodedata.category(c) != 'Mn')

def ler_assessment_file(filepath):
    assessment_data = {}
    try:
        with open(filepath, 'r', encoding='utf-8') as file:
            lines = file.readlines()

        for line in lines:
            line = line.strip()
            if line.startswith('---- assessment title:'):
                assessment_data['assessment_title'] = line.split(': ')[1]
            elif line.startswith('---- class name:'):
                assessment_data['class_name'] = line.split(': ')[1]
            elif line.startswith('---- type:'):
                assessment_data['type'] = line.split(': ')[1]
        
        print(f"Conteúdo do arquivo {filepath}: {assessment_data}")  # Mensagem de depuração

    except Exception as e:
        print(f"Erro ao ler o arquivo {filepath}: {e}")

    return assessment_data

def processar_assessments(destino, tipo_desejado, curso):
    
    
    # Criar a pasta 'Provas' se ela não existir
    os.makedirs(provas_path, exist_ok=True)

    # Manter um conjunto de nomes de classe únicos e tipos únicos
    nomes_classes = set()
    tipos_unicos = set()

    # Caminhar pela árvore de diretórios procurando por pastas 'assessments'
    for root, dirs, files in os.walk(destino):
        if os.path.basename(root) == 'assessments':
            print(f"Processando pasta: {root}")  # Mensagem de depuração
            for filename in files:
                if filename.endswith('.data'):
                    filepath = os.path.join(root, filename)
                    print(f"Lendo arquivo: {filepath}")  # Mensagem de depuração
                    assessment_data = ler_assessment_file(filepath)
                    
                    class_name = assessment_data.get('class_name', '')
                    tipo = assessment_data.get('type', '')

                    class_name_normalized = remover_acento(class_name).lower()
                    tipo_normalized = remover_acento(tipo).lower()
                    curso_normalized = remover_acento(curso).lower()

                    # Verificação para o caso 'todos' ou um curso específico
                    if curso == 'todos' or curso_normalized == class_name_normalized:
                        if tipo_desejado == '' or tipo_normalized == remover_acento(tipo_desejado).lower():
                            if curso == 'todos' or curso_normalized == class_name_normalized:
                                # Criar a subpasta para a classe
                                class_folder = os.path.join(provas_path, class_name_normalized)
                                os.makedirs(class_folder, exist_ok=True)
                                
                                if tipo_desejado == '':
                                    # Criar a subpasta para o tipo
                                    tipo_folder = os.path.join(class_folder, tipo_normalized)
                                    os.makedirs(tipo_folder, exist_ok=True)
                                    novo_caminho = os.path.join(tipo_folder, filename)
                                else:
                                    # Criar a subpasta para o tipo_desejado
                                    tipo_folder = os.path.join(class_folder, remover_acento(tipo_desejado).lower())
                                    os.makedirs(tipo_folder, exist_ok=True)
                                    novo_caminho = os.path.join(tipo_folder, filename)

                                # Copiar o arquivo para o local apropriado
                                try:
                                    shutil.copy(filepath, novo_caminho)
                                    print(f"Arquivo copiado para: {novo_caminho}")  # Mensagem de depuração
                                except Exception as e:
                                    print(f"Erro ao copiar o arquivo {filepath} para {novo_caminho}: {e}")



# Processar assessments e copiar arquivos do tipo especificado ou todos se tipo_desejado for vazio
processar_assessments(destino, tipo_desejado, curso)


Processando pasta: ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments
Lendo arquivo: ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5213.data
Conteúdo do arquivo ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5213.data: {'assessment_title': 'Lab 0 – Primeiros passos com o Python - 2020', 'class_name': 'Introdução à Ciência dos Computadores', 'type': 'homework'}
Lendo arquivo: ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5223.data
Conteúdo do arquivo ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5223.data: {'assessment_title': 'Lab 1 - Variáveis e Estrutura Sequencial', 'class_name': 'Introdução à Ciência dos Computadores', 'type': 'homework'}
Lendo arquivo: ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5234.data
Conteúdo do arquivo ../Extraidos\cb_dataset_2023_2_v1.81\2023-2\557\assessments\5234.data: {'assessment_title': 'Extras 1 - Variáveis e Estrutura Sequencial (2020)', 'class_name': 'Introdução à Ciênci

# Explicação do Código Python

Este código Python reorganiza arquivos `.data` localizados em uma estrutura de diretórios com base no título da avaliação (`assessment title`). O código é composto por várias funções que realizam tarefas específicas para alcançar esse objetivo.

## Funções

### 1. `remover_acento(texto)`

Esta função remove acentos e diacríticos de uma string.

**Parâmetros:**
- `texto` (str): A string da qual os acentos serão removidos.

**Retorno:**
- `str`: A string sem acentos.

**Funcionamento:**
- Usa a normalização Unicode para decompor caracteres acentuados e remove os caracteres de marcação (`Mn`).

### 2. `limpar_nome_diretorio(nome)`

Esta função remove caracteres inválidos para nomes de diretórios no Windows.

**Parâmetros:**
- `nome` (str): O nome do diretório a ser limpo.

**Retorno:**
- `str`: O nome do diretório sem caracteres inválidos.

**Funcionamento:**
- Usa expressões regulares para substituir caracteres proibidos (`<`, `>`, `:`, `"`, `/`, `\`, `|`, `?`, `*`) por uma string vazia.

### 3. `ler_assessment_file(filepath)`

Esta função lê um arquivo `.data` e extrai informações relevantes sobre a avaliação.

**Parâmetros:**
- `filepath` (str): O caminho do arquivo `.data` a ser lido.

**Retorno:**
- `dict`: Um dicionário com as chaves `'assessment_title'`, `'class_name'` e `'type'` preenchidas com os valores extraídos do arquivo.

**Funcionamento:**
- Abre e lê o arquivo, linha por linha.
- Extrai os valores das linhas que começam com `'---- assessment title:'`, `'---- class name:'`, e `'---- type:'`.

### 4. `reorganizar_por_assessment_title(provas_path)`

Esta função reorganiza arquivos `.data` movendo-os para subpastas baseadas no título da avaliação.

**Parâmetros:**
- `provas_path` (str): O caminho base para a pasta `'Provas'`, onde os arquivos serão reorganizados.

**Funcionamento:**
- Caminha pela estrutura de diretórios a partir de `provas_path`.
- Ignora a pasta `'Provas'` principal.
- Para cada arquivo `.data` encontrado, lê as informações usando `ler_assessment_file`.
- Normaliza e limpa o título da avaliação extraído.
- Cria uma subpasta para o título da avaliação se ela não existir.
- Move o arquivo `.data` para a subpasta correspondente.
- Imprime mensagens de depuração para rastrear o progresso.

## Exemplo de Uso

- **Reorganizar arquivos `.data` com base no título da avaliação:**

  ```python
  provas_path = 'D:\\Trabalho_Super\\Provas'
  reorganizar_por_assessment_title(provas_path)


In [4]:
import os
import shutil
import unicodedata
import re

def remover_acento(texto):
    return ''.join(c for c in unicodedata.normalize('NFD', texto)
                   if unicodedata.category(c) != 'Mn')

def limpar_nome_diretorio(nome):
    # Remove caracteres inválidos para nomes de diretórios no Windows
    return re.sub(r'[<>:"/\\|?*]', '', nome)

def ler_assessment_file(filepath):
    assessment_data = {}
    try:
        with open(filepath, 'r', encoding='utf-8') as file:
            lines = file.readlines()

        for line in lines:
            line = line.strip()
            if line.startswith('---- assessment title:'):
                assessment_data['assessment_title'] = line.split(': ')[1]
            elif line.startswith('---- class name:'):
                assessment_data['class_name'] = line.split(': ')[1]
            elif line.startswith('---- type:'):
                assessment_data['type'] = line.split(': ')[1]
        
    except Exception as e:
        print(f"Erro ao ler o arquivo {filepath}: {e}")

    return assessment_data

def reorganizar_por_assessment_title(provas_path):
    # Caminhar pela estrutura de pastas na raiz 'Provas'
    for root, dirs, files in os.walk(provas_path):
        # Ignorar a pasta 'Provas' principal
        if root == provas_path:
            continue
        
        # Processar cada arquivo .data na subpasta atual
        for filename in files:
            if filename.endswith('.data'):
                filepath = os.path.join(root, filename)
                assessment_data = ler_assessment_file(filepath)
                assessment_title = assessment_data.get('assessment_title', '')
                assessment_title_normalized = remover_acento(assessment_title).lower()
                assessment_title_limpado = limpar_nome_diretorio(assessment_title_normalized)

                if assessment_title_limpado:
                    # Criar uma nova subpasta para o 'assessment title' se ela não existir
                    title_folder = os.path.join(root, assessment_title_limpado)
                    os.makedirs(title_folder, exist_ok=True)

                    # Mover o arquivo .data para a subpasta correta
                    novo_caminho = os.path.join(title_folder, filename)
                    try:
                        shutil.move(filepath, novo_caminho)
                        print(f"Arquivo movido para: {novo_caminho}")  # Mensagem de depuração
                    except Exception as e:
                        print(f"Erro ao mover o arquivo {filepath} para {novo_caminho}: {e}")

# Caminho para a pasta 'Provas'


# Reorganizar os arquivos .data com base no 'assessment title'
reorganizar_por_assessment_title(provas_path)


Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 1\5256.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 1\5257.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 2\5294.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 2\5308.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 3\5331.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 3\5335.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 4\5405.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 4\5411.data
Arquivo movido para: ../Etapa_3/Processamento/Provas\introducao a ciencia dos computadores\exam\tp 5\5468.data
A

# Explicação da Função `remover_tp_matrizes()`

## Objetivo
A função `remover_tp_matrizes()` foi criada para automatizar o processo de limpeza de diretórios dentro de um caminho específico, removendo todas as subpastas que contêm o número 7 em seus nomes. Essa função é útil em cenários onde há necessidade de filtrar e excluir pastas com base em padrões específicos nos nomes, como por exemplo, remover pastas que contêm determinado número ou conjunto de caracteres.

## Como a Função Funciona

### 1. Definição do Caminho Base
```python
provas_path = r'D:\Trabalho_Super\Processamento\Provas'


In [5]:
import os
import shutil



def remover_tp_matrizes():
    for root, dirs, files in os.walk(provas_path):
        for dir_name in dirs:
            if '7' in dir_name:
                dir_path = os.path.join(root, dir_name)
                shutil.rmtree(dir_path)
                print(f'Pasta removida: {dir_path}')

remover_tp_matrizes()


## Explicação da Função `processar_usuarios()`

Este código em Python tem o objetivo de navegar por subpastas dentro de um diretório especificado, encontrar pastas chamadas `users`, e copiar as subpastas dentro delas para outro diretório, se essas subpastas ainda não tiverem sido copiadas.

### Código

```python
import os
import shutil

# Variáveis globais
destino = r"D:\Trabalho_Super\Extraidos"
usuarios_unicos = r"D:\Trabalho_Super\UsuariosUnicos"

# Vetor global para armazenar os nomes das pastas já copiadas
pastas_copiadas = []

def processar_usuarios():
    # Cria o diretório usuarios_unicos se ele não existir
    if not os.path.exists(usuarios_unicos):
        os.makedirs(usuarios_unicos)
    
    # Percorre as subpastas dentro de 'destino'
    for root, dirs, files in os.walk(destino):
        if os.path.basename(root) == 'users':  # Checa se o nome da pasta é 'users'
            for subpasta in dirs:
                if subpasta not in pastas_copiadas:  # Verifica se a pasta já foi copiada
                    src_path = os.path.join(root, subpasta)
                    dest_path = os.path.join(usuarios_unicos, subpasta)
                    shutil.copytree(src_path, dest_path)  # Copia a pasta para 'usuarios_unicos'
                    pastas_copiadas.append(subpasta)  # Adiciona o nome da pasta ao vetor global

# Executa a função
processar_usuarios()


In [6]:
import os
import shutil





# Vetor global para armazenar os nomes das pastas já copiadas
pastas_copiadas = []

def processar_usuarios():
    # Cria o diretório usuarios_unicos se ele não existir
    if not os.path.exists(usuarios_unicos_pasta):
        os.makedirs(usuarios_unicos_pasta)
    
    # Percorre as subpastas dentro de 'destino'
    for root, dirs, files in os.walk(destino):
        if os.path.basename(root) == 'users':  # Checa se o nome da pasta é 'users'
            for subpasta in dirs:
                if subpasta not in pastas_copiadas:  # Verifica se a pasta já foi copiada
                    src_path = os.path.join(root, subpasta)
                    dest_path = os.path.join(usuarios_unicos_pasta, subpasta)
                    shutil.copytree(src_path, dest_path)  # Copia a pasta para 'usuarios_unicos'
                    pastas_copiadas.append(subpasta)  # Adiciona o nome da pasta ao vetor global

# Executa a função
processar_usuarios()


# Explicação do Código Python

Este código Python define uma estrutura de árvore binária e uma função para construir e preencher essa árvore com base em arquivos `.data` localizados em um diretório específico.

## Classes

### 1. `BinaryTreeNode`

A classe `BinaryTreeNode` representa um nó em uma árvore binária.

**Atributos:**
- `value` (int): O valor armazenado no nó.
- `left` (BinaryTreeNode): Referência para o filho à esquerda.
- `right` (BinaryTreeNode): Referência para o filho à direita.

**Método:**
- `__init__(self, value)`: Construtor que inicializa o valor do nó e define os filhos como `None`.

### 2. `BinaryTree`

A classe `BinaryTree` representa a estrutura da árvore binária.

**Atributos:**
- `root` (BinaryTreeNode): Referência para o nó raiz da árvore.
- `nome` (str): Nome associado à árvore.

**Métodos:**
- `__init__(self, nome)`: Construtor que inicializa a árvore com um nome e define a raiz como `None`.
- `insert(self, value)`: Insere um valor na árvore. Se a raiz for `None`, o valor se torna a raiz; caso contrário, usa `_insert_node` para encontrar a posição correta.
- `_insert_node(self, current, node)`: Método auxiliar recursivo para inserir um nó na posição correta na árvore.
- `search(self, value)`: Procura por um valor na árvore e retorna `True` se o valor for encontrado, caso contrário, `False`.
- `_search_node(self, current, value)`: Método auxiliar recursivo para realizar a busca.
- `in_order_traversal(self)`: Retorna uma lista de valores da árvore em ordem crescente.
- `_in_order_traversal(self, current, nodes)`: Método auxiliar recursivo para a travessia em ordem.

## Função

### `construir_arvore_binaria(provas_path, nome_arvore)`

Esta função constrói uma árvore binária a partir dos arquivos `.data` encontrados em um diretório.

**Parâmetros:**
- `provas_path` (str): O caminho para o diretório onde os arquivos `.data` estão localizados.
- `nome_arvore` (str): O nome da árvore binária a ser criada.

**Retorno:**
- `BinaryTree`: Uma instância da classe `BinaryTree` contendo os IDs extraídos dos arquivos `.data`.

**Funcionamento:**
- Cria uma nova instância de `BinaryTree` com o nome fornecido.
- Percorre o diretório `provas_path` para encontrar arquivos `.data`.
- Para cada arquivo `.data`, tenta extrair um ID numérico do nome do arquivo usando expressões regulares.
- Insere o ID na árvore binária.
- Imprime uma mensagem de erro se o nome do arquivo não corresponder ao padrão esperado.

## Exemplo de Uso

- **Construir uma árvore binária a partir dos arquivos `.data` em um diretório:**

  ```python
  provas_path = 'D:\\Trabalho_Super\\Provas'
  nome_arvore = 'MinhaArvoreBinaria'
  arvore_binaria = construir_arvore_binaria(provas_path, nome_arvore)


In [7]:
import os
import re
import shutil

# Definição da classe BinaryTreeNode
class BinaryTreeNode:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

# Definição da classe BinaryTree
class BinaryTree:
    def __init__(self, nome):
        self.root = None
        self.nome = nome

    def insert(self, value):
        node = BinaryTreeNode(value)
        if self.root is None:
            self.root = node
        else:
            self._insert_node(self.root, node)

    def _insert_node(self, current, node):
        if node.value < current.value:
            if current.left is None:
                current.left = node
            else:
                self._insert_node(current.left, node)
        elif node.value > current.value:
            if current.right is None:
                current.right = node
            else:
                self._insert_node(current.right, node)

    def search(self, value):
        return self._search_node(self.root, value)

    def _search_node(self, current, value):
        if current is None:
            return False
        if value == current.value:
            return True
        elif value < current.value:
            return self._search_node(current.left, value)
        else:
            return self._search_node(current.right, value)

    def in_order_traversal(self):
        nodes = []
        self._in_order_traversal(self.root, nodes)
        return nodes

    def _in_order_traversal(self, current, nodes):
        if current is not None:
            self._in_order_traversal(current.left, nodes)
            nodes.append(current.value)
            self._in_order_traversal(current.right, nodes)

# Função para construir uma árvore binária para cada subpasta em "Provas"
def construir_arvore_binaria(provas_path,nome_arvore):
    arvore_binaria = BinaryTree(nome=nome_arvore)
    
    for root, dirs, files in os.walk(provas_path):
        for filename in files:
            if filename.endswith('.data'):
                match = re.match(r'(\d+)\.data', filename)
                if match:
                    id = int(match.group(1))
                    arvore_binaria.insert(id)
                else:
                    print(f"Nome de arquivo inválido: {filename}")
    return arvore_binaria






# Explicação do Código Python

Este código Python contém duas funções para salvar e carregar o progresso de usuários, armazenando os nomes dos usuários em um arquivo de progresso.

## Funções

### 1. `salvar_progresso(usuario, progresso_path)`

Esta função salva o nome de um usuário em um arquivo de progresso.

**Parâmetros:**
- `usuario` (str): O nome do usuário a ser salvo no arquivo de progresso.
- `progresso_path` (str): O caminho do arquivo onde o progresso será salvo.

**Funcionamento:**
- Abre o arquivo especificado em modo de adição (`'a'`).
- Adiciona o nome do usuário seguido de uma nova linha (`'\n'`).

**Exemplo de Uso:**

```python
salvar_progresso('usuario123', 'caminho/para/progresso.txt')


In [8]:
def salvar_progresso(usuario, progresso_path):
    with open(progresso_path, 'a') as file:
        file.write(f"{usuario}\n")
        
def carregar_progresso(progresso_path):
    if not os.path.exists(progresso_path):
        return set()
    
    with open(progresso_path, 'r') as file:
        usuarios_processados = set(line.strip() for line in file)
    
    return usuarios_processados

# Explicação do Código Python

Este código Python realiza a cópia seletiva de arquivos de usuários de uma estrutura de diretórios. Ele verifica se os arquivos de um usuário atendem a certos critérios (baseados em IDs armazenados em uma árvore binária) antes de copiá-los para um destino específico. Além disso, o código mantém o progresso do processo de cópia e permite limitar o número de usuários processados.

## Funções Principais

### `verificar_e_copiar_arquivos(usuario_path, destino_path, arvore_binaria)`

- **Parâmetros:**
  - `usuario_path`: Caminho para a pasta do usuário a ser verificado.
  - `destino_path`: Caminho para onde os arquivos aprovados devem ser copiados.
  - `arvore_binaria`: Estrutura de árvore binária usada para verificar se os IDs dos arquivos estão presentes.

- **Funcionamento:**
  - A função verifica as subpastas `grades`, `executions` e `codes` dentro da pasta do usuário.
  - Para cada arquivo nessas subpastas, ela extrai o ID do usuário (parte do nome do arquivo) e verifica se o ID está presente na árvore binária.
  - Se o ID estiver presente, o arquivo é copiado para o destino.
  - Se pelo menos um arquivo for copiado, a função também copia os arquivos `final_grade.data` e `user.data`, caso existam.
  - A função retorna um valor booleano (`True` ou `False`) indicando se algum arquivo foi copiado.

### `copiar_arquivos_usuarios(destino, arvore_binaria, quant_user=-1, subpasta_name='')`

- **Parâmetros:**
  - `destino`: Caminho raiz que contém as pastas dos usuários.
  - `arvore_binaria`: Estrutura de árvore binária usada para verificação dos IDs.
  - `quant_user`: Limite de usuários a serem processados (valor padrão `-1` significa sem limite).
  - `subpasta_name`: Nome da subpasta dentro do destino onde os arquivos dos usuários serão copiados.

- **Funcionamento:**
  - A função cria a estrutura de diretórios de destino e carrega o progresso de cópias anteriores.
  - Ela percorre a estrutura de diretórios a partir de `destino`, procurando por pastas de usuários.
  - Para cada usuário, a função chama `verificar_e_copiar_arquivos`. Se nenhum arquivo do usuário for copiado, a pasta de destino do usuário é removida.
  - O progresso é salvo após cada usuário ser processado, e o contador global de usuários (`global_user_counter`) é incrementado.
  - Se o número máximo de usuários especificado (`quant_user`) for atingido, a função termina a execução.

## Fluxo de Execução

1. **Processamento de Usuários:**
   - Para cada pasta de usuário encontrada:
     - Se a pasta já foi processada anteriormente, ela é ignorada.
     - A função `verificar_e_copiar_arquivos` é chamada para verificar e copiar os arquivos do usuário.
     - Se pelo menos um arquivo for copiado, o usuário é considerado processado, o progresso é salvo, e o contador é incrementado.
     - Se nenhum arquivo for copiado, a pasta de destino é removida.

2. **Gerenciamento de Progresso:**
   - O progresso de usuários já processados é mantido em um arquivo (`progresso.txt`) para evitar processamento duplicado.

3. **Limite de Processamento:**
   - Se um limite (`quant_user`) for especificado, o processo é interrompido após atingir o número máximo de usuários.

Esse código é útil em cenários onde é necessário filtrar e copiar arquivos com base em critérios específicos (neste caso, IDs de usuários) e permite controlar o progresso e a quantidade de usuários processados. A estrutura é modular, com funções separadas para verificação, cópia e controle do processo.


In [9]:
import os
import shutil
global_user_counter=0
def copiar_arquivos_usuarios(usuarios_unicos, arvore_binaria, quant_user=-1):
    global global_user_counter
    
    if quant_user == -1:
        quant_user = len(usuarios_unicos)
    
    for usuario in usuarios_unicos[:quant_user]:
        usuario_path = os.path.join(usuarios_unicos_pasta, usuario)
        if not os.path.isdir(usuario_path):
            print(f"Pasta do usuário não encontrada: {usuario_path}")
            continue
        
        # Flags para verificar se pelo menos um arquivo deve ser copiado
        deve_copiar_pasta = False
        
        # Verifique e copie arquivos nas subpastas
        arquivos_para_copiar = []
        for subpasta in ['codes', 'executions', 'grades']:
            subpasta_path = os.path.join(usuario_path, subpasta)
            if os.path.isdir(subpasta_path):
                for arquivo in os.listdir(subpasta_path):
                    numero_arquivo = re.match(r'(\d+)_', arquivo) or re.match(r'(\d+)\.', arquivo)
                    if numero_arquivo:
                        numero_arquivo = int(numero_arquivo.group(1))
                        if arvore_binaria.search(numero_arquivo):
                            deve_copiar_pasta = True
                            origem_arquivo = os.path.join(subpasta_path, arquivo)
                            destino_arquivo = os.path.join(subpasta, arquivo)  # Relative path
                            arquivos_para_copiar.append((origem_arquivo, destino_arquivo))
        
        # Copie a pasta do usuário e os arquivos apenas se deve_copiar_pasta for True
        if deve_copiar_pasta:
            destino_usuario = os.path.join(usuarios_processamento, usuario)
            os.makedirs(destino_usuario, exist_ok=True)
            
            for origem_arquivo, destino_arquivo in arquivos_para_copiar:
                destino_completo = os.path.join(destino_usuario, destino_arquivo)
                os.makedirs(os.path.dirname(destino_completo), exist_ok=True)
                shutil.copy2(origem_arquivo, destino_completo)
            
            # Copie o arquivo user.data se pelo menos um arquivo foi copiado
            origem_user_data = os.path.join(usuario_path, 'user.data')
            destino_user_data = os.path.join(destino_usuario, 'user.data')
            if os.path.isfile(origem_user_data):
                shutil.copy2(origem_user_data, destino_user_data)
            
            global_user_counter += 1

# Exemplo de uso

arvore_binaria = construir_arvore_binaria(provas_path, "CodeBench")
lista_pastas = os.listdir(usuarios_unicos_pasta )
copiar_arquivos_usuarios(lista_pastas, arvore_binaria, quant_user=-1)


# Explicação do Código Python

Este código realiza o processamento de arquivos de usuários baseando-se em árvores binárias de IDs criadas a partir de subpastas dentro de uma pasta 'Provas'. Ele percorre as subpastas para construir árvores binárias, exibe os IDs das árvores e então usa essas árvores para filtrar e copiar arquivos de uma pasta 'Extraidos' para um destino.

## Funções e Processos Principais

### `listar_subpastas(diretorio)`

- **Parâmetros:**
  - `diretorio`: Caminho para o diretório onde as subpastas devem ser listadas.

- **Funcionamento:**
  - A função lista todos os diretórios (subpastas) dentro do diretório especificado.
  - Retorna uma lista de nomes de subpastas.

### Fluxo do Código

1. **Definição do Caminho para 'Provas':**
   - `provas_path`: Caminho para a pasta onde estão localizadas as subpastas que contêm arquivos para construir árvores binárias.

2. **Construção da Lista de Árvores Binárias:**
   - O código obtém uma lista de subpastas em `provas_path` usando a função `listar_subpastas`.
   - Para cada subpasta:
     - O caminho completo para a subpasta é construído.
     - A função `construir_arvore_binaria` é chamada para criar uma árvore binária a partir dos arquivos nessa subpasta. Presumivelmente, `construir_arvore_binaria` é uma função que lê IDs dos arquivos e constrói a árvore binária.
     - A árvore binária criada é adicionada a `lista_arvores_binarias`.

3. **Exibição das Árvores Binárias:**
   - O código imprime a lista de IDs em ordem de cada árvore binária (presumivelmente usando o método `in_order_traversal` da árvore binária).
   - Em seguida, imprime a lista de IDs em ordem novamente para cada árvore binária na lista.

4. **Processamento dos Arquivos:**
   - Para cada árvore binária em `lista_arvores_binarias`:
     - O código chama a função `copiar_arquivos_usuarios` para processar arquivos na pasta `destino` (caminho para 'Extraidos').
     - Passa a árvore binária atual, o caminho raiz e outros parâmetros necessários para a função de cópia.

## Observações

- **`construir_arvore_binaria(caminho_subpasta, subpasta)`:**
  - Presume-se que esta função é responsável por criar uma árvore binária de IDs a partir dos arquivos encontrados na subpasta.
  
- **`copiar_arquivos_usuarios(destino, arvore_binaria, quant_user=-1, subpasta_name=arvore_binaria.nome)`:**
  - Esta função realiza a cópia dos arquivos com base nos IDs da árvore binária. O parâmetro `quant_user` pode ser usado para limitar o número de usuários processados.

- **`in_order_traversal()`:**
  - Método da árvore binária que retorna uma lista dos IDs em ordem crescente.

Este código é útil para organizar e processar arquivos de forma baseada em IDs estruturados em árvores binárias, permitindo uma filtragem eficiente antes da cópia dos arquivos para o destino desejado.


In [10]:

    


print(f"Árvore Binária({arvore_binaria.nome})  (IDs em ordem): {arvore_binaria.in_order_traversal()}")
        



#---------------------------------------------------
# Exemplo de uso:







Árvore Binária(CodeBench)  (IDs em ordem): [5256, 5257, 5258, 5260, 5265, 5267, 5268, 5294, 5297, 5299, 5307, 5308, 5309, 5311, 5331, 5332, 5333, 5335, 5338, 5340, 5346, 5405, 5411, 5412, 5413, 5414, 5424, 5425, 5468, 5470, 5471, 5472, 5473, 5474, 5493, 5524, 5525, 5527, 5528, 5531, 5532, 5537, 5540, 5541, 5542, 5544, 5545, 5547, 5550, 5551, 5554, 5557, 5647, 5653, 5658, 5659, 5660, 5661, 5697, 5698, 5704, 5706, 5708, 5718, 5719, 5762, 5763, 5764, 5765, 5766, 5767, 5769, 5810, 5812, 5816, 5817, 5818, 5820, 5825, 5865, 5867, 5868, 5872, 5874, 5875, 5877, 5904, 5905, 5921, 5922, 5923, 5924, 5934, 5935, 5939, 5941, 5944, 5945, 5946, 5947, 5948, 5949, 5950, 5951, 5952, 5953]


In [11]:
import os

def buscar_subpastas(nome_subpasta):
    # Caminho global para o diretório "Extraidos"
    extraidos = r'D:\Trabalho_Super\Extraidos'
    
    # Lista para armazenar os caminhos encontrados
    caminhos_encontrados = []
    
    # Percorre todas as subpastas em "extraidos"
    for root, dirs, files in os.walk(extraidos):
        if nome_subpasta in dirs:
            caminho_completo = os.path.join(root, nome_subpasta)
            caminhos_encontrados.append(caminho_completo)
    
    # Imprime os caminhos encontrados
    if caminhos_encontrados:
        for caminho in caminhos_encontrados:
            print(caminho)
    else:
        print(f"Subpasta '{nome_subpasta}' não encontrada em '{extraidos}'.")

# Exemplo de uso
buscar_subpastas("1090")


D:\Trabalho_Super\Extraidos\cb_dataset_2016_1_v1.8\2016-1\109\users\1090
