# Título do notebook

## TL;DR
Fazer uma descrição de 3 linhas do objetivo do notebook e conclusões presentes na análise.

## Objetivo

Descrever com clareza qual o objetivo desse notebook.

## Dados

Descrever a base de dados utilizada.

## Modelos (opcional)

Em caso de treinamento ou comparação de modelos, descrever os modelos considerados

## Conclusões
Listar **todas** as conclusões obtidas no notebook:
1. conclusão 1
2. conclusão 2
3. etc.


## Observações importantes:
1. Sempre organize o conteúdo utilizando células markdown e seções. Também utilize células de texto para escrever sua análise das figuras que forem geradas.
2. Lembre-se que essa primeira célula deve ter informação suficiente para entender o que foi feito e quais conclusões você chegou, sem ter que ler o notebook inteiro. Isso agiliza muito a busca por informações ao longo do projeto. Além disso, seu eu do futuro (ou novas pessoas que entrem no projeto) vai agradecer se o seu notebook estiver bem escrito e completo.

# Aqui é a primeira seção

In [None]:
import os
import pandas as pd
import numpy as np

# Caminho da pasta com os arquivos CSV
folder = '../data/data_rafael_tratado'

# Inicializa um dicionário para armazenar os dados
data_dict = {}

# Percorre todos os arquivos no diretório
for filename in sorted(os.listdir(folder)):
    if filename.endswith('.csv'):
        # Ex: Voluntário 1_Ex1.csv -> Vol1Ex1
        clean_name = filename.replace('Voluntário ', 'Vol').replace('Voluntario ', 'Vol').replace('_', '').replace('.csv', '')
        file_path = os.path.join(folder, filename)
        
        # Lê o CSV, apenas a coluna 22 (index 21)
        df = pd.read_csv(file_path, header=None)
        if df.shape[1] > 21:  # Garante que existe a coluna 22
            data_dict[clean_name] = df.iloc[:, 22].values

# Descobre o maior comprimento de sinal
max_len = max(len(col) for col in data_dict.values())

# Cria a coluna de tempo com passo de 0.0334
timestamps = np.arange(0, max_len * 0.0334, 0.0334)

# Cria o DataFrame final
final_df = pd.DataFrame({'timestamp': timestamps})

# Adiciona os sinais
for col_name, signal in data_dict.items():
    # Preenche com NaN se o sinal for menor que o maior comprimento
    padded_signal = np.pad(signal, (0, max_len - len(signal)), constant_values=np.nan)
    final_df[col_name] = padded_signal

# Exibe uma prévia do DataFrame
print(final_df.head())
final_df.shape

   timestamp   Vol1Ex1   Vol1Ex2   Vol1Ex3   Vol1Ex4   Vol1Ex5   Vol2Ex1  \
0     0.0000  86.05160  79.04637  79.92158  88.55168  94.18597  144.2986   
1     0.0334  86.05160  79.42403  79.92158  88.55168  94.36861  144.2986   
2     0.0668  86.24536  79.42403  79.92158  88.72372  94.36861  144.2986   
3     0.1002  85.88944  79.42403  79.92158  88.72372  94.36861  144.4738   
4     0.1336  85.88944  79.89925  79.41667  88.72372  94.40106  144.5396   

    Vol2Ex2   Vol2Ex3   Vol2Ex4  ...   Vol6Ex1   Vol6Ex2   Vol6Ex3   Vol6Ex4  \
0  138.7671  147.3392  148.2097  ...  192.9248  172.1902  173.6004  204.8451   
1  138.7671  147.2379  148.2097  ...  192.9248  172.1767  173.1956  204.8451   
2  138.7671  147.2379  148.2097  ...  192.9248  172.1767  173.1956  204.8451   
3  138.6201  147.2379  148.2097  ...  192.9248  172.1767  173.1956  204.8451   
4  138.6201  146.8200  148.2097  ...  192.9248  172.1767  173.1956  204.8451   

    Vol6Ex5   Vol7Ex1   Vol7Ex2   Vol7Ex3   Vol7Ex4   Vol7Ex5 

(1144, 36)

In [2]:
final_df.to_csv('../../data/rafaelDB.csv', index=False)

In [2]:
import os
import pandas as pd
import numpy as np

# Caminho da pasta com os arquivos CSV
folder = '../data/data_rafael_tratado'

# Inicializa um dicionário para armazenar os dados
data_dict = {}

# Índices das colunas que você quer extrair (Python usa índice 0-based)
cols_to_extract = [18, 19, 20, 21, 22, 23]

# Percorre todos os arquivos no diretório
for filename in sorted(os.listdir(folder)):
    if filename.endswith('.csv'):
        # Ex: Voluntário 1_Ex1.csv -> vol1ex1
        clean_name = filename.replace('Voluntário ', 'vol').replace('Voluntario ', 'vol').replace('_', '').replace('.csv', '').lower()
        file_path = os.path.join(folder, filename)
        
        # Lê o CSV
        df = pd.read_csv(file_path, header=None)
        
        if df.shape[1] > max(cols_to_extract):
            for idx, col_idx in enumerate(cols_to_extract):
                if idx < 3:
                    axis = f'q{"xyz"[idx]}'
                else:
                    axis = f'j{"xyz"[idx - 3]}'
                
                col_name = f"{clean_name}_{axis}"
                data_dict[col_name] = df.iloc[:, col_idx].values

# Descobre o maior comprimento de sinal
max_len = max(len(col) for col in data_dict.values())

# Cria a coluna de tempo com passo de 0.0334
timestamps = np.arange(0, max_len * 0.0334, 0.0334)

# Cria o DataFrame final
final_df = pd.DataFrame({'timestamp': timestamps})

# Adiciona os sinais
for col_name, signal in data_dict.items():
    padded_signal = np.pad(signal, (0, max_len - len(signal)), constant_values=np.nan)
    final_df[col_name] = padded_signal

# Exibe uma prévia do DataFrame
print(final_df.head())
print(final_df.shape)

# Se quiser, salve em CSV
final_df.to_csv('dados_extraidos.csv', index=False)


  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
  final_df[col_name] = padded_signal
 

   timestamp  vol1ex1_qx  vol1ex1_qy  vol1ex1_qz  vol1ex1_jx  vol1ex1_jy  \
0     0.0000     0.71875    102.9769    91.90424    186.9064    86.05160   
1     0.0334     0.71875    102.9769    91.90424    186.9064    86.05160   
2     0.0668    -0.25000    102.9769    91.90424    186.9064    86.24536   
3     0.1002    -0.25000    102.9769    91.90424    186.9064    85.88944   
4     0.1336     0.40625    102.9769    91.90424    186.9064    85.88944   

   vol1ex1_jz  vol1ex2_qx  vol1ex2_qy  vol1ex2_qz  ...  vol7ex4_qz  \
0    198.7182     0.71875    101.1554    100.2091  ...    308.6826   
1    198.7182     2.71875    101.1554    100.2091  ...    308.6826   
2    198.8709     2.71875    101.1554    100.2091  ...    308.6826   
3    199.3856     2.71875    101.1554    100.2091  ...    308.6826   
4    199.3856     2.50000    101.1554    100.2091  ...    308.6826   

   vol7ex4_jx  vol7ex4_jy  vol7ex4_jz  vol7ex5_qx  vol7ex5_qy  vol7ex5_qz  \
0    277.2512    219.5107    316.9044    -47.

# Aqui é a segunda seção

# Conclusões

Aqui você deve listar todas as conclusões obtidas ao longo do notebook.
Pode copiar todo o conteúdo dessa seção lá na parte de conclusões do cabeçalho.