# Combinando Dados - Atrito e Umidade/Temperatura

Neste script foram combinados os dados de umidade e temperatura com os dados de atrito obtidos do tribômetro. Apenas os dados de PU Puro estão sendo mostrados neste arquivo, para fins de exemplificação. No entanto, no trabalho de mestrado e nos dados observáveis no website, todos os ensaios foram combinados para visualização das condições ao longo do ensaio.

## Bibliotecas Utilizadas

Foram utilizadas as bibliotecas do Plotly para construir os gráficos, além de outras bibliotecas para torná-los interativos (`ipywidgets`), para lidar com os arquivos e pastas (`pathlib`, `os`) e para manipular os dados (`numpy` e `pandas`).

In [8]:
import pandas as pd
import numpy as np
import plotly.express as px
pd.options.plotting.backend = "plotly"
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from pathlib import Path
from os import listdir
from os.path import isfile, join
from ipywidgets import interact, widgets

## Etapa 1: Abrindo os Arquivos de Dados

Vários arquivos serão utilizados neste script:  `summary_pu.csv`, com o resumo dos resultados de atrito obtidos em outro script; `umidade_combinada.csv`, com todos os dados de umidade combinados em outro script; e os arquivos individuais de coeficiente de atrito, diretamente após serem exportados pelo software *Viewer*. Nesta etapa os arquivos de umidade e o sumário de atrito são abertos, e é gerada uma lista de endereços dos arquivos individuais de atrito.

In [9]:
p = Path('src/')
cof_path = p/'PU_atrito'
cof_files = [cof_path/f for f in listdir(cof_path) if isfile(join(cof_path, f))]
hum_path = p/'umidade_combinada.csv'
cof_summary_path = p/'summary_pu.csv'
parse_dates = ['Timestamp']

In [10]:
hum_df = pd.read_csv(hum_path,
                     usecols = ['Timestamp','Temperatura','Umidade'],
                     parse_dates = parse_dates,
                     dtype = np.float64
                    )

In [11]:
summary_df = pd.read_csv(cof_summary_path, parse_dates = ['Início'])

## Etapa 2: Determinação do Tempo

Nesta etapa, usamos os valores de Início do ensaio já compilados no DataFrame `summary_pu` para determinar o tempo de cada leitura de força/atrito no tribômetro. No entanto, há uma diferença de tempo entre o relógio do computador do  tribômetro (que está adiantado 50 minutos e 50 segundos) e o computador ao qual estava ligado o Arduino. Deste modo, essas diferenças são computadas antes de gravar os Timestamps nos DataFrames.

In [12]:
starts = summary_df.sort_values(by = 'Início').reset_index(drop = True)['Início']
corr_time_diffs = pd.Timedelta(value = 50, unit = 'min') + pd.Timedelta(value = 50, unit = 'sec')

In [13]:
frames = {}
for i, file in enumerate(cof_files):
    cof_df = pd.read_csv(file,
                     header=17,
                     skiprows = [21],
                     dtype = {'T': np.float64,'COF': np.float64},
                     usecols = ['T','COF']
                    )
    cof_df['Timedeltas'] = pd.Timedelta(value = 1, unit = 'ms') * cof_df.index
    cof_df['Timestamp'] = starts[i] + cof_df['Timedeltas'] - corr_time_diffs
    if i < 10:
        cof_df['Timestamp'] = starts[i] + cof_df['Timedeltas'] - corr_time_diffs - pd.Timedelta(value = 12, unit = 'sec')
    cof_df = cof_df.drop(columns = 'Timedeltas')
    frames[str(file)] = cof_df

Na sequência, são arredondados os tempos para segundos, e assim fazer a correlação do tempo de ensaio tribológico e o tempo gravado pelo Arduino, realizando uma operação de junção (`.join`) nos dois DataFrames. A junção é feita sobre os tempos, de modo que para cada entrada de tempo que existe nos dois DataFrames, é gerada uma entrada de tempo no DataFrame resultante, juntamente com os outros dados dos dois DataFrames.

In [14]:
hum_df['Time_round'] = hum_df['Timestamp'].round('S')
for key, frame in frames.items():
    frame['Time_round'] = frame['Timestamp'].round('S')

In [15]:
for key, frame in frames.items():
    frame = frame.set_index('Time_round').join(hum_df[['Time_round','Umidade','Temperatura']].set_index('Time_round'))
    frames[key] = frame.reset_index(drop = True)

In [16]:
for key, frame in frames.items():
    frame['COF_roll'] = frame['COF'].rolling(1000).mean()

## Etapa 3: Visualização dos Dados

Aqui são plotados os gráficos de atrito/umidade/temperatura ao longo do ensaio.

In [17]:
def timeline_plot(key):
    df = frames[key].sample(frac = 0.001).sort_values(by = 'Timestamp')
    fig = make_subplots(specs=[[{"secondary_y": True}]])
    fig.add_trace(go.Scatter(
        x = df['Timestamp'], 
        y = df['COF_roll'],
        mode = 'lines',
        name = 'COF',
        marker_color = 'darkgreen',
        legendgroup = 'COF',
         ),
        secondary_y = True,)
    fig.add_trace(go.Scatter(   
        x = df['Timestamp'],           
        y = df['Umidade'],            
        mode = 'lines',
        name = 'Umidade',
        marker_color = 'blue',
        legendgroup = 'Umidade',
         ),
        secondary_y = False,)
    fig.add_trace(go.Scatter(   
        x = df['Timestamp'],           
        y = df['Temperatura'],            
        mode = 'lines',
        name = 'Temperatura',
        marker_color = 'red',
        legendgroup = 'Umidade',
         ),
        secondary_y = False,)
    fig.update_yaxes(title_text = 'COF (-)',
                     title_font_color = 'darkgreen',
                     range = [0,1],
                     secondary_y = True) #only temperature
    fig.update_yaxes(title_text = 'Umidade Relativa (%) / Temperatura (°C)',
                     title_font_color = 'black',
                     range = [0,55],
                     secondary_y = False) #only humidity
    fig.update_layout(template = 'plotly')
    return fig

In [18]:
interact(timeline_plot, key = list(frames.keys()))

interactive(children=(Dropdown(description='key', options=('src\\PU_atrito\\Umidade_FC_001.zip', 'src\\PU_atri…

<function __main__.timeline_plot(key)>

## Etapa 4: Salvando os Dados

Os dados são comprimidos e salvos na pasta `src/combinados/`.

In [19]:
i = 0
for filename in cof_files:
    frames[str(filename)].to_csv('src/combinados/{}'.format(filename.stem+'.gz'), compression='gzip')