## Análise dos Termometros Normal

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

In [13]:
df_normal = pd.read_csv('C:/Users/Cristiano/OneDrive - Belago Technologies/Documentos/projeto_fnt/data/base_dados_normal_araraquara.csv')
df_normal.head()

Unnamed: 0,regiao,operacao,original,temperatura,temperaturatermometro,amplitude,status,checkedat,dataref,year,month,day
0,NORTE,ZSOZAR-ZARZOI3-244450,thermo_id_20001336,37.6,37.6,0.0,Normal,2023-11-08 08:51:06,2023-11-08,2023,11,8
1,NORTE,ZSOZAR-ZARZOI3-244450,thermo_id_20001336,42.9,42.9,6.7,Normal,2023-11-08 09:51:05,2023-11-08,2023,11,8
2,NORTE,ZSOZAR-ZARZOI3-244450,thermo_id_20001336,43.2,43.2,7.0,Normal,2023-11-08 10:01:05,2023-11-08,2023,11,8
3,NORTE,ZSOZAR-ZARZOI3-244450,thermo_id_20001336,43.2,43.2,7.0,Normal,2023-11-08 10:01:32,2023-11-08,2023,11,8
4,NORTE,ZSOZAR-ZARZOI3-244450,thermo_id_20001336,45.1,45.1,8.9,Normal,2023-11-08 10:21:05,2023-11-08,2023,11,8


In [14]:
df_normal.isnull().sum()

regiao                   0
operacao                 0
original                 0
temperatura              0
temperaturatermometro    0
amplitude                0
status                   0
checkedat                0
dataref                  0
year                     0
month                    0
day                      0
dtype: int64

In [15]:
# Convertendo a coluna 'dataref' para o formato datetime
df_normal["dataref"] = pd.to_datetime(df_normal["dataref"])

In [16]:
df_normal.dtypes

regiao                           object
operacao                         object
original                         object
temperatura                     float64
temperaturatermometro           float64
amplitude                       float64
status                           object
checkedat                        object
dataref                  datetime64[ns]
year                              int64
month                             int64
day                               int64
dtype: object

In [17]:
# Criando uma nova categoria "Erro Consistência" para temperaturas fora do intervalo esperado
df_normal['erro_consistencia'] = np.where(
    (df_normal['temperatura'] < 0) | (df_normal['temperatura'] > 65), 'Erro Consistência', 'Normal'
)

## Quantidade e porcentagem de medidas com status Normal X Com qualquer erro - Geral e abertura mensal

In [None]:
# Calculando as quantidades gerais
status_count = df_normal['erro_consistencia'].value_counts()
status_percentage = df_normal['erro_consistencia'].value_counts(normalize=True) * 100

In [22]:
# Visualizando a contagem geral
print("Contagem geral de status:")
print(status_count)

Contagem geral de status:
erro_consistencia
Normal               42014
Erro Consistência      205
Name: count, dtype: int64


In [23]:
# Visualizando a porcentagem geral
print("\nPorcentagem geral de status:")
print(status_percentage)


Porcentagem geral de status:
erro_consistencia
Normal               99.514437
Erro Consistência     0.485563
Name: proportion, dtype: float64


In [24]:
# Calculando as quantidades mensais
status_count_monthly = df_normal.groupby(['year', 'month'])['erro_consistencia'].value_counts()
status_percentage_monthly = df_normal.groupby(['year', 'month'])['erro_consistencia'].value_counts(normalize=True) * 100

In [25]:
# Exibindo as quantidades mensais
print("\nContagem mensal de status:")
print(status_count_monthly)


Contagem mensal de status:
year  month  erro_consistencia
2023  11     Normal               1556
      12     Normal               1389
2024  1      Normal               3264
      2      Normal               3689
      3      Normal               4024
      4      Normal               4028
      5      Normal               3572
      6      Normal               3297
      7      Normal               2962
      8      Normal               2651
      9      Normal               3524
      10     Normal               3311
             Erro Consistência     204
      11     Normal               3196
      12     Normal               1551
             Erro Consistência       1
Name: count, dtype: int64


In [26]:
# Exibindo a porcentagem mensal
print("\nPorcentagem mensal de status:")
print(status_percentage_monthly)


Porcentagem mensal de status:
year  month  erro_consistencia
2023  11     Normal               100.000000
      12     Normal               100.000000
2024  1      Normal               100.000000
      2      Normal               100.000000
      3      Normal               100.000000
      4      Normal               100.000000
      5      Normal               100.000000
      6      Normal               100.000000
      7      Normal               100.000000
      8      Normal               100.000000
      9      Normal               100.000000
      10     Normal                94.196302
             Erro Consistência      5.803698
      11     Normal               100.000000
      12     Normal                99.935567
             Erro Consistência      0.064433
Name: proportion, dtype: float64


## Gráfico Contagem de Status - Geral

In [27]:
# Gráfico de barras para a contagem geral de status
fig1 = px.bar(status_count, title="Contagem de Status - Geral", labels={'index': 'Status', 'value': 'Contagem'})
fig1.show()

## Gráfico Porcentagem de Status - Geral

In [28]:
# Gráfico de barras para a porcentagem geral de status
fig2 = px.bar(status_percentage, title="Porcentagem de Status - Geral", labels={'index': 'Status', 'value': 'Porcentagem'})
fig2.show()

## Quantidade e porcentagem de cada tipo de erro em relação ao total de medidas com erro - Geral e abertura Mensal

In [29]:
# Calculando a quantidade de erros (qualquer tipo)
erro_count = df_normal[df_normal['erro_consistencia'] != 'Normal']['erro_consistencia'].value_counts()
erro_percentage = df_normal[df_normal['erro_consistencia'] != 'Normal']['erro_consistencia'].value_counts(normalize=True) * 100

In [30]:
# Exibindo a quantidade de erros gerais
print("\nQuantidade de erros - Geral:")
print(erro_count)


Quantidade de erros - Geral:
erro_consistencia
Erro Consistência    205
Name: count, dtype: int64


In [31]:
# Exibindo a porcentagem de erros gerais
print("\nPorcentagem de erros - Geral:")
print(erro_percentage)


Porcentagem de erros - Geral:
erro_consistencia
Erro Consistência    100.0
Name: proportion, dtype: float64


In [32]:
# Calculando a quantidade de erros mensais
erro_count_monthly = df_normal[df_normal['erro_consistencia'] != 'Normal'].groupby(['year', 'month'])['erro_consistencia'].value_counts()
erro_percentage_monthly = df_normal[df_normal['erro_consistencia'] != 'Normal'].groupby(['year', 'month'])['erro_consistencia'].value_counts(normalize=True) * 100

In [33]:
# Exibindo a quantidade de erros mensais
print("\nQuantidade de erros - Mensal:")
print(erro_count_monthly)


Quantidade de erros - Mensal:
year  month  erro_consistencia
2024  10     Erro Consistência    204
      12     Erro Consistência      1
Name: count, dtype: int64


In [34]:
# Exibindo a porcentagem de erros mensais
print("\nPorcentagem de erros - Mensal:")
print(erro_percentage_monthly)


Porcentagem de erros - Mensal:
year  month  erro_consistencia
2024  10     Erro Consistência    100.0
      12     Erro Consistência    100.0
Name: proportion, dtype: float64


## Gráfico Contagem de Erros - Geral

In [35]:
# Gráfico de barras para a contagem de erros gerais
fig3 = px.bar(erro_count, title="Contagem de Erros - Geral", labels={'index': 'Erro', 'value': 'Contagem'})
fig3.show()

## Gráfico de barras para a porcentagem de erros gerais

In [36]:
# Gráfico de barras para a porcentagem de erros gerais
fig4 = px.bar(erro_percentage, title="Porcentagem de Erros - Geral", labels={'index': 'Erro', 'value': 'Porcentagem'})
fig4.show()

In [49]:
# Resetando o índice para o gráfico de barras de erros mensais
erro_count_monthly_reset = erro_count_monthly.reset_index()

# Gráfico de barras para a contagem de erros mensais
fig5 = px.bar(
    erro_count_monthly_reset,
    x='month',  
    y='erro_consistencia',  
    color='year', 
    title="Contagem de Erros Mensais",  
    labels={'erro_consistencia': 'Tipo de Erro', 'count': 'Contagem'},
    color_discrete_sequence=px.colors.qualitative.Set2,  
    barmode='stack',  
    height=400,  
    template='plotly_dark',  
)

fig5.update_layout(
    title_text="Contagem de Erros Mensais - Tipo de Erro",  
    xaxis_title="Mês",  
    yaxis_title="Contagem", 
    xaxis=dict(tickmode='linear', tick0=1, dtick=1), 
    yaxis=dict(showgrid=True),  
    plot_bgcolor='rgb(32, 32, 32)',  
    paper_bgcolor='rgb(32, 32, 32)', 
    font=dict(color="white"), 
    showlegend=True 
)

fig5.show()

In [47]:
# Resetando o índice para o gráfico de barras de porcentagem de erros mensais
erro_percentage_monthly_reset = erro_percentage_monthly.reset_index()

# Gráfico de barras para a porcentagem de erros mensais
fig6 = px.bar(
    erro_percentage_monthly_reset,
    x='month', 
    y='erro_consistencia', 
    color='month', 
    title="Porcentagem de Erros Mensais", 
    labels={'erro_consistencia': 'Tipo de Erro', 'percentage': 'Porcentagem'},
    color_discrete_sequence=px.colors.qualitative.Set1, 
    barmode='stack', 
    height=400,  
    template='plotly_dark', 
)

fig6.update_layout(
    title_text="Porcentagem de Erros Mensais - Tipo de Erro",  
    xaxis_title="Mês",  
    yaxis_title="Porcentagem",  
    xaxis=dict(tickmode='linear', tick0=1, dtick=1),  
    yaxis=dict(showgrid=True),  
    plot_bgcolor='rgb(32, 32, 32)', 
    paper_bgcolor='rgb(32, 32, 32)',  
    font=dict(color="white"),  
    showlegend=True 
)

fig6.show()

## Máximas e Mínimas Absolutas por Ano e Tendências

In [54]:
# Máximas e Mínimas Absolutas por Ano
max_min_year = df_normal.groupby('year')['temperatura'].agg(['max', 'min'])

# Calculando a tendência de aumento/diminuição
max_min_year['tendencia_max'] = max_min_year['max'].diff() 
max_min_year['tendencia_min'] = max_min_year['min'].diff() 

print(max_min_year)

       max   min  tendencia_max  tendencia_min
year                                          
2023  58.8  13.8            NaN            NaN
2024  63.2 -20.0            4.4          -33.8


## Gráfico de tendência de máximas e mínimas por ano

In [None]:
fig1 = px.line(max_min_year, x=max_min_year.index, y=['max', 'min'], title="Máximas e Mínimas Absolutas por Ano", 
               labels={'value': 'Temperatura (°C)', 'year': 'Ano'}, template='plotly_dark')
fig1.show()

## Máximas e Mínimas Absolutas por Mês e Ano e Tendências

In [55]:
# Máximas e Mínimas Absolutas por Mês e Ano
max_min_month = df_normal.groupby(['year', 'month'])['temperatura'].agg(['max', 'min'])

# Calculando a tendência de aumento/diminuição mensal
max_min_month['tendencia_max'] = max_min_month['max'].diff()  # Diferença entre meses para máxima
max_min_month['tendencia_min'] = max_min_month['min'].diff()  # Diferença entre meses para mínima

# Exibindo as máximas, mínimas e tendências por mês e ano
print(max_min_month)

             max   min  tendencia_max  tendencia_min
year month                                          
2023 11     57.6  15.5            NaN            NaN
     12     58.8  13.8            1.2           -1.7
2024 1      57.6  13.9           -1.2            0.1
     2      57.7  16.0            0.1            2.1
     3      56.2  11.8           -1.5           -4.2
     4      51.5  12.3           -4.7            0.5
     5      48.3   4.6           -3.2           -7.7
     6      43.2   9.1           -5.1            4.5
     7      43.4   6.3            0.2           -2.8
     8      48.6   3.1            5.2           -3.2
     9      51.4  11.5            2.8            8.4
     10     51.5 -20.0            0.1          -31.5
     11     60.6   6.8            9.1           26.8
     12     63.2  -1.0            2.6           -7.8


## Gráfico de tendência de máximas e mínimas por mês e ano

In [56]:
fig2 = px.line(max_min_month.reset_index(), x='month', y=['max', 'min'], color='year', 
               title="Máximas e Mínimas Absolutas por Mês e Ano", labels={'value': 'Temperatura (°C)', 'month': 'Mês'})
fig2.show()

## Boxplot de Temperaturas por Estação do Ano

In [58]:
# Mapeando os meses para as estações do ano
def map_estacao(month):
    if month in [12, 1, 2]:
        return 'Verão'
    elif month in [3, 4, 5]:
        return 'Outono'
    elif month in [6, 7, 8]:
        return 'Inverno'
    else:
        return 'Primavera'

# Adicionando uma coluna para a estação
df_normal['estacao'] = df_normal['month'].apply(map_estacao)

# Boxplot de Temperaturas por Estação do Ano
fig3 = px.box(df_normal, x='estacao', y='temperatura', title="Boxplot de Temperaturas por Estação do Ano", 
              labels={'temperatura': 'Temperatura (°C)', 'estacao': 'Estação do Ano'}, color='estacao', template='plotly_dark')
fig3.show()

# Resumo da Análise

Este notebook apresenta uma análise detalhada dos dados de medições de termômetros, com foco em identificar padrões de erro e tendências.

## Estrutura da Análise

1. **Carregamento de Dados**
   - Leitura do DataFrame e exploração inicial.
   - Visualização das primeiras linhas dos dados.

2. **Pré-processamento**
   - Conversão de colunas para tipos adequados.
   - Tratamento de valores ausentes e ajustes nos dados.

3. **Análises Exploratórias**
   - Estatísticas descritivas para compreender a distribuição das variáveis.
   - Gráficos para visualizar padrões nos dados.

4. **Visualizações**
   - **Percentual de Erros por Termômetro:** Barras agrupadas para identificar termômetros problemáticos.
   - **Dispersão de Temperaturas:** Boxplot para observar a variação das temperaturas e identificar outliers.
   - **Evolução Temporal dos Erros:** Gráfico de linhas para monitorar tendências ao longo do tempo.

5. **Conclusões**
   - Identificação de termômetros com maior incidência de erros.
   - Padrões temporais e sazonais nos dados de erros.

## Tecnologias Utilizadas

- **Python:** Para análise e visualização.
- **Pandas:** Manipulação de dados.
- **Plotly:** Criação de gráficos interativos.

## Resultados e Recomendação

Os gráficos e análises apresentados fornecem insights sobre os termômetros mais problemáticos e padrões temporais que podem ser utilizados para planejar manutenções e reduzir erros no futuro.
