# Instalação das bibliotecas utilizadas

Antes de iniciarmos a análise dos dados de Consumo no Google Colab, é essencial garantir que todas as bibliotecas necessárias estejam devidamente instaladas e atualizadas. No ambiente do Colab, embora muitas bibliotecas já venham pré-instaladas, pode ser necessário instalar ou atualizar pacotes adicionais para garantir que o código funcione corretamente, como por exemplo o MeteoStat, biblioteca utilizada para coletar os dados climáticos.

In [26]:
!pip install meteostat



In [27]:
# Importação das bibliotecas

import numpy as np
import pandas as pd
import gdown
import plotly.graph_objects as go
from meteostat import Point, Daily
from datetime import datetime

In [28]:
arquivo_destino_base = "dataset_{}.csv"

ids = {
    "consumo_2023": "1-WfvkRwaRr85B_Joxcm9xVdpyg5NBAmp",
    "consumo_2024": "1-iXT7eaJWQokHf9cyfrB8N5wvkdhgjJW",
}

dataframes = {}

for key, file_id in ids.items():
    url = f"https://drive.google.com/uc?id={file_id}"
    arquivo_destino = arquivo_destino_base.format(key)

    gdown.download(url, arquivo_destino, quiet=False)
    df = pd.read_csv(arquivo_destino, sep=";")
    dataframes[key] = df


Downloading...
From (original): https://drive.google.com/uc?id=1-WfvkRwaRr85B_Joxcm9xVdpyg5NBAmp
From (redirected): https://drive.google.com/uc?id=1-WfvkRwaRr85B_Joxcm9xVdpyg5NBAmp&confirm=t&uuid=cce12366-0401-4e83-a9ce-c8019c9cbb88
To: /content/dataset_consumo_2023.csv
100%|██████████| 1.09G/1.09G [00:22<00:00, 48.4MB/s]
Downloading...
From (original): https://drive.google.com/uc?id=1-iXT7eaJWQokHf9cyfrB8N5wvkdhgjJW
From (redirected): https://drive.google.com/uc?id=1-iXT7eaJWQokHf9cyfrB8N5wvkdhgjJW&confirm=t&uuid=aca2a9f6-bc1e-4421-bd89-c5c7b885f5a3
To: /content/dataset_consumo_2024.csv
100%|██████████| 668M/668M [00:11<00:00, 57.5MB/s]

Columns (30) have mixed types. Specify dtype option on import or set low_memory=False.



In [29]:
df_23 = pd.read_csv("/content/dataset_consumo_2023.csv", delimiter=";")
df_24 = pd.read_csv("/content/dataset_consumo_2024.csv", delimiter=";")


Columns (30) have mixed types. Specify dtype option on import or set low_memory=False.



# Estruturação dos datasets - 2023

Nesta seção, iremos organizar os arquivos, dataset do Consumo 2023 na integra, com todas as colunas disponibilizadas pelo parceiro, e os dados climáticos, que serão utilizados.

**Desta forma, se precisarmos de mais colunas e features, será de fácil recuperação**

Para o código a seguir é importante ressaltar que a Latitude e a Longitude foram retiradas de: [Campo Grande MS](https://pt.db-city.com/Brasil--Mato-Grosso-do-Sul--Campo-Grande)

In [30]:
# Define a localização geográfica
location = Point(-20.4435, -54.6478)

# Define o intervalo de datas
start = datetime(2023, 1, 1)
end = datetime(2023, 12, 31)

# Busca os dados diários de clima para a localização e período definidos
data = Daily(location, start, end)
data = data.fetch()

# Calcula a média mensal dos dados climáticos
df_monthly_weather_23 = data.resample('M').mean()

# Renomeia as colunas do DataFrame para termos mais descritivos em português
df_weather_23 = df_monthly_weather_23.rename(columns={
    'tavg': 'Temperatura Média',
    'tmin': 'Temperatura Mínima',
    'tmax': 'Temperatura Máxima',
    'prcp': 'Precipitação',
    'snow': 'Neve',
    'wdir': 'Direção do Vento',
    'wspd': 'Velocidade do Vento',
    'wpgt': 'Rajada Máxima de Vento',
    'pres': 'Pressão Atmosférica',
    'tsun': 'Insolação'
})

# Exibe o DataFrame renomeado
df_weather_23

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima,Precipitação,Neve,Direção do Vento,Velocidade do Vento,Rajada Máxima de Vento,Pressão Atmosférica,Insolação
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2023-01-31,26.722581,23.16129,31.077419,4.932258,,299.032258,10.309677,,1010.664516,
2023-02-28,26.5,23.321429,30.685714,8.685714,,320.357143,9.832143,,1011.942857,
2023-03-31,27.003226,23.122581,31.841935,5.796774,,256.774194,8.319355,,1012.729032,
2023-04-30,25.31,21.08,30.45,4.34,,263.633333,7.326667,,1013.293333,
2023-05-31,23.493548,18.722581,29.483871,2.980645,,219.645161,7.083871,,1016.183871,
2023-06-30,20.97,15.116667,28.09,2.813333,,114.666667,7.206667,,1018.67,
2023-07-31,23.3,17.006452,30.729032,0.348387,,112.806452,8.5,,1017.596774,
2023-08-31,26.048387,19.877419,33.348387,1.158065,,177.064516,9.445161,,1014.345161,
2023-09-30,28.703333,22.693333,35.75,1.123333,,237.5,10.156667,,1011.826667,
2023-10-31,30.0,24.554839,36.654839,3.193548,,257.709677,11.73871,,1009.429032,


A seguir iremos remover as colunas que julgamos não serem importantes para entender a mudança do consumo da água.

Aqui fizemos uma descrição estatística básica nas colunas e seus valores

In [31]:
print("\nDescrição estatística básica:")
print(df_23.describe())


Descrição estatística básica:
         Unnamed: 0  EMP_CODIGO     COD_GRUPO  COD_SETOR_COMERCIAL  \
count  4.574507e+06   4574507.0  4.574455e+06         4.574455e+06   
mean   2.287253e+06         2.0  1.351021e+01         5.364079e+01   
std    1.320547e+06         0.0  7.059274e+00         2.887554e+01   
min    0.000000e+00         2.0  0.000000e+00         1.000000e+00   
25%    1.143626e+06         2.0  8.000000e+00         2.900000e+01   
50%    2.287253e+06         2.0  1.300000e+01         5.600000e+01   
75%    3.430880e+06         2.0  1.800000e+01         7.900000e+01   
max    4.574506e+06         2.0  9.900000e+01         9.900000e+01   

         NUM_QUADRA  COD_ROTA_LEITURA     MATRICULA  SEQ_RESPONSAVEL  \
count  4.574455e+06      4.574455e+06  4.574507e+06     4.574507e+06   
mean   2.616135e+02      2.389014e+01  1.764897e+07     7.183687e+05   
std    2.063684e+02      1.405627e+01  2.901598e+05     4.000247e+05   
min    1.000000e+00      0.000000e+00  1.700000e+0

In [32]:
# Remove as colunas desnecessárias do DataFrame
df_weather_23 = df_weather_23.drop(columns=['Neve', 'Precipitação', 'Direção do Vento', 'Velocidade do Vento', 'Rajada Máxima de Vento', 'Pressão Atmosférica', 'Insolação'])
df_weather_23

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2023-01-31,26.722581,23.16129,31.077419
2023-02-28,26.5,23.321429,30.685714
2023-03-31,27.003226,23.122581,31.841935
2023-04-30,25.31,21.08,30.45
2023-05-31,23.493548,18.722581,29.483871
2023-06-30,20.97,15.116667,28.09
2023-07-31,23.3,17.006452,30.729032
2023-08-31,26.048387,19.877419,33.348387
2023-09-30,28.703333,22.693333,35.75
2023-10-31,30.0,24.554839,36.654839


In [33]:
# Converte a coluna 'REFERENCIA' para o tipo datetime, garantindo que as datas sejam reconhecidas corretamente
df_23['REFERENCIA'] = pd.to_datetime(df_23['REFERENCIA'])

# Cria uma nova coluna 'MES' extraindo o número do mês da coluna 'REFERENCIA'
df_23['MES'] = df_23['REFERENCIA'].dt.month

# Extrai o número do mês do índice (assumindo que o índice do DataFrame é uma coluna datetime) e cria uma nova coluna 'MES'
df_weather_23['MES'] = df_weather_23.index.month

# Agrupa os dados por mês e calcula a média do consumo medido ('CONS_MEDIDO') para cada mês
consumo_medio_23 = df_23.groupby('MES')['CONS_MEDIDO'].mean().reset_index()

# Combina os dados de consumo médio com os dados meteorológicos com base na coluna 'MES'
df_combined_23 = pd.merge(consumo_medio_23, df_weather_23, on='MES')

## Big Numbers

Nesta seção, apresentamos os alguns indicadores e métricas do nosso dataset, destacando valores significativos que fornecem uma visão rápida e intuitiva sobre o comportamento dos dados

In [34]:
# Obtém o número de linhas e colunas do DataFrame 'df_23'
linhas, colunas = df_23.shape

print(f"O DataFrame de 2023 tem {linhas} linhas e {colunas} colunas.")

O DataFrame de 2023 tem 4574507 linhas e 38 colunas.


In [35]:
# Extrai os valores únicos da coluna 'MATRICULA' no DataFrame 'df_23'
matriculas_unicas = df_23['MATRICULA'].unique()

# Calcula o número total de valores únicos na coluna 'MATRICULA'
tamanho = len(matriculas_unicas)

print(f"O DataFrame de 2023 tem {tamanho} matrículas únicas")

O DataFrame de 2023 tem 384553 matrículas únicas


In [36]:
# Calcula a soma total dos valores na coluna 'CONS_MEDIDO' no DataFrame 'df_23'
soma_consumo = df_23['CONS_MEDIDO'].sum()

print(f"Em 2023 foi consumido {soma_consumo} m^3")

Em 2023 foi consumido 55921055.0 m^3


## Gráficos

Nesta seção, apresentamos uma série de visualizações que ilustram as principais tendências e padrões encontrados nos dados. Os gráficos fornecem uma maneira intuitiva de entender a distribuição, variação e correlação entre as diferentes variáveis analisadas.


### Consumo Médio Mensal e Temperatura Média

Este gráfico ilustra a relação entre o consumo médio de água e a temperatura média ao longo dos meses. A linha verde tracejada representa o consumo médio mensal, enquanto a linha vermelha sólida mostra a variação da temperatura média mensal.


In [37]:
# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona o consumo médio mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_23['MES'],
    y=df_combined_23['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio',
    line=dict(color='green', dash='dash')
))

# Adiciona a temperatura média mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_23['MES'],
    y=df_combined_23['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [38]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média
correlation_23 = df_combined_23['CONS_MEDIDO'].corr(df_combined_23['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média: {correlation_23:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média: 0.61


In [39]:
# Obtém os valores únicos da coluna 'CATEGORIA' no DataFrame 'df_23'
categorias_unicas = df_23['CATEGORIA'].unique()

categorias_unicas

array(['COMERCIAL', 'RESIDENCIAL', 'PUBLICA', 'INDUSTRIAL'], dtype=object)

Este gráfico apresenta a análise do consumo médio de água na categoria **Pública** em relação à temperatura média ao longo dos meses.

In [40]:
# Filtra os dados para a categoria 'PUBLICA'
consumo_publica_23 = df_23[df_23['CATEGORIA'] == 'PUBLICA']

# Calcula o consumo médio mensal para a categoria 'PUBLICA'
consumo_medio_publica_23 = consumo_publica_23.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_publica_23 = pd.merge(consumo_medio_publica_23, df_weather_23, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'PUBLICA'
fig.add_trace(go.Scatter(
    x=df_combined_publica_23['MES'],
    y=df_combined_publica_23['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Pública)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_publica_23['MES'],
    y=df_combined_publica_23['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Pública - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [41]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Pública'
correlacao_pearson = df_combined_publica_23['CONS_MEDIDO'].corr(df_combined_publica_23['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: {correlacao_pearson:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: 0.28


Este gráfico apresenta a análise do consumo médio de água na categoria **Comercial** em relação à temperatura média ao longo dos meses.

In [42]:
# Filtra os dados para a categoria 'COMERCIAL'
consumo_comercial_23 = df_23[df_23['CATEGORIA'] == 'COMERCIAL']

# Calcula o consumo médio mensal para a categoria 'COMERCIAL'
consumo_medio_comercial_23 = consumo_comercial_23.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_comercial_23 = pd.merge(consumo_medio_comercial_23, df_weather_23, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'COMERCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_comercial_23['MES'],
    y=df_combined_comercial_23['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Comercial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_comercial_23['MES'],
    y=df_combined_comercial_23['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Comercial - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [43]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Comercial'
correlacao_pearson = df_combined_comercial_23['CONS_MEDIDO'].corr(df_combined_comercial_23['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: 0.5208


Este gráfico apresenta a análise do consumo médio de água na categoria **Residencial** em relação à temperatura média ao longo dos meses.

In [44]:
# Filtra os dados para a categoria 'RESIDENCIAL'
consumo_residencial_23 = df_23[df_23['CATEGORIA'] == 'RESIDENCIAL']

# Calcula o consumo médio mensal para a categoria 'RESIDENCIAL'
consumo_medio_residencial_23 = consumo_residencial_23.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_residencial_23 = pd.merge(consumo_medio_residencial_23, df_weather_23, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'RESIDENCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_residencial_23['MES'],
    y=df_combined_residencial_23['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Residencial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_residencial_23['MES'],
    y=df_combined_residencial_23['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Residencial - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [45]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Residencial'
correlacao_pearson = df_combined_residencial_23['CONS_MEDIDO'].corr(df_combined_residencial_23['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: 0.6097


Este gráfico apresenta a análise do consumo médio de água na categoria **Industrial** em relação à temperatura média ao longo dos meses.

In [46]:
# Filtra os dados para a categoria 'INDUSTRIAL'
consumo_industrial_23 = df_23[df_23['CATEGORIA'] == 'INDUSTRIAL']

# Calcula o consumo médio mensal para a categoria 'INDUSTRIAL'
consumo_medio_industrial_23 = consumo_industrial_23.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_industrial_23 = pd.merge(consumo_medio_industrial_23, df_weather_23, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'INDUSTRIAL'
fig.add_trace(go.Scatter(
    x=df_combined_industrial_23['MES'],
    y=df_combined_industrial_23['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Industrial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_industrial_23['MES'],
    y=df_combined_industrial_23['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Industrial - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [47]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Industrial'
correlacao_pearson = df_combined_industrial_23['CONS_MEDIDO'].corr(df_combined_industrial_23['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: 0.5907


### Consumo Médio Mensal por Categoria

Nesta seção, apresentamos uma análise detalhada do consumo médio mensal de água para diferentes categorias: Pública, Comercial, Residencial e Industrial. Ao comparar essas categorias lado a lado, podemos identificar padrões de consumo específicos, sazonalidades e variações que refletem as diferentes necessidades e comportamentos de cada grupo ao longo do ano de 2023.


In [48]:
# Define as categorias a serem analisadas
categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'INDUSTRIAL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada categoria no gráfico
for categoria in categorias:
    consumo_categoria = df_23[df_23['CATEGORIA'] == categoria]
    consumo_medio_categoria = consumo_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da categoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_categoria['MES'],
        y=consumo_medio_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio (Categoria: {categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Categoria - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

### Consumo Médio Mensal por Tipo de Ligação

Nesta seção, exploramos o consumo médio mensal de água segmentado por tipo de ligação: Hidrometrado e Consumo Fixo. Essa análise permite observar como o consumo varia ao longo do ano para cada tipo de ligação.


In [49]:
# Obtém os valores únicos da coluna 'TIPO_LIGACAO' no DataFrame 'df_23'
tipo_ligacao = df_23['TIPO_LIGACAO'].unique()

# Define os tipos de ligação a serem analisados
tipos_ligacao = ['Hidrometrado', 'Consumo Fixo']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada tipo de ligação no gráfico
for tipo in tipos_ligacao:
    consumo_tipo = df_23[df_23['TIPO_LIGACAO'] == tipo]
    consumo_medio_tipo = consumo_tipo.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio do tipo de ligação ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_tipo['MES'],
        y=consumo_medio_tipo['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({tipo})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Tipo de Ligação - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()


### Consumo Médio Mensal por Subcategoria

Nesta seção, analisamos o consumo médio mensal de água segmentado por subcategoria. As subcategorias incluem Pública, Comercial, Residencial, Residencial Social, Industrial e Residencial Indubrasil.


In [50]:
# Obtém os valores únicos da coluna 'SUB_CATEGORIA' no DataFrame 'df_23'
sub_categoria = df_23['SUB_CATEGORIA'].unique()


# Define as subcategorias a serem analisadas
sub_categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'RES. SOCIAL', 'INDUSTRIAL', 'RES. INDUBRASIL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada subcategoria no gráfico
for sub_categoria in sub_categorias:
    consumo_sub_categoria = df_23[df_23['SUB_CATEGORIA'] == sub_categoria]
    consumo_medio_sub_categoria = consumo_sub_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da subcategoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_sub_categoria['MES'],
        y=consumo_medio_sub_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({sub_categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Subcategoria - 2023',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

# Estruturação dos datasets - 2024

Nesta seção, iremos organizar os arquivos, dataset do Consumo 2024 na integra, com todas as colunas disponibilizadas pelo parceiro, e os dados climáticos, que serão utilizados.

**Desta forma, se precisarmos de mais colunas e features, será de fácil recuperação**

Para o código a seguir é importante ressaltar que a Latitude e a Longitude foram retiradas de: [Campo Grande MS](https://pt.db-city.com/Brasil--Mato-Grosso-do-Sul--Campo-Grande)

In [94]:
# Define a localização geográfica
location = Point(-20.4435, -54.6478)

# Define o intervalo de datas
start = datetime(2024, 1, 1)
end = datetime(2024, 12, 31)

# Busca os dados diários de clima para a localização e período definidos
data = Daily(location, start, end)
data = data.fetch()

# Calcula a média mensal dos dados climáticos
df_monthly_weather_24 = data.resample('M').mean()

# Renomeia as colunas do DataFrame para termos mais descritivos em português
df_weather_24 = df_monthly_weather_24.rename(columns={
    'tavg': 'Temperatura Média',
    'tmin': 'Temperatura Mínima',
    'tmax': 'Temperatura Máxima',
    'prcp': 'Precipitação',
    'snow': 'Neve',
    'wdir': 'Direção do Vento',
    'wspd': 'Velocidade do Vento',
    'wpgt': 'Rajada Máxima de Vento',
    'pres': 'Pressão Atmosférica',
    'tsun': 'Insolação'
})

# Exibe o DataFrame renomeado
df_weather_24

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima,Precipitação,Neve,Direção do Vento,Velocidade do Vento,Rajada Máxima de Vento,Pressão Atmosférica,Insolação
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2024-01-31,28.477419,24.283871,33.470968,2.906452,,180.16129,9.63871,,1009.954839,
2024-02-29,28.075862,24.393103,32.803448,4.7,,184.655172,9.1,,1011.451724,
2024-03-31,28.935484,25.429032,33.93871,3.267742,,256.258065,8.822581,,1011.729032,
2024-04-30,27.306667,23.453333,32.456667,3.48,,261.333333,8.47,,1012.41,
2024-05-31,24.0,19.693548,29.225806,0.406452,,269.645161,9.632258,,1015.454839,
2024-06-30,24.523333,19.053333,31.74,0.02,,239.2,9.363333,,1015.576667,
2024-07-31,21.364516,15.822581,28.193548,0.429032,,150.16129,9.125806,,1018.977419,
2024-08-31,24.040741,17.537037,31.555556,1.635,,213.851852,10.366667,,1016.151852,


A seguir iremos remover as colunas que julgamos não serem importantes para entender a mudança do consumo da água.

Aqui fizemos uma descrição estatística básica nas colunas e seus valores

In [95]:
print("\nDescrição estatística básica:")
print(df_24.describe())


Descrição estatística básica:
         Unnamed: 0  EMP_CODIGO                     REFERENCIA     COD_GRUPO  \
count  2.805908e+06   2805908.0                        2805908  2.805894e+06   
mean   1.402954e+06         2.0  2024-04-05 13:31:31.568219392  1.326040e+01   
min    0.000000e+00         2.0            2024-01-01 00:00:00  0.000000e+00   
25%    7.014768e+05         2.0            2024-02-01 00:00:00  8.000000e+00   
50%    1.402954e+06         2.0            2024-04-01 00:00:00  1.300000e+01   
75%    2.104430e+06         2.0            2024-06-01 00:00:00  1.800000e+01   
max    2.805907e+06         2.0            2024-08-01 00:00:00  9.900000e+01   
std    8.099960e+05         0.0                            NaN  7.064224e+00   

       COD_SETOR_COMERCIAL    NUM_QUADRA  COD_ROTA_LEITURA     MATRICULA  \
count         2.805894e+06  2.805894e+06      2.805894e+06  2.805908e+06   
mean          5.345236e+01  2.603010e+02      2.399906e+01  1.765128e+07   
min           1.0000

In [96]:
# Remove as colunas desnecessárias do DataFrame
df_weather_24 = df_weather_24.drop(columns=['Neve', 'Precipitação', 'Direção do Vento', 'Velocidade do Vento', 'Rajada Máxima de Vento', 'Pressão Atmosférica', 'Insolação'])
df_weather_24

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01-31,28.477419,24.283871,33.470968
2024-02-29,28.075862,24.393103,32.803448
2024-03-31,28.935484,25.429032,33.93871
2024-04-30,27.306667,23.453333,32.456667
2024-05-31,24.0,19.693548,29.225806
2024-06-30,24.523333,19.053333,31.74
2024-07-31,21.364516,15.822581,28.193548
2024-08-31,24.040741,17.537037,31.555556


In [97]:
# Converte a coluna 'REFERENCIA' para o tipo datetime, garantindo que as datas sejam reconhecidas corretamente
df_24['REFERENCIA'] = pd.to_datetime(df_24['REFERENCIA'])

# Cria uma nova coluna 'MES' extraindo o número do mês da coluna 'REFERENCIA'
df_24['MES'] = df_24['REFERENCIA'].dt.month

# Extrai o número do mês do índice (assumindo que o índice do DataFrame é uma coluna datetime) e cria uma nova coluna 'MES'
df_weather_24['MES'] = df_weather_24.index.month

# Agrupa os dados por mês e calcula a média do consumo medido ('CONS_MEDIDO') para cada mês
consumo_medio_24 = df_24.groupby('MES')['CONS_MEDIDO'].mean().reset_index()

# Combina os dados de consumo médio com os dados meteorológicos com base na coluna 'MES'
df_combined_24 = pd.merge(consumo_medio_24, df_weather_24, on='MES')

## Big Numbers

Nesta seção, apresentamos os alguns indicadores e métricas do nosso dataset, destacando valores significativos que fornecem uma visão rápida e intuitiva sobre o comportamento dos dados

In [98]:
# Obtém o número de linhas e colunas do DataFrame 'df_24'
linhas, colunas = df_24.shape

print(f"O DataFrame de 2024 tem {linhas} linhas e {colunas} colunas.")

O DataFrame de 2024 tem 2805908 linhas e 38 colunas.


In [99]:
# Extrai os valores únicos da coluna 'MATRICULA' no DataFrame 'df_24'
matriculas_unicas = df_24['MATRICULA'].unique()

# Calcula o número total de valores únicos na coluna 'MATRICULA'
tamanho = len(matriculas_unicas)

print(f"O DataFrame de 2024 tem {tamanho} matrículas únicas")

O DataFrame de 2024 tem 389577 matrículas únicas


In [100]:
# Calcula a soma total dos valores na coluna 'CONS_MEDIDO' no DataFrame 'df_24'
soma_consumo = df_24['CONS_MEDIDO'].sum()

print(f"Em 2024 foi consumido {soma_consumo} m^3")

Em 2024 foi consumido 34136808.0 m^3


## Gráficos

Nesta seção, apresentamos uma série de visualizações que ilustram as principais tendências e padrões encontrados nos dados. Os gráficos fornecem uma maneira intuitiva de entender a distribuição, variação e correlação entre as diferentes variáveis analisadas.


### Consumo Médio Mensal e Temperatura Média

Este gráfico ilustra a relação entre o consumo médio de água e a temperatura média ao longo dos meses. A linha verde tracejada representa o consumo médio mensal, enquanto a linha vermelha sólida mostra a variação da temperatura média mensal.


In [101]:
# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona o consumo médio mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_24['MES'],
    y=df_combined_24['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio',
    line=dict(color='green', dash='dash')
))

# Adiciona a temperatura média mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_24['MES'],
    y=df_combined_24['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [102]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média
correlation_24 = df_combined_24['CONS_MEDIDO'].corr(df_combined_24['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média: {correlation_24:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média: 0.47


In [103]:
# Obtém os valores únicos da coluna 'CATEGORIA' no DataFrame 'df_24'
categorias_unicas = df_24['CATEGORIA'].unique()

categorias_unicas

array(['COMERCIAL', 'RESIDENCIAL', 'PUBLICA', 'INDUSTRIAL'], dtype=object)

Este gráfico apresenta a análise do consumo médio de água na categoria **Pública** em relação à temperatura média ao longo dos meses.

In [104]:
# Filtra os dados para a categoria 'PUBLICA'
consumo_publica_24 = df_24[df_24['CATEGORIA'] == 'PUBLICA']

# Calcula o consumo médio mensal para a categoria 'PUBLICA'
consumo_medio_publica_24 = consumo_publica_24.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_publica_24 = pd.merge(consumo_medio_publica_24, df_weather_24, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'PUBLICA'
fig.add_trace(go.Scatter(
    x=df_combined_publica_24['MES'],
    y=df_combined_publica_24['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Pública)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_publica_24['MES'],
    y=df_combined_publica_24['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Pública - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [105]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Pública'
correlacao_pearson = df_combined_publica_24['CONS_MEDIDO'].corr(df_combined_publica_24['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: {correlacao_pearson:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: 0.34


Este gráfico apresenta a análise do consumo médio de água na categoria **Comercial** em relação à temperatura média ao longo dos meses.

In [106]:
# Filtra os dados para a categoria 'COMERCIAL'
consumo_comercial_24 = df_24[df_24['CATEGORIA'] == 'COMERCIAL']

# Calcula o consumo médio mensal para a categoria 'COMERCIAL'
consumo_medio_comercial_24 = consumo_comercial_24.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_comercial_24 = pd.merge(consumo_medio_comercial_24, df_weather_24, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'COMERCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_comercial_24['MES'],
    y=df_combined_comercial_24['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Comercial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_comercial_24['MES'],
    y=df_combined_comercial_24['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Comercial - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [107]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Comercial'
correlacao_pearson = df_combined_comercial_24['CONS_MEDIDO'].corr(df_combined_comercial_24['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: 0.4241


Este gráfico apresenta a análise do consumo médio de água na categoria **Residencial** em relação à temperatura média ao longo dos meses.

In [108]:
# Filtra os dados para a categoria 'RESIDENCIAL'
consumo_residencial_24 = df_24[df_24['CATEGORIA'] == 'RESIDENCIAL']

# Calcula o consumo médio mensal para a categoria 'RESIDENCIAL'
consumo_medio_residencial_24 = consumo_residencial_24.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_residencial_24 = pd.merge(consumo_medio_residencial_24, df_weather_24, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'RESIDENCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_residencial_24['MES'],
    y=df_combined_residencial_24['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Residencial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_residencial_24['MES'],
    y=df_combined_residencial_24['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Residencial - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [109]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Residencial'
correlacao_pearson = df_combined_residencial_24['CONS_MEDIDO'].corr(df_combined_residencial_24['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: 0.4732


Este gráfico apresenta a análise do consumo médio de água na categoria **Industrial** em relação à temperatura média ao longo dos meses.

In [110]:
# Filtra os dados para a categoria 'INDUSTRIAL'
consumo_industrial_24 = df_24[df_24['CATEGORIA'] == 'INDUSTRIAL']

# Calcula o consumo médio mensal para a categoria 'INDUSTRIAL'
consumo_medio_industrial_24 = consumo_industrial_24.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_industrial_24 = pd.merge(consumo_medio_industrial_24, df_weather_24, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'INDUSTRIAL'
fig.add_trace(go.Scatter(
    x=df_combined_industrial_24['MES'],
    y=df_combined_industrial_24['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Industrial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_industrial_24['MES'],
    y=df_combined_industrial_24['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Industrial - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [111]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Industrial'
correlacao_pearson = df_combined_industrial_24['CONS_MEDIDO'].corr(df_combined_industrial_24['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: 0.4261


### Consumo Médio Mensal por Categoria

Nesta seção, apresentamos uma análise detalhada do consumo médio mensal de água para diferentes categorias: Pública, Comercial, Residencial e Industrial. Ao comparar essas categorias lado a lado, podemos identificar padrões de consumo específicos, sazonalidades e variações que refletem as diferentes necessidades e comportamentos de cada grupo ao longo do ano de 2024.


In [112]:
# Define as categorias a serem analisadas
categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'INDUSTRIAL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada categoria no gráfico
for categoria in categorias:
    consumo_categoria = df_24[df_24['CATEGORIA'] == categoria]
    consumo_medio_categoria = consumo_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da categoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_categoria['MES'],
        y=consumo_medio_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio (Categoria: {categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Categoria - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

### Consumo Médio Mensal por Tipo de Ligação

Nesta seção, exploramos o consumo médio mensal de água segmentado por tipo de ligação: Hidrometrado e Consumo Fixo. Essa análise permite observar como o consumo varia ao longo do ano para cada tipo de ligação.


In [113]:
# Obtém os valores únicos da coluna 'TIPO_LIGACAO' no DataFrame 'df_24'
tipo_ligacao = df_24['TIPO_LIGACAO'].unique()

# Define os tipos de ligação a serem analisados
tipos_ligacao = ['Hidrometrado', 'Consumo Fixo']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada tipo de ligação no gráfico
for tipo in tipos_ligacao:
    consumo_tipo = df_24[df_24['TIPO_LIGACAO'] == tipo]
    consumo_medio_tipo = consumo_tipo.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio do tipo de ligação ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_tipo['MES'],
        y=consumo_medio_tipo['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({tipo})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Tipo de Ligação - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()


### Consumo Médio Mensal por Subcategoria

Nesta seção, analisamos o consumo médio mensal de água segmentado por subcategoria. As subcategorias incluem Pública, Comercial, Residencial, Residencial Social, Industrial e Residencial Indubrasil.


In [114]:
# Obtém os valores únicos da coluna 'SUB_CATEGORIA' no DataFrame 'df_24'
sub_categoria = df_24['SUB_CATEGORIA'].unique()


# Define as subcategorias a serem analisadas
sub_categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'RES. SOCIAL', 'INDUSTRIAL', 'RES. INDUBRASIL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada subcategoria no gráfico
for sub_categoria in sub_categorias:
    consumo_sub_categoria = df_24[df_24['SUB_CATEGORIA'] == sub_categoria]
    consumo_medio_sub_categoria = consumo_sub_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da subcategoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_sub_categoria['MES'],
        y=consumo_medio_sub_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({sub_categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Subcategoria - 2024',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()