# Instalação das bibliotecas utilizadas

Antes de iniciarmos a análise dos dados de Consumo no Google Colab, é essencial garantir que todas as bibliotecas necessárias estejam devidamente instaladas e atualizadas. No ambiente do Colab, embora muitas bibliotecas já venham pré-instaladas, pode ser necessário instalar ou atualizar pacotes adicionais para garantir que o código funcione corretamente, como por exemplo o MeteoStat, biblioteca utilizada para coletar os dados climáticos.

In [2]:
!pip install meteostat



In [3]:
# Importação das bibliotecas

import numpy as np
import pandas as pd
import gdown
import plotly.graph_objects as go
from meteostat import Point, Daily
from datetime import datetime

Código do link de 2021 = 1-RHRuSdeXE3iphP_IsLYKlOFFTuVssf5
<br>
Código do link de 2022 = 1-Uu4Tf4lufJVFeJnYKc5w7OeW66pe1eC



In [3]:
arquivo_destino_base = "dataset_{}.csv"

ids = {
    "consumo_2021": "1-RHRuSdeXE3iphP_IsLYKlOFFTuVssf5",
    "consumo_2022": "1-Uu4Tf4lufJVFeJnYKc5w7OeW66pe1eC",
}

dataframes = {}

for key, file_id in ids.items():
    url = f"https://drive.google.com/uc?id={file_id}"
    arquivo_destino = arquivo_destino_base.format(key)

    gdown.download(url, arquivo_destino, quiet=False)
    df = pd.read_csv(arquivo_destino, sep=";")
    dataframes[key] = df


Downloading...
From (original): https://drive.google.com/uc?id=1-RHRuSdeXE3iphP_IsLYKlOFFTuVssf5
From (redirected): https://drive.google.com/uc?id=1-RHRuSdeXE3iphP_IsLYKlOFFTuVssf5&confirm=t&uuid=f894cdef-3f79-44e5-94f8-2f5dface1a7f
To: /content/dataset_consumo_2021.csv
100%|██████████| 1.06G/1.06G [00:16<00:00, 64.8MB/s]
Downloading...
From (original): https://drive.google.com/uc?id=1-Uu4Tf4lufJVFeJnYKc5w7OeW66pe1eC
From (redirected): https://drive.google.com/uc?id=1-Uu4Tf4lufJVFeJnYKc5w7OeW66pe1eC&confirm=t&uuid=43baad8f-6002-4951-aa55-1cddf4a98893
To: /content/dataset_consumo_2022.csv
100%|██████████| 1.07G/1.07G [00:07<00:00, 135MB/s]


In [13]:
df_21 = pd.read_csv("/content/dataset_consumo_2021.csv", delimiter=";")
df_22 = pd.read_csv("/content/dataset_consumo_2022.csv", delimiter=";")



# Estruturação dos datasets - 2021

Nesta seção, iremos organizar os arquivos, dataset do Consumo 2021 na integra, com todas as colunas disponibilizadas pelo parceiro, e os dados climáticos, que serão utilizados.

**Desta forma, se precisarmos de mais colunas e features, será de fácil recuperação**

Para o código a seguir é importante ressaltar que a Latitude e a Longitude foram retiradas de: [Campo Grande MS](https://pt.db-city.com/Brasil--Mato-Grosso-do-Sul--Campo-Grande)

In [4]:
# Define a localização geográfica
location = Point(-20.4435, -54.6478)

# Define o intervalo de datas
start = datetime(2021, 1, 1)
end = datetime(2021, 12, 31)

# Busca os dados diários de clima para a localização e período definidos
data = Daily(location, start, end)
data = data.fetch()

# Calcula a média mensal dos dados climáticos
df_monthly_weather_21 = data.resample('M').mean()

# Renomeia as colunas do DataFrame para termos mais descritivos em português
df_weather_21 = df_monthly_weather_21.rename(columns={
    'tavg': 'Temperatura Média',
    'tmin': 'Temperatura Mínima',
    'tmax': 'Temperatura Máxima',
    'prcp': 'Precipitação',
    'snow': 'Neve',
    'wdir': 'Direção do Vento',
    'wspd': 'Velocidade do Vento',
    'wpgt': 'Rajada Máxima de Vento',
    'pres': 'Pressão Atmosférica',
    'tsun': 'Insolação'
})

# Exibe o DataFrame renomeado
df_weather_21

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima,Precipitação,Neve,Direção do Vento,Velocidade do Vento,Rajada Máxima de Vento,Pressão Atmosférica,Insolação
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2021-01-31,24.406452,21.258065,29.1,6.956667,,48.354839,3.822581,,1010.735484,
2021-02-28,24.707143,19.9,30.382143,4.228571,,59.928571,2.978571,,1010.328571,
2021-03-31,24.858065,20.506452,30.848387,2.477419,,37.290323,2.012903,,1011.512903,
2021-04-30,24.183333,19.75,30.25,0.506667,,69.866667,3.34,,1013.426667,
2021-05-31,22.5,17.783871,28.619355,1.019355,,60.870968,2.390323,,1015.551613,
2021-06-30,20.096667,15.54,25.856667,1.38,,66.6,3.626667,,1017.186667,
2021-07-31,20.070968,14.193548,27.096774,0.325806,,74.741935,4.358065,,1018.66129,
2021-08-31,23.977419,18.119355,30.967742,0.635484,,76.322581,4.906452,,1015.506452,
2021-09-30,27.496667,21.536667,34.253333,0.313333,,56.1,3.44,,1011.83,
2021-10-31,25.312903,20.803226,30.651613,4.241935,,61.419355,5.680645,,1011.180645,


A seguir iremos remover as colunas que julgamos não serem importantes para entender a mudança do consumo da água.

Aqui fizemos uma descrição estatística básica nas colunas e seus valores

In [14]:
print("\nDescrição estatística básica:")
print(df_21.describe())


Descrição estatística básica:
         Unnamed: 0  EMP_CODIGO     COD_GRUPO  COD_SETOR_COMERCIAL  \
count  4.393626e+06   4393626.0  4.393566e+06         4.393566e+06   
mean   2.196812e+06         2.0  1.348282e+01         5.333542e+01   
std    1.268331e+06         0.0  7.061037e+00         2.897872e+01   
min    0.000000e+00         2.0  1.000000e+00         1.000000e+00   
25%    1.098406e+06         2.0  8.000000e+00         2.900000e+01   
50%    2.196812e+06         2.0  1.300000e+01         5.500000e+01   
75%    3.295219e+06         2.0  1.800000e+01         7.900000e+01   
max    4.393625e+06         2.0  9.900000e+01         9.900000e+01   

         NUM_QUADRA  COD_ROTA_LEITURA     MATRICULA  SEQ_RESPONSAVEL  \
count  4.393566e+06      4.393566e+06  4.393626e+06     4.393626e+06   
mean   2.606107e+02      2.382738e+01  1.763482e+07     6.211370e+05   
std    2.055649e+02      1.405711e+01  2.879849e+05     3.484745e+05   
min    1.000000e+00      0.000000e+00  1.700000e+0

In [37]:
# Remove as colunas desnecessárias do DataFrame
df_weather_21 = df_weather_21.drop(columns=['Neve', 'Precipitação', 'Direção do Vento', 'Velocidade do Vento', 'Rajada Máxima de Vento', 'Pressão Atmosférica', 'Insolação'])
df_weather_21

KeyError: "['Neve', 'Precipitação', 'Direção do Vento', 'Velocidade do Vento', 'Rajada Máxima de Vento', 'Pressão Atmosférica', 'Insolação'] not found in axis"

In [38]:
# Converte a coluna 'REFERENCIA' para o tipo datetime, garantindo que as datas sejam reconhecidas corretamente
df_21['REFERENCIA'] = pd.to_datetime(df_21['REFERENCIA'])

# Cria uma nova coluna 'MES' extraindo o número do mês da coluna 'REFERENCIA'
df_21['MES'] = df_21['REFERENCIA'].dt.month

# Extrai o número do mês do índice (assumindo que o índice do DataFrame é uma coluna datetime) e cria uma nova coluna 'MES'
df_weather_21['MES'] = df_weather_21.index.month

# Agrupa os dados por mês e calcula a média do consumo medido ('CONS_MEDIDO') para cada mês
consumo_medio_21 = df_21.groupby('MES')['CONS_MEDIDO'].mean().reset_index()

# Combina os dados de consumo médio com os dados meteorológicos com base na coluna 'MES'
df_combined_21 = pd.merge(consumo_medio_21, df_weather_21, on='MES')

## Big Numbers

Nesta seção, apresentamos os alguns indicadores e métricas do nosso dataset, destacando valores significativos que fornecem uma visão rápida e intuitiva sobre o comportamento dos dados

In [39]:
# Obtém o número de linhas e colunas do DataFrame 'df_21'
linhas, colunas = df_21.shape

print(f"O DataFrame de 2021 tem {linhas} linhas e {colunas} colunas.")

O DataFrame de 2021 tem 4393626 linhas e 38 colunas.


In [40]:
# Extrai os valores únicos da coluna 'MATRICULA' no DataFrame 'df_21'
matriculas_unicas = df_21['MATRICULA'].unique()

# Calcula o número total de valores únicos na coluna 'MATRICULA'
tamanho = len(matriculas_unicas)

print(f"O DataFrame de 2021 tem {tamanho} matrículas únicas")

O DataFrame de 2021 tem 370881 matrículas únicas


In [41]:
# Calcula a soma total dos valores na coluna 'CONS_MEDIDO' no DataFrame 'df_21'
soma_consumo = df_21['CONS_MEDIDO'].sum()

print(f"Em 2021 foi consumido {soma_consumo} m^3")

Em 2021 foi consumido 53932473.0 m^3


## Gráficos

Nesta seção, apresentamos uma série de visualizações que ilustram as principais tendências e padrões encontrados nos dados. Os gráficos fornecem uma maneira intuitiva de entender a distribuição, variação e correlação entre as diferentes variáveis analisadas.


### Consumo Médio Mensal e Temperatura Média

Este gráfico ilustra a relação entre o consumo médio de água e a temperatura média ao longo dos meses de 2021. A linha verde tracejada representa o consumo médio mensal, enquanto a linha vermelha sólida mostra a variação da temperatura média mensal.


In [43]:
# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona o consumo médio mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_21['MES'],
    y=df_combined_21['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio',
    line=dict(color='green', dash='dash')
))

# Adiciona a temperatura média mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_21['MES'],
    y=df_combined_21['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [44]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média
correlation_21 = df_combined_21['CONS_MEDIDO'].corr(df_combined_21['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média: {correlation_21:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média: 0.34


In [45]:
# Obtém os valores únicos da coluna 'CATEGORIA' no DataFrame 'df_21'
categorias_unicas = df_21['CATEGORIA'].unique()

categorias_unicas

array(['RESIDENCIAL', 'COMERCIAL', 'PUBLICA', 'INDUSTRIAL'], dtype=object)

Este gráfico apresenta a análise do consumo médio de água na categoria **Pública** em relação à temperatura média ao longo dos meses de 2021.

In [46]:
# Filtra os dados para a categoria 'PUBLICA'
consumo_publica_21 = df_21[df_21['CATEGORIA'] == 'PUBLICA']

# Calcula o consumo médio mensal para a categoria 'PUBLICA'
consumo_medio_publica_21 = consumo_publica_21.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_publica_21 = pd.merge(consumo_medio_publica_21, df_weather_21, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'PUBLICA'
fig.add_trace(go.Scatter(
    x=df_combined_publica_21['MES'],
    y=df_combined_publica_21['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Pública)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_publica_21['MES'],
    y=df_combined_publica_21['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Pública - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [47]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Pública'
correlacao_pearson = df_combined_publica_21['CONS_MEDIDO'].corr(df_combined_publica_21['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: {correlacao_pearson:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: -0.40


Este gráfico apresenta a análise do consumo médio de água na categoria **Comercial** em relação à temperatura média ao longo dos meses de 2021.

In [48]:
# Filtra os dados para a categoria 'COMERCIAL'
consumo_comercial_21 = df_21[df_21['CATEGORIA'] == 'COMERCIAL']

# Calcula o consumo médio mensal para a categoria 'COMERCIAL'
consumo_medio_comercial_21 = consumo_comercial_21.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_comercial_21 = pd.merge(consumo_medio_comercial_21, df_weather_21, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'COMERCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_comercial_21['MES'],
    y=df_combined_comercial_21['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Comercial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_comercial_21['MES'],
    y=df_combined_comercial_21['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Comercial - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [49]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Comercial'
correlacao_pearson = df_combined_comercial_21['CONS_MEDIDO'].corr(df_combined_comercial_21['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: 0.4813


Este gráfico apresenta a análise do consumo médio de água na categoria **Residencial** em relação à temperatura média ao longo dos meses de 2021.

In [50]:
# Filtra os dados para a categoria 'RESIDENCIAL'
consumo_residencial_21 = df_21[df_21['CATEGORIA'] == 'RESIDENCIAL']

# Calcula o consumo médio mensal para a categoria 'RESIDENCIAL'
consumo_medio_residencial_21 = consumo_residencial_21.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_residencial_21 = pd.merge(consumo_medio_residencial_21, df_weather_21, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'RESIDENCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_residencial_21['MES'],
    y=df_combined_residencial_21['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Residencial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_residencial_21['MES'],
    y=df_combined_residencial_21['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Residencial - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [51]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Residencial'
correlacao_pearson = df_combined_residencial_21['CONS_MEDIDO'].corr(df_combined_residencial_21['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: 0.4041


Este gráfico apresenta a análise do consumo médio de água na categoria **Industrial** em relação à temperatura média ao longo dos meses de 2021.

In [52]:
# Filtra os dados para a categoria 'INDUSTRIAL'
consumo_industrial_21 = df_21[df_21['CATEGORIA'] == 'INDUSTRIAL']

# Calcula o consumo médio mensal para a categoria 'INDUSTRIAL'
consumo_medio_industrial_21 = consumo_industrial_21.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_industrial_21 = pd.merge(consumo_medio_industrial_21, df_weather_21, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'INDUSTRIAL'
fig.add_trace(go.Scatter(
    x=df_combined_industrial_21['MES'],
    y=df_combined_industrial_21['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Industrial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_industrial_21['MES'],
    y=df_combined_industrial_21['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Industrial - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [53]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Industrial'
correlacao_pearson = df_combined_industrial_21['CONS_MEDIDO'].corr(df_combined_industrial_21['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: 0.0292


### Consumo Médio Mensal por Categoria

Nesta seção, apresentamos uma análise detalhada do consumo médio mensal de água para diferentes categorias: Pública, Comercial, Residencial e Industrial. Ao comparar essas categorias lado a lado, podemos identificar padrões de consumo específicos, sazonalidades e variações que refletem as diferentes necessidades e comportamentos de cada grupo ao longo do ano de 2021.


In [54]:
# Define as categorias a serem analisadas
categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'INDUSTRIAL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada categoria no gráfico
for categoria in categorias:
    consumo_categoria = df_21[df_21['CATEGORIA'] == categoria]
    consumo_medio_categoria = consumo_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da categoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_categoria['MES'],
        y=consumo_medio_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio (Categoria: {categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Categoria - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

### Consumo Médio Mensal por Tipo de Ligação

Nesta seção, exploramos o consumo médio mensal de água segmentado por tipo de ligação: Hidrometrado e Consumo Fixo. Essa análise permite observar como o consumo varia ao longo do ano para cada tipo de ligação.


In [55]:
# Obtém os valores únicos da coluna 'TIPO_LIGACAO' no DataFrame 'df_21'
tipo_ligacao = df_21['TIPO_LIGACAO'].unique()

# Define os tipos de ligação a serem analisados
tipos_ligacao = ['Hidrometrado', 'Consumo Fixo']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada tipo de ligação no gráfico
for tipo in tipos_ligacao:
    consumo_tipo = df_21[df_21['TIPO_LIGACAO'] == tipo]
    consumo_medio_tipo = consumo_tipo.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio do tipo de ligação ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_tipo['MES'],
        y=consumo_medio_tipo['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({tipo})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Tipo de Ligação - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()


### Consumo Médio Mensal por Subcategoria

Nesta seção, analisamos o consumo médio mensal de água segmentado por subcategoria. As subcategorias incluem Pública, Comercial, Residencial, Residencial Social, Industrial e Residencial Indubrasil.


In [56]:
# Obtém os valores únicos da coluna 'SUB_CATEGORIA' no DataFrame 'df_21'
sub_categoria = df_21['SUB_CATEGORIA'].unique()


# Define as subcategorias a serem analisadas
sub_categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'RES. SOCIAL', 'INDUSTRIAL', 'RES. INDUBRASIL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada subcategoria no gráfico
for sub_categoria in sub_categorias:
    consumo_sub_categoria = df_21[df_21['SUB_CATEGORIA'] == sub_categoria]
    consumo_medio_sub_categoria = consumo_sub_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da subcategoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_sub_categoria['MES'],
        y=consumo_medio_sub_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({sub_categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Subcategoria - 2021',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

# Estruturação dos datasets - 2022

Nesta seção, iremos organizar os arquivos, dataset do Consumo 2022 na integra, com todas as colunas disponibilizadas pelo parceiro, e os dados climáticos, que serão utilizados.

**Desta forma, se precisarmos de mais colunas e features, será de fácil recuperação**

Para o código a seguir é importante ressaltar que a Latitude e a Longitude foram retiradas de: [Campo Grande MS](https://pt.db-city.com/Brasil--Mato-Grosso-do-Sul--Campo-Grande)

In [57]:
# Define a localização geográfica
location = Point(-20.4435, -54.6478)

# Define o intervalo de datas
start = datetime(2022, 1, 1)
end = datetime(2022, 12, 31)

# Busca os dados diários de clima para a localização e período definidos
data = Daily(location, start, end)
data = data.fetch()

# Calcula a média mensal dos dados climáticos
df_monthly_weather_22 = data.resample('M').mean()

# Renomeia as colunas do DataFrame para termos mais descritivos em português
df_weather_22 = df_monthly_weather_22.rename(columns={
    'tavg': 'Temperatura Média',
    'tmin': 'Temperatura Mínima',
    'tmax': 'Temperatura Máxima',
    'prcp': 'Precipitação',
    'snow': 'Neve',
    'wdir': 'Direção do Vento',
    'wspd': 'Velocidade do Vento',
    'wpgt': 'Rajada Máxima de Vento',
    'pres': 'Pressão Atmosférica',
    'tsun': 'Insolação'
})

# Exibe o DataFrame renomeado
df_weather_22

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima,Precipitação,Neve,Direção do Vento,Velocidade do Vento,Rajada Máxima de Vento,Pressão Atmosférica,Insolação
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2022-01-31,27.229032,23.332258,32.103226,4.332258,,313.096774,10.1,,1009.667742,
2022-02-28,27.939286,23.692857,33.107143,2.628571,,288.464286,9.239286,,1010.625,
2022-03-31,27.116129,23.287097,31.951613,4.609677,,276.516129,8.751613,,1011.9,
2022-04-30,25.73,20.703333,31.763333,2.536667,,251.766667,8.336667,,1013.306667,
2022-05-31,21.525806,16.33871,27.370968,1.293103,,221.774194,8.119355,,1016.96129,
2022-06-30,21.18,16.01,27.45,1.733333,,108.933333,7.426667,,1016.686667,
2022-07-31,24.154839,17.36129,31.890323,0.358065,,114.354839,9.335484,,1015.574194,
2022-08-31,22.622581,16.109677,29.606452,4.364516,,150.354839,10.077419,,1016.564516,
2022-09-30,24.48,19.076667,30.346667,4.046667,,191.733333,10.55,,1014.16,
2022-10-31,26.032258,20.541935,31.351613,2.751613,,219.258065,10.096774,,1012.325806,


A seguir iremos remover as colunas que julgamos não serem importantes para entender a mudança do consumo da água.

Aqui fizemos uma descrição estatística básica nas colunas e seus valores

In [60]:
print("\nDescrição estatística básica:")
print(df_22.describe())


Descrição estatística básica:
         Unnamed: 0  EMP_CODIGO     COD_GRUPO  COD_SETOR_COMERCIAL  \
count  4.492148e+06   4492148.0  4.492088e+06         4.492088e+06   
mean   2.246074e+06         2.0  1.349882e+01         5.351475e+01   
std    1.296772e+06         0.0  7.056912e+00         2.892488e+01   
min    0.000000e+00         2.0  0.000000e+00         1.000000e+00   
25%    1.123037e+06         2.0  8.000000e+00         2.900000e+01   
50%    2.246074e+06         2.0  1.300000e+01         5.600000e+01   
75%    3.369110e+06         2.0  1.800000e+01         7.900000e+01   
max    4.492147e+06         2.0  9.900000e+01         9.900000e+01   

         NUM_QUADRA  COD_ROTA_LEITURA     MATRICULA  SEQ_RESPONSAVEL  \
count  4.492088e+06      4.492088e+06  4.492148e+06     4.492148e+06   
mean   2.606829e+02      2.385028e+01  1.764261e+07     6.700022e+05   
std    2.057257e+02      1.406538e+01  2.891875e+05     3.757550e+05   
min    1.000000e+00      0.000000e+00  1.700000e+0

In [61]:
# Remove as colunas desnecessárias do DataFrame
df_weather_22 = df_weather_22.drop(columns=['Neve', 'Precipitação', 'Direção do Vento', 'Velocidade do Vento', 'Rajada Máxima de Vento', 'Pressão Atmosférica', 'Insolação'])
df_weather_22

Unnamed: 0_level_0,Temperatura Média,Temperatura Mínima,Temperatura Máxima
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2022-01-31,27.229032,23.332258,32.103226
2022-02-28,27.939286,23.692857,33.107143
2022-03-31,27.116129,23.287097,31.951613
2022-04-30,25.73,20.703333,31.763333
2022-05-31,21.525806,16.33871,27.370968
2022-06-30,21.18,16.01,27.45
2022-07-31,24.154839,17.36129,31.890323
2022-08-31,22.622581,16.109677,29.606452
2022-09-30,24.48,19.076667,30.346667
2022-10-31,26.032258,20.541935,31.351613


In [62]:
# Converte a coluna 'REFERENCIA' para o tipo datetime, garantindo que as datas sejam reconhecidas corretamente
df_22['REFERENCIA'] = pd.to_datetime(df_22['REFERENCIA'])

# Cria uma nova coluna 'MES' extraindo o número do mês da coluna 'REFERENCIA'
df_22['MES'] = df_22['REFERENCIA'].dt.month

# Extrai o número do mês do índice (assumindo que o índice do DataFrame é uma coluna datetime) e cria uma nova coluna 'MES'
df_weather_22['MES'] = df_weather_22.index.month

# Agrupa os dados por mês e calcula a média do consumo medido ('CONS_MEDIDO') para cada mês
consumo_medio_22 = df_22.groupby('MES')['CONS_MEDIDO'].mean().reset_index()

# Combina os dados de consumo médio com os dados meteorológicos com base na coluna 'MES'
df_combined_22 = pd.merge(consumo_medio_22, df_weather_22, on='MES')

## Big Numbers

Nesta seção, apresentamos os alguns indicadores e métricas do nosso dataset, destacando valores significativos que fornecem uma visão rápida e intuitiva sobre o comportamento dos dados

In [80]:
# Obtém o número de linhas e colunas do DataFrame 'df_22'
linhas, colunas = df_22.shape

print(f"O DataFrame de 2022 tem {linhas} linhas e {colunas} colunas.")

O DataFrame de 2022 tem 4492148 linhas e 38 colunas.


In [81]:
# Extrai os valores únicos da coluna 'MATRICULA' no DataFrame 'df_22'
matriculas_unicas = df_22['MATRICULA'].unique()

# Calcula o número total de valores únicos na coluna 'MATRICULA'
tamanho = len(matriculas_unicas)

print(f"O DataFrame de 2022 tem {tamanho} matrículas únicas")

O DataFrame de 2022 tem 377724 matrículas únicas


In [82]:
# Calcula a soma total dos valores na coluna 'CONS_MEDIDO' no DataFrame 'df_22'
soma_consumo = df_22['CONS_MEDIDO'].sum()

print(f"Em 2022 foi consumido {soma_consumo} m^3")

Em 2022 foi consumido 53169734.0 m^3


## Gráficos

Nesta seção, apresentamos uma série de visualizações que ilustram as principais tendências e padrões encontrados nos dados. Os gráficos fornecem uma maneira intuitiva de entender a distribuição, variação e correlação entre as diferentes variáveis analisadas.


### Consumo Médio Mensal e Temperatura Média

Este gráfico ilustra a relação entre o consumo médio de água e a temperatura média ao longo dos meses de 2022. A linha verde tracejada representa o consumo médio mensal, enquanto a linha vermelha sólida mostra a variação da temperatura média mensal.


In [83]:
# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona o consumo médio mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_22['MES'],
    y=df_combined_22['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio',
    line=dict(color='green', dash='dash')
))

# Adiciona a temperatura média mensal ao gráfico
fig.add_trace(go.Scatter(
    x=df_combined_22['MES'],
    y=df_combined_22['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [84]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média
correlation_22 = df_combined_22['CONS_MEDIDO'].corr(df_combined_22['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média: {correlation_22:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média: 0.60


In [85]:
# Obtém os valores únicos da coluna 'CATEGORIA' no DataFrame 'df_22'
categorias_unicas = df_22['CATEGORIA'].unique()

categorias_unicas

array(['COMERCIAL', 'RESIDENCIAL', 'PUBLICA', 'INDUSTRIAL'], dtype=object)

Este gráfico apresenta a análise do consumo médio de água na categoria **Pública** em relação à temperatura média ao longo dos meses.

In [86]:
# Filtra os dados para a categoria 'PUBLICA'
consumo_publica_22 = df_22[df_22['CATEGORIA'] == 'PUBLICA']

# Calcula o consumo médio mensal para a categoria 'PUBLICA'
consumo_medio_publica_22 = consumo_publica_22.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_publica_22 = pd.merge(consumo_medio_publica_22, df_weather_22, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'PUBLICA'
fig.add_trace(go.Scatter(
    x=df_combined_publica_22['MES'],
    y=df_combined_publica_22['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Pública)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_publica_22['MES'],
    y=df_combined_publica_22['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Pública - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [87]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Pública'
correlacao_pearson = df_combined_publica_22['CONS_MEDIDO'].corr(df_combined_publica_22['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: {correlacao_pearson:.2f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Pública: -0.54


Este gráfico apresenta a análise do consumo médio de água na categoria **Comercial** em relação à temperatura média ao longo dos meses.

In [88]:
# Filtra os dados para a categoria 'COMERCIAL'
consumo_comercial_22 = df_22[df_22['CATEGORIA'] == 'COMERCIAL']

# Calcula o consumo médio mensal para a categoria 'COMERCIAL'
consumo_medio_comercial_22 = consumo_comercial_22.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_comercial_22 = pd.merge(consumo_medio_comercial_22, df_weather_22, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'COMERCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_comercial_22['MES'],
    y=df_combined_comercial_22['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Comercial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_comercial_22['MES'],
    y=df_combined_comercial_22['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Comercial - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [89]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Comercial'
correlacao_pearson = df_combined_comercial_22['CONS_MEDIDO'].corr(df_combined_comercial_22['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Comercial: 0.4465


Este gráfico apresenta a análise do consumo médio de água na categoria **Residencial** em relação à temperatura média ao longo dos meses.

In [90]:
# Filtra os dados para a categoria 'RESIDENCIAL'
consumo_residencial_22 = df_22[df_22['CATEGORIA'] == 'RESIDENCIAL']

# Calcula o consumo médio mensal para a categoria 'RESIDENCIAL'
consumo_medio_residencial_22 = consumo_residencial_22.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_residencial_22 = pd.merge(consumo_medio_residencial_22, df_weather_22, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'RESIDENCIAL'
fig.add_trace(go.Scatter(
    x=df_combined_residencial_22['MES'],
    y=df_combined_residencial_22['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Residencial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_residencial_22['MES'],
    y=df_combined_residencial_22['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Residencial - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [91]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Residencial'
correlacao_pearson = df_combined_residencial_22['CONS_MEDIDO'].corr(df_combined_residencial_22['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Residencial: 0.6418


Este gráfico apresenta a análise do consumo médio de água na categoria **Industrial** em relação à temperatura média ao longo dos meses.

In [92]:
# Filtra os dados para a categoria 'INDUSTRIAL'
consumo_industrial_22 = df_22[df_22['CATEGORIA'] == 'INDUSTRIAL']

# Calcula o consumo médio mensal para a categoria 'INDUSTRIAL'
consumo_medio_industrial_22 = consumo_industrial_22.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

# Combina o consumo médio mensal com os dados de temperatura média com base no mês
df_combined_industrial_22 = pd.merge(consumo_medio_industrial_22, df_weather_22, on='MES')

# Cria uma figura para o gráfico
fig = go.Figure()

# Adiciona a linha do consumo médio para a categoria 'INDUSTRIAL'
fig.add_trace(go.Scatter(
    x=df_combined_industrial_22['MES'],
    y=df_combined_industrial_22['CONS_MEDIDO'],
    mode='lines+markers',
    name='Consumo Médio (Categoria: Industrial)',
    line=dict(color='green', dash='dash')
))

# Adiciona a linha da temperatura média
fig.add_trace(go.Scatter(
    x=df_combined_industrial_22['MES'],
    y=df_combined_industrial_22['Temperatura Média'],
    mode='lines+markers',
    name='Temp. Média',
    line=dict(color='red'),
    yaxis='y2'
))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal e Temperatura Média para Categoria Industrial - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    yaxis2=dict(
        title='Temperatura (°C)',
        overlaying='y',
        side='right'
    ),
    legend=dict(
        x=0.5,
        y=-0.2,
        orientation="h",
        xanchor="center"
    ),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

In [93]:
# Calcula a correlação de Pearson entre o consumo médio e a temperatura média para a categoria 'Industrial'
correlacao_pearson = df_combined_industrial_22['CONS_MEDIDO'].corr(df_combined_industrial_22['Temperatura Média'])

print(f"Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: {correlacao_pearson:.4f}")

Correlação de Pearson entre Consumo Médio e Temperatura Média para a Categoria Industrial: 0.0793


### Consumo Médio Mensal por Categoria

Nesta seção, apresentamos uma análise detalhada do consumo médio mensal de água para diferentes categorias: Pública, Comercial, Residencial e Industrial. Ao comparar essas categorias lado a lado, podemos identificar padrões de consumo específicos, sazonalidades e variações que refletem as diferentes necessidades e comportamentos de cada grupo ao longo do ano de 2021.


In [94]:
# Define as categorias a serem analisadas
categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'INDUSTRIAL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada categoria no gráfico
for categoria in categorias:
    consumo_categoria = df_22[df_22['CATEGORIA'] == categoria]
    consumo_medio_categoria = consumo_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da categoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_categoria['MES'],
        y=consumo_medio_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio (Categoria: {categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Categoria - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()

### Consumo Médio Mensal por Tipo de Ligação

Nesta seção, exploramos o consumo médio mensal de água segmentado por tipo de ligação: Hidrometrado e Consumo Fixo. Essa análise permite observar como o consumo varia ao longo do ano para cada tipo de ligação.


In [95]:
# Obtém os valores únicos da coluna 'TIPO_LIGACAO' no DataFrame 'df_22'
tipo_ligacao = df_22['TIPO_LIGACAO'].unique()

# Define os tipos de ligação a serem analisados
tipos_ligacao = ['Hidrometrado', 'Consumo Fixo']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada tipo de ligação no gráfico
for tipo in tipos_ligacao:
    consumo_tipo = df_22[df_22['TIPO_LIGACAO'] == tipo]
    consumo_medio_tipo = consumo_tipo.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio do tipo de ligação ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_tipo['MES'],
        y=consumo_medio_tipo['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({tipo})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Tipo de Ligação - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()


### Consumo Médio Mensal por Subcategoria

Nesta seção, analisamos o consumo médio mensal de água segmentado por subcategoria. As subcategorias incluem Pública, Comercial, Residencial, Residencial Social, Industrial e Residencial Indubrasil.


In [97]:
# Obtém os valores únicos da coluna 'SUB_CATEGORIA' no DataFrame 'df_22'
sub_categoria = df_22['SUB_CATEGORIA'].unique()


# Define as subcategorias a serem analisadas
sub_categorias = ['PUBLICA', 'COMERCIAL', 'RESIDENCIAL', 'RES. SOCIAL', 'INDUSTRIAL', 'RES. INDUBRASIL']

# Cria uma figura para o gráfico
fig = go.Figure()

# Loop para adicionar uma linha para cada subcategoria no gráfico
for sub_categoria in sub_categorias:
    consumo_sub_categoria = df_22[df_22['SUB_CATEGORIA'] == sub_categoria]
    consumo_medio_sub_categoria = consumo_sub_categoria.groupby('MES').agg({'CONS_MEDIDO': 'mean'}).reset_index()

    # Adiciona a linha do consumo médio da subcategoria ao gráfico
    fig.add_trace(go.Scatter(
        x=consumo_medio_sub_categoria['MES'],
        y=consumo_medio_sub_categoria['CONS_MEDIDO'],
        mode='lines+markers',
        name=f'Consumo Médio ({sub_categoria})'
    ))

# Configura o layout do gráfico
fig.update_layout(
    title='Consumo Médio Mensal por Subcategoria - 2022',
    xaxis=dict(title='Mês', tickmode='array', tickvals=list(range(1, 13))),
    yaxis=dict(title='Consumo Médio'),
    legend=dict(
        x=1,
        y=1,
        orientation="v",
        font=dict(size=10),
    ),
    margin=dict(l=40, r=40, t=40, b=40),
    width=800,
    height=500
)

# Exibe o gráfico
fig.show()