# Importando as bibliotecas

In [100]:
import pandas as pd
import plotly.express as px

# Lendo e atribuindo a base de dados para um DataFrame

In [101]:
path = './BaseDados/relatorio.csv'

In [102]:
dfRelatorio = pd.read_csv(path, sep=';')


# Pré-visualização dos tipos de dados do DataFrame

In [103]:
dfRelatorio.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 174108 entries, 0 to 174107
Data columns (total 13 columns):
 #   Column                  Non-Null Count   Dtype 
---  ------                  --------------   ----- 
 0   CNPJ                    174108 non-null  object
 1   Razão Social            174108 non-null  object
 2   Estado                  174108 non-null  object
 3   Município               174108 non-null  object
 4   Código da Categoria     174108 non-null  int64 
 5   Categoria de Atividade  174108 non-null  object
 6   Código do Detalhe       174108 non-null  int64 
 7   Detalhe                 174108 non-null  object
 8   Ano                     174108 non-null  int64 
 9   Poluente emitido        174108 non-null  object
 10  Quantidade              174108 non-null  object
 11  Metodologia utilizada   174000 non-null  object
 12  Situação Cadastral      174108 non-null  object
dtypes: int64(3), object(10)
memory usage: 17.3+ MB


# Tratamento de Valores Nulos e da coluna Quantidade

In [104]:
dfRelatorio['Quantidade'] = pd.to_numeric(dfRelatorio['Quantidade'].str.replace(',', ''), downcast='float')
dfRelatorio = dfRelatorio.dropna()


# Definição dos municípios que vão ser analisados

In [109]:

cidades = ['SANTOS', 'SAO VICENTE', 'GUARUJA','PRAIA GRANDE', 'CUBATAO']
df_bs = dfRelatorio[dfRelatorio.Município.isin(cidades)]

In [112]:
df_bs.groupby(['Ano']).sum()['Quantidade']

Ano
2013    1215389.99
2014     745447.67
2015      32802.20
2016     473551.27
2017      21917.25
2018      20658.00
2019      21256.44
2020      21803.44
2021      20754.95
2022      22734.63
2023       3957.75
Name: Quantidade, dtype: float64

In [113]:
df_bs.groupby(['Categoria de Atividade']).sum()['Quantidade'].sort_values(ascending=False)


Categoria de Atividade
Serviços de Utilidade                                             1464532.48
Transporte, Terminais, Depósitos e Comércio                        744691.17
Indústria Química                                                  261783.77
Extração e Tratamento de Minerais                                   80293.36
Indústria Metalúrgica                                               33591.72
Indústria de Produtos Minerais Não Metálicos                        14850.96
Indústrias Diversas                                                   266.38
Indústria de Produtos Alimentares e Bebidas                           151.95
Indústria Mecânica                                                    102.84
Atividades não relacionadas no Anexo VIII da Lei nº 6.938/1981          8.96
Indústria de Material de Transporte                                     0.00
Name: Quantidade, dtype: float64

# Criando o DataFrame que vai ser utilizado para plotar o gráfico

In [105]:
result_df = pd.DataFrame({'Soma': df_bs.groupby(['Município', 'Poluente emitido'])['Quantidade'].sum()})

result_df.sort_values(by=['Município', 'Soma'], ascending=[True, False])

Unnamed: 0_level_0,Unnamed: 1_level_0,Soma
Município,Poluente emitido,Unnamed: 2_level_1
CUBATAO,"Dióxido de carbono (gás carbônico, anidrido carbônico); gelo seco",1731807.35
CUBATAO,Óxidos de nitrogênio (NOx),110808.4
CUBATAO,Óxido nitroso,99390.2
CUBATAO,Óxidos de enxofre (SOx),77453.2
CUBATAO,Monóxido de carbono (CO),20665.73
CUBATAO,Material Particulado (MP),13231.77
CUBATAO,Dióxido de enxofre,8222.4
CUBATAO,Monóxido de carbono,1185.92
GUARUJA,Óxidos de nitrogênio (NOx),169.97
GUARUJA,Monóxido de carbono (CO),70.34


# Plotagem do gráfico

In [111]:

# DataFrame fornecido
result_df = pd.DataFrame({'Soma': df_bs.groupby(['Município', 'Poluente emitido'])['Quantidade'].sum()})

# Ordenar o DataFrame
result_df = result_df.sort_values(by=['Município', 'Soma'], ascending=[True, False]).reset_index()

# Plotar o gráfico de barras
fig = px.bar(result_df, x='Município', y='Soma', color='Poluente emitido', barmode='group',
             title='Quantidade total de Poluentes Emitidos por Município de 2013 à 2023',
             labels={'Soma': 'Quantidade', 'Município': 'Município', 'Poluente emitido': 'Poluente'})
fig.update_xaxes(title='Município')
fig.update_yaxes(title='Soma')
fig.show()
