In [3]:
import pandas as pd

In [4]:
# Arquivo: Resíduos Sólidos – Armazenador.csv
df_armazenador = pd.read_csv('Residuos_Solidos.csv', sep=';')

In [5]:
df_armazenador.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20209 entries, 0 to 20208
Data columns (total 16 columns):
 #   Column                          Non-Null Count  Dtype 
---  ------                          --------------  ----- 
 0   CNPJ do armazenador             20209 non-null  object
 1   Razão Social do Armazenador     20209 non-null  object
 2   Estado                          20209 non-null  object
 3   Município                       20209 non-null  object
 4   CNPJ da emp. ger. do resíduo    20209 non-null  object
 5   Raz. soc. da emp. ger. do res.  20209 non-null  object
 6   Cód. Resíduo                    20209 non-null  int64 
 7   Desc. Resíduo                   20209 non-null  object
 8   Ano da destinação               20209 non-null  int64 
 9   CNPJ Armazenamento/Destinação   20209 non-null  object
 10  Raz. soc. empresa Armaz./Dest.  20209 non-null  object
 11  Qtd armaz/enviada p/dest final  20209 non-null  object
 12  Unidade                         20209 non-null

In [6]:
# Apagando colunas desnecessárias para a análise
df_armazenador = df_armazenador.drop(['CNPJ do armazenador','CNPJ da emp. ger. do resíduo','Cód. Resíduo','CNPJ Armazenamento/Destinação','Tipo de armazenamento/destin.','Situação','Situação Cadastral'], axis=1)

In [7]:
# Renomeando colunas
df_armazenador.columns = ['nome_armazenador','estado','municipio','nome_geradora_residuo','residuo','ano','nome_distribuidor','quantidade','unidade']

In [10]:
df_armazenador.head()

Unnamed: 0,nome_armazenador,estado,municipio,nome_geradora_residuo,residuo,ano,nome_distribuidor,quantidade,unidade
0,A.C. LIMA COLETA E RECICLAGEM DE RESÍDUOS LTDA...,SAO PAULO,MORRO AGUDO,P.A. FILIPPINI SERVIÇOS DE ENGENHARIA,Resíduos de concreto,2024,A.C. LIMA COLETA E RECICLAGEM DE RESÍDUOS LTDA...,4800.0,kilogramas (kg)
1,A.C. LIMA COLETA E RECICLAGEM DE RESÍDUOS LTDA...,SAO PAULO,MORRO AGUDO,A.C. LIMA COLETA E RECICLAGEM DE RESÍDUOS LTDA...,Madeira,2024,A.C. LIMA COLETA E RECICLAGEM DE RESÍDUOS LTDA...,78480.0,kilogramas (kg)
2,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,IOCHPE-MAXION S/A,Emb. de qualquer um dos tipos acima descr. con...,2013,IDEAL COMERCIO DE TAMBORES LTDA,31930.0,kilogramas (kg)
3,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,COMPANHIA SIDERÚRGICA NACIONAL,Emb. de qualquer um dos tipos acima descr. con...,2014,IDEAL COMERCIO DE TAMBORES LTDA,17497400.0,kilogramas (kg)
4,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,EUROAMERICAN DO BRASIL IMP.INDUSTRIA E COMERCI...,Lodos do tratamento local de efluentes,2015,IDEAL COMERCIO DE TAMBORES LTDA,250.0,kilogramas (kg)


In [8]:
# Ajustando unidades
df_armazenador['quantidade'] = df_armazenador['quantidade'].str.replace('.', '')
df_armazenador['quantidade'] = df_armazenador['quantidade'].str.replace(',', '.').astype(float)

In [11]:
df_armazenador['estado'].unique()

array(['SAO PAULO', 'PARANA', 'SANTA CATARINA', 'RIO GRANDE DO SUL',
       'CEARA', 'GOIAS', 'MINAS GERAIS', 'RIO DE JANEIRO',
       'ESPIRITO SANTO', 'PARA', 'MATO GROSSO DO SUL', 'BAHIA',
       'TOCANTINS', 'PARAIBA', 'MARANHAO', 'PERNAMBUCO', 'MATO GROSSO',
       'DISTRITO FEDERAL', 'AMAZONAS', 'PIAUI', 'RORAIMA', 'RONDONIA',
       'ALAGOAS', 'SERGIPE', 'RIO GRANDE DO NORTE'], dtype=object)

In [12]:
# Filtrando o estado de SP
df_armazenador = df_armazenador[df_armazenador['estado'] == "SAO PAULO"]

df_armazenador['estado'].unique()

array(['SAO PAULO'], dtype=object)

In [13]:
# Filtrando os anos 2020, 2021 e 2022
anos = [2020,2021,2022]
df_armazenador = df_armazenador[df_armazenador['ano'].isin(anos)]

df_armazenador['ano'].unique()

array([2020, 2021, 2022])

In [14]:
df_armazenador['residuo'] = df_armazenador['residuo'].str.lower()

In [15]:
# Apagando acentos e caracteres especiais

df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('ç','c', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('ã','a', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('á','a', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('à','a', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('â','a', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('ó','o', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('õ','o', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('ú','u', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('í','i', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('é','e', regex=True)
df_armazenador['residuo'] = df_armazenador['residuo'].str.replace('ê','e', regex=True)


In [16]:
# Unificando Lodos

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('lodo')].unique()
view

df_armazenador.loc[df_armazenador['residuo'].str.contains('lodo', case=False), 'residuo'] = 'Lodos'

In [17]:
# Unificando Ácidos

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('acido')].unique()
view

df_armazenador.loc[df_armazenador['residuo'].str.contains('acido', case=False), 'residuo'] = 'Acidos'

In [18]:
# Unificando Baterias e Pilhas

df_armazenador.loc[df_armazenador['residuo'].str.contains('bateria', case=False), 'residuo'] = 'Baterias e Pilhas'
df_armazenador.loc[df_armazenador['residuo'].str.contains('pilha', case=False), 'residuo'] = 'Baterias e Pilhas'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('bateria')].unique()
view

array([], dtype=object)

In [19]:
# Unificado Residuos Texteis

df_armazenador.loc[df_armazenador['residuo'].str.contains('text', case=False), 'residuo'] = 'Residuos Texteis'
df_armazenador.loc[df_armazenador['residuo'].str.contains('confeccao', case=False), 'residuo'] = 'Residuos Texteis'
df_armazenador.loc[df_armazenador['residuo'].str.contains('roupa', case=False), 'residuo'] = 'Residuos Texteis'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('rou')].unique()
view

array([], dtype=object)

In [20]:
# Unificando Residuos Perigosos

df_armazenador.loc[df_armazenador['residuo'].str.contains('perig', case=False), 'residuo'] = 'Residuos Perigosos'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('perig')].unique()
view

array([], dtype=object)

In [21]:
# Unificando Plasticos

df_armazenador.loc[df_armazenador['residuo'].str.contains('plast', case=False), 'residuo'] = 'Plasticos'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('plast')].unique()
view

array([], dtype=object)

In [22]:
# Unificando Oleos

df_armazenador.loc[df_armazenador['residuo'].str.contains('oleo', case=False), 'residuo'] = 'Oleos'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('oleo')].unique()
view

array([], dtype=object)

In [23]:
# Unificando Metais e derivados

df_armazenador.loc[df_armazenador['residuo'].str.contains('met', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('aluminio', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('cobre', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('cabo', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('aco', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('estanho', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('niquel', case=False), 'residuo'] = 'Metais e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('liquefeito', case=False), 'residuo'] = 'Metais e derivados'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('liquef')].unique()
view

array([], dtype=object)

In [24]:
# Unificando Produtos Quimicos

df_armazenador.loc[df_armazenador['residuo'].str.contains('quim', case=False), 'residuo'] = 'Produtos Quimicos'
df_armazenador.loc[df_armazenador['residuo'].str.contains('pcb', case=False), 'residuo'] = 'Produtos Quimicos'
df_armazenador.loc[df_armazenador['residuo'].str.contains('cfc', case=False), 'residuo'] = 'Produtos Quimicos'
df_armazenador.loc[df_armazenador['residuo'].str.contains('solvente', case=False), 'residuo'] = 'Produtos Quimicos'
df_armazenador.loc[df_armazenador['residuo'].str.contains('tinta', case=False), 'residuo'] = 'Produtos Quimicos'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('tinta')].unique()
view

array([], dtype=object)

In [25]:
# Unificando Materia Organica

df_armazenador.loc[df_armazenador['residuo'].str.contains('org', case=False), 'residuo'] = 'Materia Organica'
df_armazenador.loc[df_armazenador['residuo'].str.contains('viscera', case=False), 'residuo'] = 'Materia Organica'
df_armazenador.loc[df_armazenador['residuo'].str.contains('corpo', case=False), 'residuo'] = 'Materia Organica'
df_armazenador.loc[df_armazenador['residuo'].str.contains('anim', case=False), 'residuo'] = 'Materia Organica'
df_armazenador.loc[df_armazenador['residuo'].str.contains('vegeta', case=False), 'residuo'] = 'Materia Organica'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('vegeta')].unique()
view

array([], dtype=object)

In [26]:
# Unificando Papel e Papelão

df_armazenador.loc[df_armazenador['residuo'].str.contains('papel', case=False), 'residuo'] = 'Papel e Papelao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('embala', case=False), 'residuo'] = 'Papel e Papelao'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('embala')].unique()
view

array([], dtype=object)

In [27]:
# Unificando Madeiras e derivados

df_armazenador.loc[df_armazenador['residuo'].str.contains('mad', case=False), 'residuo'] = 'Madeiras e derivados'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('mad')].unique()
view

array([], dtype=object)

In [28]:
# Unificando Materiais de Construção

df_armazenador.loc[df_armazenador['residuo'].str.contains('areia', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('asfalto', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('tijolo', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('pedra', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('brita', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('telha', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('cascalho', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('construc', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('isolamento', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('concreto', case=False), 'residuo'] = 'Materiais de Construcao'
df_armazenador.loc[df_armazenador['residuo'].str.contains('rocha', case=False), 'residuo'] = 'Materiais de Construcao'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('rocha')].unique()
view

array([], dtype=object)

In [29]:
# Unificando Borracha e derivados

df_armazenador.loc[df_armazenador['residuo'].str.contains('borracha', case=False), 'residuo'] = 'Borracha e derivados'
df_armazenador.loc[df_armazenador['residuo'].str.contains('pneu', case=False), 'residuo'] = 'Borracha e derivados'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('pne')].unique()
view

array([], dtype=object)

In [30]:
# Unificando Vidro

df_armazenador.loc[df_armazenador['residuo'].str.contains('vidro', case=False), 'residuo'] = 'Vidro'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('vidro')].unique()
view

array([], dtype=object)

In [31]:
# Uniifcando Couro e derivados

df_armazenador.loc[df_armazenador['residuo'].str.contains('couro', case=False), 'residuo'] = 'Couro e derivados'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('couro')].unique()
view

array([], dtype=object)

In [32]:
# Unificando Outros

df_armazenador.loc[df_armazenador['residuo'].str.contains('inorganico', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('filtr', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('cinza', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('compo', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('materia', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('outr', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('lampada', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('produto', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('liquido', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('residuo', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('mistura', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('escoria', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('efluente', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('medicamento', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('escama', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('equipamento', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('freio', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('pos', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('emuls', case=False), 'residuo'] = 'Outros'
df_armazenador.loc[df_armazenador['residuo'].str.contains('carvao', case=False), 'residuo'] = 'Outros'

view = df_armazenador['residuo'][df_armazenador['residuo'].str.contains('carvao')].unique()
view

array([], dtype=object)

In [33]:
df_armazenador['residuo'].sort_values().unique()

array(['Acidos', 'Baterias e Pilhas', 'Borracha e derivados', 'Lodos',
       'Madeiras e derivados', 'Metais e derivados', 'Oleos', 'Outros',
       'Papel e Papelao', 'Plasticos', 'Vidro'], dtype=object)

In [34]:
quantidades = df_armazenador.groupby('residuo')[['quantidade','unidade']].sum().round().reset_index()
quantidades['unidade'] = quantidades['unidade'].str.replace(r'(kilogramas \(kg\))+', 'kilogramas (kg)', regex=True).replace(r'(Litro \(L\))+', 'Litro (L)', regex=True).replace(r'(Unidade \(UN\))+', 'Unidade (UN)', regex=True)

quantidades


Unnamed: 0,residuo,quantidade,unidade
0,Acidos,4162626.0,kilogramas (kg)
1,Baterias e Pilhas,27667.0,kilogramas (kg)
2,Borracha e derivados,304184.0,kilogramas (kg)
3,Lodos,499879.0,kilogramas (kg)
4,Madeiras e derivados,1931114.0,kilogramas (kg)
5,Metais e derivados,17112766.0,kilogramas (kg)
6,Oleos,519212.0,Litro (L)kilogramas (kg)Litro (L)kilogramas (k...
7,Outros,19403649.0,kilogramas (kg)Litro (L)Unidade (UN)kilogramas...
8,Papel e Papelao,2401902.0,kilogramas (kg)
9,Plasticos,792520.0,kilogramas (kg)


In [35]:
# Separando os itens com 'Oleos'

df_oleos = df_armazenador[df_armazenador['residuo'].str.contains('oleo', case=False)]
df_armazenador = df_armazenador[~df_armazenador['residuo'].str.contains('oleo', case=False)]

In [36]:
# Tratando dados de Oleos

df_oleos.loc[df_oleos['residuo'].str.contains('Oleos', case=False) & df_oleos['unidade'].str.contains('lit', case=False), 'residuo'] = 'Oleos (L)'
df_oleos.loc[df_oleos['residuo'].str.contains('Oleos', case=False) & df_oleos['unidade'].str.contains('kg', case=False), 'residuo'] = 'Oleos (kg)'

df_oleos.head()

Unnamed: 0,nome_armazenador,estado,municipio,nome_geradora_residuo,residuo,ano,nome_distribuidor,quantidade,unidade
747,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,SAO PAULO,MERIDIANO,COLOMBO AUTO POSTO POTIRENDABA LTDA,Oleos (L),2022,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,866.0,Litro (L)
748,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,SAO PAULO,MERIDIANO,AUTO POSTO NATURE LTDA,Oleos (L),2022,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,500.0,Litro (L)
749,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,SAO PAULO,MERIDIANO,AVIP - COMÉRCIO DE PRODUTOS DE PETRÓLEO LTDA,Oleos (L),2022,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,1308.0,Litro (L)
750,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,SAO PAULO,MERIDIANO,AUTO POSTO SALOME LTDA,Oleos (L),2022,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,820.0,Litro (L)
751,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,SAO PAULO,MERIDIANO,VENI COMÉRCIO DE COMBUSTÍVEIS LTDA,Oleos (L),2022,PC DE ARAUJO COLETA DE RESÍDUOS EIRELI-ME,1434.0,Litro (L)


In [37]:
# Separando os itens com 'Outros'

df_outros = df_armazenador[df_armazenador['residuo'].str.contains('outro', case=False)]
df_armazenador = df_armazenador[~df_armazenador['residuo'].str.contains('outro', case=False)]

In [38]:
# Tratando dados de Outros

df_outros.loc[df_outros['residuo'].str.contains('Outros', case=False) & df_outros['unidade'].str.contains('lit', case=False), 'residuo'] = 'Outros (L)'
df_outros.loc[df_outros['residuo'].str.contains('Outros', case=False) & df_outros['unidade'].str.contains('kg', case=False), 'residuo'] = 'Outros (kg)'
df_outros.loc[df_outros['residuo'].str.contains('Outros', case=False) & df_outros['unidade'].str.contains('uni', case=False), 'residuo'] = 'Outros (UN)'

df_outros['unidade'].unique()

array(['kilogramas (kg)', 'Litro (L)', 'Unidade (UN)'], dtype=object)

In [39]:
df_outros['unidade'].value_counts()

unidade
kilogramas (kg)    295
Unidade (UN)        33
Litro (L)           14
Name: count, dtype: int64

In [40]:
# Devolvendo dados ao df_armazenador

df_armazenador = pd.merge(df_armazenador, df_oleos, how='outer')
df_armazenador = pd.merge(df_armazenador, df_outros, how='outer')

In [46]:
df_armazenador.head()

Unnamed: 0,nome_armazenador,estado,municipio,nome_geradora_residuo,residuo,ano,nome_distribuidor,quantidade,unidade
0,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,ACRILEX TINTAS ESPECIAIS S/A,Plasticos,2020,IDEAL COMERCIO DE TAMBORES LTDA,175.0,kilogramas (kg)
1,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,ACRILEX TINTAS ESPECIAIS S/A,Metais e derivados,2020,IDEAL COMERCIO DE TAMBORES LTDA,672.0,kilogramas (kg)
2,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,ZF DO BRASIL LTDA,Metais e derivados,2020,VALLOUREC SOLUÇÕES TUBULARES DO BRASIL S.A.,1388000.0,kilogramas (kg)
3,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,TT SERVIÇOS DE RECICLAGEM LTDA,Papel e Papelao,2020,GESCRAP - AUTOMETAL COMERCIO DE SUCATAS LTDA,832.2,kilogramas (kg)
4,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,GREENBRIER MAXION - EQUIPAMENTOS E SERVIÇOS FE...,Papel e Papelao,2020,GESCRAP - AUTOMETAL COMERCIO DE SUCATAS LTDA,87350.0,kilogramas (kg)


In [41]:
quantidades_total = df_armazenador.groupby('residuo')[['quantidade','unidade']].sum().round().reset_index()
quantidades_total['unidade'] = quantidades_total['unidade'].str.replace(r'(kilogramas \(kg\))+', 'kilogramas (kg)', regex=True).replace(r'(Litro \(L\))+', 'Litro (L)', regex=True).replace(r'(Unidade \(UN\))+', 'Unidade (UN)', regex=True)

quantidades_total


Unnamed: 0,residuo,quantidade,unidade
0,Acidos,4162626.0,kilogramas (kg)
1,Baterias e Pilhas,27667.0,kilogramas (kg)
2,Borracha e derivados,304184.0,kilogramas (kg)
3,Lodos,499879.0,kilogramas (kg)
4,Madeiras e derivados,1931114.0,kilogramas (kg)
5,Metais e derivados,17112766.0,kilogramas (kg)
6,Oleos (L),515500.0,Litro (L)
7,Oleos (kg),3712.0,kilogramas (kg)
8,Outros (L),244044.0,Litro (L)
9,Outros (UN),22230.0,Unidade (UN)


In [42]:
df_2020 = df_armazenador[df_armazenador['ano'] == 2020]
df_2021 = df_armazenador[df_armazenador['ano'] == 2021]
df_2022 = df_armazenador[df_armazenador['ano'] == 2022]

df_2022.head()

Unnamed: 0,nome_armazenador,estado,municipio,nome_geradora_residuo,residuo,ano,nome_distribuidor,quantidade,unidade
11,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,AUTOCAM DO BRASIL USINAGEM LTDA.,Papel e Papelao,2022,TERNIUM BRASIL LTDA,1848.17,kilogramas (kg)
12,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,AUTOCAM DO BRASIL USINAGEM LTDA.,Papel e Papelao,2022,METSO BRASIL INDUSTRIA E COMERCIO LTDA,17351.83,kilogramas (kg)
13,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,AUTOCAM DO BRASIL USINAGEM LTDA.,Plasticos,2022,TERNIUM BRASIL LTDA,3202.08,kilogramas (kg)
14,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,AUTOCAM DO BRASIL USINAGEM LTDA.,Plasticos,2022,VALLOUREC SOLUÇÕES TUBULARES DO BRASIL S.A.,8260.67,kilogramas (kg)
15,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,AUTOCAM DO BRASIL USINAGEM LTDA.,Plasticos,2022,TUPY S.A.,3737.25,kilogramas (kg)


In [43]:
# Puxando quantidades para cada ano
# 2020
quantidades_2020 = df_2020.groupby('residuo')[['quantidade','unidade']].sum().round().reset_index()
quantidades_2020['unidade'] = quantidades_2020['unidade'].str.replace(r'(kilogramas \(kg\))+', 'kilogramas (kg)', regex=True).replace(r'(Litro \(L\))+', 'Litro (L)', regex=True).replace(r'(Unidade \(UN\))+', 'Unidade (UN)', regex=True)

quantidades_2020


Unnamed: 0,residuo,quantidade,unidade
0,Acidos,1910830.0,kilogramas (kg)
1,Baterias e Pilhas,26334.0,kilogramas (kg)
2,Borracha e derivados,119034.0,kilogramas (kg)
3,Lodos,356500.0,kilogramas (kg)
4,Madeiras e derivados,180604.0,kilogramas (kg)
5,Metais e derivados,4651017.0,kilogramas (kg)
6,Oleos (L),9370.0,Litro (L)
7,Oleos (kg),1761.0,kilogramas (kg)
8,Outros (L),86721.0,Litro (L)
9,Outros (UN),9415.0,Unidade (UN)


In [44]:
# Puxando quantidades para cada ano
# 2021
quantidades_2021 = df_2021.groupby('residuo')[['quantidade','unidade']].sum().round().reset_index()
quantidades_2021['unidade'] = quantidades_2021['unidade'].str.replace(r'(kilogramas \(kg\))+', 'kilogramas (kg)', regex=True).replace(r'(Litro \(L\))+', 'Litro (L)', regex=True).replace(r'(Unidade \(UN\))+', 'Unidade (UN)', regex=True)

quantidades_2021

Unnamed: 0,residuo,quantidade,unidade
0,Acidos,909486.0,kilogramas (kg)
1,Baterias e Pilhas,820.0,kilogramas (kg)
2,Borracha e derivados,4000.0,kilogramas (kg)
3,Lodos,50928.0,kilogramas (kg)
4,Madeiras e derivados,360794.0,kilogramas (kg)
5,Metais e derivados,1707695.0,kilogramas (kg)
6,Oleos (L),48196.0,Litro (L)
7,Oleos (kg),1284.0,kilogramas (kg)
8,Outros (L),13271.0,Litro (L)
9,Outros (UN),10777.0,Unidade (UN)


In [45]:
# Puxando quantidades para cada ano
# 2022
quantidades_2022 = df_2022.groupby('residuo')[['quantidade','unidade']].sum().round().reset_index()
quantidades_2022['unidade'] = quantidades_2021['unidade'].str.replace(r'(kilogramas \(kg\))+', 'kilogramas (kg)', regex=True).replace(r'(Litro \(L\))+', 'Litro (L)', regex=True).replace(r'(Unidade \(UN\))+', 'Unidade (UN)', regex=True)

quantidades_2022

Unnamed: 0,residuo,quantidade,unidade
0,Acidos,1342310.0,kilogramas (kg)
1,Baterias e Pilhas,513.0,kilogramas (kg)
2,Borracha e derivados,181150.0,kilogramas (kg)
3,Lodos,92451.0,kilogramas (kg)
4,Madeiras e derivados,1389716.0,kilogramas (kg)
5,Metais e derivados,10754054.0,kilogramas (kg)
6,Oleos (L),457933.0,Litro (L)
7,Oleos (kg),667.0,kilogramas (kg)
8,Outros (L),144052.0,Litro (L)
9,Outros (UN),2038.0,Unidade (UN)


In [47]:
df_armazenador.head()

Unnamed: 0,nome_armazenador,estado,municipio,nome_geradora_residuo,residuo,ano,nome_distribuidor,quantidade,unidade
0,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,ACRILEX TINTAS ESPECIAIS S/A,Plasticos,2020,IDEAL COMERCIO DE TAMBORES LTDA,175.0,kilogramas (kg)
1,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,ACRILEX TINTAS ESPECIAIS S/A,Metais e derivados,2020,IDEAL COMERCIO DE TAMBORES LTDA,672.0,kilogramas (kg)
2,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,ZF DO BRASIL LTDA,Metais e derivados,2020,VALLOUREC SOLUÇÕES TUBULARES DO BRASIL S.A.,1388000.0,kilogramas (kg)
3,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,TT SERVIÇOS DE RECICLAGEM LTDA,Papel e Papelao,2020,GESCRAP - AUTOMETAL COMERCIO DE SUCATAS LTDA,832.2,kilogramas (kg)
4,SUDESTE PAULISTA COM DE METAIS LTDA,SAO PAULO,SOROCABA,GREENBRIER MAXION - EQUIPAMENTOS E SERVIÇOS FE...,Papel e Papelao,2020,GESCRAP - AUTOMETAL COMERCIO DE SUCATAS LTDA,87350.0,kilogramas (kg)
