# Projeto Visualização de dados de Resíduos Reciclados no Brasil

Este projeto foi desenvolvido por [Gustavo Lins](https://github.com/gnlins/Projeto_reciclaveis) com a intenção de aprimorar seus conhecimentos em análise de dados. 

O Dataset utilizado  foi o da relação das pessoas jurídicas que entregaram o Relatório de Atividades Potencialmente Poluidoras (RAPP) referente ao formulário Produtos Reciclados.

Esse formulário esteve em vigência entre os anos 2006 e 2013 e recolhe informações sobre Produtos Reciclados – tais como:
- tratamento e destinação de resíduos industriais líquidos e sólidos; 
- disposição de resíduos especiais;
- destinação de resíduos de esgotos sanitários e de resíduos sólidos urbanos, inclusive aqueles provenientes de fossas; 
- tratamento e destinação de resíduos industriais líquidos e sólidos; 
- destinação de pilhas e baterias.

Dataset está disponível [aqui](http://www.dados.gov.br/dataset/produtos-reciclados/resource/72a96394-72f9-4d19-ac5a-ab28bbfab2e2?inner_span=True).

# 1. Importando bibliotecas e acessando o Dataset

In [2]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

In [3]:
url = 'http://dadosabertos.ibama.gov.br/dados/RAPP/produtosReciclados/relatorio.csv'
rel = pd.read_csv(url, sep=';')

In [5]:
rel.head(1)

Unnamed: 0,CNPJ,Razão Social,Estado,Município,Ano,Tipo de Resíduo,Método de Reciclagem,Quantidade,Unidade de Medida,Empresa Destinadora do Resíduo,Situação Cadastral
0,00.024.376/0001-36,IDEAL COMERCIO DE TAMBORES LTDA,SAO PAULO,GUARULHOS,2004,"Resíduo inflamável (resinas, etc)",Queima em formos industriais,1,kilogramas,40.263.170/0008-50 - ESSENCIS SOLUÇÕES AMBIENT...,Ativa


In [7]:
UF_dict = {
    'AC': 'Acre',
    'AL': 'Alagoas',
    'AP': 'Amapá',
    'AM': 'Amazonas',
    'BA': 'Bahia',
    'CE': 'Ceará',
    'DF': 'Distrito Federal',
    'ES': 'Espírito Santo',
    'GO': 'Goiás',
    'MA': 'Maranhão',
    'MT': 'Mato Grosso',
    'MS': 'Mato Grosso do Sul',
    'MG': 'Minas Gerais',
    'PA': 'Pará',
    'PB': 'Paraíba',
    'PR': 'Paraná',
    'PE': 'Pernambuco',
    'PI': 'Piauí',
    'RJ': 'Rio de Janeiro',
    'RN': 'Rio Grande do Norte',
    'RS': 'Rio Grande do Sul',
    'RO': 'Rondônia',
    'RR': 'Roraima',
    'SC': 'Santa Catarina',
    'SP': 'São Paulo',
    'SE': 'Sergipe',
    'TO': 'Tocantins'
}

In [24]:
estados = list(map(lambda x: x.replace(), list(UF_dict.values())))
[number for number, name in UF_dict.items() if name == 'São Paulo']

['SP']

In [None]:
rel['UF']=map

In [27]:
'ã'=='a'

False

In [28]:
x = "top"

In [29]:
x.replace('t','r')

'rop'

In [30]:
x

'top'

# 2. Explorando e conhecendo os dados

In [None]:
rel.head(2)

In [None]:
rel.info()

<h5>Acima podemos conferir que a única informação numérica é o ano. A coluna de 'Quantidade', que também é preenchida por números, está como texto (já temos algo que precisará de nossa atenção). Explorando os dados, percebi que o separador de milhar '.', não permitiu que o número fosse reconhecido. Então utilizei a seguinte função para criar uma coluna com valores numéricos das quantidades.<h5/>

In [None]:
def converter(x):
    l = x.split('.')
    if len(l)>1:
        for i, e in enumerate(l):
            a = l[i-1]+e
    else:
        a=l[0]
    return a
rel['Qtde_numero'] = list(map(lambda x: converter(x),rel['Quantidade']))
rel['Qtde_numero'] = list(map(lambda x: float(x), rel['Qtde_numero']))
rel.head(1)

In [None]:
rel.info()

In [None]:
rel['Estado'].nunique()

In [None]:
rel[rel['Tipo de Resíduo']=='Óleo lubrificante usado']

In [None]:
rel['Unidade de Medida'].nunique()

In [None]:
rel['Método de Reciclagem'].nunique()

In [None]:
rel['Situação Cadastral'].nunique()

# 3. Limpando os dados
Aqui vamos retirar as informações que não são do nosso interesse.

In [None]:
rel.drop(['CNPJ','Quantidade', 'Razão Social', 'Empresa Destinadora do Resíduo', 'Situação Cadastral'], axis=1)

In [None]:
rel.head(1)

In [None]:
plt.figure(figsize=(16,8))
chart=sns.barplot(x=rel[rel['Tipo de Resíduo']=='Óleo lubrificante usado']['Estado'], y=rel[rel['Tipo de Resíduo']=='Óleo lubrificante usado']['Qtde_numero'], ci=None)
chart.set_xticklabels(chart.get_xticklabels(), rotation=45)