Projeto Final de Análise de Dados

Desenvolvido por:

Paloma Avena palomaavena@gmail.com

Anne Ribeiro anne.asribeiro@gmail.com

**Contexto**
Este projeto consiste na criação de um banco de dados e análise destes dados de desmatamento e CO2 do estado da Bahia nos últimos 5 anos.

Bases Escolhidas

Base 1: MapBiomas Alertas https://plataforma.alerta.mapbiomas.org/downloads

Base 2: Sistema de Estimativas de Emissões e Remoções de Gases de Efeito Estufa (SEEG) https://plataforma.seeg.eco.br/?highlight=states-net-emissions-by-sector-goias&_gl=1*1nqir75*_ga*NTI0MDk2MzUwLjE3Mjc1NDQ0NjA.*_ga_XZWSWEJDWQ*MTcyNzU0NDQ2MC4xLjAuMTcyNzU0NDQ2MC4wLjAuMA..

Objetivo Geral:

Criar um banco de dados e realizar uma análise dos dados com o objetivo de identificar variáveis de como o desmatamento na Bahia impacta nas taxas de emissão de CO2?

As perguntas norteadoras deste projeto são:

Como o desmatamento na Bahia impacta as taxas de emissão de CO₂ e qual sua relação com a temperatura dos oceanos?

Qual a taxa de desmatamento nos biomas/municípios da Bahia e como ela evoluiu no período de 2019 a 2022?

Qual a taxa de CO2 nos municípios da Bahia e como ela evoluiu no período de 2019 a 2022?

Existe uma relação entre as áreas desmatadas e o aumento de CO2?

Quais regiões da Bahia apresentam as maiores emissões de carbono derivadas do desmatamento?

Houve alguma alteração no período da Pandemia?

Base de Dados MapBiomas

In [5]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [6]:
df = pd.read_csv(r'C:\Users\annea\OneDrive\Área de Trabalho\Reprograma\on35-python-s17-s18-projeto-final\dados\mapbiomas_ba.csv', delimiter=';', encoding='utf-8')

In [3]:
print(df.head())

   CODEALERTA           FONTE     BIOMA ESTADO      MUNICIPIO  \
0     1226926  {SAD-CAATINGA}  Caatinga  BAHIA           Iaçu   
1     1226922  {SAD-CAATINGA}  Caatinga  BAHIA  Miguel Calmon   
2     1227303  {SAD-CAATINGA}  Caatinga  BAHIA     Buritirama   
3     1227296  {SAD-CAATINGA}  Caatinga  BAHIA          Piatã   
4     1227291  {SAD-CAATINGA}  Caatinga  BAHIA       Cotegipe   

            AREAHA            ANODETEC   DATADETEC    DTIMGANT    DTIMGDEP  \
0   29.600.000.000  20.240.000.000.000  01/01/2024  26/01/2023  14/02/2024   
1   16.900.000.000  20.240.000.000.000  01/01/2024  30/06/2023  31/01/2024   
2   20.500.000.000  20.240.000.000.000  01/01/2024  17/03/2023  10/10/2023   
3     0.6900000000  20.240.000.000.000  01/01/2024  27/04/2023  17/06/2023   
4  239.700.000.000  20.240.000.000.000  01/01/2024  12/08/2023  17/10/2023   

      DTPUBLI     VPRESSAO  
0  30/04/2024  agriculture  
1  30/04/2024  agriculture  
2  30/04/2024  agriculture  
3  30/04/2024  agricultu

In [7]:
# Remover múltiplas colunas de uma vez
colunas_para_remover = ['CODEALERTA', 'FONTE', 'AREAHA', 'ANODETEC', 'DATADETEC', 'DTPUBLI', 'VPRESSAO']
df = df.drop(columns=colunas_para_remover)


In [8]:
print(df.head())

      BIOMA ESTADO      MUNICIPIO    DTIMGANT    DTIMGDEP
0  Caatinga  BAHIA           Iaçu  26/01/2023  14/02/2024
1  Caatinga  BAHIA  Miguel Calmon  30/06/2023  31/01/2024
2  Caatinga  BAHIA     Buritirama  17/03/2023  10/10/2023
3  Caatinga  BAHIA          Piatã  27/04/2023  17/06/2023
4  Caatinga  BAHIA       Cotegipe  12/08/2023  17/10/2023


In [10]:
df.to_csv('mapbiomas_ba_limpo.csv', index=False, encoding='utf-8')

In [17]:
df = pd.read_csv(r'C:\Users\annea\OneDrive\Área de Trabalho\Reprograma\on35-python-s17-s18-projeto-final\material\mapbiomas_ba_limpo.csv',delimiter=';', encoding='utf-8')


In [18]:
print(df.head())

            BIOMA,ESTADO,MUNICIPIO,DTIMGANT,DTIMGDEP
0          Caatinga,BAHIA,Iaçu,26/01/2023,14/02/2024
1  Caatinga,BAHIA,Miguel Calmon,30/06/2023,31/01/...
2    Caatinga,BAHIA,Buritirama,17/03/2023,10/10/2023
3         Caatinga,BAHIA,Piatã,27/04/2023,17/06/2023
4      Caatinga,BAHIA,Cotegipe,12/08/2023,17/10/2023


In [21]:
# Verificar tipos de dados e quantidade de valores não nulos
print(df.info())


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 28397 entries, 0 to 28396
Data columns (total 1 columns):
 #   Column                                    Non-Null Count  Dtype 
---  ------                                    --------------  ----- 
 0   BIOMA,ESTADO,MUNICIPIO,DTIMGANT,DTIMGDEP  28397 non-null  object
dtypes: object(1)
memory usage: 222.0+ KB
None


In [22]:
# Verificar se tem valores faltantes
print(df.isnull().sum())


BIOMA,ESTADO,MUNICIPIO,DTIMGANT,DTIMGDEP    0
dtype: int64


In [23]:
# Estatísticas descritivas 
print(df.describe())


              BIOMA,ESTADO,MUNICIPIO,DTIMGANT,DTIMGDEP
count                                            28397
unique                                           27558
top     Caatinga,BAHIA,Itapicuru,22/09/2021,08/06/2022
freq                                                13
