<a href="https://colab.research.google.com/github/PedroOlavo/ArtigosMedium/blob/main/Inc%C3%AAndios_nas_Florestas_Brasileiras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Uma breve análise sobre incêndios nas florestas brasileiras entre 1998-2017.

Os incêndios florestais há muito tempo sem um problema enorme para a preservação dos biomas brasileiros. Tendo isso em mente, entender a frequência com que as queimadas acontecem pode ajudar a prevenir os estragos.

Essa análise será divida em partes, inicialmente será abordada a evolução durante os anos presentes. Em seguida os meses mais propensos a queimadas serão o foco. Posteriormente serão expostos quais estados tiveram mais casos nesses quases 20 anos e quais foram as regiões mais afetadas.

In [53]:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.graph_objects as go
import plotly.express as px

In [54]:
data = pd.read_csv('/content/drive/MyDrive/amazon.csv', encoding = "latin1")
data.head()

Unnamed: 0,year,state,month,number,date
0,1998,Acre,Janeiro,0.0,1998-01-01
1,1999,Acre,Janeiro,0.0,1999-01-01
2,2000,Acre,Janeiro,0.0,2000-01-01
3,2001,Acre,Janeiro,0.0,2001-01-01
4,2002,Acre,Janeiro,0.0,2002-01-01


In [55]:
data.describe()

Unnamed: 0,year,number
count,6454.0,6454.0
mean,2007.461729,108.293163
std,5.746654,190.812242
min,1998.0,0.0
25%,2002.0,3.0
50%,2007.0,24.0
75%,2012.0,113.0
max,2017.0,998.0


In [56]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6454 entries, 0 to 6453
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   year    6454 non-null   int64  
 1   state   6454 non-null   object 
 2   month   6454 non-null   object 
 3   number  6454 non-null   float64
 4   date    6454 non-null   object 
dtypes: float64(1), int64(1), object(3)
memory usage: 252.2+ KB


In [57]:
data['state'].unique()

array(['Acre', 'Alagoas', 'Amapa', 'Amazonas', 'Bahia', 'Ceara',
       'Distrito Federal', 'Espirito Santo', 'Goias', 'Maranhao',
       'Mato Grosso', 'Minas Gerais', 'Pará', 'Paraiba', 'Pernambuco',
       'Piau', 'Rio', 'Rondonia', 'Roraima', 'Santa Catarina',
       'Sao Paulo', 'Sergipe', 'Tocantins'], dtype=object)

É válido notar que alguns estados ficaram fora dos registros, sendo eles:


*   Rio Grande do Norte
*   Rio Grande do Sul
*   Mato Grosso do Sul
*   Paraná

In [58]:
data.replace('Rio', 'Rio de Janeiro', inplace=True)
data.replace('Piau', 'Piaui', inplace=True)
data['state'].unique()

array(['Acre', 'Alagoas', 'Amapa', 'Amazonas', 'Bahia', 'Ceara',
       'Distrito Federal', 'Espirito Santo', 'Goias', 'Maranhao',
       'Mato Grosso', 'Minas Gerais', 'Pará', 'Paraiba', 'Pernambuco',
       'Piaui', 'Rio de Janeiro', 'Rondonia', 'Roraima', 'Santa Catarina',
       'Sao Paulo', 'Sergipe', 'Tocantins'], dtype=object)

In [59]:
year_month_state = data.groupby(['year', 'state', 'month']).sum().reset_index()
year_month_state.head()

Unnamed: 0,year,state,month,number
0,1998,Acre,Abril,0.0
1,1998,Acre,Agosto,130.0
2,1998,Acre,Dezembro,7.0
3,1998,Acre,Fevereiro,0.0
4,1998,Acre,Janeiro,0.0


# Análise por ano

In [60]:
anos = list(data.year.unique())
quei_anos = []
for i in anos:
  soma = data.loc[data['year']==i].number.sum().round(0)
  quei_anos.append(soma)

ano_dict = {'Ano': anos, 'Número_de_Queimadas': quei_anos}

n_ano = pd.DataFrame(ano_dict)
n_ano.head()

Unnamed: 0,Ano,Número_de_Queimadas
0,1998,20014.0
1,1999,26883.0
2,2000,27351.0
3,2001,29072.0
4,2002,37391.0


In [61]:
plot_1 = go.Figure(go.Scatter(x=n_ano.Ano, y=n_ano.Número_de_Queimadas,
                     mode='lines+markers', line={'color': 'red'}))
plot_1.update_layout(title='Queimadas no Brasil entre 1998 e 2017',
                     xaxis_title='Ano',
                     yaxis_title='Número de Queimadas')
                     

plot_1.update_layout(
    xaxis = dict(
        tickmode = 'array',
        tickvals = n_ano.Ano
    )
)

plot_1.show()

É interessante notar que após os casos praticamente dobrarem entre 1898 e 2003, houve uma grande queda entre 2003 e 2008, saindo de 42761 incêndios em 2003 para 29397 em 2008.

Após esse período o número de queimadas sobe e desce com certa frequência, porém o número de casos depois de 2008 nunca fica abaixo de 30 mil.


# Análise por mês

In [62]:
meses = list(data.month.unique())
quei_mes = []
for i in meses:
  soma = data.loc[data["month"]==i].number.sum()
  soma = soma.astype(int)
  quei_mes.append(soma)

mes_dict = {'Mês': meses, 'Queimadas_no_mês': quei_mes}
q_mes = pd.DataFrame(mes_dict)

bar_plot3 = px.bar(q_mes, x='Mês', y='Queimadas_no_mês', color='Mês', text='Queimadas_no_mês')

bar_plot3.update_layout(title_text='Número de queimadas totais em cada mês no intervalo entre 1998 e 2017',
                        yaxis_title = 'Número de queimadas')
                        
bar_plot3.update_traces(texttemplate='%{text:.4s}', textposition='outside')
bar_plot3.show()


É possível observar que os casos passam a aumentar no mês de Junho, quando começa o inverno que é a parte mais seca do ano, fazendo com que a umidade relativa do ar caia, e com isso muitas plantas secam e suas folhas caem, o que favorece a disseminação do fogo.

Além disso é notável que as queimadas passam a diminuir a partir de Dezembro, que além de marcar o ínicio do verão, marca também o começo da estação chuvosa.

# Análise por estado

In [63]:
estados = list(data.state.unique())

quei_estados = []

for i in estados:
  soma = data.loc[data["state"]==i].number.sum()
  soma = soma.astype(int)
  quei_estados.append(soma)


esta_dict = {'Estados': estados, 'Queimadas_por_Estados': quei_estados}
n_esta = pd.DataFrame(esta_dict)
n_esta.head()

Unnamed: 0,Estados,Queimadas_por_Estados
0,Acre,18464
1,Alagoas,4644
2,Amapa,21831
3,Amazonas,30650
4,Bahia,44746


In [64]:
estados_com_m_n = n_esta.sort_values(['Queimadas_por_Estados'], ascending=False).iloc[:5]

In [65]:
bar_plot=px.bar(estados_com_m_n, x='Estados', y='Queimadas_por_Estados',  color='Queimadas_por_Estados',
                text='Queimadas_por_Estados',
                labels={'Queimadas_por_Estados':'Número de Queimadas' , 'Estados':'Estados'},
                color_continuous_scale='Reds')

bar_plot.update_layout(title_text='5 Estados com maior número de queimadas entre 1998-2017', xaxis_title='Estados', yaxis_title='Número de Queimadas')
bar_plot.update_traces(texttemplate='%{text:.4s}', textposition='outside')

bar_plot.show()

Após ser gerado um gráfico dos estados com o maior número de casos foi observado que Mato Grosso apresenta um número muito elevado em relação ao demais, sendo mais de 40mil casos a mais que o segundo estado, Paraíba, que registrou 52440 ocorrências.

Isso nos leva a pensar em duas hipóteses: Mato Grosso teve um erro nas suas contagens ou combinaram os casos dos estados Mato Grosso e Mato Grosso do Sul em apenas um estado, isso explicaria a ausência do segundo no dataset. Porém como não é possível ter certeza se alguma das hipóteses está correta, o mais sábio a se fazer é excluir Mato Grossos das nossas análises. 

In [66]:
n_esta_sem_mt = n_esta.drop(labels=10 , axis=0)
est_com_m_n = n_esta_sem_mt.sort_values(['Queimadas_por_Estados'], ascending=False).iloc[:5]
est_com_m_n


Unnamed: 0,Estados,Queimadas_por_Estados
13,Paraiba,52435
20,Sao Paulo,51121
16,Rio de Janeiro,45160
4,Bahia,44746
15,Piaui,37803


In [67]:
bar_plot=px.bar(est_com_m_n, x='Estados', y='Queimadas_por_Estados',  color='Queimadas_por_Estados',
                text='Queimadas_por_Estados',
                labels={'Queimadas_por_Estados':'Número de Queimadas' , 'Estados':'Estados'},
                color_continuous_scale='Reds')

bar_plot.update_layout(title_text='5 Estados com maior número de queimadas entre 1998-2017', xaxis_title='Estados', yaxis_title='Número de Queimadas')
bar_plot.update_traces(texttemplate='%{text:.4s}', textposition='outside')

bar_plot.show()

Após a exclusão de Mato Grosso, um novo gráfico foi obtido para os 5 estados com maior número de queimadas.

É importante ressaltar que os 3 primeiros estados, Paraíba, São Paulo e Rio de Janeiro são estados relativamente pequenos comparados a outros como a própria Bahia que ocupa o quarto lugar de estado com mais incêndios nesse período.

Isso nos leva a pensar que a abordagem desse dataset não é tão interessante, pois não é possível mensurar o impacto das queimadas apenas com o números de casos, o melhor seria uma métrica como por exemplo, a área devastada em hectares.

# Análise por regiões


In [68]:
es_norte = ['Acre', 'Amapa', 'Amazonas', 'Pará', 'Rondonia' ,'Roraima', 'Tocantins']
soma2 = 0
n_norte = []
for j in es_norte:
  soma = data.loc[data["state"]==j].number.sum()
  soma2 = soma2 + soma
  n_norte = soma2.astype(int)


In [69]:
es_sudeste = ['Espirito Santo', 'Minas Gerais', 'Rio de Janeiro', 'Sao Paulo']
soma2 = 0
n_sudes = []
for j in es_sudeste:
  soma = data.loc[data["state"]==j].number.sum()
  soma2 = soma2 + soma
  n_sudes = soma2.astype(int)


  

In [70]:
es_nordes = ['Pernambuco', 'Sergipe', 'Alagoas', 'Bahia', 'Paraiba', 'Piaui', 'Maranhao', 'Ceara']
soma2 = 0
n_norde = []
for j in es_nordes:
  soma = data.loc[data["state"]==j].number.sum()
  soma2 = soma2 + soma
  n_norde = soma2.astype(int)


In [71]:
re = ['Norte', 'Sudeste', 'Nordeste']
q_r = [n_norte, n_sudes, n_norde]
regiões = {'Regiões': re, 'Queimadas/Região': q_r}
q_região = pd.DataFrame(regiões)

bar_plot2 = px.bar(q_região, x='Regiões', y='Queimadas/Região', color='Queimadas/Região',
                   text='Queimadas/Região',
                   labels={'Queimadas/Região': 'Número de Queimadas', 'Regiões': 'Região'})
bar_plot2.update_layout(title_text='Número de queimadas para as regiões Nordeste, Norte e Sudeste entre os anos 1998-2017')
bar_plot2.update_traces(texttemplate='%{text:.4s}', textposition='outside')
bar_plot2.show()



Não foi possível analisar as regiões Centro-Oeste e Sul, pois no caso da Centro-Oeste foi verificado um problema com o estado Mato Grosso e a ausência de Mato Grosso do Sul.

Já no caso da região Sul apenas um dos seus três estados possuía registro no banco de dados.

Ter o Nordeste como a região com mais casos é bastante significativo e de certa forma até intuitivo por se tratar da região mais árida do país, fazendo assim com que focos de incêndios possam se alastrar com relatividade facilidade.

In [75]:
fig = go.Figure()
for i in es_sudeste:
    datas = data[data['state']==i][['date','state','number']].groupby(['date','state']).mean().reset_index()
    fig.add_trace(go.Scatter(x=datas['date'], y=datas['number'], name=i,
                        line_shape='linear'))
fig.update_layout(title_text='Evolução do número de queimadas nos estados do Sudeste entre 1998-2017.',
                  xaxis_title='Ano', yaxis_title='Número de casos')
fig.show()

Na região Sudeste Espiríto Santo se destaca por raramente passar de 50 casos de queimadas por ano.

In [76]:
fig = go.Figure()
for i in es_norte:
    datas = data[data['state']==i][['date','state','number']].groupby(['date','state']).mean().reset_index()
    fig.add_trace(go.Scatter(x=datas['date'], y=datas['number'], name=i,
                        line_shape='linear'))
fig.update_layout(title_text='Evolução do número de queimadas nos estados do Norte entre 1998-2017.',
                  xaxis_title='Ano', yaxis_title='Número de casos')
fig.show()

Na região Norte todos os estados tem o mesmo perfil: números de casos variados, mas raramente abaixo de 50 por ano. 

In [77]:
fig = go.Figure()
for i in es_nordes:
    datas = data[data['state']==i][['date','state','number']].groupby(['date','state']).mean().reset_index()
    fig.add_trace(go.Scatter(x=datas['date'], y=datas['number'], name=i,
                        line_shape='linear'))
  
fig.update_layout(title_text='Evolução do número de queimadas nos estados do Nordeste entre 1998-2017.',
                  xaxis_title='Ano', yaxis_title='Número de casos')
fig.show()

Já no Nordeste os estados com menor número de incêndios são Sergipe e Alagoas, ambos sempre abaixo de 50 casos por ano. Já o estado de Pernambuco é o que mais sofre da região chegando a quase 300 queimadas em 2012 e 2016.