In [8]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [9]:
df =pd.read_csv('amazon.csv', sep = ',', encoding='ISO-8859-1')
df.head()

Unnamed: 0,year,state,month,number,date
0,1998,Acre,Janeiro,0.0,1998-01-01
1,1999,Acre,Janeiro,0.0,1999-01-01
2,2000,Acre,Janeiro,0.0,2000-01-01
3,2001,Acre,Janeiro,0.0,2001-01-01
4,2002,Acre,Janeiro,0.0,2002-01-01


In [10]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6454 entries, 0 to 6453
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   year    6454 non-null   int64  
 1   state   6454 non-null   object 
 2   month   6454 non-null   object 
 3   number  6454 non-null   float64
 4   date    6454 non-null   object 
dtypes: float64(1), int64(1), object(3)
memory usage: 252.2+ KB


In [11]:
# Criando dois dicionários
# O primeiro vai servir para implementar a coluna estações e fazer as alterações de acordo com os meses
# O segundo vai servir para ordenar as linhas de acordo com os meses, já que a coluna date inicial está errada, então eu fiz a substituição.
# O terceiro é para separar por regiões

estacao = {'Janeiro': 'Verão', 'Fevereiro': 'Verão', 'Março': 'Verão',
            'Abril': 'Outono', 'Maio': 'Outono', 'Junho': 'Outono',
            'Julho': 'Inverno', 'Agosto': 'Inverno', 'Setembro': 'Inverno',
            'Outubro': 'Primavera', 'Novembro': 'Primavera', 'Dezembro': 'Primavera'}


dict_meses = {'Janeiro': '01', 'Fevereiro': '02', 'Março': '03',
            'Abril': '04', 'Maio': '05', 'Junho': '06',
            'Julho': '07', 'Agosto': '08', 'Setembro': '09',
            'Outubro': '10', 'Novembro': '11', 'Dezembro': '12'}

regioes = {'Acre': 'Norte', 'Roraima': 'Norte', 'Amazonas': 'Norte', 'Pará': 'Norte', 'Tocantins': 'Norte',
            'Rondonia': 'Norte', 'Maranhao': 'Nordeste', 'Piau': 'Nordeste', 'Bahia': 'Nordeste',
            'Pernambuco': 'Nordeste', 'Alagoas': 'Nordeste', 'Sergipe': 'Nordeste', 'Rio Grande do Norte': 'Nordeste',
            'Ceara': 'Nordeste', 'Paraiba': 'Nordeste', 'Amapa': 'Sudeste',
            'Mato Grosso': 'Centro-Oeste', 'Distrito Federal': 'Centro-Oeste', 'Goias': 'Centro-Oeste',
            'Minas Gerais': 'Sudeste', 'Espirito Santo': 'Sudeste', 'Rio': 'Sudeste', 'Sao Paulo': 'Sudeste',
            'Parana': 'Sul', 'Santa Catarina': 'Sul', 'Rio Grande do Sul': 'Sul'}


In [12]:
# Aqui é possível ver que os meses ficaram ordenados de 1 à 12.

df['estacoes'] = df['month'].map(estacao)
df['date'] = df['month'].map(dict_meses)
df['regioes'] = df['state'].map(regioes)
df.head()

Unnamed: 0,year,state,month,number,date,estacoes,regioes
0,1998,Acre,Janeiro,0.0,1,Verão,Norte
1,1999,Acre,Janeiro,0.0,1,Verão,Norte
2,2000,Acre,Janeiro,0.0,1,Verão,Norte
3,2001,Acre,Janeiro,0.0,1,Verão,Norte
4,2002,Acre,Janeiro,0.0,1,Verão,Norte


In [13]:
# Agrupando o número de queimadas por estações do ano e achando a média.

x = df.groupby('estacoes')[['number', 'estacoes']].mean()
x


  x = df.groupby('estacoes')[['number', 'estacoes']].mean()


Unnamed: 0_level_0,number
estacoes,Unnamed: 1_level_1
Inverno,147.502996
Outono,73.414079
Primavera,145.464603
Verão,67.435718


In [14]:
# Plot do gráfico

fig = px.histogram(data_frame=df,
                    x='state', 
                    y='number',
                    color='estacoes', 
                    barmode='group', 
                    histfunc='avg')

In [15]:
# Customização do gráfico, inclusive era interessante a gente fazer uma função genérica para esses gráficos, deixaria o código mais limpo.

fig.update_layout(
    xaxis_title={
        'text': 'Estados do Brasil',
        'font_size': 12
    },
    yaxis_title={
        'text': 'Média de Queimadas Reportadas por Estado',
        'font_size': 12
    },
    legend_title={
        'text': 'Estações',
        'font_size': 12
    },
    font_color='grey',
    font_size=10,
    title={
        'text': 'Média de Queimadas por Estação do Ano',
        'x': 0.5,
        'font_family': 'Verdana',
        'font_color': 'white',
        'font_size': 16
    },
    template='plotly_dark')

ValueError: Mime type rendering requires nbformat>=4.2.0 but it is not installed

In [None]:

fig2 = px.histogram(data_frame=df,
                    x='estacoes', 
                    y='number',
                    color='regioes', 
                    barmode='group', 
                    histfunc='avg')
fig2.update_layout(
    xaxis_title={
        'text': 'Estações do Ano',
        'font_size': 12
    },
    yaxis_title={
        'text': 'Média de Queimadas Reportadas por Estado',
        'font_size': 12
    },
    legend_title={
        'text': 'Regiões do Brasil',
        'font_size': 12
    },
    font_color='grey',
    font_size=10,
    title={
        'text': 'Média de Queimadas por Estação do Ano por Regiões',
        'x': 0.5,
        'font_family': 'Verdana',
        'font_color': 'white',
        'font_size': 16
    },
    template='plotly_dark')

In [None]:
# Agrupando o número de queimadas total por ano.

df_plot = df.groupby('year')['number'].sum().reset_index().sort_values(by= 'year')
df_plot.head()

Unnamed: 0,year,number
0,1998,20013.971
1,1999,26882.821
2,2000,27351.251
3,2001,29071.612
4,2002,37390.6


In [None]:
# Plotando o gráfico de linhas

linha = px.line(data_frame=df_plot, x='year', y='number', markers=True, template='plotly_dark')
linha.update_layout(
    xaxis_title={
        'text': 'Anos',
        'font_size': 12,
    },
    yaxis_title={
        'text': 'Número de Queimadas Registradas',
        'font_size': 12
    },
    legend_title={
        'text': 'Meses',
        'font_size': 12
    },
    font_color='grey',
    font_size=10,
    title={
        'text': 'Número de Queimadas Registradas no Brasil Entre 1998 e 2016',
        'x': 0.5,
        'font_family': 'Verdana',
        'font_color': 'white',
        'font_size': 16,
        
    })

In [None]:
# Agrupando o número de queimadas por ano e meses.

df_plot2 = df.groupby(['year','month','date'])['number'].sum().reset_index().sort_values(by=['date', 'year'])
df_plot2.head()

Unnamed: 0,year,month,date,number
4,1998,Janeiro,1,0.0
16,1999,Janeiro,1,1081.0
28,2000,Janeiro,1,778.0
40,2001,Janeiro,1,547.0
52,2002,Janeiro,1,1654.0


In [None]:
# Plot do gráfico de linhas

lines = px.line(data_frame=df_plot2, x='year', y='number', color = 'month', markers=False, template='plotly_dark')
lines.update_layout(
    xaxis_title={
        'text': 'Anos',
        'font_size': 12,
    },
    yaxis_title={
        'text': 'Número de Queimadas Registradas',
        'font_size': 12
    },
    legend_title={
        'text': 'Meses',
        'font_size': 12
    },
    font_color='grey',
    font_size=10,
    title={
        'text': 'Número de Queimadas Registradas no Brasil Entre 1998 e 2016 Por Anos',
        'x': 0.5,
        'font_family': 'Verdana',
        'font_color': 'white',
        'font_size': 16,
        
    })

In [None]:
# Plot do gráfico de linhas

lines2 = px.line(data_frame=df_plot2, x='month', y='number', color = 'year', markers=False, template='plotly_dark')
lines2.update_layout(
    xaxis_title={
        'text': 'Meses',
        'font_size': 12,
    },
    yaxis_title={
        'text': 'Número de Queimadas Registradas',
        'font_size': 12
    },
    legend_title={
        'text': 'Anos',
        'font_size': 12
    },
    font_color='grey',
    font_size=10,
    title={
        'text': 'Número de Queimadas Registradas no Brasil Entre 1998 e 2016 Por Meses',
        'x': 0.5,
        'font_family': 'Verdana',
        'font_color': 'white',
        'font_size': 16,
        
    })