# Exemplo de notebook python para fazer leitura direta dos arquivos de dados abertos do Programa Queimadas do INPE

Este doc foi produzido no dia 15/09/2023 por Fabiano Morelli para registrar um exemplo de como pode ser feito o download e leitura para análise em um Pandas Dataframe dos dados disponibilizados pelo Programa Queimadas do INPE. Os dados originais podem ser encontrados no endereço www.inpe.br/queimadas 

In [41]:
# 1 - importacao de bibliotecas necessárias
import pandas as pd
import urllib3
import requests
urllib3.disable_warnings()
import sys, os

In [42]:
# 2 - Definição de endereço de download e nome do arquivo de saída baseado no nome de entrada

# url = 'https://dataserver-coids.inpe.br/queimadas/queimadas/focos/csv/mensal/focos_mensal_202309.csv'
url = 'https://dataserver-coids.inpe.br/queimadas/queimadas/focos/csv/mensal/Brasil/focos_mensal_br_202309.csv'
# url = 'https://dataserver-coids.inpe.br/queimadas/queimadas/focos/csv/diario/Brasil/focos_diario_br_20230914.csv'
filename = os.path.basename(url)


In [32]:
print(filename)

focos_mensal_br_202309.csv


In [33]:
# 3 - Criação de uma função para download dos arquivos

def download_file(url, filename):
    ''' Downloads file from the url and save it as filename '''
    # check if file already exists
    if not os.path.isfile(filename):
        print('Downloading File')
        response = requests.get(url, verify=False)
        # Check if the response is ok (200)
        if response.status_code == 200:
            # Open file and write the content
            with open(filename, 'wb') as file:
                # A chunk of 128 bytes
                for chunk in response:
                    file.write(chunk)
        print('Download finished')
    else:
        print('File exists')


In [34]:
# 4 - Executa a funcao e realiza o download

download_file(url, filename)

Downloading File
Download finished


In [35]:
# 5 - leitura dos dados no Pandas Dataframe
df = pd.read_csv(filename, index_col='id', parse_dates=['data_hora_gmt'])

In [37]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 494698 entries, 3fc06b30-c10e-3e80-9afc-4997dcf49d0e to 03b0e3fa-f1e7-3820-b9dd-e36e04b4b927
Data columns (total 15 columns):
 #   Column                 Non-Null Count   Dtype         
---  ------                 --------------   -----         
 0   lat                    494698 non-null  float64       
 1   lon                    494698 non-null  float64       
 2   data_hora_gmt          494698 non-null  datetime64[ns]
 3   satelite               494698 non-null  object        
 4   municipio              494698 non-null  object        
 5   estado                 494698 non-null  object        
 6   pais                   494698 non-null  object        
 7   municipio_id           494698 non-null  int64         
 8   estado_id              494698 non-null  int64         
 9   pais_id                494698 non-null  int64         
 10  numero_dias_sem_chuva  0 non-null       float64       
 11  precipitacao           0 non-null       floa

In [38]:
# Verifica a quantidade de focos por satélite

df.satelite.value_counts()

GOES-16      168803
NOAA-20      142023
NPP-375      106493
NPP-375D      40033
AQUA_M-T      22219
TERRA_M-T      7449
TERRA_M-M      5706
AQUA_M-M       1972
Name: satelite, dtype: int64

In [39]:
# Verifica a quantidade de focos por pais

df.pais.value_counts()

Brasil    494698
Name: pais, dtype: int64

In [40]:
# Verifica a quantidade de focos por estados

df.estado.value_counts()

PARÁ                   108167
AMAZONAS                92663
MATO GROSSO             59533
MARANHÃO                56630
RONDÔNIA                37940
PIAUÍ                   37315
TOCANTINS               30616
BAHIA                   18805
ACRE                    14770
MINAS GERAIS            10341
GOIÁS                   10259
CEARÁ                    3442
SÃO PAULO                2973
AMAPÁ                    2639
MATO GROSSO DO SUL       2103
RORAIMA                  2014
PERNAMBUCO               1448
RIO DE JANEIRO            756
PARAÍBA                   681
PARANÁ                    566
RIO GRANDE DO NORTE       358
ESPÍRITO SANTO            213
SANTA CATARINA            150
RIO GRANDE DO SUL         125
DISTRITO FEDERAL          112
ALAGOAS                    51
SERGIPE                    28
Name: estado, dtype: int64