[<img src="http://www.cba.inpe.br/imagens/INPE%20BR/logo_inpe2.gif" alt="Instituto Nacionalde Pesquisas Espaciais " width="400" align="left">](http://www.inpe.br/)<br><br><br>

# <span style="color:black">Trabalho Final da Disciplina de Introdução à Programação para Sensoriamento Remoto (SER-347)</span>
<hr style="border:0.5px solid #black;">

# <span style="color:black">Análise temporal do índice de vegetação NDVI baseados nos focos de incêndio registrados no banco BDQueimadas</span>

- Ana Lígia do Nascimento Martins
- Izak Francisco Justi

## Conceituação
<p style="text-align: justify;">O Programa de Monitoramento de Queimadas foi desenvolvido e implementado pelo Instituto Nacional de Pesquisas Espaciais (INPE), possibilitando o acompanhamento de queimadas e incêndios florestais a partir de imagens de satélites, sendo assim, uma ferramenta muito importante, principalmente em regiões remotas sem meios intensivos e locais de acompanhamento, condição dominante em grande parte do país.
O sistema é capaz de gerar e disponibilizar produtos diariamente de maneira gratuita, como coordenadas geográficas de focos de incêndio, alertas por e-mail e ocorrências em áreas de interesse especial, mapas de risco de fogo, estimativas de concentração de fumaça, mapas de áreas queimadas, entre outros. Para tanto, são utilizadas imagens processadas a partir dos sensores a bordo dos satélites NOAA-15, NOAA-18, NOAA-19, METOP-B, MODIS, NPP-Suomi, GOES-13 e MSG-3. Os dados são atualizados na página do Programa sete vezes ao dia.</p>

<p style="text-align: justify;">Os dados pontuais de focos de incêndio, gerados diariamente das diversas plataformas espaciais são armazenados em um banco de dados conhecido como [BDQueimadas](http://www.inpe.br/queimadas/bdqueimadas). Esse banco de dados pode ser acessado livremente a partir do site do Programa Queimadas, permitindo acesso a dados históricos de todo o país. Os dados podem ser obtidos em formatos com extensão CSV, GeoJSON, KML ou shapefile a escolha do usuário.</p>

<p style="text-align: justify;">O estudo do comportamento e da dinâmica dos incêndios envolvem diversos fatores como a precipitação, clima, indicadores socio-econômicos, entre outros. Um dos fatores mais importantes é a vegetação, que atua como combustível nos incêndios. Portanto, é fundamental analisar seu comportamento para melhor compreensão dos eventos de queimada.</p>

<p style="text-align: justify;">Para tanto, os índices de vegetação são uma excelente ferramenta para estudos da vegetação. Eles são obtidos a partir da razão entre as refectâncias da vegetação em determindas regiões do espectro eletromagnético. Entre eles se destacam o *Normalized Vegetation Index* (NDVI) e o *Enhanced Vegetation Index* (EVI). A fórmula para obtenção desses índices são demonstradas abaixo:</p>

*Normalized Difference Vegetation Index* \begin{align*}\textrm{NDVI}=\frac{\rho_{\textrm{nir}}-\rho_{\textrm{red}}}{\rho_{\textrm{nir}}+\rho_{\textrm{red}}}\end{align*}

*Enhanced Vegetation Index* \begin{align*}\textrm{EVI}=G \cdot \frac{\rho_{\textrm{nir}}+\rho_{\textrm{red}}}{\rho_{\textrm{nir}} + C_{\textrm{1}}  \cdot \rho_{\textrm{red}} - C_{\textrm{2}} \cdot \rho_{\textrm{blue}}  + L}\end{align*}

Onde:<br>
$\rho_{red} =$ Reflectância na banda do vermelho;<br>
$\rho_{nir} =$ Reflectância na banda do infravermelho próximo;<br>
$\rho_{blue} =$ Reflectância na banda do azul;<br>
$G = 2,5$;<br>
$L = 1$;<br>
$C_1 = 6$;<br>
$C_2 = 7,5$.

<p style="text-align: justify;">A bordo do satélite Terra e Aqua, o [sensor MODIS](https://terra.nasa.gov/about/terra-instruments/modis) possui uma ampla faixa de visualização de 2.330 km de largura, e período de revisita de 1-2 dias com sensibilidade a 36 bandas espectrais discretas. Consequentemente, o MODIS rastreia uma ampla gama de sinais vitais da Terra do que qualquer outro sensor Terra.</p>

<p style="text-align: justify;">A partir dos dados oriundos desse sensor são gerados diversos produtos periodiamente para análise da superfície terrestre entre eles o NDVI e o EVI, componentes do produto [MOD13Q1](https://lpdaac.usgs.gov/dataset_discovery/modis/modis_products_table/mod13q1_v006). Esse produto fornece os índices de vegetação de toda superfície terrestre a cada 16 dias com precisão de 250 metros o qual será utilizado para o desenvolvimento desse trabalho.</p>

## Desenvolvimento
<p style="text-align: justify;">Os dados pontuais de focos de incêndio foram obtidos do banco [BDQueimadas](http://www.inpe.br/queimadas/bdqueimadas) em formato *.shp*. Os pontos de focos de incêndio obtidos através do portal compreendem todo o município analisado por um determinado período de tempo.</p>

<p style="text-align: justify;">Além disso, foi delimitado uma área de interesse para o monitoramento também em formato *.shp*.

<p style="text-align: justify;">Ambos arquivos foram importados para o ambiente Python utilizando a biblioteca [GeoPandas](http://geopandas.org/).</p>

In [1]:
import geopandas as gpd
point = gpd.GeoDataFrame.from_file('Dados\Focos.2015-01-01.2015-12-31.shp') 
poly  = gpd.GeoDataFrame.from_file('Dados\Area_Interesse.shp')


Através da ferramenta 'sjoin' disponível na biblioteca [GeoPandas](http://geopandas.org/), foi possível selecionar apenas o pontos contidos dentro da área de interesse.

In [2]:
from geopandas.tools import sjoin
pointInPolys = sjoin(point, poly, how='left')
focos = pointInPolys[pointInPolys.index_right == 0]
focos.head()

Unnamed: 0,DataHora,Satelite,Pais,Estado,Municipi,Bioma,DiaSemCh,Precipit,RiscoFog,Latitude,Longitud,AreaIndu,FRP,geometry,index_right,id
77,2015/02/12 16:09:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0.0,0.0,-20.19133,-40.28257,,3.8,POINT (-40.28257 -20.19133),0.0,
80,2015/02/13 15:50:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0.0,0.0,-20.19165,-40.28241,,2.4,POINT (-40.28241 -20.19165),0.0,
92,2015/02/15 04:23:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0.0,0.0,-20.19436,-40.28326,,1.6,POINT (-40.28326 -20.19436),0.0,
93,2015/02/15 04:23:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0.0,0.0,-20.19012,-40.28268,,1.6,POINT (-40.28268 -20.19012),0.0,
96,2015/02/15 16:53:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0.0,0.0,-20.19333,-40.28279,,5.6,POINT (-40.28279 -20.19333),0.0,


<p style="text-align: justify;">A partir da seleção foi gerado um novo dataframe, apenas com os pontos de interesse.</p>

In [3]:
colunas = focos.columns
valores = focos.values
focos_int= gpd.GeoDataFrame(valores,columns=colunas)

<p style="text-align: justify;">Foram então adicionadas e calculadas as colunas de data inicial e final para obtenção da série temporal com auxílio da biblioteca [datetime](https://docs.python.org/2/library/datetime.html#), bem como renomeados os índices das colunas referentes a latitude e longitude. Dessa forma, padronizando o DataFrame segundo as exigências do pacote WTSS, que será utilizado posteriormente.</p>

<p style="text-align: justify;">Para execução da função, considerou-se 6 meses igual a 180 dias.</p>

In [4]:
import datetime as dt
import pandas as pd

focos_int["DataHora"] = pd.to_datetime(focos_int["DataHora"])
focos_int['start_date'] = ""
focos_int['end_date'] = ""
focos_int['label'] = "Área de Interesse"
focos_int.rename(columns={"Latitude": "latitude","Longitud": "longitude"}, inplace=True)

for j in range(len(focos_int)):
    focos_int['start_date'][j] = ((focos_int['DataHora'][j]) + dt.timedelta(days=-90)).strftime('%Y-%m-%d')
    focos_int['end_date'][j] = ((focos_int['DataHora'][j]) + dt.timedelta(days=90)).strftime('%Y-%m-%d')

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  # This is added back by InteractiveShellApp.init_path()
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  if sys.path[0] == '':


In [5]:
focos_int.head()

Unnamed: 0,DataHora,Satelite,Pais,Estado,Municipi,Bioma,DiaSemCh,Precipit,RiscoFog,latitude,longitude,AreaIndu,FRP,geometry,index_right,id,start_date,end_date,label
0,2015-02-12 16:09:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0,0,-20.1913,-40.2826,,3.8,POINT (-40.28257 -20.19133),0,,2014-11-14,2015-05-13,Área de Interesse
1,2015-02-13 15:50:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0,0,-20.1916,-40.2824,,2.4,POINT (-40.28241 -20.19165),0,,2014-11-15,2015-05-14,Área de Interesse
2,2015-02-15 04:23:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0,0,-20.1944,-40.2833,,1.6,POINT (-40.28326 -20.19436),0,,2014-11-17,2015-05-16,Área de Interesse
3,2015-02-15 04:23:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0,0,-20.1901,-40.2827,,1.6,POINT (-40.28268 -20.19012),0,,2014-11-17,2015-05-16,Área de Interesse
4,2015-02-15 16:53:00,NPP_375,Brasil,Espirito Santo,Serra,Mata Atlantica,0,0,0,-20.1933,-40.2828,,5.6,POINT (-40.28279 -20.19333),0,,2014-11-17,2015-05-16,Área de Interesse


In [15]:
import folium

locations = focos_int[['latitude', 'longitude']]
locationlist = locations.values.tolist()
len(locationlist)
locationlist


[[-20.19133, -40.28257],
 [-20.19165, -40.28241],
 [-20.19436, -40.28326],
 [-20.19012, -40.28268],
 [-20.19333, -40.28279],
 [-20.19186, -40.28313],
 [-20.19523, -40.2837],
 [-20.19242, -40.27936],
 [-20.19081, -40.28302],
 [-20.19427, -40.28238],
 [-20.19316, -40.28172],
 [-20.19508, -40.28226],
 [-20.19568, -40.28072],
 [-20.19415, -40.28204],
 [-20.1962, -40.28103],
 [-20.19206, -40.28468],
 [-20.19265, -40.28048],
 [-20.19306, -40.28299],
 [-20.19229, -40.28233],
 [-20.19571, -40.28299],
 [-20.19262, -40.28273],
 [-20.18044, -40.2781],
 [-20.17928, -40.27999],
 [-20.181, -40.278],
 [-20.17789, -40.27605]]

In [19]:
map = folium.Map(location=[-20.19133, -40.28257], zoom_start=12)

for point in range(0, len(locationlist)):
    folium.Marker(locationlist[point], popup=focos_int['Municipi'][point]).add_to(map)
map

<p style="text-align: justify;">O [WTSS](https://github.com/e-sensing/wtss.py) é um serviço da Web leve para manipular imagens de sensoriamento remoto como séries temporais. Dado um local e um intervalo de tempo, pode-se recuperar as séries temporais correspondentes como uma lista Python de valores reais.</p>

<p style="text-align: justify;">Vale ressaltar que o servidor conta com a coleção de imagens *MOD13Q1* do sensor MODIS na versão 6. O catálogo conta com imagens datadas entre 18/02/2000 a 01/01/2018. </p>

<p style="text-align: justify;">Primeiramente, é necessário conectar ao servidor de imagens. </p>

In [6]:
from wtss import wtss

w = wtss("http://www.esensing.dpi.inpe.br")


cv_scheme = w.describe_coverage("MOD13Q1")

print ("ARRAY: {}".format(cv_scheme["name"]) + ". " \
       + str (cv_scheme['description']) + " - " + str(cv_scheme['detail']))

print ("\nTIMELINE:\n{}...{}".format(cv_scheme['timeline'][0:3], \
                                     cv_scheme['timeline'][-3:]))
print ("\nATRIBUTOS:")
for el in cv_scheme['attributes']:
    att = cv_scheme['attributes'][el]
    print (el + ": " + att['description'] + ". Type: " + att['datatype'] + \
           ".Scale factor:" + str(att['scale_factor']))

ARRAY: MOD13Q1. Vegetation Indices 16-Day L3 Global 250m - https://lpdaac.usgs.gov/dataset_discovery/modis/modis_products_table/mod13q1

TIMELINE:
['2000-02-18', '2000-03-05', '2000-03-21']...['2017-12-03', '2017-12-19', '2018-01-01']

ATRIBUTOS:
mir: 250m 16 days MIR reflectance. Type: int16.Scale factor:0.0001
blue: 250m 16 days blue reflectance. Type: int16.Scale factor:0.0001
nir: 250m 16 days NIR reflectance. Type: int16.Scale factor:0.0001
red: 250m 16 days red reflectance. Type: uint16.Scale factor:0.0001
evi: 250m 16 days EVI. Type: int16.Scale factor:0.0001
ndvi: 250m 16 days NDVI. Type: int16.Scale factor:0.0001


<p style="text-align: justify;">Então, foram utilizadas funções para gerar as séries temporais (wtss_get_time_series), e gerar o gráfico de variação dos índices de vegetação (plot_time_series). </p>

<p style="text-align: justify;">Essas funções possuem código aberto e foram obtidas no seguinte endereço: </p>
- https://github.com/e-sensing/wgiss-py-webinar/blob/master/tools.py


In [7]:
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
from wtss import wtss
import json


def wtss_get_time_series(samples):
    
    w = wtss("http://www.esensing.dpi.inpe.br")
    data = pd.DataFrame()
    for i in range(len(samples)):
        ts = w.time_series("MOD13Q1", ("ndvi", "evi"), 
                           latitude=samples["latitude"][i], 
                           longitude=samples["longitude"][i], 
                           start_date=samples["start_date"][i],
                           end_date=samples["end_date"][i])
        data = pd.concat([data, 
                                pd.DataFrame({"id": i, 
                                              "label": samples["label"][i],
                                              "start_date": samples["start_date"][i],
                                              "latitude": samples["latitude"][i], 
                                              "longitude": samples["longitude"][i], 
                                              "timeline": pd.to_datetime(ts.timeline), 
                                              "ndvi": ts["ndvi"], 
                                              "evi": ts["evi"]},
                                             columns=["id", "label", "start_date", "latitude", "longitude", 
                                                      "timeline", "ndvi", "evi"])])
    return data


def plot_time_series_ndvi(data, w = 15, h = 5):
    
    labels, index_labels = np.unique(data.groupby("id").agg({"label": "first"})["label"], 
                                     return_inverse=True)
    colors = plt.cm.jet(plt.Normalize()(np.arange(len(labels))))
    
    matplotlib.style.use("ggplot")
    fig, ax = plt.subplots(1, figsize = (w, h))
    fig.subplots_adjust(bottom=0.2)

    for i, (key, grp) in enumerate(data.groupby(["id"])): 
        ax.plot((grp["timeline"] - pd.to_datetime(grp["start_date"])) / pd.Timedelta('1 days'), 
                grp["ndvi"], color=colors[index_labels][i])

 
    plt.xlabel("dias após o início da série temporal")
    plt.ylabel("NDVI")

    plt.show()
    
def plot_time_series_evi(data, w = 15, h = 5):
    
    labels, index_labels = np.unique(data.groupby("id").agg({"label": "first"})["label"], 
                                     return_inverse=True)
    colors = plt.cm.jet(plt.Normalize()(np.arange(len(labels))))
    
    matplotlib.style.use("ggplot")
    fig, ax = plt.subplots(1, figsize = (w, h))
    fig.subplots_adjust(bottom=0.2)

    for i, (key, grp) in enumerate(data.groupby(["id"])): 
        ax.plot((grp["timeline"] - pd.to_datetime(grp["start_date"])) / pd.Timedelta('1 days'), 
                grp["evi"], color=colors[index_labels][i])

    plt.xlabel("dias após o início da série temporal")
    plt.ylabel("EVI")

    plt.show()

Aplica-se então a função *wtss_get_time_series* para obter a série temporal de todos os pontos do DataFrame.

In [8]:
samples_ts = wtss_get_time_series(focos_int)
samples_ts.head()

KeyError: 'ndvi'

Reescalando os valores de NDVI e EVI da série temporal.

In [None]:
samples_ts['ndvi'] *= cv_scheme['attributes']['ndvi']['scale_factor']
samples_ts['evi'] *= cv_scheme['attributes']['evi']['scale_factor']

Plotando o gráfico com a séries temporais do NDVI.

In [None]:
plot_time_series_ndvi(samples_ts)

Plotando o gráfico com a séries temporais do EVI.

In [None]:
plot_time_series_evi(samples_ts)

Ordenando os valores de NDVI e EVI segundo as datas.

In [None]:
ndvi=samples_ts.groupby('timeline')['ndvi'].apply(list)
evi=samples_ts.groupby('timeline')['evi'].apply(list)

In [None]:
ndvi[:5]

In [None]:
evi[:5]

Obtendo as datas da série.

In [None]:
datas = []
for m in range(len(ndvi.index)):
    datas.append((ndvi.index[m]).strftime('%d/%m/%Y'))

Plotando gráfico estatístico de NDVI.

In [None]:
fig, ax1 = plt.subplots(figsize=(20, 15))
fig.canvas.set_window_title('Distribuicao estatistica NDVI')
fig.subplots_adjust(left=0.075, right=0.95, top=0.9, bottom=0.25)

bp = ax1.boxplot(ndvi, notch=False, sym='+', vert=True, whis=1.5, meanline=True, showmeans=True, showfliers=False)

ax1.yaxis.grid(True, linestyle='-', which='major', color='lightgrey',
               alpha=0.5)

ax1.set_axisbelow(True)
ax1.set_title('Distribuição estatística do valor de NDVI', fontdict={'size': 25,'weight': 'bold'})
ax1.set_xlabel('Tempo', fontdict={'size': 20})
ax1.set_ylabel('NDVI', fontdict={'size': 20})

          
top = 1
bottom = 0
ax1.set_ylim(bottom, top)
ax1.set_xticklabels(datas, rotation=90, fontsize=15)
ax1.set_yticklabels([0,0.2,0.4,0.6,0.8,1], fontsize=15)

plt.show()

Plotando gráfico estatístico de EVI.

In [None]:
fig, ax1 = plt.subplots(sharey=True,figsize=(20, 15))
fig.canvas.set_window_title('Distribuicao estatistica EVI')
fig.subplots_adjust(left=0.075, right=0.95, top=0.9, bottom=0.25)

bp = ax1.boxplot(evi, notch=False, sym='+', vert=True, whis=1.5, meanline=True, showmeans=True, showfliers=False)

ax1.yaxis.grid(True, linestyle='-', which='major', color='lightgrey',
               alpha=0.5)

ax1.set_axisbelow(True)
ax1.set_title('Distribuição estatística do valor de EVI', fontdict={'size': 25,'weight': 'bold'})
ax1.set_xlabel('Tempo', fontdict={'size': 20})
ax1.set_ylabel('EVI', fontdict={'size': 20})

          
top = 1
bottom = 0
ax1.set_ylim(bottom, top)
ax1.set_xticklabels(datas, rotation=90, fontsize=15)
ax1.set_yticklabels([0,0.2,0.4,0.6,0.8,1], fontsize=15)

plt.show()

Plotando o gráfico comparativo entre ambos índices.

In [None]:
from matplotlib.patches import Polygon

numDists = len(datas)
randomDists = datas
data = []

for l in range(len(datas)):
    data.append(np.array(ndvi[l]))
    data.append(np.array(evi[l]))


fig, ax1 = plt.subplots(figsize=(20,15))

fig.subplots_adjust(left=0.075, right=0.95, top=0.9, bottom=0.25)

bp = ax1.boxplot(data, notch=0, sym='+', vert=1, whis=1.5, showfliers=False)
plt.setp(bp['boxes'], color='black')
plt.setp(bp['whiskers'], color='black')
plt.setp(bp['medians'], color='red',linestyle='-')

ax1.yaxis.grid(True, linestyle='--', which='major', color='lightgrey',
               alpha=0.5)


ax1.set_axisbelow(True)
ax1.set_title('Comparação entre as distribuições estatísticas entre NDVI e EVI', fontdict={'size': 25,'weight': 'bold'})
ax1.set_xlabel('Data', fontdict={'size': 20,'weight': 'normal', 'style':'italic'})
ax1.set_ylabel('Valor', fontdict={'size': 20,'weight': 'normal', 'style':'italic'})


boxColors = ['teal', 'green']
numBoxes = numDists*2
medians = list(range(numBoxes))
for i in range(numBoxes):
    box = bp['boxes'][i]
    boxX = []
    boxY = []
    for j in range(5):
        boxX.append(box.get_xdata()[j])
        boxY.append(box.get_ydata()[j])
    boxCoords = np.column_stack([boxX, boxY])
    
    k = i % 2
    boxPolygon = Polygon(boxCoords, facecolor=boxColors[k])
    ax1.add_patch(boxPolygon)
    
    med = bp['medians'][i]
    medianX = []
    medianY = []
    for j in range(2):
        medianX.append(med.get_xdata()[j])
        medianY.append(med.get_ydata()[j])
        ax1.plot(medianX, medianY, 'k')
        medians[i] = medianY[0]
    ax1.plot([np.average(med.get_xdata())], [np.average(data[i])],
             color='black', marker='o', markeredgecolor='k')

top = 1
bottom = 0
ax1.set_ylim(bottom, top)
ax1.set_xticklabels(np.repeat(randomDists, 2),
                    rotation=90, fontsize=13)
ax1.set_yticklabels([0,0.2,0.4,0.6,0.8,1], fontsize=13)

pos = np.arange(numBoxes) + 1
upperLabels = [str(np.round(s, 2)) for s in medians]
for tick, label in zip(range(numBoxes), ax1.get_xticklabels()):
    k = tick % 2
    ax1.text(pos[tick], top - (top*0.05), upperLabels[tick],
             horizontalalignment='center', weight='normal',
             color=boxColors[k],
                    rotation=90)

fig.text(0.80, 0.08, 'NDVI',
         backgroundcolor=boxColors[0], color='black', weight='roman',
         size='x-large')
fig.text(0.80, 0.045, 'EVI   ',
         backgroundcolor=boxColors[1],
         color='white', weight='roman', size='x-large')
fig.text(0.80, 0.015, 'o', color='black',
         weight='roman', size='x-large')
fig.text(0.815, 0.013, ' Média', color='black', weight='roman',
         size='x-large')

plt.show()
