In [23]:
import folium
from folium.plugins import HeatMap
import pandas as pd

### Funções auxiliares

In [25]:
def visualize_heatmap(data, output_name, save_file = True):
    posix = data.index[0] 
    init_point = data['latitude'][posix], data['longitude'][posix]
    hmap = folium.Map(location = init_point, zoom_start = 9)
    hm_wide = HeatMap( list(zip(data.latitude.values, data.longitude.values)),
                       min_opacity=0.5,
                       radius = 11, blur= 15, 
                       max_zoom = 1, 
                     )
    
    if save_file:
        hmap.save(output_name + '.html')
        data.to_csv(output_name + '.csv', index = None)
    return hmap.add_child(hm_wide)

### Lendo base de dados

In [26]:
data_k = pd.read_csv('DATASET_FINAL.csv')

### Plot - Mapa com todos geopoints

In [27]:
posix = data_k.index[0] 
init_point = data_k['latitude'][posix], data_k['longitude'][posix]
hmap = folium.Map(location = init_point, zoom_start = 9)
hm_wide = HeatMap( list(zip(data_k.latitude.values, data_k.longitude.values)),
                   min_opacity=0.5,
                   radius = 11, blur= 15, 
                   max_zoom = 1, 
                 )
hmap.add_child(hm_wide)

### Ordenando por **Data/Hora** para trabalhar com os dados num sentido linear

In [30]:
data_k.sort_values(by=['date', 'time'],  inplace = True)

### Remove várias localizações duplicadas de um usuário
### Para modificar basta comentar esta linha, ou alterar o parâmetro keep (Ver a documentação)
**first: Drop duplicates except for the first occurrence.**

**last : Drop duplicates except for the last occurrence.**

In [31]:
data_k.drop_duplicates(subset='user_name', keep = 'first', inplace = True)

In [32]:
print("Total: ", len(data_k.id_str))

Total:  148


### Todos os dados de **Geopoints** abaixo desta latitude **{20.532432}** 
Esse filtro faz com que seja considerados somente os geopoints abaixo da **Big Island**

In [33]:
data_k = data_k[data_k['latitude'] < 20.532432]

In [34]:
"Total: {}".format(len(data_k))

'Total: 96'

### Data mínima e Máxima

In [38]:
print("min: ", data_k['date'].min())
print("max: ", data_k['date'].max())

min:  2018-04-29
max:  2018-05-26


### Todos os dados GEOPOINTS antes e depois de '2018-05-05'

In [39]:
data_before = data_k[data_k['date'] <= '2018-05-04']
data_after  = data_k[data_k['date'] > '2018-05-04'] 

In [40]:
print("before: ", len(data_before))
print("after: ", len(data_after))

before:  51
after:  45


In [41]:
visualize_heatmap(data_before, 'dataset_before')
visualize_heatmap(data_after, 'dataset_after')