# Pesquisa de Opinião - Estudo de Caso


### O que é o PyMove?
O **PyMove** é uma biblioteca Python, open-source, que dispõe de operações para lidar com dados de trajetória, indo desde a representação do dado, operações de pré-processamento, modelos e técnicas de visualização.


O PyMove **oferece**:
- Uma sintaxe familiar e similar ao Pandas;
- Documentação clara;
- Extensibilidade, visto que pode-se implementar sua estrutura de dados principal manipulando outras estruturas de dados como DataFrame do Dask, arrays numpy e etc, além da adição de novos módulos;
- Flexibilidade, visto que o usuário pode alternar entre diferentes estruturas de dados;
- Operações para pré-processamento dos dados, mineração de padrões e visualização dos dados.

### Antes de tudo, é importante você entender alguns conceitos... 
- <b>Scikit Mobility</b>: é uma outra biblioteca Python para análise de trajetórias, voltada a análise de mobilidade humana.
- <b>Trajetória</b>: é um traço gerado por um objeto em movimento em espaços geográficos,  geralmente representado por uma série de pontos cronologicamente ordenados. Cada ponto consiste em coordenadas geoespaciais (latitude e longitude) e uma marcação de tempo. 
- <b>Filtragem de ruído</b>: consiste na remoção de dados que sofreram distorção devido aos ruídos, geralmente causada por falha na leitura do sensor de GPS.
- <b>Pontos de parada</b>: são pontos em que o usuário permaneceu em um parada, ou ao redor. por um determinado tempo,como uma casa, um mercado
- <b>Compressão de trajetória</b>: Consiste em reduzir o tamanho das trajetórias.

### Qual o objetivo desse notebook?
Esse notebook tem o objetivo de validar a usabilidade do PyMove, através da sua sintaxe e documentação, fazendo uma comparação com o Scikit Mobility, que 

Para isso, é disposto 6 problemas a seguir, para que você, usuário, possa experimentar o PyMove! No Final, é necessário que você responda esse <b>[formulário](https://forms.gle/n7atgxNsSXJZqkm78)</b>, para nos contar como foi a sua experiência!

### Como funciona?
Como dito, são dispostos x problemas, variando em:
- Uso da estrutura de dados do PyMove, o MoveDataFrame;
- Uso de técnicas para realizar o pré-processamento dos dados;
- Uso de técnicas para realizar a visualização dos dados.

Para cada problema deverá haver 2 soluções: utilizando o PyMove e o Scikit-Mobility. A solução deve ser feita em no <b>MÁXIMO</b> 20 minutos.

---


### Instalações...

1. Crie um ambiente utilizando o conda

`conda create -n validacao-pymove`

2. Ative o ambiente

`conda activate validacao-pymove`

#### Usando o PyMove
1. Clone o repositório 

`git clone https://github.com/InsightLab/PyMove`

2. Crie a branch developer

`git branch developer`

3. Mova-se para a branch criada 

`git checkout developer`

4. Puxe todas as alterações dessa branch

`git pull origin developer`

5. Mude-se para a pasta PyMove

`cd PyMove`

6. Para usar basta acessar normalmente através de importações! 

`import pymove`

#### Usando o Scikit Mobility
1. Clone o repositório 

`git clone https://github.com/scikit-mobility/scikit-mobility`

2. Mude-se para a pasta scikit_mobility 

`cd scikit_mobility`

3. Instale as dependências

`python setup.py install`

4.  Para usar basta acessar normalmente através de importações!

`import skmob`

---

### Material de consulta
* [Notebooks Pymove](https://github.com/InsightLab/PyMove/tree/developer/examples)
* [Notebooks scikit-mob](https://github.com/scikit-mobility/scikit-mobility/tree/master/tutorial)

---

# PROBLEMAS

### 00. Importe a biblioteca
Neste problema você deve realizar a importação da biblioteca! :)

In [2]:
# code PyMove here
import pymove

In [None]:
# code Scikit-Mobility here
import skmob

### 01. Realize a importação dos dados para a estrutura de dados adequada da biblioteca.
Neste problema você deve importar os dados `geolife.csv`. Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! :)

In [5]:
# code PyMove here
move_df = pymove.read_csv('examples/geolife_sample.csv')
move_df.head()

Unnamed: 0,lat,lon,datetime,id
0,39.984094,116.319236,2008-10-23 05:53:05,1
1,39.984198,116.319322,2008-10-23 05:53:06,1
2,39.984224,116.319402,2008-10-23 05:53:11,1
3,39.984211,116.319389,2008-10-23 05:53:16,1
4,39.984217,116.319422,2008-10-23 05:53:21,1


In [None]:
# code Scikit-Mobility here
tdf = skmob.TrajDataFrame.from_file('examples/geolife_sample.txt.gz')

### 02. Realize a filtragem de ruído dos dados.
Neste problema você deve realizar a técnica de filtrangem de ruído, que é um técnica de pré-processamento. Essa técnica pode possuir diferentes implementações. Como dito, essa técnica consiste na remoção de pontos com distorções e errôneos. Novamente, atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! :)

In [6]:
# code PyMove here
pymove.filters.outliers(move_df)


Creating or updating distance features in meters...

...Sorting by id and datetime to increase performance

...Set id as index to increase attribution performance

(217653/217653) 100% in 00:00:00.274 - estimated end in 00:00:00.000
...Reset index

..Total Time: 0.28879714012145996
...Filtring jumps 



Unnamed: 0,id,lat,lon,datetime,dist_to_prev,dist_to_next,dist_prev_to_next
148,1,39.970511,116.341455,2008-10-23 10:32:53,1452.319115,1470.641291,71.088460
338,1,39.995042,116.326465,2008-10-23 10:44:24,10.801860,10.274331,1.465144
8133,1,39.991075,116.188395,2008-10-25 08:20:19,5.090766,6.247860,1.295191
10175,1,40.015169,116.311045,2008-10-25 23:40:12,23.454754,24.899678,3.766959
13849,1,39.977157,116.327151,2008-10-26 08:13:53,11.212682,10.221164,1.004375
...,...,...,...,...,...,...,...
216877,5,39.992096,116.329136,2009-03-12 15:57:42,7.035981,6.182086,1.909349
216927,5,39.998061,116.326402,2009-03-12 16:02:17,16.758753,19.151449,4.051863
217456,5,40.001983,116.328414,2009-03-19 04:35:52,179.564668,191.030434,15.276237
217465,5,40.001433,116.321387,2009-03-19 04:41:02,77.928727,75.686512,16.676141


In [None]:
# code Scikit-Mobility here
tdf = skmob.TrajDataFrame.from_file('examples/geolife_sample.txt.gz')

### 03. Realize a detecção de pontos de parada
Neste problema você deve realizar a detecção de pontos de parada. Essa técnica, como dito acima, consiste em detectar pontos em que o usuário permaneceu em um local (não necessariamente com a mesma latitude e longitude) por um determinado tempo,como uma casa, um mercado. Novamente, essa técnica pode possuir diferentes implementações. Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! :)

In [3]:
# code PyMove here
pymove.filters.outliers(move_df)

In [None]:
# code Scikit-Mobility here
from skmob.preprocessing import filtering
ftdf = filtering.filter(tdf, max_speed_kmh=500)

### 04. Realize a compressão da tajetória
Neste problema você deve realizar a compressão da trajetória. Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! :)

In [None]:
# code PyMove here
pymove.compression.compress_segment_stop_to_point(move_df)

In [None]:
# code Scikit-Mobility here 
from skmob.preprocessing import compression
ctdf = compression.compress(ftdf, spatial_radius_km=0.2)

### 05. Realize a visualização de todas as trajetórias
Neste problema você deve realizar plotar todos os dados de trajetória, ligados por um linha. Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! :)

In [None]:
# code PyMove here

In [None]:
# code Scikit-Mobility here
map_f = tdf.plot_trajectory(max_users=1, hex_color=’#000000’)
map_f

### 0.6 Realize a visualização das rotas com maior fluxo.
Neste problema você deve realizar uma visualização que permita identificar quais os caminhos que possuem um maior fluxo. Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! 

In [5]:
# code PyMove here

In [None]:
# code Scikit-Mobility here

### 07. Realize a visualização das informações das trajetórias pelo tempo
Neste problema você deve realizar uma visualização que permita visualizar os dados de trajetória e movimento de um objeto pelo tempo (seja pelos dias, períodos do dia ou etc). Atente-se aos exemplos demonstrados nos notebooks das duas bibliotecas! 

In [6]:
# code PyMove here

In [None]:
# code Scikit-Mobility here