<a href="https://colab.research.google.com/github/rlrocha/infovis_tp3/blob/main/MC2_v3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# VAST Challenge 2021: Mini-Challenge 2
Rafael Rocha  
Gerson Serejo

In [1]:
import pandas as pd
import altair as alt
import numpy as np
from datetime import datetime

In [2]:
alt.data_transformers.disable_max_rows()

DataTransformerRegistry.enable('default')

In [3]:
df = pd.read_csv('https://raw.githubusercontent.com/rlrocha/infovis_tp3/main/datasets/linked_v2.csv')

In [4]:
df.head()

Unnamed: 0,timestamp,location,price,last4ccnum,link,loyaltynum
0,2014-01-06 07:28:00,Brew've Been Served,11.34,4795,both,L8566
1,2014-01-06 07:34:00,Hallowed Grounds,52.22,7108,credit,L6544
2,2014-01-06 07:35:00,Brew've Been Served,8.33,6816,both,L8148
3,2014-01-06 07:36:00,Hallowed Grounds,16.72,9617,both,L5553
4,2014-01-06 07:37:00,Brew've Been Served,4.24,7384,both,L3800


## MC2.1
Os locais mais populares foram definidos como os que possuem as maiores quantidades de compras no cartão de débito, crédito e/ou fidelidade. A visualização 1 mostra a quantidade de compras por local, onde nota-se que os locais mais populares são **Katerina's Café**, **Hippokampos**, **Brew've Been Served**, **Guy's Gyros** e **Hallowed Grounds**. No local **Katerina's Café**, as maiores quantidades de compras são feitas nos dias 14 e 16, com 22 compras em cada um desses dias, conforme pode ser vista pela interação entre as visualizações 1 e 2.

In [5]:
selection = alt.selection_interval()

local_compra = alt.Chart(df).mark_bar(tooltip=True).encode(
    y=alt.Y('count()', title='Quantidade de compras'),
    x=alt.X('location', stack='normalize', sort=alt.EncodingSortField(field="location", op="count", order="descending"), title='Local'),
    text='count()',
    tooltip = [alt.Tooltip('count()', title='Quantidade de compras'),
               alt.Tooltip('location', title='Local')]
).properties(
    width=550,
    height=150
).add_selection(
    selection
)

local_dia = alt.Chart(df).mark_rect(tooltip=True).encode(
    alt.Y('location:N', title='Local', stack='normalize', sort=alt.EncodingSortField(field="location", op="count", order="descending")),
    alt.X('date(timestamp):T', title='Dia'),
    alt.Color('count()', title='Quantidade de compras', scale=alt.Scale(scheme='yellowgreenblue')),
    tooltip = [alt.Tooltip('location:N', title='Local'),
               alt.Tooltip('date(timestamp):T'),
               alt.Tooltip('day(timestamp):T', title='Dia da semana'), 
               alt.Tooltip('count()')]
).transform_filter(selection).properties(
    width=350,
    height=350
)


alt.concat(local_compra, local_dia.interactive())
#chart1 | chart2

As visualizações 3 e 4 apresentam o número do cartão que realizou a compra pela hora da compra, onde a cor e tamanho dos círculos representam o total gasto por este cartão. A visualização 1 representa o local **Brew've Been Served** no dia 08 e a visualização 2 representa o local **Katerina's Café** no dia 14, as escolhas desses dias representam um dos dias que tiveram uma grande quantidade de compras nestes locais. Os círculos centrados na hora 00:00 representam as compras feitas somente no cartão fidelidade, já que os dados referentes a este apresentam somente o dia da compra e a ligação entre os dados dos cartões de crédito e fidelidade não foi bem-sucedida. Observa-se que o local da visualização 3 é frequentado entre 07:00 e 08:00 para o café da manhã, e o local da visualização 4 é utlizada tanto para o almoço quanto para o jantar, entre 12:00-15:00 e 19:00-21:00, respectivamente.

In [6]:
ts_min = '2014-01-14 00:00:00'
ts_max = '2014-01-14 23:59:59'

fmt = '%Y-%m-%d %H:%M:%S'

df_1 = df.loc[(df['timestamp'] >= ts_min) & (df['timestamp'] <= ts_max) & (df['location']=='Katerinas Cafe')]

kc_cartaoXhora = alt.Chart(df_1).mark_circle(tooltip=True).encode(
    alt.Y('last4ccnum:N', title='Número do cartão'),
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Color('sum(price)', title='Total gasto'),
    alt.Size('sum(price)', title='Total gasto'),
    tooltip = [alt.Tooltip('last4ccnum:N', title='Número do cartão'),
               alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('sum(price)', title='Total gasto')]
).properties(title='Katerina\'s Café, dia 14/01/2014')

ts_min = '2014-01-08 00:00:00'
ts_max = '2014-01-08 23:59:59'

fmt = '%Y-%m-%d %H:%M:%S'

df_2 = df.loc[(df['timestamp'] >= ts_min) & (df['timestamp'] <= ts_max) & (df['location']=='Brew\'ve Been Served')]

bbs_cartaoXhora = alt.Chart(df_2).mark_circle(tooltip=True).encode(
    alt.Y('last4ccnum:N', title='Número do cartão'),
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Color('sum(price)', title='Total gasto', scale=alt.Scale(scheme='greens')),
    alt.Size('sum(price)', title='Total gasto'),
    tooltip = [alt.Tooltip('last4ccnum:N', title='Número do cartão'),
               alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('sum(price)', title='Total gasto')]
).properties(title='Brew\'ve Been Served, dia 08/01/2014')

alt.concat(bbs_cartaoXhora, kc_cartaoXhora).resolve_scale(
    color='independent',
    size='independent'
)

A visualização 5 apresenta os cinco locais mais populares, e mais quatro locais que apresentam possíveis anomalias no horário das compras. Dos cinco locais mais populares, três são frequentados durante o almoço e jantar e dois no café da manhã. Os locais **Coffee Shack**, **Brewed Awakenings**, **Bean There Done That** e **Jack's Magical Beans** apresentam anomalias no horário das compras realizadas neles, ondes todas essas ocorrem exatamente as 12:00, com exceção das compras realizadas somente no cartão fidelidade (horário 00:00). Para corrigir essas anomalias, é necessário analisar a rotina das pessoas em Abila, onde elas vão durante o café, almoço e jantar, quanto tempo ficam paradas em determinado local, e com a ajuda dos locais mais populares, é possível inferir o local e horário aproximado das compras.

In [7]:
# Explorar o 1415
df_3 = df.loc[(df['location']=='Katerinas Cafe') | (df['location']=='Hippokampos') | (df['location']=='Brew\'ve Been Served') |
              (df['location']=='Guy\'s Gyros') | (df['location']=='Hallowed Grounds') | (df['location']=='Bean There Done That') |
              (df['location']=='Brewed Awakenings') | (df['location']=='Coffee Shack') | (df['location']=='Jack\'s Magical Beans')]

ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 23:59:59'

fmt = '%Y-%m-%d %H:%M:%S'

df_3 = df_3.loc[(df_3['timestamp'] >= ts_min) & (df_3['timestamp'] <= ts_max)]

selection = alt.selection_interval()

chart8 = alt.Chart(df_3).mark_circle(tooltip=True).encode(
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Y('location', title='Local', stack='normalize', sort=alt.EncodingSortField(field="location", op="count", order="ascending")),
    alt.Color('count()', title='Quantidade de compras'),
    alt.Size('count()', title='Quantidade de compras'),
    tooltip = [alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('location', title='Local'),
               alt.Tooltip('date(timestamp):N'),
               alt.Tooltip('count()', title='Quantidade de compras')]
).add_selection(
    selection
)

chart9 = alt.Chart(df_3).mark_bar(tooltip=True).encode(
    alt.Y('sum(price)'),
    alt.X('last4ccnum:N'),
    #alt.Color('loyaltynum'),
    tooltip = [alt.Tooltip('sum(price)'), 
               alt.Tooltip('last4ccnum:N'),
               alt.Tooltip('date(timestamp):N')]
).transform_filter(selection)

alt.concat(chart8, chart9).resolve_scale(
    color='independent',
    size='independent'
)

## MC2.2

In [8]:
url_mapa = "https://raw.githubusercontent.com/rlrocha/infovis_tp3/main/datasets/Abila.json"

In [9]:
location = [{'location':'Abila Airport', 'lat': 36.050969835000004, 'long':24.825931275000002},
            {'location':'U-Pump', 'lat': 36.06774866000001, 'long': 24.87149411},
            {'location':'Brew\'ve Been Served', 'lat': 36.054035845, 'long': 24.901202945},
            {'location':'Kalami Kafenion', 'lat': 36.06583318, 'long': 24.852373035},
            {'location':'Katerinas Cafe', 'lat': 36.054455715, 'long': 24.89992967},
            {'location':'Guy\'s Gyros', 'lat': 36.055821304999995, 'long': 24.902547795},
            {'location':'Gelatogalore', 'lat': 36.059754534999996, 'long': 24.857996489999998},
            {'location':'Abila Zacharo', 'lat': 36.063474475, 'long': 24.851022675000003},
            {'location':'Ouzeri Elian', 'lat': 36.051949135, 'long': 24.870791035},
            {'location':'Albert\'s Fine Clothing', 'lat': 36.075254834999996, 'long': 24.856285624999998},
            {'location':'Frydos Autosupply n\' More', 'lat': 36.054957035, 'long': 24.90179316},
            {'location':'Kronos Pipe and Irrigation', 'lat': 36.065317754999995, 'long': 24.83316992},
            {'location':'Maximum Iron and Steel', 'lat': 36.064047035, 'long': 24.841404535000002},
            {'location':'Carlyle Chemical Inc.', 'lat': 36.058546379999996, 'long': 24.880893345},
            {'location':'Stewart and Sons Fabrication', 'lat': 36.054174625, 'long': 24.908116145},
            {'location':'Nationwide Refinery', 'lat': 36.058443929999996, 'long': 24.88549086},
            {'location':'Abila Scrapyard', 'lat': 36.074389929999995, 'long': 24.845948915},
            {'location':'Frank\'s Fuel', 'lat': 36.072162109999994, 'long': 24.84133855},
            {'location':'Hippokampos', 'lat': 36.076641, 'long': 24.857599},
            {'location':'Shoppers\' Delight', 'lat': 36.052859225000006, 'long': 24.868597705},
            {'location':'Hallowed Grounds', 'lat': 36.063658185, 'long': 24.885897815},
            {'location':'Daily Dealz', 'lat': 36.06644339, 'long': 24.88264199}, # suposta localização
            {'location':'General Grocer', 'lat': 36.06033762, 'long': 24.85653086},
            {'location':'Octavio\'s Office Supplies', 'lat': 36.05856317, 'long': 24.857921935},
            {'location':'Ahaggo Museum', 'lat': 36.07714712, 'long': 24.87619283},
            {'location':'Chostus Hotel', 'lat': 36.0706817, 'long': 24.895260595},
            {'location':'Bean There Done That', 'lat': 36.081803, 'long': 24.85095648},
            #{'location':'Coffee Shack', 'lat': 36.073331815, 'long': 24.864186930000002}, # suposta localização
            {'location':'Brewed Awakenings', 'lat': 36.073336850000004, 'long': 24.864171759999998}, # suposta localização
            {'location':'Coffee Cameleon', 'lat': 36.05467411, 'long': 24.889794995},
            {'location':'Desafio Golf Course', 'lat': 36.0895915, 'long': 24.860744415},
            {'location':'GAStech', 'lat': 36.048022, 'long': 24.879522},
            {'location':'Jack\'s Magical Beans', 'lat': 36.067529035, 'long': 24.87335874},
            {'location':'Roberts and Sons', 'lat': 36.063299425, 'long': 24.85228613},
            {'location':'Kronos Mart', 'lat': 36.06585217, 'long': 24.84982234}
           ]

In [10]:
df_gps = pd.read_csv('https://raw.githubusercontent.com/rlrocha/infovis_tp3/main/datasets/gps_v2.csv')
df_gps.head()

Unnamed: 0,Timestamp,id,lat,long
0,2014-01-06 06:28:01,35,36.076225,24.874689
1,2014-01-06 06:28:01,35,36.07622,24.874596
2,2014-01-06 06:28:03,35,36.076211,24.874443
3,2014-01-06 06:28:05,35,36.076217,24.874253
4,2014-01-06 06:28:06,35,36.076214,24.874167


In [11]:
df_location = pd.DataFrame(location)
df_location.head()

Unnamed: 0,location,lat,long
0,Abila Airport,36.05097,24.825931
1,U-Pump,36.067749,24.871494
2,Brew've Been Served,36.054036,24.901203
3,Kalami Kafenion,36.065833,24.852373
4,Katerinas Cafe,36.054456,24.89993


In [12]:
# ID's 17 e 18 padrões normais, café, almoço e janta.

ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 23:30:00'

fmt = '%Y-%m-%d %H:%M:%S'

# 2
#df_gps_filter = df_gps.loc[(df['Timestamp'] >= ts_min) & (df['Timestamp'] <= ts_max) & (df['id'] == 17)]
df_gps_filter = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & ( (df_gps['id'] == 17) | (df_gps['id'] == 18))]

df_location_filter = df_location.loc[(df_location['location']=='Katerinas Cafe') | (df_location['location']=='Hippokampos') |
                                     (df_location['location']=='Brew\'ve Been Served') | (df_location['location']=='Guy\'s Gyros') |
                                     (df_location['location']=='Hallowed Grounds') | (df_location['location']=='GAStech')]

In [13]:
alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    alt.Chart(df_location_filter).mark_circle(size=50).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        tooltip=['location']
    )
).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

In [14]:
ids = list(df_gps_filter['id'].unique())

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)


alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_gps_filter).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.01)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

In [15]:
df_location_filter = df_location.loc[(df_location['location']=='Katerinas Cafe') | (df_location['location']=='Hippokampos') |
                                     (df_location['location']=='Brew\'ve Been Served') | (df_location['location']=='Guy\'s Gyros') |
                                     (df_location['location']=='Hallowed Grounds') | (df_location['location']=='GAStech')]

In [16]:
ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 10:30:00'

df_cafe = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & ( (df_gps['id'] == 17) | (df_gps['id'] == 18))]

ts_min = '2014-01-06 11:00:00'
ts_max = '2014-01-06 15:30:00'

df_almoco = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & ( (df_gps['id'] == 17) | (df_gps['id'] == 18))]

ts_min = '2014-01-06 17:00:00'
ts_max = '2014-01-06 23:30:00'

df_jantar = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & ( (df_gps['id'] == 17) | (df_gps['id'] == 18))]

In [17]:
ids = list(df_cafe['id'].unique())

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)


cafe = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_cafe).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.01)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=300,
    height=300
)

almoco = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_almoco).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.01)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=300,
    height=300
)

jantar = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_jantar).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.01)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=300,
    height=300
)

alt.concat(cafe, almoco, jantar).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

Dois locais são os mais populares entre os locais de parada para o café da manhã, que são **Brew've Been Served** e **Hallowed Grounds**. Logo para analisar as anomalias das 12:00 horas, busca-se encontrar locais que são paradas para o café da manhã com o intuito de avaliar se as compras feitas exatamente as 12:00 são realizadas durante o período de café da manhã. A visualização 10 apresenta o local e hora de compras realizados por alguns cartões que estão na anomalia das 12:00. Nessa visualização, notam-se compras feita entre as 12:00 e as 15:00 indicando compras feitas durante o almoço, e compras feita entre 19:00 e 21:00, indicando compras feitas durante o jantar. Logo, é possível supor que as compras feitas nos locais das anomalias das 12:00 são provavelmente feitas para o café da manhã.

In [18]:
df.head()

Unnamed: 0,timestamp,location,price,last4ccnum,link,loyaltynum
0,2014-01-06 07:28:00,Brew've Been Served,11.34,4795,both,L8566
1,2014-01-06 07:34:00,Hallowed Grounds,52.22,7108,credit,L6544
2,2014-01-06 07:35:00,Brew've Been Served,8.33,6816,both,L8148
3,2014-01-06 07:36:00,Hallowed Grounds,16.72,9617,both,L5553
4,2014-01-06 07:37:00,Brew've Been Served,4.24,7384,both,L3800


In [19]:
df_filter = df.loc[(df['last4ccnum']== 1415) | (df['last4ccnum']== 1877) | (df['last4ccnum']== 2463) | (df['last4ccnum']== 6899) |
                   (df['last4ccnum']== 8156) | (df['last4ccnum']== 8332)]


ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 23:59:59'

df_filter = df_filter.loc[(df_filter['timestamp'] >= ts_min) & (df_filter['timestamp'] <= ts_max)]

last4ccnums = list(df_filter['last4ccnum'].unique())
last4ccnums.sort()

selection_cc = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['last4ccnum'], # Seleção somente no campo cidade
    init={'last4ccnum': last4ccnums[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=last4ccnums) # vincula um menu ao nome das cidades
)

local_hora_cartao = alt.Chart(df_filter).mark_circle(tooltip=True).encode(
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Y('location', title='Local'),
    #alt.Color('count()', title='Quantidade de compras'),
    alt.Size('sum(price)', title='Total gasto'),
    color=alt.condition(selection_cc, "last4ccnum:N" ,alt.value("darkgrey"), title='Número do cartão'),
    opacity=alt.condition(selection_cc, alt.value(.9),alt.value(.05)),
    tooltip = [alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('location', title='Local'),
               alt.Tooltip('sum(price)', title='Total gasto')]
).add_selection(selection_cc)

local_hora_cartao

Para avaliar as anomalias com base nos dados do GPS, é analisada a rotina dos veículos (ID). As visualizações 7, 8 e 9 apresentam a rotina do ID 18 no dia 6. Essa rotina é comum a muitos ID's, já que apresentam atividades básicas durante o dia, que são café da manhã, almoço e jantar. Durante a manhã, o ID 18 faz a rota até a **GAStech**, porém realiza uma parada para o café da manhã em **Hallowed Grounds** (das 07:14 as 07:41). No início da tarde, o ID 18 se move até **Katerina's Café** para o almoço, e ao final da tarde e à noite, realiza o percurso da **GAStech** até seu local de moradia e vai para o **Katerina's Café** para o jantar. Todos esses locais visitados pelo ID 18 estão entre os locais mais populares.

In [20]:
id_curr = 18
dia = '2014-01-06 '

ts_min = dia + '00:00:00'
ts_max = dia + '10:30:00'

df_cafe = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

ts_min = dia + '11:00:00'
ts_max = dia + '15:30:00'

df_almoco = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

ts_min = dia + '17:00:00'
ts_max = dia + '23:30:00'

df_jantar = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

cafe = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_cafe).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=200,
    height=200
)

almoco = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_almoco).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=200,
    height=200
)

jantar = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_jantar).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=200,
    height=200
)

alt.concat(cafe, almoco, jantar).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

O carro de ID 2 apresenta um comportamento que indica um possível relacionamento com as anomalias das 12:00, como mostra as visualizações abaixo. O veículo sai de seu local de moradia, para das 07:34 as 08:11 no local de latitude 36.081803 e longitude 24.85095648, o qual aparenta ser um dos locais envolvidos com as anomalias. Após essa parada para um possível café da manhã, o veículo vai em direção a **GAStech**. Em seguida, para o almoço, o veículo vai em direção ao **Guy's Gyros**, ao final da tarde ele sai da **GAStech** em direção a sua moradia e por fim vai jantar no **Hippokampos**.

In [21]:
id_curr = 2
dia = '2014-01-06 '

ts_min = dia + '00:00:00'
ts_max = dia + '10:30:00'

df_cafe = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

ts_min = dia + '11:00:00'
ts_max = dia + '15:30:00'

df_almoco = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

ts_min = dia + '17:00:00'
ts_max = dia + '23:30:00'

df_jantar = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id_curr)]

cafe = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_cafe).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

almoco = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_almoco).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

jantar = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_jantar).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

alt.concat(cafe, almoco, jantar).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

Além das discrepâncias entre as compras realizadas somente no cartão fidelidade (as quais não sabemos a hora da compra, mas somente o dia) e das anomalias das compras das 12:00 em relação aos dados do GPS, nota-se algumas compras improváveis de acontecer, como as compras do cartão 6899 no dia 06, visualização acima. Essas compras indicam duas compras realizada em locais de café da manhã, a saber: **Hallowed Grounds** e **Jack's Magical Beans** (anomalia 12:00), além duas compras em locais distintos para o almoço, que são: **Hippokampos** e **Katerina's Café**.

## MC2.3
Para inferir os donos dos cartões de crédito e fidelidade utiliza-se o horário e o local das compras. Duas abordagens são feitas. Na primeira, é analisada a diferença temporal entre uma coordenada para a seguinte, onde qualquer diferença maior que 5 minutos, é considerada como uma parada, a qual pode indicar uma compra no local específico da coordenada média. Por exemplo, um determinado veículo parou as 08:00:00 e começou a se mover novamente as 08:15:00 (ficou parado 15 minutos), onde a coordenada média é a média entre a coordenada referente a 08:00:00 e a coordenada 08:15:00. Desse modo é possível obter não só o ID do veículo relacionado a compra em determinado local usando determinado cartão de crédito e cartão fidelidade, mas também a coordenada aproximada do local onde foi realizada a compra, e a partir disso, pode-se inferir outros locais e compras realizadas por este cartão e/ou outros ID's que realizam compras neste local.  
A visualização à esquerda apresenta a coordenadas dos locais cujos ID's apresentam um tempo de parada maior que 5 minutos entre 00:00:00 e 08:30:00 do dia 06. A visualização à direita apresenta a rota dos ID's que realizaram essa parada. Ao analisar o ID 101, nota-se realiza uma rota e para as 07:45:00 no local que provavelmente seja o **Abila Airport** e se move novamente as 08:24:00, indicando uma possível compra realizada neste local durante esse período. A visualização abaixo apresenta alguns locais e horas de compras realizadas por alguns cartões, e é possível notar que o cartão 9220 realiza uma compra as 08:23:00 no **Abila Airport**, logo é possível inferir que o ID 101 é o dono do cartão 9220.

In [22]:
ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 08:30:00'

fmt = '%Y-%m-%d %H:%M:%S'

In [23]:
id_list = list(df_gps['id'].unique())

id2_list = []
lat_list = []
long_list = []
t1_list = []
t2_list = []

for id in id_list:
    df_temp = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == id)]

    index_list = list(df_temp.index)

    for i in range(np.size(index_list)-1):

        t1 = datetime.strptime(df_temp['Timestamp'][index_list[i]], fmt)
        t2 = datetime.strptime(df_temp['Timestamp'][index_list[i+1]], fmt)

        td = t2-t1

        td_mins = (td.total_seconds()/60)

        if td_mins>=5:
            
            lat1 = df_temp['lat'][index_list[i]]
            lat2 = df_temp['lat'][index_list[i+1]]
            long1 = df_temp['long'][index_list[i]]
            long2 = df_temp['long'][index_list[i+1]]

            id2_list.append(id)
            
            t1_list.append(t1)
            t2_list.append(t2)
            
            lat = (lat1 + lat2)/2
            long = (long1 + long2)/2

            lat_list.append(lat)
            long_list.append(long)

In [24]:
coord_dict = {'id': id2_list,
              't1': t1_list,
              't2': t2_list,
              'lat': lat_list,
              'long': long_list}

In [25]:
df_coord = pd.DataFrame(coord_dict)
df_coord.head()

Unnamed: 0,id,t1,t2,lat,long
0,35,2014-01-06 06:33:01,2014-01-06 07:05:01,36.06753,24.873337
1,4,2014-01-06 06:35:24,2014-01-06 06:53:01,36.073333,24.864203
2,4,2014-01-06 06:53:01,2014-01-06 07:15:01,36.073336,24.864177
3,19,2014-01-06 06:57:01,2014-01-06 07:40:01,36.08176,24.850918
4,10,2014-01-06 07:01:01,2014-01-06 07:34:01,36.073332,24.864187


In [26]:
df_coord.loc[df_coord['id']==101]

Unnamed: 0,id,t1,t2,lat,long
26,101,2014-01-06 07:45:49,2014-01-06 08:24:01,36.05097,24.825931


In [27]:
df_location_filter = df_location.loc[(df_location['location']=='Abila Airport') | (df_location['location']=='Coffee Cameleon') |
                                     (df_location['location']=='Brew\'ve Been Served') | (df_location['location']=='Jack\'s Magical Beans') |
                                     (df_location['location']=='Hallowed Grounds') | (df_location['location']=='GAStech') |
                                     (df_location['location']=='Brewed Awakenings') | (df_location['location']=='Bean There Done That')]

In [28]:
ids = list(df_coord['id'].unique())
ids.sort()

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)

#selection = alt.selection_multi(encodings=['x', 'y'])
#selection = alt.selection_interval()
selection = alt.selection_single(on='mousedown', fields=['id'], empty='none')

id_parada = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_coord).mark_circle(size=50).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('id:N'),
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'id', 'hoursminutes(t1):T', 'hoursminutes(t2):T']
    ).add_selection(selection_id)
)
#.configure_view(
#    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
#)

df_gps_filter = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max)]

id_rota = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_gps_filter).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.005)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):T']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location:N'),
        tooltip=['location:N']
    )
)

#.configure_view(
#    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
#)

#id_rota
alt.concat(id_parada, id_rota).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
).resolve_scale(
    color='independent'
)

In [29]:
df_filter = df.loc[(df['last4ccnum']== 9220) | (df['last4ccnum']== 3506) | (df['last4ccnum']== 9614) | (df['last4ccnum']== 8642) |
                   (df['last4ccnum']== 7792) | (df['last4ccnum']== 2276) | (df['last4ccnum']== 9152) | (df['last4ccnum']== 4530) |
                   (df['last4ccnum']== 9735)]


ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 23:59:59'

df_filter = df_filter.loc[(df_filter['timestamp'] >= ts_min) & (df_filter['timestamp'] <= ts_max)]

last4ccnums = list(df_filter['last4ccnum'].unique())
last4ccnums.sort()

selection_cc = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['last4ccnum'], # Seleção somente no campo cidade
    init={'last4ccnum': last4ccnums[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=last4ccnums) # vincula um menu ao nome das cidades
)

local_hora_cartao = alt.Chart(df_filter).mark_circle(tooltip=True).encode(
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Y('location', title='Local'),
    #alt.Color('count()', title='Quantidade de compras'),
    alt.Size('sum(price)', title='Quantidade de compras'),
    color=alt.condition(selection_cc, "last4ccnum:N" ,alt.value("darkgrey"), title='Número do cartão'),
    opacity=alt.condition(selection_cc, alt.value(.9),alt.value(.05)),
    tooltip = [alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('location', title='Local'),
               alt.Tooltip('sum(price)', title='Total gasto')]
).add_selection(selection_cc)

local_hora_cartao

A segunda abordagem compara a rotina diária por ID's com a rotina diária de compras de cartão de crédito e cartão fidelidade para inferir os proprietários de cada cartão. A visualização 1 apresenta a rotina de três ID's 1, 11 e 29. O ID 1 toma café em **Hallowed Grounds**, almoça no **Hippokampos** e realiza uma compra no **Albert's Fine Clothing** pela noite. Essa rotina do ID 1 é idêntica a rotina de compras do cartão 9551, como mostra a visualização 2. Com isso, é possível inferir que o cartão 9551 pertence a Nils Calixto, de carro de ID 1.

In [30]:
dia = '2014-01-06 '

df_location_filter = df_location.loc[(df_location['location']=='Hallowed Grounds') | (df_location['location']=='Hippokampos') |
                                     (df_location['location']=='Coffee Cameleon') | (df_location['location']=='Ouzeri Elian') |
                                     (df_location['location']=='Katerinas Cafe') | (df_location['location']=='Bean There Done That') |
                                     (df_location['location']=='Kalami Kafenion') | (df_location['location']=='Albert\'s Fine Clothing')]


df_gps_filter = df_gps.loc[(df_gps['id'] == 1) | (df_gps['id'] == 11) | (df_gps['id'] == 29)]

ids = list(df_gps_filter['id'].unique())
ids.sort()

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)

ts_min = dia + '00:00:00'
ts_max = dia + '10:30:00'

df_manha = df_gps_filter.loc[(df_gps_filter['Timestamp'] >= ts_min) & (df_gps_filter['Timestamp'] <= ts_max)]

ts_min = dia + '11:00:00'
ts_max = dia + '15:30:00'

df_tarde = df_gps_filter.loc[(df_gps_filter['Timestamp'] >= ts_min) & (df_gps_filter['Timestamp'] <= ts_max)]

ts_min = dia + '17:00:00'
ts_max = dia + '23:30:00'

df_noite = df_gps_filter.loc[(df_gps_filter['Timestamp'] >= ts_min) & (df_gps_filter['Timestamp'] <= ts_max)]

manha = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_manha).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.005)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

tarde = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_tarde).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.005)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

noite = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_noite).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.005)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        shape=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250
)

alt.concat(manha, tarde, noite).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

In [31]:
df_filter = df.loc[(df['last4ccnum']== 9551) | (df['last4ccnum']== 5921) | (df['last4ccnum']== 1321) | (df['last4ccnum']== 6899)]


ts_min = '2014-01-06 00:00:00'
ts_max = '2014-01-06 23:59:59'

df_filter = df_filter.loc[(df_filter['timestamp'] >= ts_min) & (df_filter['timestamp'] <= ts_max)]

last4ccnums = list(df_filter['last4ccnum'].unique())
last4ccnums.sort()

selection_cc = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['last4ccnum'], # Seleção somente no campo cidade
    init={'last4ccnum': last4ccnums[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=last4ccnums) # vincula um menu ao nome das cidades
)

local_hora_cartao = alt.Chart(df_filter).mark_circle(tooltip=True).encode(
    alt.X('hoursminutes(timestamp):T', title='Hora'),
    alt.Y('location', title='Local'),
    #alt.Color('count()', title='Quantidade de compras'),
    #alt.Size('sum(price)', title='Quantidade de compras'),
    color=alt.condition(selection_cc, "last4ccnum:N" ,alt.value("darkgrey"), title='Número do cartão'),
    opacity=alt.condition(selection_cc, alt.value(.9),alt.value(.05)),
    tooltip = [alt.Tooltip('hoursminutes(timestamp):T', title='Hora'),
               alt.Tooltip('location', title='Local'),
               alt.Tooltip('sum(price)', title='Total gasto')]
).add_selection(selection_cc)

local_hora_cartao

A incerteza da primeira abordagem está na dificuldade de inferir cartões em locais populares, devido a essa incerteza a segunda abordagem é utilizada.
Um exemplo de incerteza dos dados se dá pelo cartão de número 6899, o qual as compras indicam a realização de compras em dois locais de café da manhã distintos (um deles dentro da anomalia das 12:00), além de ir a dois locais para o almoço, desse modo, a segunda abordagem torna-se incerta.

## MC2.5
A visualização à esquerda mostra os cartões que possuem compras em todos os quatorzes dias. É possível notar o cartão 9551 de Nils Calixto, carro de ID 1, que possui um total gasto no dia 13 que destoa do total gasto durante os outros dias, cujo valor é 10130,64, e ao inspecionar as compras desse cartão no dia 13, percebe-se compras em um intervalo de tempo muito próximo: **U-Pump** e **Hippokampos** (diferença de 10 minutos), e **Frydos Autosupply n' More**, que possui uma compra no valor de 10000, e **Ouzeri Elian**, também em um intervalo de 10 minutos entre as compras.

In [43]:
df_temp = df.loc[(df['last4ccnum'] == 1286) | (df['last4ccnum'] == 1310) | (df['last4ccnum'] == 1321) | (df['last4ccnum'] == 1415) |
                 (df['last4ccnum'] == 1874) | (df['last4ccnum'] == 1877) | (df['last4ccnum'] == 2540) | (df['last4ccnum'] == 3484) |
                 (df['last4ccnum'] == 3853) | (df['last4ccnum'] == 6816) | (df['last4ccnum'] == 6895) | (df['last4ccnum'] == 6899) |
                 (df['last4ccnum'] == 6901) | (df['last4ccnum'] == 7354) | (df['last4ccnum'] == 7384) | (df['last4ccnum'] == 7688) |
                 (df['last4ccnum'] == 7889) | (df['last4ccnum'] == 8156) | (df['last4ccnum'] == 8332) | (df['last4ccnum'] == 9405) |
                 (df['last4ccnum'] == 9551) | (df['last4ccnum'] == 9535)]

#| (df['last4ccnum'] == 4434)
selection = alt.selection_interval()

cartao_dia = alt.Chart(df_temp).mark_rect(tooltip=True).encode(
    alt.Y('last4ccnum:N', title='Número do cartão'),
    alt.X('date(timestamp):N', title='Dia'),
    alt.Color('sum(price)', scale=alt.Scale(scheme='reds'), title='Total gasto'),
    tooltip = [alt.Tooltip('date(timestamp):T', title='Dia'),
               alt.Tooltip('day(timestamp):T', title='Dia da semana'), 
               alt.Tooltip('sum(price)', title='Total gasto')]
).add_selection(
    selection
)

local_hora = alt.Chart(df_temp).mark_circle(tooltip=True).encode(
    
    alt.Y('location:N', title='Local'),
    alt.X('hoursminutes(timestamp):T', title='Hora'),    
    alt.Color('sum(price)', scale=alt.Scale(scheme='viridis'), title='Total gasto'),
    tooltip = [alt.Tooltip('location:N', title='Local'),
               alt.Tooltip('hoursminutes(timestamp):T', title='Hora'), 
               alt.Tooltip('sum(price)', title='Total gasto')]
).transform_filter(selection)

#chart1 | chart2.interactive()

alt.concat(cartao_dia, local_hora.interactive()).resolve_scale(
    color='independent'
)

Ao inspecionar a rota percorrida pelo ID 1 (visualização à esquerda), nota-se que Nils Calixto saí da **GAStech**, almoça no **Hippokampos**, e em seguida volta para **GAStch**, e não passa por **U-Pump**. Durante esse período (13:00 e 13:30), quem está em **U-Pump** é o ID 24, Minke Mies. Um comportamento similar ocorre durante a noite, onde Nils Calixto vai almoçar em **Ouzeri Elian**, e não passa por **Frydos Autosupply n' More**, e quem está nesse local é Minke Mies. Desse modo, é possível inferir que Minke Mies roubou e/ou clonou o cartão de Nils Calixto.

In [33]:
df_location_filter = df_location.loc[(df_location['location']=='GAStech') | (df_location['location']=='Hippokampos') |
                                     (df_location['location']=='U-Pump') | (df_location['location']=='Daily Dealz') |
                                     (df_location['location']=='Ouzeri Elian') | (df_location['location']=='Frydos Autosupply n\' More')]

ts_min = '2014-01-13 12:30:00'
ts_max = '2014-01-13 14:00:00'

df_nils_calixto_upump = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 1)]
df_minke_mies_upump = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 24)]

ids = [1, 24]
ids.sort()

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)

upump = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_nils_calixto_upump).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_minke_mies_upump).mark_circle(size=10, color='#B09110').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250,
    title='Atividade suspeita U-Pump'
)

ts_min = '2014-01-13 18:30:00'
ts_max = '2014-01-13 20:00:00'

df_nils_calixto_supply = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 1)]
df_minke_mies_supply = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 24)]

supply = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_nils_calixto_supply).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_minke_mies_supply).mark_circle(size=10, color='#B09110').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250,
    title='Atividade suspeita Frydos Autosupply n\' More'
)


alt.concat(upump, supply).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

A visualização abaixo apresenta algumas atividades suspeitas na noite do dia 6. Nils Calixto, ID 1, vai após as 22:00 para a **GAStech**, e volta nas primeiras horas do dia seguinte. Essa atividade aparenta ser suspeita, devido ao horário, porém, como Nils Calixsto é do departamento de Tecnologia da Informação, existe a possibilidade de ser algum trabalho de urgência. A visita a **GAStech** por Nils Calixto acontece também nos dias 8, 15 e 17.
Ada Campo-Corrente, ID 10, janta no **Hippokampos** e vai para o possível local de sua residência. Isia Vann, ID 16, sai tarde da noite de sua residência e vai em direção a residência de Ada Campo-Corrente e volta nas primeiras horas do dia seguinte.

In [34]:
df_location_filter = df_location.loc[(df_location['location']=='GAStech') | (df_location['location']=='Hippokampos')
                                     | (df_location['location']=='Daily Dealz')]

ts_min = '2014-01-06 21:30:00'
ts_max = '2014-01-06 23:59:00'

df_nils_calixto = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 1)]
df_campo_corrente = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 10)]
df_isia_vann = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 16)]

ids = [1, 10, 16]
ids.sort()

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)

atividade_noite_06 = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_nils_calixto).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_campo_corrente).mark_circle(size=10, color='#B09110').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_isia_vann).mark_circle(size=10, color='#30A5FC').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250,
    title='Atividades suspeitas na noite do dia 6'
).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

atividade_noite_06

A Figura 22 apresenta uma atividade suspeita na noite do dia 10. Willem Vasco-Paris, ID 35, janta no **Hippokampos** e vai para o possível local de sua residência. Isia Vann, ID 16, sai tarde da noite de sua residência e vai em direção a residência de Willem Vasco-Paris e volta nas primeiras horas do dia seguinte.

In [35]:
df_location_filter = df_location.loc[(df_location['location']=='Hippokampos')]

ts_min = '2014-01-10 21:30:00'
ts_max = '2014-01-10 23:59:00'

df_willem_vasco_pais = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 35)]
df_isia_vann = df_gps.loc[(df_gps['Timestamp'] >= ts_min) & (df_gps['Timestamp'] <= ts_max) & (df_gps['id'] == 16)]

ids = [35, 16]
ids.sort()

selection_id = alt.selection_single(
    name='selection', # dando o nome 'Seleção'
    fields=['id'], # Seleção somente no campo cidade
    init={'id': ids[0]}, # a primeira cidade começa selecionada
    bind=alt.binding_select(options=ids) # vincula um menu ao nome das cidades
)

atividade_noite_10 = alt.layer(
    alt.Chart(url_mapa).mark_geoshape(
        stroke="#000",
        strokeWidth=0.1,
        color="white",
    ),
    
    alt.Chart(df_willem_vasco_pais).mark_circle(size=10, color='#B09110').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ).add_selection(selection_id),
    
    alt.Chart(df_isia_vann).mark_circle(size=10, color='blueviolet').encode(
        latitude="lat:Q",
        longitude="long:Q",
        opacity=alt.condition(selection_id, alt.value(.9),alt.value(.1)),
        tooltip=['lat:Q','long:Q', 'hoursminutes(Timestamp):N']
    ),
    
    alt.Chart(df_location_filter).mark_circle(size=75, tooltip=True).encode(
        latitude="lat:Q",
        longitude="long:Q",
        color=('location'),
        tooltip=['location']
    )
).properties(
    width=250,
    height=250,
    title='Atividades suspeitas na noite do dia 10'
).configure_view(
    strokeWidth=0 # adicionando pra evitar que o frame da visualização apareça
)

atividade_noite_10

A atividade apresentada nas noites dos dias 6 e 10 por Isia Vann, que pertence ao departamento de segurança, é bastante suspeita, não somente pelo horário da movimentação, mas principalmente devido a tanto Ada Campo-Corrente, quanto Willem Vasco-Paris, serem do departamento executivo.
Desse modo, Isia Vann é uma seria suspeita do desaparecimento de funcionários da **GAStech**, enquanto Ada Campo-Corrente e Willem Vasco-Paris são candidatos a pessoas desaparecidas.