## Imports

In [1]:
from pprint import pprint
from statistics import mean
import os
import gmplot

In [2]:
from dataset_bending import get_all_datasets, get_dataset_info, get_dataset_data, get_dataset_data_full

## Code

In [3]:
url = next(get_dataset_info("alojamento-local"))
print(url)

https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/35


In [4]:
datapoint = next(get_dataset_data(url))
print(datapoint)

{'objectid': 1, 'data_levan': 1488758400000, 'cod_dmpu': '140747', 'cod_topo': 'RCAMO0', 'n_pol': '77', 'nome_aloj': 'Metro Apartment', 'ano_reg': 2016, 'ano_ab': 2016, 'n_reg': '35375/AL', 'tit_expl': None, 'qual_tit': 'Proprietario', 'tit_tipo': 'Pessoa singular (empresário em nome individual)', 'obs': None, 'pos_1951': 'S', 'nud': None, 'morada': 'Rua Rua Camões, 77 1º 1.1', 'desativo': None, 'modalidade': 'Apartamento', 'n_policia': None, 'cod_postal': '4000-144', 'data_reg': 1475193600000, 'data_ab': 1477958400000, 'toponimo': None, 'cod_freg': None, 'cod_sgr': None, 'n_ordem': None, 'cod_gis': None, 'np_codtopo': None, 'coordinates': [-8.610274113044303, 41.1525537929996]}


In [5]:
dataset = list(get_dataset_data(url))
print("Dataset has %d datapoints" % len(dataset))

Dataset has 1000 datapoints


## Alojamentos with bad names

In [6]:
alojamentos = list(get_dataset_data(next(get_dataset_info('alojamento-local'))))
for a in alojamentos: 
    if a["nome_aloj"] == "0": pprint(a["n_reg"])

'17775/AL'
'27604/AL'
'29751/AL'


## Generate Polygons

In [7]:
def create_polygons(coordinates, gmap=None, display=False):
    lon, lat = tuple(map(list,zip(*coordinates)))
    gmap = gmplot.GoogleMapPlotter(min(lat), mean(lon), 16) if not gmap else gmap
    gmap.apikey = "AIzaSyA2B83Ome4_S-EXUe5zLTrkaGeZv-Ndft4"
    gmap.polygon(lat, lon, color = 'cornflowerblue') 
    if display: os.system("temp.html")
    return gmap

In [8]:
def display_plot(gmap, filename="temp.html"):
    gmap.draw(filename)
    os.system(filename)

In [9]:
def display_dataset_polygon(dataset):
    gmap = None
    for datapoint in dataset:
        gmap = create_polygons(datapoint["coordinates"][0], gmap)
    display_plot(gmap)

In [10]:
def create_points(coordinates, gmap=None, display=False):
    lon, lat = tuple(coordinates)
    gmap = gmplot.GoogleMapPlotter(lat, lon, 16) if not gmap else gmap
    gmap.apikey = "AIzaSyA2B83Ome4_S-EXUe5zLTrkaGeZv-Ndft4"
    gmap.scatter([lat], [lon], '#FF0000', size = 25, marker = False) 
    if display: os.system("temp.html")
    return gmap

In [11]:
def display_dataset_points(dataset):
    gmap = None
    for datapoint in dataset:
        gmap = create_points(datapoint["coordinates"], gmap)
    display_plot(gmap)

In [12]:
def try_to_display_dataset(dataset_name):
    url = next(get_dataset_info(dataset_name))
    print(url)
    dataset = get_dataset_data_full(url)
    # coordinates are len 2, polygons are not
    if len(dataset[0]["coordinates"]) == 2: display_dataset_points(dataset)
    else: display_dataset_polygon(dataset)

### Some polygon tests

In [13]:
try_to_display_dataset("areas-verdes")

https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/77


In [14]:
try_to_display_dataset("ruido-zona-sensivel")

https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/73


# Create Dataset
Datasets uteis

Para features:
- ruído
- qualidade do ar
- ponto de interesse
- templos religiosos
- promoção de vinho do porto
- restaurantes
- areas verdes
- metro do porto
- ciclovias
- praça de taxis
- transportes públicos
- medições de trânsito
- quiosques multimédia
- Fontes de contaminação
- Zonas instáveis
- Áreas verdes / Espaços verdes com valor patrimonial
- Áreas edificadas
- Supermercados
- Feiras e mercados / Zonas de comércio tradicional
- Posto de informação turística

Para outras cenas:
- Limites de freguesia
- Alojamento local
- Alojamentos hoteleiros
- Pensões, Residenciais e Hospedarias
- Hotéis, ApartHoteis e Albergarias

In [15]:
pprint(get_all_datasets())

['agua-de-nascente',
 'alojamento-local',
 'alojamentos-hoteleiros-2011',
 'areas-edificadas',
 'areas-verdes',
 'atlas-desportivo',
 'bairros-de-casas-economicas-do-estado-novo',
 'balizas-de-sinalizacao',
 'bicicletarios',
 'carta-de-patrimonio',
 'cemiterios-municipais-ou-privados-2007',
 'centros-de-saude-e-extensoes-2001',
 'ciclovias',
 'correios-2013',
 'dissuasores-de-controlo-de-acessos',
 'ecocentros-2006',
 'edificios-de-interesse-publico',
 'edificios-de-interesse-publico-2012',
 'eixos-de-via-infraestruturas-portugal',
 'envolvente',
 'equipamentos-de-recolha-contentores-cinzentos_-cones_recolha-de-objectos-fora-de-uso_-reee-e-vidroes',
 'equipamentos-de-saude',
 'espacos-verdes-com-valor-patrimonial-2012',
 'estabelecimentos-de-bebidas-e-restauracao-da-movida-2012',
 'estabelecimentos-de-ensino-por-ano-letivo',
 'estabelecimentos-de-ensino-superior-por-ano-letivo',
 'feiras-e-mercados-2011',
 'fontes-de-contaminacao-cemiterios-carta-de-ocupacao-de-superficie',
 'fontes-de

In [16]:
pprint(list(get_dataset_info("templos-religiosos-centroides")))
# print(list(get_dataset_data("https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/28")))
try_to_display_dataset("promocao-do-vinho-do-porto-centroides")

['https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/28']
https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/89


In [17]:
not_used_yet = ["porto-pontos-de-interesse", ]

In [18]:
polygon_datasets = ["areas-verdes", "ruido-zona-sensivel", "ruido-zona-mista"]

In [19]:
geopoint_datasets = ["templos-religiosos-centroides", "promocao-do-vinho-do-porto-centroides"]

In [20]:
url = next(get_dataset_info("alojamento-local"))
alojamentos = get_dataset_data_full(url)
print(alojamentos[0])

{'objectid': 1, 'data_levan': 1488758400000, 'cod_dmpu': '140747', 'cod_topo': 'RCAMO0', 'n_pol': '77', 'nome_aloj': 'Metro Apartment', 'ano_reg': 2016, 'ano_ab': 2016, 'n_reg': '35375/AL', 'tit_expl': None, 'qual_tit': 'Proprietario', 'tit_tipo': 'Pessoa singular (empresário em nome individual)', 'obs': None, 'pos_1951': 'S', 'nud': None, 'morada': 'Rua Rua Camões, 77 1º 1.1', 'desativo': None, 'modalidade': 'Apartamento', 'n_policia': None, 'cod_postal': '4000-144', 'data_reg': 1475193600000, 'data_ab': 1477958400000, 'toponimo': None, 'cod_freg': None, 'cod_sgr': None, 'n_ordem': None, 'cod_gis': None, 'np_codtopo': None, 'coordinates': [-8.610274113044303, 41.1525537929996]}


In [21]:
try_to_display_dataset("alojamento-local")

https://servsig.cm-porto.pt/arcgis/rest/services/OpenData_APD/OpenData_APD/MapServer/35


# Construct Dataframe

In [27]:
import pandas as pd

In [59]:
def get_dataframe_alojamentos():
    url = next(get_dataset_info("alojamento-local"))
    alojamentos = get_dataset_data_full(url)
    df = pd.DataFrame(columns=["id", "data_levan", "nome", "ano_registo", "type", "address", "freg", "n_reg", "lat", "lon"])
    print(alojamentos[0])
    for i, a in enumerate(alojamentos):
         df.loc[i] = [a["objectid"], a["data_levan"], a["nome_aloj"],
                      a["ano_reg"], a["modalidade"],
                      "%s, %s Porto, Portugal" % (a["morada"], a["cod_postal"]),
                      a["cod_freg"], a["n_reg"],
                      a["coordinates"][1], a["coordinates"][0]]
    return df

In [60]:
df = get_dataframe_alojamentos()
df.head(10)

{'objectid': 1, 'data_levan': 1488758400000, 'cod_dmpu': '140747', 'cod_topo': 'RCAMO0', 'n_pol': '77', 'nome_aloj': 'Metro Apartment', 'ano_reg': 2016, 'ano_ab': 2016, 'n_reg': '35375/AL', 'tit_expl': None, 'qual_tit': 'Proprietario', 'tit_tipo': 'Pessoa singular (empresário em nome individual)', 'obs': None, 'pos_1951': 'S', 'nud': None, 'morada': 'Rua Rua Camões, 77 1º 1.1', 'desativo': None, 'modalidade': 'Apartamento', 'n_policia': None, 'cod_postal': '4000-144', 'data_reg': 1475193600000, 'data_ab': 1477958400000, 'toponimo': None, 'cod_freg': None, 'cod_sgr': None, 'n_ordem': None, 'cod_gis': None, 'np_codtopo': None, 'coordinates': [-8.610274113044303, 41.1525537929996]}


Unnamed: 0,id,data_levan,nome,ano_registo,type,address,freg,lat,lon
0,1,1488758400000,Metro Apartment,2016,Apartamento,"Rua Rua Camões, 77 1º 1.1, 4000-144 Porto, Por...",,41.152554,-8.610274
1,2,1488758400000,Be Happy Flat,2016,Apartamento,"Rua Rua Camões, 327 1.º Hab. 1.5, 4000-145 Por...",,41.154861,-8.610286
2,3,1488758400000,Camões Apartment,2016,Apartamento,"Rua Rua Camões, 387 2º Dt, 4000-146 Porto, Por...",,41.155397,-8.610221
3,4,1488758400000,Zarolho,2016,Apartamento,"None, None Porto, Portugal",,41.157035,-8.610126
4,5,1488758400000,Casa Carvalheiras,2016,Moradia,"None, 4000-159 Porto, Portugal",,41.154907,-8.605619
5,6,1488758400000,E-House Asprela,2016,Moradia,"None, 4200-011 Porto, Portugal",,41.176717,-8.610834
6,7,1488758400000,CAZV,2016,Apartamento,"Rua Rua Coutinho de Azevedo, 214 R/C, 4000-189...",,41.158079,-8.596343
7,8,1488758400000,Girassol,2016,Moradia,"Rua Rua Coutinho de Azevedo, 259, 4000-190 Por...",,41.1582,-8.596966
8,9,1488758400000,Estudio 312,2016,Apartamento,"None, 4000-188 Porto, Portugal",,41.15868,-8.597245
9,10,1488758400000,Andorinhas,2016,Apartamento,"None, 4200-221 Porto, Portugal",,41.163204,-8.602644


In [56]:
df.type.unique()

array(['Apartamento', 'Moradia', 'Estabelecimento de hospedagem',
       'Estabelecimento de hospedagem-Hostel', None], dtype=object)

In [57]:
# df.loc[df.nome.str.find("Metro")]
df.loc[df.apply(lambda row: row.astype(str).str.contains("(?i)" + "villa").any(), axis=1)]

Unnamed: 0,id,data_levan,nome,ano_registo,type,address,lat,lon
380,381,1488758400000.0,FeelPorto Modern Villa,2015,Apartamento,"1ª Rua Rua do Vale Formoso, 174, 4200-512 Port...",41.167006,-8.611626
498,499,1488758400000.0,Caldevilla AP,2016,Apartamento,"Rua Rua Raúl Caldevilla, 126 9º Drt. Frt. Port...",41.1658,-8.594586
575,576,1488758400000.0,Boavista Villa,2015,Moradia,"Avenida Avenida França, 532, 4050-279 Porto, P...",41.163608,-8.627151
620,621,1488758400000.0,PL Villas Campanhã,2016,Moradia,"Rua Rua São Rosendo, 4300-476 Porto, Portugal",41.15119,-8.590344
1733,1734,1488758400000.0,Villa Bolhão,2014,Apartamento,"Rua Alexandre Braga, 66 1º Frente Fração B, 40...",41.149098,-8.60662
1734,1735,1488758400000.0,Villa Bolhão,2014,Apartamento,"Rua Alexandre Braga, 66 3º Fração F, 4000-049 ...",41.14909,-8.606599
1735,1736,1488758400000.0,Villa Bolhão/Apartamentos,2014,Apartamento,"Rua Alexandre Braga, 66 1º drtº Fração C, 4000...",41.149107,-8.606651
1736,1737,1488758400000.0,Villa Bolhão/Apartamentos,2014,Apartamento,"Rua Alexandre Braga, 66 2º Frente Fração D, 40...",41.149118,-8.606682
1737,1738,1488758400000.0,Villa Bolhão/Apartamentos,2014,Apartamento,"Rua Alexandre Braga, 66 2º Trs. Fração E, 4000...",41.149085,-8.606581
1802,1803,1488758400000.0,Villa Imperio Apartments,2014,Apartamento,"Rua Santos Pousada, 62 1º 2º hab 62, 4000-480 ...",41.152437,-8.599685
