In [1]:
import numpy as np # library to handle data in a vectorized manner

import pandas as pd # library for data analsysis
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

import json # library to handle JSON files

!conda install -c conda-forge geopy --yes # uncomment this line if you haven't completed the Foursquare API lab
from geopy.geocoders import Nominatim # convert an address into latitude and longitude values

import requests # library to handle requests
from pandas.io.json import json_normalize # tranform JSON file into a pandas dataframe

# Matplotlib and associated plotting modules
import matplotlib.cm as cm
import matplotlib.colors as colors

# import k-means from clustering stage
from sklearn.cluster import KMeans

#!conda install -c conda-forge folium=0.5.0 --yes # uncomment this line if you haven't completed the Foursquare API lab
import folium # map rendering library

print('Libraries imported.')

Collecting package metadata (repodata.json): done
Solving environment: done

# All requested packages already installed.

Libraries imported.


In [4]:
## Load data with nationalities per Zurich district
zhdf1 = pd.read_csv('https://data.stadt-zuerich.ch/dataset/eeb68173-d3e5-43f5-80cf-318b5a4045bf/resource/e0efc72f-29cd-4176-aa06-fc070d26278e/download/bev336od3361.csv')
zhdf1.head(100)

Unnamed: 0,StichtagDatJahr,QuarSort,QuarCd,QuarLang,NationHistSort,NationHistLang,NationSort,NationLang,RegionSort,RegionLang,KontinentSort,KontinentLang,AnzBestWir
0,1993,11,11,Rathaus,8100,Schweiz,8100,Schweiz,13,Zentraleuropa,1,Europa,2487
1,1993,11,11,Rathaus,8205,Bulgarien,8205,Bulgarien,17,Südosteuropa,1,Europa,1
2,1993,11,11,Rathaus,8206,Dänemark,8206,Dänemark,11,Nordeuropa,1,Europa,2
3,1993,11,11,Rathaus,8207,Deutschland,8207,Deutschland,13,Zentraleuropa,1,Europa,96
4,1993,11,11,Rathaus,8211,Finnland,8211,Finnland,11,Nordeuropa,1,Europa,2
5,1993,11,11,Rathaus,8212,Frankreich,8212,Frankreich,14,Westeuropa,1,Europa,22
6,1993,11,11,Rathaus,8214,Griechenland,8214,Griechenland,16,Südeuropa,1,Europa,1
7,1993,11,11,Rathaus,8215,Grossbritannien,8215,Grossbritannien,14,Westeuropa,1,Europa,18
8,1993,11,11,Rathaus,8216,Irland,8216,Irland,14,Westeuropa,1,Europa,2
9,1993,11,11,Rathaus,8218,Italien,8218,Italien,16,Südeuropa,1,Europa,69


In [6]:
## Load data with age groups and gender per Zurich district
zhdf2 = pd.read_csv('https://data.stadt-zuerich.ch/dataset/a2c776d2-56e5-42af-8f3c-7540bd106f53/resource/38843a2e-31e2-4963-b99e-6806684e3e42/download/bev325od3250.csv')
zhdf2.head(500)

Unnamed: 0,StichtagDatJahr,StichtagDatMM,StichtagDatMonat,StichtagDat,SexCd,SexLang,AlterV20Sort,AlterV20Kurz,HerkunftCd,HerkunftLang,KreisCd,KreisLang,QuarCd,QuarLang,DatenstandCd,DatenstandLang,AnzBestWir
0,2013,12,Dezember,19723,2,weiblich,5,80 u. älter,1,Schweizer/in,12,Kreis 12,123,Hirzenbach,V,Veröffentlicht,493
1,2013,12,Dezember,19723,2,weiblich,4,60-79,2,Ausländer/in,10,Kreis 10,102,Wipkingen,V,Veröffentlicht,202
2,2013,12,Dezember,19723,1,männlich,5,80 u. älter,2,Ausländer/in,4,Kreis 4,44,Hard,V,Veröffentlicht,19
3,2013,12,Dezember,19723,2,weiblich,4,60-79,1,Schweizer/in,3,Kreis 3,31,Alt-Wiedikon,V,Veröffentlicht,860
4,2013,12,Dezember,19723,1,männlich,5,80 u. älter,2,Ausländer/in,4,Kreis 4,42,Langstrasse,V,Veröffentlicht,20
5,2013,12,Dezember,19723,1,männlich,5,80 u. älter,1,Schweizer/in,4,Kreis 4,44,Hard,V,Veröffentlicht,139
6,2013,12,Dezember,19723,2,weiblich,4,60-79,2,Ausländer/in,9,Kreis 9,91,Albisrieden,V,Veröffentlicht,268
7,2013,12,Dezember,19723,2,weiblich,5,80 u. älter,2,Ausländer/in,3,Kreis 3,31,Alt-Wiedikon,V,Veröffentlicht,28
8,2013,12,Dezember,19723,1,männlich,5,80 u. älter,2,Ausländer/in,1,Kreis 1,13,Lindenhof,V,Veröffentlicht,0
9,2013,12,Dezember,19723,2,weiblich,5,80 u. älter,2,Ausländer/in,1,Kreis 1,12,Hochschulen,V,Veröffentlicht,3


In [9]:
SSL_VERIFY = True
# evtl. SSL_VERIFY auf False setzen wenn die Verbindung zu https://www.zuerich.com nicht klappt (z.B. wegen Proxy)
# Um die SSL Verifikation auszustellen, bitte die nächste Zeile einkommentieren ("#" entfernen)
SSL_VERIFY = False
if not SSL_VERIFY:
    import urllib3
    urllib3.disable_warnings()
    
def get_de(field):
    try:
        return field['de']
    except (KeyError, TypeError):
        try:
            return field['en']
        except (KeyError, TypeError):
            return field
        
        
## read JSON data for information of existing bars and lounges in Zurich
headers = {'Accept': 'application/json'}
r = requests.get('https://www.zuerich.com/en/data/gastronomy/nightlife/bars+%7C%7C+lounges', headers=headers, verify=SSL_VERIFY)

In [10]:
bardata = r.json()
bardata

[{'id': '527248',
  '@context': 'https://schema.org/',
  '@type': 'LocalBusiness',
  'copyright': {'en': 'Zurich Tourism www.zuerich.com',
   'de': 'Zürich Tourismus www.zuerich.com',
   'it': 'Zürich Tourismo www.zuerich.com',
   'fr': 'Zürich Tourisme www.zuerich.com'},
  'cc': 'BY-SA',
  'category': ['Nightlife',
   'Atmosphere',
   'Cool and Trendy',
   'Bars & Lounges',
   'Neighborhood Bar'],
  'name': {'de': 'Total Bar',
   'en': 'Total Bar',
   'fr': 'Total Bar',
   'it': 'Total Bar'},
  'disambiguatingDescription': {'de': 'Wie ein gallisches Dorf trotzt diese Bar seit 20 Jahren allem Trubel um sie herum. Zum Glück für Freunde der entspannten Bar-Kultur.',
   'en': 'Like the Gallic village of “Asterix and Obelix” fame, for 20 years this bar has withstood all the many changes going on around it. Which is good news for fans of the relaxed bar culture.',
   'fr': 'Tel un village gaulois, ce bar résiste depuis 20 ans au tumulte. Une chance pour les amateurs appréciant le côté décon