<a href="https://colab.research.google.com/github/AndreaDvorakova/ENGETO_Data_Academy_Useful/blob/main/Tvorba_map.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Tvorba map

V této části si na mapě zobrazíme světová města. Data jsou dostupná buď z tabulky cities na engeto databázi. Nejdříve načteme data a importujeme potřebné moduly včetně folium.

In [2]:
import numpy as np
import pandas as pd
import sqlalchemy

!pip install folium
import folium
from folium import plugins

!pip install pymysql
student_conn_string = "mysql+pymysql://student:p7%40vw7MCatmnKjy7@data.engeto.com/data"
engine = sqlalchemy.create_engine(student_conn_string)

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting pymysql
  Downloading PyMySQL-1.0.2-py3-none-any.whl (43 kB)
[K     |████████████████████████████████| 43 kB 2.1 MB/s 
[?25hInstalling collected packages: pymysql
Successfully installed pymysql-1.0.2


Pokud chceme vytvořit mapu, začneme vytvořením mapového objektu, který budeme dále rozšiřovat. Základní mapu vytvoříme pomocí folium.Map() a zobrazíme prostým vyvoláním objektu na konci dané buňky (předpokládám, že pracujete v jupyter notebooku, labu, nebo Google Colaboratory).

In [None]:
m = folium.Map()
m

Dejte si pozor, abyste objekt neuložili do proměnné map, jelikož je to rezervované slovo v Pythonu. Po vyvolání objektu m se nám ukáže mapa světa, kterou můžeme libovolně přibližovat, oddalovat a pohybovat se po ní.

Nyní si ukážeme, jak a čím mapu zaplnit. Postup si ukážeme na příkladu, kdy budeme chtít zobrazit města v České republice. Načteme data z Engeto databáze:

In [None]:
cz_df = (pd.read_sql("select * from cities", engine)
         .query("country == 'Czechia'")
         .drop('country', 1)
         .set_index('city')
        )

Pokud chceme naši úvodní mapu přiblížit na určité místo, do konstruktoru Map přidáme počáteční souřadnice a přiblížení. Naši mapu přiblížíme na Chotěboř, jelikož je zhruba uprostřed ČR:

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values.tolist(), zoom_start=8)

m

V mapě vyznačíme města. Pro přehlednost vybereme pouze Prahu a krajská města. Začku do mapy vložíme pomocí objektu Marker. Pro každé město vytvoříme značku a přidáme ji k mapě pomocí funkce add_to():

In [None]:
for city, row in cz_df.dropna().iterrows():
    folium.Marker(row[['lat', 'lng']].values.tolist()).add_to(m)
#
m

Značky můžeme různě editovat. Následujícím kódem přidáme ikonu, a také popisek, který se zobrazí, pokud na značku klikneme:

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values, zoom_start=8)
#
for city, row in cz_df.dropna().iterrows():
    folium.Marker(row[['lat', 'lng']].values.tolist(),
                  popup=folium.Popup(row['city_ascii'], max_width=500),
                  icon=folium.Icon(icon="home", prefix='fa')
                 ).add_to(m)
#
m

Názvy přidávám bez háčků a čátek, protože jupyter je nedokáže přečíst. Pokud ovšem mapu uložíme do html formátu a otevřeme v prohlížeči, můžeme použít i háčky a čárky.

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values, zoom_start=8)
#
for city, row in cz_df.dropna().iterrows():
    folium.Marker(row[['lat', 'lng']].values.tolist(),
                  popup=folium.Popup(city, max_width=500),
                  icon=folium.Icon(icon="home", prefix='fa')
                 ).add_to(m)
#
m.save('mymap.html')
m


Přidáme další informace. Do vyskakovacího popisku přidáme počet obyvatel města. Také k souřadnicím přidáme kruh, jehož velikost bude odpovídat poctu obyvatel města. K tomu použijeme funkci Circle:

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values, zoom_start=8)
#
for city, row in cz_df.dropna().iterrows():
    folium.Marker(row[['lat', 'lng']].values.tolist(),
                  popup=folium.Popup(f"""
                  Nazev mesta: {row['city_ascii']} <br>
                  Poctet obyvatel: {int(row['population']//1000)} tisic
                  """, max_width=500),
                  icon=folium.Icon(icon="home", prefix='fa')
                 ).add_to(m)
    folium.Circle(row[['lat', 'lng']].values.tolist(),
                  radius=np.sqrt(row['population'])*10,
                  fill=True
                 ).add_to(m)
#
m

**Úkol:** Vytvořte mapu všech měst v České Republice. Odlište Prahu a ostatní města.

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values, zoom_start=8)
#
for city, row in cz_df.dropna().iterrows():
    if city == 'Prague':
      folium.Marker(row[['lat', 'lng']].values.tolist(),
                  popup=folium.Popup(f"""
                  Nazev mesta: {row['city_ascii']} <br>
                  Poctet obyvatel: {int(row['population']//1000)} tisic
                  """, max_width=500),
                  icon=folium.Icon(icon="cloud", prefix='fa')
                 ).add_to(m)
      folium.Circle(row[['lat', 'lng']].values.tolist(),
                  radius=np.sqrt(row['population'])*10,
                  fill=True
                 ).add_to(m)

    else:
      folium.Marker(row[['lat', 'lng']].values.tolist(),
                    popup=folium.Popup(f"""
                    Nazev mesta: {row['city_ascii']} <br>
                    Poctet obyvatel: {int(row['population']//1000)} tisic
                    """, max_width=500),
                    icon=folium.Icon(icon="home", prefix='fa')
                  ).add_to(m)
      folium.Circle(row[['lat', 'lng']].values.tolist(),
                    radius=np.sqrt(row['population'])*10,
                    fill=True
                  ).add_to(m)
#
m

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values, zoom_start=8)

for city, row in cz_df.iterrows():
    if row['capital']=='primary':
        icon = 'users'
        color = 'red'
    else:
        icon = 'user'
        color = 'blue'
    folium.Marker(row[['lat', 'lng']].values.tolist(), 
                  popup=folium.Popup(f"""
                  Nazev mesta: {row['city_ascii']} <br>
                  Poctet obyvatel: {int(row['population']//1000)} tisic
                  """, max_width=500),
                  icon=folium.Icon(icon=icon, prefix='fa', color=color)
                 ).add_to(m)
    folium.Circle(row[['lat', 'lng']].values.tolist(), 
                  radius=np.sqrt(row['population'])*10,
                  color=color,
                  fill=True
                 ).add_to(m)

m

Folium nabízí možností, jak mapy upravovat. Například můžeme pro přehlednost automaticky seskupit menší města, pokud v se na mapu díváme z větší vzdálenosti:

In [None]:
m = folium.Map(cz_df.loc['Chotěboř', ['lat', 'lng']].values.tolist(), zoom_start=8)
mc = folium.plugins.MarkerCluster().add_to(m)
#
for city, row in cz_df.iterrows():
    if row['capital']:
        folium.Marker(row[['lat', 'lng']].values.tolist(),
                      popup=folium.Popup(f"""
                      Nazev mesta: {row['city_ascii']} <br>
                      Poctet obyvatel: {int(row['population']//1000)} tisic
                      """, max_width=500),
                      icon=folium.Icon(icon='users', prefix='fa', color='red')
                     ).add_to(m)
    else:
        folium.Marker(row[['lat', 'lng']].values.tolist(),
                      popup=folium.Popup(f"""
                      Nazev mesta: {row['city_ascii']} <br>
                      Poctet obyvatel: {int(row['population']//1000)} tisic
                      """, max_width=500),
                      icon=folium.Icon(icon='user', prefix='fa', color='blue')
                     ).add_to(mc)
#
m

##Města - úkoly

**Úkol 1:** Z tabulky cities vyberte pouze Evropu (použijte spojení s tabukou countries). V mapě zobrazte všechna hlavní města v Evropě.

In [None]:
df_countries_europe = pd.read_sql('SELECT * FROM countries', engine).query("continent == 'Europe'").set_index(['capital_city', 'country'])
df_cities = pd.read_sql('SELECT * FROM cities', engine).set_index(['city', 'country'])
df_join = df_cities.join(df_countries_europe, rsuffix='_cities').query('city == capital_city')

ma = folium.Map()

for city, row in df_join.iterrows():
    folium.Marker(row[['lat', 'lng']].values.tolist(),
      popup=folium.Popup(f"""
      Nazev mesta: {row['city_ascii']} <br>
      Poctet obyvatel: {int(row['population']//1000)} tisic
      """, max_width=500),
      icon=folium.Icon(icon="cloud", prefix='fa')
      ).add_to(ma)
    folium.Circle(row[['lat', 'lng']].values.tolist(),
      radius=np.sqrt(row['population'])*10,
      fill=True
      ).add_to(ma)

ma

In [None]:
countries_df = pd.read_sql("select * from countries", engine)
ct_df = pd.read_sql("select * from cities", engine)

df1 = countries_df.query("continent == 'Europe'").set_index('iso3')[['country']]
df2 = ct_df.set_index('iso3')[['city_ascii', 'capital', 'lat', 'lng', 'population']]
ep_df = df1.join(df2)

df3 = ep_df.query("capital == 'primary'").drop('capital', 1).set_index('city_ascii')

m = folium.Map(df3.loc['Prague', ['lat', 'lng']].values, zoom_start=5)

for city, row in df3.iterrows():
    folium.Marker(row[['lat', 'lng']].values).add_to(m)

m

**Úkol 2**: Ke značkám přidejte vyskakovací okénko, které ukáže název města, počet jeho obyvatel a stát, ve kterém město leží.

In [None]:
m = folium.Map(df3.loc['Prague', ['lat', 'lng']].values, zoom_start=5)

for city, row in df3.iterrows():
    folium.Marker(row[['lat', 'lng']].values,
                  popup=folium.Popup(html=f"""
                        Nazev mesta: {city} <br>
                        Poctet obyvatel: {round(row['population']//1000000, 2)} milionu <br>
                        Stat: {row['country']}""", 
                      max_width=500)).add_to(m)

m

**Úkol 3**: Do grafu přidejte všechna města s počtem obyvatel vyšším než 200 tisíc. Tato města odlište od hlavních měst pomocí barvy značky, ikony a/nebo textu ve vyskakovacím okénku. Uvažte, že východní geografická hranice Evropy vede přibližně 60tým poledníkem.

In [None]:
df1 = countries_df.query("continent == 'Europe'").set_index('iso3')[['country']]
df2 = ct_df.set_index('iso3')[['city_ascii', 'capital', 'lat', 'lng', 'population']]
ep_df = df1.join(df2)

df3 = ep_df.query(" (population > 200000 or capital == 'primary') and lng < 60").set_index('city_ascii')
m = folium.Map(df3.loc['Prague', ['lat', 'lng']].values, zoom_start=5)

for city, row in df3.iterrows():
    popup = folium.Popup(html=f"""
                              nazev mesta: {city} <br>
                              pocet obyvatel: {round(row['population']/1000000, 2)} milionu <br>
                              zeme: {row['country']} <br>
                              status: {row['capital']}
                              """,
                         max_width=500
                        )
    if row['capital'] == 'primary':
        folium.Marker(row[['lat', 'lng']].values, popup=popup, icon=folium.Icon(icon='building', prefix='fa')).add_to(m)
    else:
        folium.Marker(row[['lat', 'lng']].values, popup=popup, icon=folium.Icon(icon='home', color='green', prefix='fa')).add_to(m)

m

**Úkol 4**: Města, která nejsou hlavní, spojte při nižším rozlišení do shluků.

In [None]:
m = folium.Map(df3.loc['Prague', ['lat', 'lng']].values, zoom_start=5)
cl = folium.plugins.MarkerCluster().add_to(m)

for city, row in df3.iterrows():
    popup = folium.Popup(html=f"""
                              nazev mesta: {city} <br>
                              pocet obyvatel: {round(row['population']/1000000, 2)} milionu <br>
                              zeme: {row['country']} <br>
                              status: {row['capital']}
                              """,
                         max_width=500
                        )
    if row['capital'] == 'primary':
        folium.Marker(row[['lat', 'lng']].values, popup=popup, icon=folium.Icon(icon='building', prefix='fa')).add_to(m)
    else:
        folium.Marker(row[['lat', 'lng']].values, popup=popup, icon=folium.Icon(icon='home', color='green', prefix='fa')).add_to(cl)

m

**Úkol 5:** V mapě zobrazte pouze hlavní města v západní Evropě (region_in_world = 'Western Europe' v tabulce countries). Spočítejte vzdušné vzdálenosti mezi těmito městy. Do mapy přidejte úsečky spojující města. Při kliknutí na úsečku by se měly zobrazit názvy obou měst a vzdálenost mezi nimi.

Nápověda: Ke zjištění vzdáleností můžete použít modul geopy. Úsečka mezi dvěma body se do mapy přidá pomocí funkce PolyLine.

In [None]:
## spocitani vzdalenosti
# nacteni dat

countries_df = pd.read_sql("select * from countries", engine)
ct_df = pd.read_sql("select * from cities", engine)
df1 = countries_df.query("region_in_world == 'Western Europe'").set_index('iso3')[['country']]
df2 = ct_df.set_index('iso3')[['city_ascii', 'capital', 'lat', 'lng', 'population']]
ep_df = df1.join(df2)
df3 = ep_df.query("capital == 'primary'").set_index('city_ascii')

# vzdalenosti

from geopy.distance import geodesic
from itertools import combinations

@np.vectorize
def geodesic_vec(lat1, lon1, lat2, lon2):
    rs = geodesic( (lat1, lon1), (lat2, lon2) ).kilometers
    return rs

coords = np.array(list(combinations(df3[['lat', 'lng']].values, 2)))
coords = coords.reshape(coords.shape[0], 4)
distances = geodesic_vec(coords[:, 0], coords[:, 1], coords[:, 2], coords[:, 3])

combos = list(combinations(df3.index, 2))
dist_df = pd.DataFrame(distances, index=pd.Index(combos, names=['city1', 'city2']), columns=['distance'])
dist_df = dist_df.join(df3.rename_axis('city1')).join(df3.rename_axis('city2'), rsuffix='2')

##zobrazeni vzdalenosti
m = folium.Map(df3.loc['Luxembourg', ['lat', 'lng']].values, zoom_start=6)

for city, row in df3.iterrows():
    popup = folium.Popup(html=f"""
                              nazev mesta: {city} <br>
                              pocet obyvatel: {round(row['population']/1000000, 2)} milionu <br>
                              zeme: {row['country']} <br>
                              status: {row['capital']}
                              """,
                         max_width=500
                        )
    folium.Marker(row[['lat', 'lng']].values, popup=popup, icon=folium.Icon(icon='building', prefix='fa')).add_to(m)

for (city1, city2), row in dist_df.iterrows():
    folium.PolyLine([row[['lat', 'lng']].values.tolist(), row[['lat2', 'lng2']].values.tolist()], 
                    popup=folium.Popup(f"{city1} to {city2}: {int(row['distance'])} kilometers", max_width=500), 
                    opacity=0.25, 
                    color='black'
                   ).add_to(m)

m