In [15]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import LineString
import matplotlib.pyplot as plt

In [16]:
# 1. Načti data
df = pd.read_excel('../data/czech/data_czech.xlsx')

# 2. Ulož název krajů ze sloupce a nastav index
df = df.rename(columns={'University ↓ / Student →': 'origin'})
df = df.set_index('origin')

# 3. Očisti názvy (pro jistotu, kvůli shodě)
df.index = df.index.str.strip()
df.columns = df.columns.str.strip()

# 4. Pro každou krajskou kombinaci: pokud je řádek == sloupec → nastav 0
for region in df.index:
    if region in df.columns:
        df.at[region, region] = 0

# 5. Výstup pro kontrolu
df

Unnamed: 0_level_0,Hlavní město Praha,Středočeský kraj,Jihočeský kraj,Plzeňský kraj,Karlovarský kraj,Ústecký kraj,Liberecký kraj,Královéhradecký kraj,Pardubický kraj,Kraj Vysočina,Jihomoravský kraj,Olomoucký kraj,Zlínský kraj,Moravskoslezský kraj
origin,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1
Hlavní město Praha,0,24305,5838,4205,2652,6997,4035,4703,3343,3160,3240,2056,2077,3449
Jihomoravský kraj,986,1432,1195,316,226,555,458,1590,2648,5103,0,3690,4856,4570
Jihočeský kraj,572,1268,0,984,197,211,109,78,111,1081,178,67,36,78
Královéhradecký kraj,366,978,143,80,67,269,475,0,1519,443,177,170,136,224
Liberecký kraj,324,1026,37,41,46,655,0,711,87,48,49,25,17,42
Moravskoslezský kraj,232,296,99,80,35,283,109,228,400,233,718,1989,1423,0
Olomoucký kraj,640,748,212,167,101,297,281,801,1621,644,2230,0,2833,4082
Pardubický kraj,262,962,76,94,33,125,265,1344,0,384,208,180,98,189
Plzeňský kraj,657,1243,1229,0,1352,951,182,146,100,140,75,53,66,85
Středočeský kraj,548,0,141,103,83,232,231,173,51,65,37,27,24,39


In [17]:
# Load spatial regions
gdf = gpd.read_file('../data/czech/regions.gpkg')

# Keep only necessary columns and compute centroids
gdf = gdf[['nazev', 'geometry']]

# Compute centroids
gdf['centroid'] = gdf.geometry.centroid

# Show the result
gdf.head()

Unnamed: 0,nazev,geometry,centroid
0,Hlavní město Praha,"MULTIPOLYGON (((4644153.668 3017220.732, 46441...",POINT (4640553.289 3004667.586)
1,Jihočeský kraj,"MULTIPOLYGON (((4614559.886 2946839.972, 46145...",POINT (4644571.676 2896376.941)
2,Plzeňský kraj,"MULTIPOLYGON (((4557165.672 3003874.933, 45571...",POINT (4554357.223 2947867.821)
3,Karlovarský kraj,"MULTIPOLYGON (((4521107.248 3042368.860, 45211...",POINT (4517635.093 3010561.894)
4,Liberecký kraj,"MULTIPOLYGON (((4672911.633 3113397.259, 46729...",POINT (4673801.100 3077989.990)


In [25]:
# Příchozí studenti do každého kraje
prichozi = df.sum(axis=1).rename('prichozi')
prichozi = prichozi.reset_index().set_index('origin')

# Odchozí studenti z každého kraje
odchozi = df.sum(axis=0).rename('odchozi')
odchozi = odchozi.reset_index().set_index('index')

print(prichozi)
print(odchozi)

                      prichozi
origin                        
Hlavní město Praha       70060
Jihomoravský kraj        27625
Jihočeský kraj            4970
Královéhradecký kraj      5047
Liberecký kraj            3108
Moravskoslezský kraj      6125
Olomoucký kraj           14657
Pardubický kraj           4220
Plzeňský kraj             6279
Středočeský kraj          1754
Kraj Vysočina              690
Zlínský kraj              4152
Ústecký kraj              2666
                      odchozi
index                        
Hlavní město Praha       5169
Středočeský kraj        33302
Jihočeský kraj           9206
Plzeňský kraj            6198
Karlovarský kraj         5196
Ústecký kraj            10637
Liberecký kraj           6707
Královéhradecký kraj    10013
Pardubický kraj         10176
Kraj Vysočina           11552
Jihomoravský kraj        8573
Olomoucký kraj           9551
Zlínský kraj            11606
Moravskoslezský kraj    13467


Hlavní město Praha       5169
Středočeský kraj        33302
Jihočeský kraj           9206
Plzeňský kraj            6198
Karlovarský kraj         5196
Ústecký kraj            10637
Liberecký kraj           6707
Královéhradecký kraj    10013
Pardubický kraj         10176
Kraj Vysočina           11552
Jihomoravský kraj        8573
Olomoucký kraj           9551
Zlínský kraj            11606
Moravskoslezský kraj    13467
Name: odchozi, dtype: int64
