In [592]:
import polars as pl
import altair as alt
from math import cos, radians

from src.kristi_promin import kristi_promin
from src.me_to_neurazi import me_to_neurazi

pl.Config.set_tbl_rows(150)
pl.Config.set_fmt_str_lengths(150)
pl.Config.set_tbl_width_chars(200)

alt.themes.register('irozhlas', kristi_promin)
alt.theme.enable('irozhlas')
alt.data_transformers.disable_max_rows()

DataTransformerRegistry.enable('default')

In [593]:
zkraceni = {
    "K - adresa knihovny: ulice": "ulice",
    "K - adresa knihovny: PSČ": "psc",
    "K - adresa knihovny: město": "mesto",
    "K - adresa knihovny: kraj": "kraj"
}

In [594]:
df = pl.read_excel(
    "data/knihovny/Evidence knihoven-11122025.xlsx"
).filter(
    pl.col("aktivní / zrušená (vyřazená z evidence)") == "A"
).rename(
    zkraceni
).with_columns(
    (
        pl.col("ulice") + ", " + 
        pl.col("mesto") + ", " + 
        pl.col("psc") + ", " + 
        pl.col("kraj") + ", Czechia"
    ).alias("search_query")
).select(
    pl.col(['I - NÁZEV KNIHOVNY','J - druh knihovny','ulice','psc','mesto','kraj','search_query'])
).with_columns(
    pl.all().str.strip_chars()
).with_columns(
    pl.col("J - druh knihovny").str.to_lowercase()
).with_columns(
    pl.when(pl.col("J - druh knihovny") == "základní").then(pl.lit("základní")).otherwise(pl.lit("jiná")).alias("kategorie")
)

Could not determine dtype for column 7, falling back to string
Could not determine dtype for column 9, falling back to string
Could not determine dtype for column 10, falling back to string
Could not determine dtype for column 20, falling back to string
Could not determine dtype for column 24, falling back to string
Could not determine dtype for column 34, falling back to string


In [595]:
republika = pl.read_parquet("data/knihovny/mrizka_republika.parquet")

In [596]:
republika.sort(by="count_within_10km")

index,grid_lat,grid_lon,nearest_point_dist_km,count_within_1km,count_within_2km,count_within_5km,count_within_10km
u32,f64,f64,f64,i64,i64,i64,i64
6771,49.929721,12.425424,10.706002,0,0,0,0
6772,49.931517,12.425424,10.511268,0,0,0,0
6773,49.933314,12.425424,10.316727,0,0,0,0
6774,49.935111,12.425424,10.122389,0,0,0,0
6990,49.918941,12.428209,11.919263,0,0,0,0
6991,49.920738,12.428209,11.724255,0,0,0,0
6992,49.922534,12.428209,11.52941,0,0,0,0
6993,49.924331,12.428209,11.334736,0,0,0,0
6994,49.926128,12.428209,11.140243,0,0,0,0
6995,49.927924,12.428209,10.945941,0,0,0,0


In [597]:
republika.select(pl.col("nearest_point_dist_km").median())

nearest_point_dist_km
f64
2.090581


In [598]:
republika.select(pl.col("count_within_5km").median())

count_within_5km
f64
5.0


In [599]:
adresy = pl.scan_parquet('data/knihovny/adresy/*.parquet').select(
    pl.col('I - NÁZEV KNIHOVNY','search_query','lon','lat')
).collect()

do_grafu = df.join(
    adresy,
    how='left',
    on='search_query'
).filter(
    ~pl.col('lon').is_null()
).drop(
    'I - NÁZEV KNIHOVNY_right'
).with_row_index(
).with_columns(
    pl.when(pl.col('index') == 4868).then(pl.lit(True)).otherwise(pl.lit(False)).alias('Velenice')
)

len(do_grafu)

5960

In [600]:
lon_min = do_grafu.select(pl.col('lon').min()).item()
lon_max = do_grafu.select(pl.col('lon').max()).item()
lat_min = do_grafu.select(pl.col('lat').min()).item()
lat_max = do_grafu.select(pl.col('lat').max()).item()

In [601]:
def calculate_realistic_dimensions(lon_min, lon_max, lat_min, lat_max, width=600):
    """
    Calculate realistic chart height based on latitude to account for Earth's curvature.
    
    At different latitudes, 1 degree of longitude represents different distances:
    - At equator: ~111 km per degree
    - At 50°N: ~71 km per degree (111 * cos(50°))
    
    Args:
        lon_min, lon_max: Longitude range
        lat_min, lat_max: Latitude range
        width: Desired chart width in pixels
    
    Returns:
        height: Calculated height in pixels for realistic aspect ratio
    """
    # Use center latitude for calculation
    center_lat = (lat_min + lat_max) / 2
    
    # Calculate the actual distance ratio
    # 1 degree longitude at this latitude vs 1 degree latitude
    lon_scale_factor = cos(radians(center_lat))
    
    # Calculate ranges
    lon_range = lon_max - lon_min
    lat_range = lat_max - lat_min
    
    # Calculate height to maintain realistic proportions
    # height/width should equal (lat_range)/(lon_range * cos(lat))
    height = width * (lat_range / (lon_range * lon_scale_factor))
    
    return int(height)

In [602]:
chart_width = 900
chart_height = calculate_realistic_dimensions(lon_min, lon_max, lat_min, lat_max, chart_width)

In [603]:
do_grafu.filter(pl.col('mesto').str.contains('Velenice'))

index,I - NÁZEV KNIHOVNY,J - druh knihovny,ulice,psc,mesto,kraj,search_query,kategorie,lon,lat,Velenice
u32,str,str,str,str,str,str,str,str,f64,f64,bool
2944,"""Obecní knihovna ve Velenicích""","""základní""","""Velenice 130""","""289 01""","""Velenice""","""Středočeský""","""Velenice 130, Velenice, 289 01, Středočeský, Czechia""","""základní""",15.223289,50.211336,False
4868,"""Městská knihovna České Velenice""","""základní""","""Na Sadech 166""","""378 10""","""České Velenice""","""Jihočeský""","""Na Sadech 166, České Velenice, 378 10, Jihočeský, Czechia""","""základní""",14.963881,48.769143,True


In [604]:
republika.filter(pl.col("index") == 95212)

index,grid_lat,grid_lon,nearest_point_dist_km,count_within_1km,count_within_2km,count_within_5km,count_within_10km
u32,f64,f64,f64,i64,i64,i64,i64
95212,49.442836,12.923816,0.24774,3,3,10,39


In [640]:
poi = pl.DataFrame(
    [
        {'index':426778,'grid_lat':50.091417,'grid_lon':14.418992,"text":["Praha: 195 knihoven v okruhu","10 km od náměstí Miloše Formana"]},
        {'index':95212,'grid_lat':50.246376,'grid_lon':13.139601,"text":["újezd","Hranice"]},
        {'index':843792,'grid_lat':50.590878,'grid_lon':14.811581,"text":["újezd","Ralsko"]},
        {'index':0,'grid_lon':14.963881,'grid_lat':48.769143,'text':['Městská knihovna České Velenice,','nejodlehlejší česká knihovna']}
    ]
)

In [606]:
kolecka_radky = [426778]

In [607]:
krouzky_radky = [95212,843792] #,1162714,1162714]

In [608]:
do_grafu.filter(pl.col("I - NÁZEV KNIHOVNY").str.contains("(?i)veterin"))

index,I - NÁZEV KNIHOVNY,J - druh knihovny,ulice,psc,mesto,kraj,search_query,kategorie,lon,lat,Velenice
u32,str,str,str,str,str,str,str,str,f64,f64,bool
1421,"""Knihovna Výzkumného ústavu veterinárního lékařství""","""základní se specializovaným knihovním fondem""","""Hudcova 70""","""621 32""","""Brno""","""Jihomoravský""","""Hudcova 70, Brno, 621 32, Jihomoravský, Czechia""","""jiná""",16.576239,49.239184,False


In [609]:
do_grafu.sample(3)

index,I - NÁZEV KNIHOVNY,J - druh knihovny,ulice,psc,mesto,kraj,search_query,kategorie,lon,lat,Velenice
u32,str,str,str,str,str,str,str,str,f64,f64,bool
877,"""Obecní knihovna Velké Kunětice""","""základní""","""Velké Kunětice 146""","""790 52""","""Velké Kunětice""","""Olomoucký""","""Velké Kunětice 146, Velké Kunětice, 790 52, Olomoucký, Czechia""","""základní""",17.252827,50.320647,False
5567,"""Místní knihovna MO Pardubice VI""","""základní""","""Kostnická 865""","""530 06""","""Pardubice""","""Pardubický""","""Kostnická 865, Pardubice, 530 06, Pardubický, Czechia""","""základní""",15.72881,50.026948,False
2544,"""Obecní knihovna Luková""","""základní""","""Luková 102""","""561 23""","""Damníkov""","""Pardubický""","""Luková 102, Damníkov, 561 23, Pardubický, Czechia""","""základní""",16.560971,49.870862,False


In [610]:
republika.select(pl.col("count_within_5km").median())

count_within_5km
f64
5.0


In [642]:
dvacet_km = 1100
velikost_textu = 15
tecky_tmava = '#2B61A2'
tecky_svetla = '#9ABFDD'
krouzky_barva = '#CA4955'
ostatni = '#171412'

tecky = alt.Chart(
    do_grafu,
    width=chart_width,
    height=chart_height
).mark_point(
    size=12,
    filled=True
).encode(
    alt.X('lon',scale=alt.Scale(domain=[lon_min,lon_max]),axis=None),
    alt.Y('lat',scale=alt.Scale(domain=[lat_min,lat_max]),axis=None),
    alt.Color("kategorie:N", scale=alt.Scale(range=[tecky_tmava]), legend=None),
    alt.Opacity("kategorie:N", scale=alt.Scale(range=[0.5,0.3]))
    # alt.Color('Velenice:N',scale=alt.Scale(range=['gray','red']), legend=None),
    # alt.Color('J - druh knihovny:N')
)

kolecka = alt.Chart(
    poi.filter(pl.col("index").is_in(kolecka_radky)),
    width=chart_width,
    height=chart_height
).mark_circle(
    size=dvacet_km,
    filled=True,
    color=krouzky_barva
).encode(
    alt.X('grid_lon',scale=alt.Scale(domain=[lon_min,lon_max]),axis=None),
    alt.Y('grid_lat',scale=alt.Scale(domain=[lat_min,lat_max]),axis=None),
)

krouzky = alt.Chart(
    poi.filter(pl.col("index").is_in(krouzky_radky)),
    width=chart_width,
    height=chart_height
).mark_circle(
    size=dvacet_km,
    filled=False,
    color=krouzky_barva
).encode(
    alt.X('grid_lon',scale=alt.Scale(domain=[lon_min,lon_max]),axis=None),
    alt.Y('grid_lat',scale=alt.Scale(domain=[lat_min,lat_max]),axis=None),
)

text = alt.Chart(
    poi, #.filter(pl.col("index") == 0),
    width=chart_width,
    height=chart_height
).mark_text(
    size=velikost_textu,
    opacity=1,
    align='left',
    dx=22,
    dy=-8.2,
    font='Noticia Text',
    fontWeight='bold',
    color=krouzky_barva
).encode(
    alt.X('grid_lon',scale=alt.Scale(domain=[lon_min,lon_max]),axis=None),
    alt.Y('grid_lat',scale=alt.Scale(domain=[lat_min,lat_max]),axis=None),
    alt.Text('text:N')
)

text_halo = alt.Chart(
    poi, 
    width=chart_width,
    height=chart_height
).mark_text(
    size=velikost_textu,
    align='left',
    dx=22,
    dy=-8.2,
    font='Noticia Text',
    fontWeight='bold',
    # --- The Magic Part ---
    color='white',        # Match your chart's background color
    stroke='white',       # Create an outline
    strokeWidth=5,        # Thickness of the halo (adjust as needed, 3-5 is usually good)
    opacity=0.8           # Optional: slight transparency if you want to see faint dots behind
).encode(
    alt.X('grid_lon', scale=alt.Scale(domain=[lon_min,lon_max]), axis=None),
    alt.Y('grid_lat', scale=alt.Scale(domain=[lat_min,lat_max]), axis=None),
    alt.Text('text:N')
)

podkresleni = alt.Chart(
    poi.filter(pl.col("index") == 0),
    width=chart_width,
    height=chart_height
).mark_point(
    size=dvacet_km,
    shape="circle",
    strokeDash=(5,3),
    color=krouzky_barva,
    align='left'
).encode(
    alt.X('grid_lon',scale=alt.Scale(domain=[lon_min,lon_max]),axis=None),
    alt.Y('grid_lat',scale=alt.Scale(domain=[lat_min,lat_max]),axis=None)
)

finalni_graf = (podkresleni + kolecka + krouzky + tecky + text_halo + text).configure_view(
    stroke='transparent'
).properties(
    title=alt.Title(
        f'5 960 českých veřejných knihoven',
        subtitle=[
            "Svělejší tečky jsou knihovny všeobecné, tmavé specializované. Všechny kruhy mají poloměr 10 kilometrů."
        ],
        fontSize=velikost_textu * 1.5,
        subtitleFontSize=velikost_textu,
        dy=-40
    )
)

finalni_graf


In [644]:
me_to_neurazi(graf=finalni_graf, kredity="Zdroj dat: Databáze knihoven Ministerstva kultury, prosinec 2025.", soubor="02_mapa_knihoven")

<figure>
    <a href="https://data.irozhlas.cz/grafy/02_mapa_knihoven.svg" target="_blank">
    <img src="https://data.irozhlas.cz/grafy/02_mapa_knihoven.svg" width="100%" alt="Graf s titulkem „5 960 českých veřejných knihoven“. Další texty by měly být čitelné ze zdrojového souboru SVG." />
    </a>
    </figure>
