In [1]:
import os
import json
import datetime
import warnings
import polars as pl
import pandas as pd
import altair as alt

from src.najdi_rok import najdi_rok
from src.pocet_stran import pocet_stran
from src.bez_bordelu import bez_bordelu
from src.alt_friendly import alt_friendly
from src.hezke_jmeno import hezke_jmeno
from src.kristi_promin import kristi_promin
from src.me_to_neurazi import me_to_neurazi

with open(os.path.join('src','kredity.json'), 'r', encoding='utf-8') as kredity:
    kredity = json.loads(kredity.read())
pl.Config(tbl_rows=100)
alt.data_transformers.disable_max_rows()
alt.themes.register('irozhlas', kristi_promin)
alt.themes.enable('irozhlas')
warnings.filterwarnings('ignore')

In [2]:
df = pl.read_parquet(os.path.join("data","cnb_ceska_proza.parquet")).rename({'autorstvo_kod':'100_7'})
df = pl.concat([df, pl.read_parquet(os.path.join("data","cnb_ceska_poezie.parquet"))])
spisovatelstvo = list(set(df.select(pl.col('100_7')).drop_nulls().to_series().to_list()))

In [3]:
len(spisovatelstvo)

18952

In [4]:
df = pl.read_parquet(os.path.join("data/cnb_sloupce","100.parquet"))

In [5]:
df = df.filter(pl.col("100_7").is_in(spisovatelstvo))

In [6]:
aut = pl.read_parquet(os.path.join("data","aut_vyber.parquet")).explode("370_c").filter(pl.col("370_c").str.contains("Česk")).explode("100_7").select(["100_7","374_a","375_a","678_a"])

In [7]:
aut

100_7,374_a,375_a,678_a
str,list[str],list[str],list[str]
"""jk01010001""",,,"[""Narozen 14.12.1931 v Osvračíně. MUDr., odborný asistent na klinice dětské neurologie fakulty dětského lékařství University Karlovy v Praze, práce z oboru.""]"
"""jk01010002""",,,"[""Narozen 19.11.1890 v Osvračíně u Horšova Týna, zemřel 21.7.1933 tamtéž. Ředitel školy v Klenčí, odborný učitel v Domažlicích, básník.""]"
"""jk01010003""",,,"[""Narozen roku 1957. Student filosofické fakulty university v Brně, básně v časopisech.""]"
"""jk01010004""","[""katoličtí kněží"", ""básníci""]","[""muž""]","[""Narozen 27. 1. 1889 v Odrlicích na Moravě, zemřel 22. 7. 1963. Kněz v Milovanech u Čermné, básník.""]"
"""jk01010005""",,,"[""Narozen 16.6.1877 v Boskovicích, zemřel 6.10.1960 v Brně. PhDr., profesor geografie, antropolog, archeolog, speleolog, publikace v oboru.""]"
"""jk01010009""",,,"[""Narozen roku 1843 ve Fryštáku, zemřel 22.7.1882 v Boskovicích. MUDr., zámecký a obvodní lékař v Boskovicích, časopisecké články.""]"
"""jk01010010""",,,"[""Narozena 1.10.1904 v Olšance na Volyňsku - Ukrajina, zemřela v roce 1995. Úřednice Ústřední rady odborů, překladatelka z ruštiny.""]"
"""jk01010012""",,,"[""Narozen 8.3.1803 v Dobřanech, zemřel 3.12.1875 v Litoměřicích. Děkan kapituly v Litoměřicích, autor modlitební knihy, překladatel do dánštiny.""]"
"""jk01010013""",,,"[""Narozen roku 1832, zemřel roku 1880. Povídkář v Poličce, příspěvky do časopisů.""]"
"""jk01010014""",,,"[""Autorka příručky o ručním tkaní koberců, předložek a tapisérií.""]"


In [8]:
df = df.join(aut, left_on="100_7", right_on="100_7", how="left")

In [9]:
df

100_ind1,100_a,100_7,100_4,100_d,100_q,100_c,100_b,100_e,001,374_a,375_a,678_a
str,str,str,list[str],str,str,list[str],str,str,str,list[str],list[str],list[str]
"""1""","""Holub, Ota,""","""jk01041820""","[""aut""]","""1930-1992""",,,,,"""ck8300092""","[""publicisté"", ""spisovatelé""]","[""muž""]","[""Narozen roku 1930 v Malých Svatoňovicích, zemřel roku 1992. Publicista, žurnalista, vojenský historik. Specializoval se na československé vojenské dějiny a byl průkopníkem popularizace a zpřístupnění prvorepublikových bunkrů a opevnění.""]"
"""1""","""Tupý, Karel,""","""jk01140425""","[""aut""]","""1920-""",,,,,"""ck8300135""",,,"[""Narozen 20.5.1920 v Praze. PhDr., pedagog, práce z oboru.""]"
"""1""","""Smutný, Oldřich,""","""jk01120196""","[""aut"", ""pht""]","""1925-2013""",,,,,"""ck8300198""",,,"[""Narozen 17. 6. 1925 v Debři nad Jizerou, zemřel 1. 9. 2013 v Putimi u Písku. Pedagog, spisovatel, scénograf, kostýmní výtvarník, malíř.""]"
"""1""","""Tošner, Jindřich,""","""jn19990209929""","[""aut""]","""1947-""",,,,,"""ck8300221""","[""lékaři"", ""gynekologové"", … ""vysokoškolští učitelé""]","[""muž""]","[""Narozen 16. 10. 1947 v Žatci. Lékař, gynekolog, přednosta porodnicko-gynekologické kliniky LF UK a FN Hradec Králové (1991-2012). Majitel nakladatelství Medexart, vydavatel časopisu Gynekolog, básník, prozaik a publicista. Spoluautor učebnic gynekologie a porodnictví.""]"
"""1""","""Hons, Josef,""","""jk01041936""","[""aut""]","""1907-2001""",,,,,"""ck8300248""","[""spisovatelé"", ""básníci"", … ""vysokoškolští učitelé""]","[""muž""]","[""Narozen 16. 10. 1907 v Kutné Hoře, zemřel 26. 2. 2001 v Praze. Ing., vysokoškolský pedagog, prozaik píšící zvláště pro děti a mládež. Básník, publicista, autor odborných prací o dopravě.""]"
"""1""","""Škodová, Helena,""","""jx20040618039""","[""aut""]","""1955-""",,,,,"""ck8300304""",,,"[""Narozena 1955. Spisovatelka knih pro děti, populárně-naučné knihy.""]"
"""1""","""Krijtová, Olga,""","""jk01063330""","[""aut""]","""1931-2013""",,,,,"""ck8300334""",,,"[""Narozena 30.3.1931 v Hradci Králové, zemřela 7. 11. 2013. PhDr., nederlandistka, překladatelka zejména z holandštiny, též z angličtiny, knížka pro děti.""]"
"""1""","""Rzounek, Vítězslav,""","""jk01103438""","[""aut""]","""1921-2001""",,,,,"""ck8300395""",,,"[""Narozen 2.5.1921 ve Vlašimi, zemřel 11.2.2001. PhDr., DrSc., profesor české literatury, práce z oboru.""]"
"""1""","""Cincibuch, Petr,""","""jk01020728""","[""aut""]","""1943-""",,,,,"""ck8300396""",,,"[""Narozen 28. 6. 1943 v Praze. Básník, prozaik, redaktor kulturních časopisů, editor knih o historii automobilismu.""]"
"""1""","""Florian, Miroslav,""","""jk01031461""","[""aut""]","""1931-1996""",,,,,"""ck8300397""",,,"[""Narozen 10.5.1931 v Kutné Hoře, zemřel 10.5.1996. Básník, překlad ze slovenštiny.""]"


In [10]:
df = df.join(pl.read_parquet(os.path.join("data/cnb_sloupce","008.parquet")), left_on="001", right_on="001", how="left")

In [11]:
df = df.join(pl.read_parquet(os.path.join("data/cnb_sloupce","245.parquet")), left_on="001", right_on="001", how="left")

In [12]:
df = df.join(pl.read_parquet(os.path.join("data/cnb_sloupce","655.parquet")), left_on="001", right_on="001", how="left")

In [13]:
df

100_ind1,100_a,100_7,100_4,100_d,100_q,100_c,100_b,100_e,001,374_a,375_a,678_a,008,245_ind1,245_ind2,245_a,245_b,245_c,245_n,245_p,245_h,245_f,245_s,655_ind2,655_a,655_7,655_2,655_ind1,655_y,655_z
str,str,str,list[str],str,str,list[str],str,str,str,list[str],list[str],list[str],str,str,str,str,str,str,list[str],list[str],str,str,str,list[str],list[str],list[str],list[str],list[str],list[str],list[str]
"""1""","""Holub, Ota,""","""jk01041820""","[""aut""]","""1930-1992""",,,,,"""ck8300092""","[""publicisté"", ""spisovatelé""]","[""muž""]","[""Narozen roku 1930 v Malých Svatoňovicích, zemřel roku 1992. Publicista, žurnalista, vojenský historik. Specializoval se na československé vojenské dějiny a byl průkopníkem popularizace a zpřístupnění prvorepublikových bunkrů a opevnění.""]","""830218s1982 xr a u0…","""1""","""0""","""Zrazené pevnosti /""",,"""Ota Holub""",,,,,,,,,,,,
"""1""","""Tupý, Karel,""","""jk01140425""","[""aut""]","""1920-""",,,,,"""ck8300135""",,,"[""Narozen 20.5.1920 v Praze. PhDr., pedagog, práce z oboru.""]","""830323s1983 xr u0…","""1""","""0""","""Metodická příručka k Českému j…",,"""Karel Tupý ; Bohumila Gregorov…",,,,,,"[""7""]","[""metodické příručky""]","[""fd132826""]","[""czenas""]",,,
"""1""","""Smutný, Oldřich,""","""jk01120196""","[""aut"", ""pht""]","""1925-2013""",,,,,"""ck8300198""",,,"[""Narozen 17. 6. 1925 v Debři nad Jizerou, zemřel 1. 9. 2013 v Putimi u Písku. Pedagog, spisovatel, scénograf, kostýmní výtvarník, malíř.""]","""951020s1982 xr af b 0…","""1""","""0""","""Labutě... labutě /""",,"""Oldřich Smutný""",,,,,,"[""7"", ""7"", … ""9""]","[""vyprávění"", ""fotografické publikace"", … ""children's literature""]","[""fd133823"", ""fd132276"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,
"""1""","""Tošner, Jindřich,""","""jn19990209929""","[""aut""]","""1947-""",,,,,"""ck8300221""","[""lékaři"", ""gynekologové"", … ""vysokoškolští učitelé""]","[""muž""]","[""Narozen 16. 10. 1947 v Žatci. Lékař, gynekolog, přednosta porodnicko-gynekologické kliniky LF UK a FN Hradec Králové (1991-2012). Majitel nakladatelství Medexart, vydavatel časopisu Gynekolog, básník, prozaik a publicista. Spoluautor učebnic gynekologie a porodnictví.""]","""830323s1982 xr u0…","""1""","""0""","""Praktická cvičení z gynekologi…","""skriptum pro posl. lék. fakult…","""Jindřich Tošner ; Miroslav Cha…",,,,,,"[""7""]","[""učebnice vysokých škol""]","[""fd133772""]","[""czenas""]",,,
"""1""","""Hons, Josef,""","""jk01041936""","[""aut""]","""1907-2001""",,,,,"""ck8300248""","[""spisovatelé"", ""básníci"", … ""vysokoškolští učitelé""]","[""muž""]","[""Narozen 16. 10. 1907 v Kutné Hoře, zemřel 26. 2. 2001 v Praze. Ing., vysokoškolský pedagog, prozaik píšící zvláště pro děti a mládež. Básník, publicista, autor odborných prací o dopravě.""]","""830407s1983 xr a u0…","""1""","""0""","""Stavíme svět /""",,"""Josef Hons ; il. Michal Brix""",,,,,,"[""7""]","[""publikace pro děti""]","[""fd133156""]","[""czenas""]",,,
"""1""","""Škodová, Helena,""","""jx20040618039""","[""aut""]","""1955-""",,,,,"""ck8300304""",,,"[""Narozena 1955. Spisovatelka knih pro děti, populárně-naučné knihy.""]","""830401s1982 xr a 0…","""1""","""0""","""Zákulisí velkoměsta :""","""[pro čtenáře od 8 let] /""","""Helena a Eduard Škodovi ; ilus…",,,,,,"[""7""]","[""publikace pro děti""]","[""fd133156""]","[""czenas""]",,,
"""1""","""Krijtová, Olga,""","""jk01063330""","[""aut""]","""1931-2013""",,,,,"""ck8300334""",,,"[""Narozena 30.3.1931 v Hradci Králové, zemřela 7. 11. 2013. PhDr., nederlandistka, překladatelka zejména z holandštiny, též z angličtiny, knížka pro děti.""]","""830303s1982 xr u0…","""1""","""0""","""Česko-nizozemské rozhovory :""","""základní konverzace : určeno p…","""OLga Krijtová""",,,,,,"[""7""]","[""učebnice vysokých škol""]","[""fd133772""]","[""czenas""]",,,
"""1""","""Rzounek, Vítězslav,""","""jk01103438""","[""aut""]","""1921-2001""",,,,,"""ck8300395""",,,"[""Narozen 2.5.1921 ve Vlašimi, zemřel 11.2.2001. PhDr., DrSc., profesor české literatury, práce z oboru.""]","""830208s1982 xr e p u0…","""1""","""0""","""Nástin poválečné české literat…","""skripta pro posl. filozof. fak…","""Vítězslav Rzounek""",,,,,,"[""7""]","[""učebnice vysokých škol""]","[""fd133772""]","[""czenas""]",,,
"""1""","""Cincibuch, Petr,""","""jk01020728""","[""aut""]","""1943-""",,,,,"""ck8300396""",,,"[""Narozen 28. 6. 1943 v Praze. Básník, prozaik, redaktor kulturních časopisů, editor knih o historii automobilismu.""]","""830321s1983 xr a u0…","""1""","""0""","""Medový kámen :""","""výbor z milostné poezie /""","""Petr Cincibuch ; ilustrace Mic…",,,,,,,,,,,,
"""1""","""Florian, Miroslav,""","""jk01031461""","[""aut""]","""1931-1996""",,,,,"""ck8300397""",,,"[""Narozen 10.5.1931 v Kutné Hoře, zemřel 10.5.1996. Básník, překlad ze slovenštiny.""]","""830405s1982 xr a 0…","""1""","""0""","""Pražský výběr /""",,"""Miroslav Florian ; kresby Ladi…",,,,,,"[""7""]","[""poezie""]","[""fd131936""]","[""czenas""]",,,


In [14]:
df.explode("655_a").group_by("655_a").len().top_k(100, by="len")

655_a,len
str,u32
,61423
"""publikace pro děti""",19698
"""česká poezie""",17143
"""české romány""",16997
"""children's literature""",14162
"""Czech fiction""",12585
"""Czech poetry""",12197
"""české příběhy""",9660
"""české povídky""",9036
"""Czech stories""",8382


In [15]:
df = df.explode("655_a")

## 1. verze

In [17]:
poezie = df.filter(pl.col('655_a').str.contains('poez|poetr')).with_columns(kategorie = pl.lit('poezie'))
proza = df.filter(pl.col('655_a').str.contains('román|fiction|novel|příbě|povíd|stor|próz')).with_columns(kategorie = pl.lit('próza'))
vzpominky = df.filter(pl.col('655_a').str.contains('vzpomínky|autobiographical')).with_columns(kategorie = pl.lit('vzpomínky'))

In [18]:
do_grafu = pl.concat([poezie, proza, vzpominky])
from src.najdi_rok import najdi_rok
do_grafu = do_grafu.with_columns(pl.col('008').map_elements(najdi_rok, return_dtype=int).alias('rok'))
do_grafu = do_grafu.sort(by="rok").unique(subset=['100_a','245_a'],keep='first')

In [19]:
def narozeni(udaje):
    try:
        return int(udaje.split("-")[0])
    except:
        return None
        
def umrti(udaje):
    try:
        return int(udaje.split("-")[1])
    except:
        return None

In [20]:
do_grafu = do_grafu.with_columns(pl.col("100_d").map_elements(narozeni).alias('narozeni')).with_columns(pl.col("100_d").map_elements(umrti).alias('umrti'))

In [21]:
do_grafu = do_grafu.drop_nulls("narozeni")

In [22]:
do_grafu = do_grafu.with_columns((pl.col("rok") - pl.col("narozeni")).alias("vek"))

In [23]:
do_grafu = do_grafu.filter(pl.col("vek") > 6)

In [24]:
do_grafu.sort(by="vek").head(n=10)

100_ind1,100_a,100_7,100_4,100_d,100_q,100_c,100_b,100_e,001,374_a,375_a,678_a,008,245_ind1,245_ind2,245_a,245_b,245_c,245_n,245_p,245_h,245_f,245_s,655_ind2,655_a,655_7,655_2,655_ind1,655_y,655_z,kategorie,rok,narozeni,umrti,vek
str,str,str,list[str],str,str,list[str],str,str,str,list[str],list[str],list[str],str,str,str,str,str,str,list[str],list[str],str,str,str,list[str],str,list[str],list[str],list[str],list[str],list[str],str,i64,i64,i64,i64
"""1""","""Prager, Josef,""","""jk01100877""","[""aut""]","""1893-""",,,,,"""bkneli06814""",,,"[""Narozen 1.9.1893 v Praze. Strojník, prozaik, dramatik.""]","""020810s1900 xr f |…","""1""","""0""","""Vyvrženci :""","""Román /""","""Josef Prager""",,,,,,"[""7""]","""české romány""","[""fd133974""]","[""czenas""]",,,,"""próza""",1900,1893,,7
"""1""","""Bílá, Viola Zoe,""","""jo2017972267""","[""aut"", ""ill""]","""2009-""",,,,,"""nkc20172895241""",,"[""žena""]","[""Narozena 8. 12. 2009. Autorka ilustrací a písniček pro děti.""]","""171115t20172017xr ag a 0…","""1""","""0""","""Jak pejsek a kočička pěstovali…",,"""Viola Zoe Bílá, Jonáš Bílý, Al…",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2017,2009,,8
"""1""","""Šmerda, Jakub,""","""mzk2005309121""","[""aut"", ""ill""]","""1995-""",,,,,"""nkc20051580412""",,,"[""Narozen 1995 v Lysicích. Povídky dětského autora s vlastními ilustracemi knihy.""]","""050831s2005 xr a c 0…","""1""","""0""","""Povídáme si s přírodou /""",,"""Jakub Šmerda""",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2005,1995,,10
"""1""","""Sobotková, Anna,""","""mzk2008479487""","[""ill""]","""1998-""",,,,,"""nkc20081823565""",,,"[""Narozena 1998. Autorka ilustrací pohádek a příběhů pro děti.""]","""081110s2008 xr a c 0…","""1""","""0""","""Chaloupka mezi lesy /""",,"""[ilustrace] Anna Sobotková & […",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2008,1998,,10
"""1""","""Horák, Radoslav,""","""ola2006340113""","[""aut""]","""1995-""",,,,,"""nkc20061653061""","[""spisovatelé"", ""literární vědci""]","[""muž""]","[""Narozen 17. 4. 1995 v Šumperku. Mgr., odborník v oblasti českého filmu, též spisovatel, držitel ceny Zlatý oříšek pro nadané děti za rok 2004.""]","""060524s2006 xr a b 0…","""1""","""0""","""Energetický čaj /""",,"""Radoslav Horák ; [ilustrace Na…",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2006,1995,,11
"""1""","""Fialová, Nela,""","""xx0195899""","[""aut"", ""ill""]","""2004-""",,,,,"""nkc20152722712""",,"[""žena""]","[""Narozena 31. 5. 2004. Autorka poezie.""]","""150713t20152015xr a b 0…","""1""","""0""","""Slepice v Africe /""",,"""Nela Fialová ; ilustrace v tex…",,,,,,"[""7"", ""7"", … ""9""]","""česká poezie""","[""fd133958"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""poezie""",2015,2004,,11
"""1""","""Bašová, Kateřina,""","""mzk2012695337""","[""aut"", ""ill""]","""2001-""",,,,,"""nkc20122359263""",,,"[""Narozena 2011 v Rakovníku. Autorka a ilustrátorka publikací pro děti.""]","""120405s2012 xr a b 0…","""1""","""0""","""Nelly na ostrově skřítků a elf…",,"""Kateřina Bašová""",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2012,2001,,11
"""1""","""Kozlova, Rebecca,""","""xx0211642""","[""aut"", ""ill""]","""2005-""",,,,,"""nkc20172882382""",,"[""žena""]","[""Narozena 19. 5. 2005. Autorka povídek a ilustrátorka.""]","""170224s2016 xr a b 0…","""1""","""0""","""Kubíkovy prázdniny /""",,"""Rebecca Kozlova""",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2016,2005,,11
"""1""","""Bradáčová, Sofie,""","""mzk2018979890""","[""aut""]","""2006-""",,,,,"""nkc20182970541""","[""spisovatelky""]","[""žena""]","[""Narozena 21. 4. 2006. Autorka knihy pro děti.""]","""180117s2017 xr a b 0…","""1""","""0""","""Kouzelná kniha /""",,"""Sofie Bradáčová ; ilustrovala …",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2017,2006,,11
"""1""","""Pokorná, Kristýna,""","""jo2013743744""","[""aut"", ""ill""]","""2000-""",,,,,"""nkc20132435733""",,,"[""Narozena 2000 v Praze. Autorka prózy.""]","""130124s2012 xr a c 0…","""1""","""0""","""Králičí válečníci.""",,"""napsala a nakreslila Kristýna …",,"[""Z domova do divočiny /""]",,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2012,2000,,12


In [25]:
do_grafu = do_grafu.filter((pl.col("umrti") >= pl.col('rok')) | pl.col("umrti").is_null())

In [26]:
do_grafu = do_grafu.filter(pl.col("vek") < 110)

In [27]:
do_grafu2 = do_grafu.filter(pl.col("rok") < 1900).group_by(["vek","kategorie"]).len().rename({"len":"počet","vek":"věk"})

alt.Chart(do_grafu2.to_pandas()).mark_line().encode(
    alt.X('věk:Q').axis(domain=False, tickSize=0),
    alt.Y('počet:Q').stack('zero').axis(None),
    alt.Color('kategorie:N')
)

In [28]:
do_grafu2 = do_grafu.filter(pl.col("rok").is_between(1875,1925)).group_by(["vek","kategorie"]).len().rename({"len":"počet","vek":"věk"})

alt.Chart(do_grafu2.to_pandas()).mark_line().encode(
    alt.X('věk:Q').axis(domain=False, tickSize=0),
    alt.Y('počet:Q').stack('zero').axis(None),
    alt.Color('kategorie:N')
)

In [29]:
do_grafu2 = do_grafu.filter(pl.col("rok").is_between(1925,1975)).group_by(["vek","kategorie"]).len().rename({"len":"počet","vek":"věk"})
print(len(do_grafu.filter(pl.col("rok").is_between(1925,1975))))

alt.Chart(do_grafu2.to_pandas()).mark_line().encode(
    alt.X('věk:Q').axis(domain=False, tickSize=0),
    alt.Y('počet:Q').stack('zero').axis(None),
    alt.Color('kategorie:N')
)

5047


In [30]:
do_grafu2 = do_grafu.filter(pl.col("rok").is_between(1995,2025)).group_by(["vek","kategorie"]).len().rename({"len":"počet","vek":"věk"})
print(len(do_grafu.filter(pl.col("rok").is_between(1995,2025))))

alt.Chart(do_grafu2.to_pandas()).mark_line().encode(
    alt.X('věk:Q').axis(domain=False, tickSize=0),
    alt.Y('počet:Q').stack('zero').axis(None),
    alt.Color('kategorie:N')
)

34557


In [31]:
do_grafu2 = do_grafu.filter(pl.col("rok") > 1950).group_by(["vek","kategorie"]).len().rename({"len":"počet","vek":"věk"})

alt.Chart(do_grafu2.to_pandas()).mark_line().encode(
    alt.X('věk:Q').axis(domain=False, tickSize=0),
    alt.Y('počet:Q').stack('zero').axis(None),
    alt.Color('kategorie:N')
)

## Mediánový věk

In [33]:
do_grafu.group_by("kategorie").agg(pl.col("vek").median())

kategorie,vek
str,f64
"""poezie""",52.0
"""vzpomínky""",66.0
"""próza""",51.0


## Druhý pokus

In [35]:
do_grafu.sample(10)

100_ind1,100_a,100_7,100_4,100_d,100_q,100_c,100_b,100_e,001,374_a,375_a,678_a,008,245_ind1,245_ind2,245_a,245_b,245_c,245_n,245_p,245_h,245_f,245_s,655_ind2,655_a,655_7,655_2,655_ind1,655_y,655_z,kategorie,rok,narozeni,umrti,vek
str,str,str,list[str],str,str,list[str],str,str,str,list[str],list[str],list[str],str,str,str,str,str,str,list[str],list[str],str,str,str,list[str],str,list[str],list[str],list[str],list[str],list[str],str,i64,i64,i64,i64
"""1""","""Sani, Jitka,""","""jx20040608001""","[""aut""]","""1969-""",,,,,"""nkc20193086975""","[""spisovatelky""]","[""žena""]","[""Narozena 11. 3. 1969 v Pardubicích. Spisovatelka, autorka knih pro děti a mládež, také autorka prací z oboru astrologie.""]","""190404s2018 xr a b 0…","""1""","""0""","""Čo radia zvieratká /""",,"""text Jitka Saniová ; ilustráci…",,,,,,"[""7"", ""7"", … ""9""]","""příběhy""","[""fd133204"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2018,1969,,49
"""1""","""Král, Petr,""","""jk01062798""","[""aut""]","""1941-2020""",,,,,"""nkc20112257627""","[""básníci"", ""spisovatelé"", … ""překladatelé""]","[""muž""]","[""Narozen 4. 9. 1941 v Praze, zemřel 17. 6. 2020. Básník, prozaik, esejista, filmový teoretik a překladatel, publikoval česky a francouzsky.""]","""111101s2011 xr e 0…","""1""","""0""","""Medové kuželky /""",,"""Petr Král ; [k vydání připravi…",,,,,,"[""7"", ""7"", … ""9""]","""české prózy""","[""fd133972"", ""fd119292"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2011,1941,2020.0,70
"""1""","""Chrudina, Ladislav,""","""jn20000400401""","[""aut""]","""1948-""",,,,,"""nkc20061684524""",,,"[""Narozen 9.9.1948 v Hrabenově. Ing., CSc., ekonom, práce z oboru financování a hodnocení efektivnosti investic a řízení výroby, též spisovatel, beletrista.""]","""060804s2006 xr a g 0…","""1""","""0""","""Hradby Senje :""","""historický román o lásce a nen…","""Ladislav Chrudina""",,,,,,"[""7"", ""7"", … ""9""]","""české romány""","[""fd133974"", ""fd132414"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2006,1948,,58
"""1""","""Pantovič, Kateřina,""","""xx0213703""","[""aut""]","""1989-""",,,,,"""nkc20233521769""","[""spisovatelky""]","[""žena""]","[""Narozena roku 28. 2. 1989 ve Vrchlabí. Spisovatelka, autorka knih pro děti, redaktorka a moderátorka.""]","""230522s2023 xr a b 0…","""1""","""0""","""Mína a náhodní kolemjdoucí /""",,"""napsala Kateřina Pantovič ; il…",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2023,1989,,34
"""1""","""Duda, Vladimír,""","""xx0313632""","[""aut""]","""1951-""",,,,,"""nkc20243585995""","[""spisovatelé"", ""technici""]","[""muž""]","[""Narozen v roce 1951 v Ostravě. Autor knihy pro děti.""]","""240206s2024 xr a c 0…","""1""","""0""","""Oliver a tajemný Kardoneon /""",,"""Vladimír Duda ; ilustroval Jar…",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133358"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2024,1951,,73
"""1""","""Drijverová, Martina,""","""jk01023067""","[""aut""]","""1951-2022""",,,,,"""nkc20132473976""","[""spisovatelky"", ""prozaičky"", … ""překladatelky""]","[""žena""]","[""Narozena 10. 7. 1951 v Praze, zemřela 2022. Prozaička, dramatička, scenáristka, překladatelka z francouzštiny, autorka knih pro děti.""]","""130705s2013 xr d 0…","""1""","""0""","""Malé věci, velké věci /""",,"""Martina Drijverová""",,,,,,"[""7"", ""7"", … ""9""]","""české romány""","[""fd133974"", ""fd133157"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2013,1951,2022.0,62
"""1""","""Kotleta, František""","""xx0123480""","[""aut""]","""1981-""",,"[""(fiktivní postava),""]",,,"""nkc20142646807""","[""spisovatelé"", ""podnikatelé"", ""řezníci""]","[""muž""]","[""František Kotleta je fiktivní český spisovatel, trestanec, podnikatel a řezník. Jeho autorem je český spisovatel Leoš Kyša (nar. 1979), který pod jménem František Kotleta píše sci-fi romány.""]","""141125s2014 xr nnnng …","""1""","""0""","""Hustej nářez""","""[kultovní akční sci-fi : upíři…","""František Kotleta""",,,"""[zvukový záznam] :""",,,"[""7"", ""7"", … ""7""]","""české romány""","[""fd133974"", ""fd184199"", … ""fd201991""]","[""czenas"", ""czenas"", … ""czenas""]",,,,"""próza""",2014,1981,,33
"""1""","""Karásková, Nikola,""","""xx0316741""","[""aut""]","""1993-""",,,,,"""nkc20223422581""","[""středoškolské učitelky""]","[""žena""]","[""Narozena 18. 11. 1993 v Jindřichově Hradci. Středoškolská učitelka českého, anglického a francouzského jazyka. Autorka knihy pro děti.""]","""221208s2022 xr a b 0…","""1""","""0""","""Králíček Sweety :""","""příběhy milovaného králíka Swe…","""Nikola Karásková ; ilustrovala…",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2022,1993,,29
"""1""","""Blechová, Zdenka,""","""xx0008875""","[""aut""]","""1957-""",,,,,"""nkc20102130622""",,,"[""Narozena 10. 9. 1957 v Mariánských Lázních. Léčitelka a vydavatelka.""]","""101011s2010 xr a e f 0…","""1""","""0""","""Duchovní partner, aneb, Setkán…",,"""Zdenka Blechová""",,,,,,"[""7"", ""7"", … ""9""]","""poezie""","[""fd131864"", ""fd131936"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""poezie""",2010,1957,,53
"""1""","""Tyl, Josef Kajetán,""","""jk01140553""","[""aut""]","""1808-1856""",,,,,"""cpk20051497557""","[""dramatici"", ""divadelní režiséři"", … ""novináři""]","[""muž""]","[""Narozen 4. 2. 1808 v Kutné Hoře, zemřel 11. 7. 1856 v Plzni. Dramatik, režisér, herec, překladatel z němčiny, divadelní kritik, spisovatel a novinář.""]","""050126s1842 xr e 0…","""1""","""0""","""Knjže ďábel :""","""romantická powjdka /""","""[od Ar. Raupacha] ; wzdělaná o…",,,,,,"[""7""]","""české povídky""","[""fd133971""]","[""czenas""]",,,,"""próza""",1842,1808,1856.0,34


In [36]:
do_grafu_drive = do_grafu.filter(pl.col("rok").is_between(1800,1938)).with_columns(obdobi = pl.lit('1800-1938'))
print(len(do_grafu_drive))
do_grafu_ted = do_grafu.filter(pl.col("rok").is_between(2000,2020)).with_columns(obdobi = pl.lit('2000-2020'))
print(len(do_grafu_ted))

7646
25431


In [37]:
do_grafu_basnici = pl.concat([do_grafu_drive.filter(pl.col("kategorie") == "poezie"), do_grafu_ted.filter(pl.col("kategorie") == "poezie")]).group_by(["obdobi","vek"]).len()
do_grafu_basnici

obdobi,vek,len
str,i64,u32
"""1800-1938""",23,58
"""2000-2020""",33,97
"""2000-2020""",72,113
"""2000-2020""",30,95
"""1800-1938""",51,42
"""2000-2020""",27,81
"""1800-1938""",29,85
"""1800-1938""",44,42
"""1800-1938""",33,66
"""2000-2020""",24,57


In [38]:
tvar1 = alt.Chart(do_grafu_basnici.to_pandas(), width=300, height=100).mark_line(interpolate="monotone").encode(
    alt.X('vek:Q').axis(domain=False, tickSize=0, title=None),
    alt.Y('len:Q').stack('zero').axis(None),
    alt.Color('obdobi:N', sort=['2000-2020','1800-1838'], scale=alt.Scale(range=['#D6534B', '#DB842F']), legend=alt.Legend(title=None, orient="top")),
    alt.StrokeDash('obdobi:N', sort=['2000-2020','1800-1838'], legend=None)
)

tvar1

In [39]:
do_grafu_prozaici = pl.concat([do_grafu_drive.filter(pl.col("kategorie") == "próza"), do_grafu_ted.filter(pl.col("kategorie") == "próza")]).group_by(["obdobi","vek"]).len()

In [40]:
tvar2 = alt.Chart(do_grafu_prozaici.to_pandas(), width=300, height=100, title="…beletrii…").mark_line(interpolate="monotone").encode(
    alt.X('vek:Q').axis(domain=False, tickSize=0, title=None),
    alt.Y('len:Q').stack('zero').axis(None),
    alt.Color('obdobi:N', sort=['2000-2020','1800-1838'], scale=alt.Scale(range=['#D6534B', '#DB842F']), legend=None),
    alt.StrokeDash('obdobi:N', sort=['2000-2020','1800-1838'], legend=None)
)

tvar2

In [41]:
do_grafu_vzpominky = pl.concat([do_grafu_drive.filter(pl.col("kategorie") == "vzpomínky"), do_grafu_ted.filter(pl.col("kategorie") == "vzpomínky")]).group_by(["obdobi","vek"]).len()

In [42]:
tvar3 = alt.Chart(do_grafu_vzpominky.to_pandas(), width=300, height=100, title="…a vzpomínky").mark_line(interpolate="monotone").encode(
    alt.X('vek:Q').axis(domain=False, tickSize=0, title=None),
    alt.Y('len:Q').stack('zero').axis(None),
    alt.Color('obdobi:N', sort=['2000-2020','1800-1838'], scale=alt.Scale(range=['#D6534B', '#DB842F']), legend=None),
    alt.StrokeDash('obdobi:N', sort=['2000-2020','1800-1838'], legend=None)
)

tvar3

In [43]:
alt.vconcat(tvar1, tvar2, tvar3, title=alt.Title("V jakém věku lidé vydávají básně…")).resolve_scale(x='shared').configure_view(stroke='transparent')

## Finální verze

In [45]:
do_grafu.sample(3)

100_ind1,100_a,100_7,100_4,100_d,100_q,100_c,100_b,100_e,001,374_a,375_a,678_a,008,245_ind1,245_ind2,245_a,245_b,245_c,245_n,245_p,245_h,245_f,245_s,655_ind2,655_a,655_7,655_2,655_ind1,655_y,655_z,kategorie,rok,narozeni,umrti,vek
str,str,str,list[str],str,str,list[str],str,str,str,list[str],list[str],list[str],str,str,str,str,str,str,list[str],list[str],str,str,str,list[str],str,list[str],list[str],list[str],list[str],list[str],str,i64,i64,i64,i64
"""1""","""Shalvarova, Tereza,""","""xx0274112""","[""aut""]","""1991-""",,,,,"""nkc20223428838""",,"[""žena""]","[""Narozena 3. 1. 1991. Autorka knihy pro děti.""]","""220620s2022 xr a b 0…","""1""","""0""","""Králíček Toníček /""",,"""Tereza Shalvarova ; ilustrace …",,,,,,"[""7"", ""7"", … ""9""]","""české příběhy""","[""fd133973"", ""fd133156"", … null]","[""czenas"", ""czenas"", … ""eczenas""]",,,,"""próza""",2022,1991,,31
"""1""","""Karásek, Svatopluk,""","""jn19990202005""","[""aut""]","""1942-2020""",,,,,"""cpk19990734688""","[""evangeličtí duchovní"", ""básníci"", … ""politici""]","[""muž""]","[""Narozen 18. 10. 1942 v Praze, zemřel 20. 12. 2020. Písničkář, básník, evangelický farář a politik.""]","""990915s1999 xr a e 0…","""1""","""0""","""V nebi je trůn :""","""písně /""","""Svatopluk Karásek""",,,,,,"[""7"", ""9""]","""česká poezie""","[""fd133958"", null]","[""czenas"", ""eczenas""]",,,,"""poezie""",1999,1942,2020.0,57
"""1""","""Martinec, Vladimír,""","""jk01080340""","[""aut""]","""1934-""",,,,,"""nkc20203258935""",,,"[""Narozen 22.10.1934 v Týništi nad Orlicí. Archeolog, muzeolog, publikace z oboru. Též autor sbírky básní.""]","""201016s2020 xr g 0…","""1""","""0""","""Jablko Evino /""",,"""Vladimír Martinec""",,,,,,"[""7"", ""9""]","""česká poezie""","[""fd133958"", null]","[""czenas"", ""eczenas""]",,,,"""poezie""",2020,1934,,86


In [46]:
do_grafu.group_by("rok").len().sort(by="rok")

rok,len
i64,u32
1801,1
1802,1
1803,1
1804,3
1805,4
1807,1
1808,2
1810,3
1812,3
1813,3


In [47]:
do_grafu.group_by(["vek","kategorie"]).len()

vek,kategorie,len
i64,str,u32
68,"""poezie""",226
69,"""poezie""",201
43,"""próza""",634
60,"""poezie""",311
72,"""poezie""",172
54,"""próza""",628
22,"""poezie""",146
25,"""vzpomínky""",2
36,"""vzpomínky""",15
89,"""poezie""",32


In [48]:
kolik = len(do_grafu.select(pl.col("100_7").unique()))
kolik

12614

In [49]:
veky_autorstva = alt.Chart(do_grafu.with_columns(pl.col("kategorie").replace({'próza':'…prózu','poezie':'…poezii','vzpomínky':'…vzpomínky'})).group_by(["vek","kategorie"]).len().to_pandas(),
         title=alt.Title(
             'V jakém věku čeští autoři a autorky publikují…',
             subtitle=[f"Souhrnné statistiky 12 614 lidí žijících v 19. až 21. století,","výrazně zastoupenější jsou současní autoři a autorky."]
         )).mark_bar(width=2).encode(
    alt.X("vek:Q", scale=alt.Scale(domainMax=100, domainMin=0), title=None),
    alt.Y("len:Q", title=None, axis=alt.Axis(domainOpacity=0, tickColor='#DCDDD6', orient='right', format='~s')),
    alt.Color('kategorie:N', scale=alt.Scale(range=['#E09DA3','#70871E','#DB842F',]), title=None, legend=None),
    alt.Row('kategorie:N', title=None, sort=['…prózu','…poezii','…vzpomínky'],
           header=alt.Header(labelAngle=0, labelAlign='left', labelAnchor='start', labelFontWeight=500, labelFont='Asap', labelOrient="top"))
).properties(
    width=kredity['sirka'], 
    height=kredity['vyska_nizkych'], 
    autosize={'type': 'fit', 'contains': 'padding'}
).configure_view(stroke='transparent').configure_axis(grid=False, domain=False).resolve_axis(x="independent").resolve_scale(y="independent")

veky_autorstva

In [50]:
me_to_neurazi(veky_autorstva, soubor="02_tvar_kariery", kredity=kredity['default'])

<figure>
    <a href="https://data.irozhlas.cz/knihy-grafy/02_tvar_kariery.svg" target="_blank">
    <img src="https://data.irozhlas.cz/knihy-grafy/02_tvar_kariery.svg" width="100%" alt="Graf s titulkem „V jakém věku čeští autoři a autorky publikují…“. Další texty by měly být čitelné ze zdrojového souboru SVG." />
    </a>
    </figure>
