Analiza Wyników Matur z 2023
=========================

Kod pozwalający odtworzyć wyniki z analizy matur z roku 2023.

Aby uruchomić kod, należy oprócz skonfigurowania repozytorium (patrz README.md) przygotować następujące pliki z wynikami:
- matura-2023.tsv
- matura-2022.tsv
- matura-2021.tsv


Pliki te można pobrać ze strony: https://mapa.wyniki.edu.pl/MapaEgzaminow/ wybierając:
- Dla wyników z roku 2023:
  - Rodzaj deklaracji: Egzamin maturalny w formule 2023
  - Rok 2023
  - Kliknąć: Pobieranie plików z wynikami -> EM2023 - szkoły (aktualizacja 07.2023).xlsx
- Dla wyników z roku 2021 i 2022:
  - Rodzaj deklaracji: Egzamin maturalny w formule 2015
  - Rok 2021 lub 2022
  - Kliknąć: Pobieranie plików z wynikami -> EM2015 - szkoły (aktualizacja 07.2021).xlsx lub EM2015 - szkoły (aktualizacja 07.2022).xlsx

Pobrane pliki będą w formacie Excel. Należy je otworzyć i przekonwertować do formatu CSV/TSV:
- Separator pola: {tabulator}
- Ogranicznik ciągu: brak

Tak przygotowane pliki należy przegrać do katalogu:

```
{ścieżka w której leży repozytorium}/ai-polit/resources/matura
```

W momencie analizy dane na stronie były zaktualizowane w dniu: 04-07-2023

Data przeprowadzenia analizy: 22-07-2023


In [61]:
import os
import openpyxl
import re
from tqdm import tqdm
import logging
logging.basicConfig(level=logging.DEBUG, format='[%(levelname)s] %(asctime)s\t%(message)s')

In [96]:
from collections import OrderedDict
from collections import Counter

In [110]:
# ładne drukowanie tabelek
import pandas as pd
from IPython.display import display, HTML

def show_pretty_table(raw_data, header):
    df = pd.DataFrame(raw_data, columns=header)
    display(HTML(df.to_html()))

In [191]:
RESOURCES_DATA_DIR = '../resources/matura'
ANALYZED_YEARS = [2021, 2022, 2023]
#ANALYZED_YEARS = [2021, 2022]

ANALYZED_LAST_YEAR = ANALYZED_YEARS[-1]
SUBHEADER_SEPARATOR = '===='

In [245]:
# Pomocnicze
def pretty_float(x):
    x = int(x * 100) / 100
    return x

Przygotowanie danych
====================

In [21]:
for year in ANALYZED_YEARS:
    fn = f"matura-{year}.xlsx" 
    assert fn in os.listdir(RESOURCES_DATA_DIR), f"Brakujący plik z wynikami matur = {fn}. Sprawdź jak przygotować pliki na początku tego notebooka."

In [208]:
def parse_header(row, unify=True):
    raw = []
    for cell_val in row:
        if cell_val is not None and isinstance(cell_val, str):
            cell_val = re.sub("^\s+", "", cell_val)
            cell_val = re.sub("\s+$", "", cell_val)
            cell_val = re.sub(r"\s+", " ", cell_val)
            if unify:
                # trochę dodatkowej unifikacji nagłówków
                cell_val = re.sub(" - ", " ", cell_val)
                cell_val = re.sub(r"\s*[(][mM][)]\s*$", "", cell_val)
                
                cell_val = re.sub("^\s+", "", cell_val)
                cell_val = re.sub("\s+$", "", cell_val)
                cell_val = re.sub(r"\s+", " ", cell_val)

        raw.append(cell_val)
    return raw

def merge_raw_headers(raw1, raw2):
    merged = []
    header_prefix = None
    duplicated_count = 0
    for i2, el2 in enumerate(raw2):
        if el2 is None:
            break
            
        cur_el1 = None
        if i2 < len(raw1):
            cur_el1 = raw1[i2]
        
        if cur_el1 is not None:
            header_prefix = cur_el1
        
        final_header_val = el2
        if header_prefix is not None:
            final_header_val = f"{header_prefix}{SUBHEADER_SEPARATOR}{el2}"
            
        final_header_val = final_header_val.lower()
        if final_header_val in merged:
            duplicated_count += 1
            final_header_val = f"duplicated{duplicated_count}"
        merged.append(final_header_val)
        
    return merged


def create_matura_results_entry(header, raw_row):
    entry = OrderedDict()
    for i, key in enumerate(header):
        value = None
        if i < len(raw_row):
            value = raw_row[i]
        entry[key] = value
    return entry
    
    
def parse_worksheet(worksheet):
    raw_header1, raw_header2 = [], []
    header = []
    parsed_data = []
   
    for row_i, row in tqdm(enumerate(worksheet.iter_rows(min_row=None, max_row=worksheet.max_row, min_col=None, max_col=None, values_only=True))):
        if row_i == 0:
            continue
        elif row_i == 1:
            raw_header1 = parse_header(row)
        elif row_i == 2:
            raw_header2 = parse_header(row)
            header = merge_raw_headers(raw_header1, raw_header2)
        else:
            raw_row = parse_header(row, unify=False)            
            entry = create_matura_results_entry(header, raw_row)
            parsed_data.append(entry)
    return parsed_data

def parse_matura_results(fp):    
    workbook = openpyxl.load_workbook(fp)
    worksheet = workbook.active
    parsed_data = parse_worksheet(worksheet)
    return parsed_data

In [209]:
matura_year_to_results = OrderedDict()

for year in ANALYZED_YEARS:    
    fp = os.path.join(RESOURCES_DATA_DIR, f"matura-{year}.xlsx")
    
    logging.info("Start parsing: %s", fp)
    parsed_data = parse_matura_results(fp)
    matura_year_to_results[year] = parsed_data
    logging.info("Finished parsing: %s", fp)
    

[INFO] 2023-07-23 02:01:56,046	Start parsing: ../resources/matura/matura-2021.xlsx
4892it [00:03, 1460.71it/s]
[INFO] 2023-07-23 02:02:14,752	Finished parsing: ../resources/matura/matura-2021.xlsx
[INFO] 2023-07-23 02:02:14,752	Start parsing: ../resources/matura/matura-2022.xlsx
4825it [00:06, 708.46it/s]
[INFO] 2023-07-23 02:02:40,978	Finished parsing: ../resources/matura/matura-2022.xlsx
[INFO] 2023-07-23 02:02:40,978	Start parsing: ../resources/matura/matura-2023.xlsx
2325it [00:03, 706.97it/s]
[INFO] 2023-07-23 02:03:02,597	Finished parsing: ../resources/matura/matura-2023.xlsx


In [215]:
# Kilka losowych sprawdzeń czy wszystko jest wgrane poprawnie
# Sprawdzamy na ostatnich wierszach z Excela
# Uwaga, jeśli dane z 2023 zostaną zaktualizowane tutaj należy zmienić indeks test_entry_2023 
# na numer wiersza szkoły o RSPO = 85757 odejmując od niego 4

test_entry_2021 = matura_year_to_results[2021][4888]
test_entry_2022 = matura_year_to_results[2022][4821]
test_entry_2023 = matura_year_to_results[2023][2321]

assert test_entry_2021['województwo nazwa'] == 'Opolskie'
assert test_entry_2021['czy publiczna'] == 'Tak'
assert test_entry_2021['rspo szkoły'] == 85757
assert test_entry_2021['język polski poziom rozszerzony====* liczba zdających'] == 8
assert test_entry_2021['język polski poziom rozszerzony====średni wynik (%)'] == ''
assert test_entry_2021['język polski poziom podstawowy====* liczba zdających'] == 15
assert abs(test_entry_2021['język polski poziom podstawowy====średni wynik (%)'] - 64.33) < 0.01

assert test_entry_2021['matematyka poziom rozszerzony====* liczba zdających'] == ''
assert test_entry_2021['matematyka poziom rozszerzony====średni wynik (%)'] == ''
assert test_entry_2021['matematyka poziom podstawowy====* liczba zdających'] == 15
assert abs(test_entry_2021['matematyka poziom podstawowy====średni wynik (%)'] - 41.0666666666667) < 0.01

assert test_entry_2022['województwo nazwa'] == 'Opolskie'
assert test_entry_2022['czy publiczna'] == 'Tak'
assert test_entry_2022['rspo szkoły'] == 56036
assert test_entry_2022['język polski poziom rozszerzony====* liczba zdających'] == 1
assert test_entry_2022['język polski poziom rozszerzony====średni wynik (%)'] == ''
assert test_entry_2022['język polski poziom podstawowy====* liczba zdających'] == 16
assert abs(test_entry_2022['język polski poziom podstawowy====średni wynik (%)'] - 48.875) < 0.01

assert test_entry_2022['matematyka poziom rozszerzony====* liczba zdających'] == 5
assert test_entry_2022['matematyka poziom rozszerzony====średni wynik (%)'] == 17.6
assert test_entry_2022['matematyka poziom podstawowy====* liczba zdających'] == 16
assert abs(test_entry_2022['matematyka poziom podstawowy====średni wynik (%)'] - 51.5) < 0.01

assert test_entry_2023['województwo nazwa'] == 'Opolskie'
assert test_entry_2023['czy publiczna'] == 'Tak'
assert test_entry_2023['rspo szkoły'] == 85757
assert test_entry_2023['język polski poziom rozszerzony====* liczba zdających'] == 4
assert test_entry_2023['język polski poziom rozszerzony====średni wynik (%)'] == ''
assert test_entry_2023['język polski poziom podstawowy====* liczba zdających'] == 19
assert abs(test_entry_2023['język polski poziom podstawowy====średni wynik (%)'] - 61.6842105263158) < 0.01

assert test_entry_2023['matematyka poziom rozszerzony====* liczba zdających'] == 3
assert test_entry_2023['matematyka poziom rozszerzony====średni wynik (%)'] == ''
assert test_entry_2023['matematyka poziom podstawowy====* liczba zdających'] == 19
assert abs(test_entry_2023['matematyka poziom podstawowy====średni wynik (%)'] - 58.6315789473684) < 0.01

Analiza średnich wyników
================================

In [216]:
matura_rspo_to_year_results = dict()

for year in ANALYZED_YEARS:
    results = matura_year_to_results[year]
    for res in results:
        rspo = res['rspo szkoły']
        if rspo not in matura_rspo_to_year_results:
            matura_rspo_to_year_results[rspo] = dict()
        matura_rspo_to_year_results[rspo][year] = res

In [217]:
# Teraz ograniczymy się tylko do szkół, które mają dostępne dane za wszystkie trzy lata
# połączymy je za pomocą kolumny RSPO
# Uwaga: na dalszych etapach ten zbiór się jeszcze zawęzi, bo nie wszystkie szkoły
# mają dane dla wszystkich przedmiotów (ze względu na anonimizcję)

def create_schools_with_all_data_available():
    """
    Returns: set of RSPO of schools for which all data is available
    """
    rspo_counter = Counter()
    for year in ANALYZED_YEARS:
        results = matura_year_to_results[year]
        for res in results:
            rspo = res['rspo szkoły']
            rspo_counter[rspo] += 1
            
    rspo_set = set()
    for rspo, freq in rspo_counter.items():
        if freq == len(ANALYZED_YEARS):
            rspo_set.add(rspo)
            
    return rspo_set
    

all_data_schools_rspo_set = create_schools_with_all_data_available()
logging.info("Mamy %i szkół dla których są dane ze wszystkich lat %s", len(all_data_schools_rspo_set), ANALYZED_YEARS)

[INFO] 2023-07-23 02:05:32,878	Mamy 2084 szkół dla których są dane ze wszystkich lat [2021, 2022, 2023]


In [236]:
def check_if_all_results_are_available_for_rspo(rspo, subject, only_podst=False):
    for year in ANALYZED_YEARS:
        year_results = matura_rspo_to_year_results[rspo][year]
        for level in ['poziom podstawowy', 'poziom rozszerzony']:
            if only_podst:
                if level == 'poziom rozszerzony':
                    continue
                    
            key_prefix = f"{subject} {level}"
            for key_val in ['* liczba zdających', 'średni wynik (%)']:
                final_key = f"{key_prefix}{SUBHEADER_SEPARATOR}{key_val}"
                value = year_results[final_key]
                if value is None:
                    return False
                if value == '':
                    return False
                if value <= 0.000001:
                    return False
    return True
                    

def create_schools_for_analysis(subject, filter_wojewodztwo=None, filter_gmina=None, filter_rodzaj=None, only_podst=False):
    analyzed_rspo_set = set()
    # filter geographically
    for rspo in all_data_schools_rspo_set:
        if ANALYZED_LAST_YEAR not in matura_rspo_to_year_results[rspo]:
            print(matura_rspo_to_year_results[rspo])
            
        last_res = matura_rspo_to_year_results[rspo][ANALYZED_LAST_YEAR]
        
        if filter_wojewodztwo is not None:
            if filter_wojewodztwo != last_res['województwo nazwa']:
                continue
        if filter_gmina is not None:
            if filter_gmina != last_res['gmina nazwa']:
                continue
        if filter_rodzaj is not None:
            if filter_rodzaj != last_res['rodzaj placówki']:
                continue
        analyzed_rspo_set.add(rspo)
    
    # now filter those for which all results are available for given subject
    all_results_analyzed_rspo_set = set()
    for rspo in analyzed_rspo_set:
        
        if check_if_all_results_are_available_for_rspo(rspo, subject, only_podst):
            all_results_analyzed_rspo_set.add(rspo)
    return all_results_analyzed_rspo_set


def do_compute_avg_for_schools(rspo_set, year, subject, level):
    total_result_val = 0
    total_zdajacy = 0
    
    key_prefix = f"{subject} {level}"
    for rspo in rspo_set:
        year_results = matura_rspo_to_year_results[rspo][year]
        rspo_avg_result = year_results[f"{key_prefix}{SUBHEADER_SEPARATOR}średni wynik (%)"]
        rspo_zdajacy = year_results[f"{key_prefix}{SUBHEADER_SEPARATOR}* liczba zdających"]
        rspo_res_value = rspo_avg_result * rspo_zdajacy
        total_result_val += rspo_res_value
        total_zdajacy += rspo_zdajacy
    total_zdajacy = int(total_zdajacy)
    total_avg = total_result_val / total_zdajacy
    
    assert total_avg >= 0.0
    
    return total_avg, total_zdajacy
    
    
def filter_public_rspo(rspo_set, public):
    public_value = 'tak'
    if not public:
        public_value = 'nie'
    
    result_set = set()
    for rspo in rspo_set:
        last_res = matura_rspo_to_year_results[rspo][ANALYZED_LAST_YEAR]
        czy_publiczna_value = last_res['czy publiczna'].lower()
        if czy_publiczna_value == public_value:
            result_set.add(rspo)
    return result_set
        
    
def compute_avg_results_from_matura(
    subject, 
    filter_wojewodztwo=None, 
    filter_gmina=None, 
    filter_rodzaj='dla młodzieży',
    only_podst=False):
    
    analyzed_schools_rspo_set = create_schools_for_analysis(
        subject, filter_wojewodztwo, filter_gmina, filter_rodzaj, only_podst)
    
    logging.info("Analizuję przedmiot: %s filtry(województwo=%s, gmina=%s, rodzaj=%s), liczba dopasowanych szkół: %i",
                 subject,
                 filter_wojewodztwo,
                 filter_gmina,
                 filter_rodzaj,
                 len(analyzed_schools_rspo_set),
                )
    
    analyzed_schools_rspo_set_public = filter_public_rspo(analyzed_schools_rspo_set, public=True)
    analyzed_schools_rspo_set_nonpublic = filter_public_rspo(analyzed_schools_rspo_set, public=False)
    
    logging.info("Szkoły publiczne: %i, Szkoły niepubliczne: %i",
                 len(analyzed_schools_rspo_set_public),
                len(analyzed_schools_rspo_set_nonpublic))
    
    public_row = ['Publiczne', len(analyzed_schools_rspo_set_public)]
    nonpublic_row = ['Niepubliczne', len(analyzed_schools_rspo_set_nonpublic)]
    all_row = ['Wszystkie', len(analyzed_schools_rspo_set)]
    
    for year in ANALYZED_YEARS:
        level = 'poziom podstawowy'
        public_avg, public_total = do_compute_avg_for_schools(analyzed_schools_rspo_set_public, year, subject, level)
        nonpublic_avg, nonpublic_total = do_compute_avg_for_schools(analyzed_schools_rspo_set_nonpublic, year, subject, level)
        all_avg, all_total = do_compute_avg_for_schools(analyzed_schools_rspo_set, year, subject, level)
        
        public_row.append(public_avg)
        public_row.append(public_total)
        
        nonpublic_row.append(nonpublic_avg)
        nonpublic_row.append(nonpublic_total)
        
        all_row.append(all_avg)
        all_row.append(all_total)

    if not only_podst:
        for year in ANALYZED_YEARS:
            level = 'poziom rozszerzony'
            public_avg, public_total = do_compute_avg_for_schools(analyzed_schools_rspo_set_public, year, subject, level)
            nonpublic_avg, nonpublic_total = do_compute_avg_for_schools(analyzed_schools_rspo_set_nonpublic, year, subject, level)
            all_avg, all_total = do_compute_avg_for_schools(analyzed_schools_rspo_set, year, subject, level)
        
            public_row.append(public_avg)
            public_row.append(public_total)
        
            nonpublic_row.append(nonpublic_avg)
            nonpublic_row.append(nonpublic_total)
        
            all_row.append(all_avg)
            all_row.append(all_total)
        
    final_table = [public_row, nonpublic_row, all_row]
    header = ['Typ szkoły', 'L. szkół']
    for year in ANALYZED_YEARS:
        header.append(f"{year}: śr. (p)")
        header.append(f"{year}: l.zd. (p)")
        
    if not only_podst:
        for year in ANALYZED_YEARS:
            header.append(f"{year}: śr. (r)")
            header.append(f"{year}: l.zd. (r)")
        
    show_pretty_table(final_table, header)
    
    return final_table    

In [237]:
for subject in ['język polski', 'matematyka']:
    final_table = compute_avg_results_from_matura(subject, filter_gmina='Warszawa', only_podst=True)

[INFO] 2023-07-23 02:27:43,279	Analizuję przedmiot: język polski filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 135
[INFO] 2023-07-23 02:27:43,280	Szkoły publiczne: 95, Szkoły niepubliczne: 40


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p)
0,Publiczne,95,63.808451,11615,60.147451,12082,71.713187,11803
1,Niepubliczne,40,60.85815,1385,59.886447,1744,65.070186,1737
2,Wszystkie,135,63.494131,13000,60.114528,13826,70.860979,13540


[INFO] 2023-07-23 02:27:43,289	Analizuję przedmiot: matematyka filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 135
[INFO] 2023-07-23 02:27:43,290	Szkoły publiczne: 95, Szkoły niepubliczne: 40


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p)
0,Publiczne,95,74.868448,11613,74.782337,12081,79.587789,11803
1,Niepubliczne,40,63.927512,1386,65.850664,1742,68.175494,1736
2,Wszystkie,135,73.701887,12999,73.656751,13823,78.12448,13539


In [238]:
for subject in ['język polski', 'matematyka']:
    final_table = compute_avg_results_from_matura(subject, filter_gmina='Warszawa')

[INFO] 2023-07-23 02:27:50,350	Analizuję przedmiot: język polski filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 95
[INFO] 2023-07-23 02:27:50,352	Szkoły publiczne: 81, Szkoły niepubliczne: 14


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p),2021: śr. (r),2021: l.zd. (r),2022: śr. (r),2022: l.zd. (r),2023: śr. (r),2023: l.zd. (r)
0,Publiczne,81,64.43345,10948,60.642953,11297,72.379996,11145,59.61102,3604,66.159989,3353,56.702826,2919
1,Niepubliczne,14,63.422829,733,61.720116,903,69.047679,797,61.769644,302,67.43382,358,50.940171,279
2,Wszystkie,95,64.370032,11681,60.72268,12200,72.157599,11942,59.777919,3906,66.282875,3711,56.200081,3198


[INFO] 2023-07-23 02:27:50,361	Analizuję przedmiot: matematyka filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 79
[INFO] 2023-07-23 02:27:50,362	Szkoły publiczne: 68, Szkoły niepubliczne: 11


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p),2021: śr. (r),2021: l.zd. (r),2022: śr. (r),2022: l.zd. (r),2023: śr. (r),2023: l.zd. (r)
0,Publiczne,68,79.370429,10038,79.645344,10083,83.793735,9919,53.81491,4366,58.442178,4403,64.265919,4667
1,Niepubliczne,11,73.062878,628,71.97401,808,75.324965,717,42.813871,236,48.283894,327,57.693333,300
2,Wszystkie,79,78.999049,10666,79.07621,10891,83.222833,10636,53.250754,4602,57.739904,4730,63.868944,4967


In [239]:
for subject in ['język polski', 'matematyka']:
    final_table = compute_avg_results_from_matura(subject)

[INFO] 2023-07-23 02:27:57,366	Analizuję przedmiot: język polski filtry(województwo=None, gmina=None, rodzaj=dla młodzieży), liczba dopasowanych szkół: 1062
[INFO] 2023-07-23 02:27:57,369	Szkoły publiczne: 1006, Szkoły niepubliczne: 56


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p),2021: śr. (r),2021: l.zd. (r),2022: śr. (r),2022: l.zd. (r),2023: śr. (r),2023: l.zd. (r)
0,Publiczne,1006,62.232495,121500,60.523163,117338,67.883337,117852,53.48892,38926,60.627187,37890,51.60929,34011
1,Niepubliczne,56,61.322385,2779,59.814006,3264,65.536153,3004,54.291473,996,60.654175,1082,50.307861,923
2,Wszystkie,1062,62.212144,124279,60.50397,120602,67.824996,120856,53.508943,39922,60.627937,38972,51.574904,34934


[INFO] 2023-07-23 02:27:57,404	Analizuję przedmiot: matematyka filtry(województwo=None, gmina=None, rodzaj=dla młodzieży), liczba dopasowanych szkół: 889
[INFO] 2023-07-23 02:27:57,407	Szkoły publiczne: 834, Szkoły niepubliczne: 55


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (p),2021: l.zd. (p),2022: śr. (p),2022: l.zd. (p),2023: śr. (p),2023: l.zd. (p),2021: śr. (r),2021: l.zd. (r),2022: śr. (r),2022: l.zd. (r),2023: śr. (r),2023: l.zd. (r)
0,Publiczne,834,72.119942,110679,73.060161,104953,77.337257,105457,41.832875,42386,46.622925,40050,52.935016,40938
1,Niepubliczne,55,74.373167,2661,73.003674,3157,77.408069,3057,44.563942,1135,49.812376,1338,59.246377,1311
2,Wszystkie,889,72.172843,113340,73.058511,108110,77.339252,108514,41.904099,43521,46.726034,41388,53.130859,42249


In [221]:
for subject in ['język polski', 'matematyka']:
    final_table = compute_avg_results_from_matura(subject, filter_gmina='Kraków')

[INFO] 2023-07-23 02:08:15,041	Analizuję przedmiot: język polski filtry(województwo=None, gmina=Kraków, rodzaj=dla młodzieży), liczba dopasowanych szkół: 39
[INFO] 2023-07-23 02:08:15,042	Szkoły publiczne: 33, Szkoły niepubliczne: 6


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (podst),2022: śr. (podst),2023: śr. (podst),2021: śr. (roz),2022: śr. (roz),2023: śr. (roz)
0,Publiczne,33,64.457763,63.552762,72.367866,57.216552,65.282855,62.192065
1,Niepubliczne,6,63.192586,61.634915,73.034186,70.074118,71.383333,61.827869
2,Wszystkie,39,64.373328,63.404682,72.424633,57.947584,65.754237,62.159821


[INFO] 2023-07-23 02:08:15,050	Analizuję przedmiot: matematyka filtry(województwo=None, gmina=Kraków, rodzaj=dla młodzieży), liczba dopasowanych szkół: 32
[INFO] 2023-07-23 02:08:15,050	Szkoły publiczne: 27, Szkoły niepubliczne: 5


Unnamed: 0,Typ szkoły,L. szkół,2021: śr. (podst),2022: śr. (podst),2023: śr. (podst),2021: śr. (roz),2022: śr. (roz),2023: śr. (roz)
0,Publiczne,27,77.380584,79.111241,83.312773,50.509717,56.137392,62.267258
1,Niepubliczne,5,78.193577,81.329605,84.645067,49.590909,60.27027,68.130435
2,Wszystkie,32,77.432565,79.290871,83.427068,50.449167,56.524719,62.773511


Szczegółowe wyniki na przestrzeni lat w wybranych szkołach
================================

In [248]:
def show_avg_results_from_matura(
    subject, 
    filter_wojewodztwo=None, 
    filter_gmina=None, 
    filter_rodzaj='dla młodzieży',
    only_podst=False,
    public=False
):
    
    analyzed_schools_rspo_set = create_schools_for_analysis(
        subject, filter_wojewodztwo, filter_gmina, filter_rodzaj, only_podst)
    
    logging.info("Pokazuję wyniki przedmiotu: %s filtry(województwo=%s, gmina=%s, rodzaj=%s), liczba dopasowanych szkół: %i",
                 subject,
                 filter_wojewodztwo,
                 filter_gmina,
                 filter_rodzaj,
                 len(analyzed_schools_rspo_set),
                )
    
    final_analyzed_rspo = filter_public_rspo(analyzed_schools_rspo_set, public=public)
    
    final_table = []
    
    for i, rspo in enumerate(sorted(final_analyzed_rspo)):
        row = [i+1, rspo]
        last_year_entry = None
        avg_results_podst = []
        avg_results_roz = []

        for year in ANALYZED_YEARS:
            cur_entry = matura_rspo_to_year_results[rspo][year]
            last_year_entry = cur_entry
            avg_results_podst.append(pretty_float(cur_entry[f"{subject} poziom podstawowy{SUBHEADER_SEPARATOR}średni wynik (%)"]))
            if not only_podst:
                avg_results_podst.append(pretty_float(cur_entry[f"{subject} poziom rozszerzony{SUBHEADER_SEPARATOR}średni wynik (%)"]))
                
        row.append(last_year_entry['nazwa szkoły'])
        row.append(last_year_entry['miejscowość'])
        for a in avg_results_podst:
            row.append(a)
        for a in avg_results_roz:
            row.append(a)
        final_table.append(row)
            
    header = ['id', 'RSPO', 'Nazwa', 'Miejscowość']
    for year in ANALYZED_YEARS:
        header.append(f"{year} śr. (p)")
    if not only_podst:
        for year in ANALYZED_YEARS:
            header.append(f"{year} śr. (r)")
            
    show_pretty_table(final_table, header)

In [249]:
print("SZKOŁY NIEPUBLICZNE")
show_avg_results_from_matura("język polski", filter_gmina='Warszawa', public=False)

[INFO] 2023-07-23 02:49:53,786	Pokazuję wyniki przedmiotu: język polski filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 95


SZKOŁY NIEPUBLICZNE


Unnamed: 0,id,RSPO,Nazwa,Miejscowość,2021 śr. (p),2022 śr. (p),2023 śr. (p),2021 śr. (r),2022 śr. (r),2023 śr. (r)
0,1,25825,LICEUM OGÓLNOKSZTAŁCĄCE NIEPUBLICZNE NR 40,Warszawa,58.16,45.92,59.85,77.19,69.65,45.18
1,2,26977,I SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE Z ODDZIAŁAMI MIĘDZYNARODOWYMI IM. MAHARADŻY JAM SAHEBA DIGVIJAY SINHJI,Warszawa,66.29,76.0,65.55,70.85,75.77,45.57
2,3,27005,2 SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE Z ODDZIAŁAMI MIĘDZYNARODOWYMI IM. PAWŁA JASIENICY SPOŁECZNEGO TOWARZYSTWA OŚWIATOWEGO,Warszawa,72.88,81.47,68.14,81.07,83.36,84.73
3,4,27748,"SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE NR 4 IMIENIA BATALIONU AK ""PARASOL"" W WARSZAWIE",Warszawa,67.68,66.0,70.84,87.93,78.48,42.46
4,5,27835,SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE NR 7 IM. BRONISŁAWA GEREMKA,Warszawa,51.04,37.2,48.64,40.0,54.67,22.0
5,6,27999,21 SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE IM. JERZEGO GROTOWSKIEGO,Warszawa,65.9,58.81,74.77,87.45,75.07,58.77
6,7,29252,PRYWATNE LICEUM OGÓLNOKSZTAŁCĄCE SIÓSTR NAZARETANEK Z ODDZIAŁAMI MIĘDZYNARODOWYMI,Warszawa,69.13,83.58,68.16,59.84,70.59,66.2
7,8,29820,LICEUM OGÓLNOKSZTAŁCĄCE SPOŁECZNE NR 17,Warszawa,61.5,45.76,59.2,68.3,55.24,73.83
8,9,79804,AKADEMICKIE LICEUM OGÓLNOKSZTAŁCĄCE PRZY PJATK,Warszawa,55.0,47.25,63.86,56.35,61.01,27.3
9,10,84874,WIELOKULTUROWE LICEUM HUMANISTYCZNE IM. JACKA KURONIA,Warszawa,70.07,68.43,64.26,73.27,68.84,52.38


In [251]:
print("SZKOŁY PUBLICZNE")
show_avg_results_from_matura("język polski", filter_gmina='Warszawa', public=True)

[INFO] 2023-07-23 02:50:14,317	Pokazuję wyniki przedmiotu: język polski filtry(województwo=None, gmina=Warszawa, rodzaj=dla młodzieży), liczba dopasowanych szkół: 95


SZKOŁY PUBLICZNE


Unnamed: 0,id,RSPO,Nazwa,Miejscowość,2021 śr. (p),2022 śr. (p),2023 śr. (p),2021 śr. (r),2022 śr. (r),2023 śr. (r)
0,1,11589,XXV LICEUM OGÓLNOKSZTAŁCĄCE IM. JÓZEFA WYBICKIEGO,Warszawa,59.69,30.45,57.06,67.0,68.72,49.47
1,2,16422,III LICEUM OGÓLNOKSZTAŁCĄCE IM. GEN. JÓZEFA SOWIŃSKIEGO,Warszawa,61.2,51.08,58.88,59.01,65.85,52.5
2,3,16423,XII LICEUM OGÓLNOKSZTAŁCĄCE IM. HENRYKA SIENKIEWICZA,Warszawa,71.6,65.77,64.7,69.39,75.13,66.2
3,4,16424,XXIV LICEUM OGÓLNOKSZTAŁCĄCE IM. CYPRIANA KAMILA NORWIDA,Warszawa,65.49,62.46,59.25,64.71,74.07,64.46
4,5,16425,XXX LICEUM OGÓLNOKSZTAŁCĄCE IM. JANA ŚNIADECKIEGO,Warszawa,60.83,56.81,60.93,63.72,73.12,71.23
5,6,16426,XL LICEUM OGÓLNOKSZTAŁCĄCE Z ODDZIAŁAMI DWUJĘZYCZNYMI IM. STEFANA ŻEROMSKIEGO,Warszawa,73.79,67.7,65.92,80.78,76.81,77.12
6,7,16427,XLV LICEUM OGÓLNOKSZTAŁCĄCE IM. ROMUALDA TRAUGUTTA,Warszawa,62.71,46.41,62.01,59.26,60.56,22.52
7,8,16428,"LXXXVI LICEUM OGÓLNOKSZTAŁCĄCE IM. BATALIONU ""ZOŚKA""",Warszawa,67.85,60.24,59.67,60.03,73.37,62.36
8,9,16429,CXIX LICEUM OGÓLNOKSZTAŁCĄCE IM. JACKA KURONIA,Warszawa,56.42,43.16,60.25,51.03,72.6,30.55
9,10,18789,LXIII LICEUM OGÓLNOKSZTAŁCĄCE IM. LAJOSA KOSSUTHA,Warszawa,60.18,26.0,62.69,63.88,66.22,60.0


In [252]:
print("SZKOŁY PUBLICZNE")
show_avg_results_from_matura("język polski", filter_gmina='Kraków', public=False)

[INFO] 2023-07-23 02:55:22,093	Pokazuję wyniki przedmiotu: język polski filtry(województwo=None, gmina=Kraków, rodzaj=dla młodzieży), liczba dopasowanych szkół: 39


SZKOŁY PUBLICZNE


Unnamed: 0,id,RSPO,Nazwa,Miejscowość,2021 śr. (p),2022 śr. (p),2023 śr. (p),2021 śr. (r),2022 śr. (r),2023 śr. (r)
0,1,58279,III PRYWATNE LICEUM OGÓLNOKSZTAŁCĄCE,Kraków,52.91,49.54,48.63,62.71,52.73,39.3
1,2,70863,VII PRYWATNE LICEUM OGÓLNOKSZTAŁCĄCE IM. MIKOŁAJA REJA W KRAKOWIE,Kraków,66.55,92.09,66.89,74.55,77.88,47.36
2,3,79902,VIII PRYWATNE AKADEMICKIE LICEUM OGÓLNOKSZTAŁCĄCE,Kraków,67.4,65.63,63.5,69.28,80.34,84.09
3,4,80061,III SPOŁECZNE LICEUM OGÓLNOKSZTAŁCĄCE IM. JULIUSZA SŁOWACKIEGO SPOŁECZNEGO TOWARZYSTWA OŚWIATOWEGO W KRAKOWIE,Kraków,60.87,86.0,61.05,75.5,73.94,71.0
4,5,84658,LICEUM OGÓLNOKSZTAŁCĄCE ZAKONU PIJARÓW IM. KS. STANISŁAWA KONARSKIEGO,Kraków,64.73,69.44,61.24,76.87,76.66,72.47
5,6,133770,KATOLICKIE LICEUM MONTESSORI IM. SPRAWIEDLIWYCH WŚRÓD NARODÓW ŚWIATA,Kraków,61.04,57.3,58.77,57.17,60.85,48.58
