Obrada podataka implementirana korištenjem okvira Pandas kao što je to napravljeno korištenjem vlastitih skripti. Ovo sam napravio radi učenja kako se radi s okvirom Pandas.

Prije nego što sam mogao započeti s obradom u Pandasu morao sam "popraviti" ručno neke pogreške u podacima, konkretno nazivi kolona između različitih Excel datoteka su bile različite zbog čega je Pandas prilikom učitavanja kreirao dodatne stupce koji nisu bili potrebni. Siguran sam da je to moguće napraviti i korištenjem samog Pandasa, ali nisam išao istraživati.

In [1]:
import pandas as pd

Prvo je na redu učitavanje podataka. Učitavanje je napravljeno tako da se očekuju Excel datoteke u direktoriju data/. Ime svake Excel datoteke treba se sastojati od godine (četiri znamenke) te slova koje označava ljetni (l) ili jesenski (j) upisni rok. Svi učitani podaci pohranjuju se u jedan DataFrame okvira Pandas.

In [2]:
import glob

xls_files = glob.glob(r"data/*.xls")
df_list = []
for file in xls_files:
    
    # Učitavanje Excel datoteke. Manje/više sve radi automatski, tj. Pandas detektira koji Excel format je u pitanju. Dodatno, u svakoj datoteci je po jedna stranica te se ona učitava "po defaultu".
    df = pd.read_excel(file)
    
    # Na učitane podatke potrebno je dodati dvije kolone. U prvoj je godina za koju su podaci, a u drugoj je upisni rok (l ili j)
    upisni_rok = file[9]
    kolona = [ upisni_rok ] * df.Nositelj.count()
    df.insert(0, 'Upisni rok', kolona)
    godina = int(file[5:9])
    kolona = [ godina ] * df.Nositelj.count()
    df.insert(0, 'Godina', kolona)
    
    # Sve se datoteke potom dodaju u listu koja se kasnije spaja u jedan DataFrame
    df_list.append(df)

# Kreiranje jednog DataFramea
df = pd.concat(df_list, ignore_index=True)

In [3]:
df.groupby('Nositelj').count().sort_values('Godina')

Unnamed: 0_level_0,Godina,Upisni rok,Vrsta,Izvođač,TipStudija,Studij,Mjesto,Ukupna upisna kvota,Broj prijava,Broj prvih izbora,Omjer prvih izbora i kvote,Ostvarili pravo upisa
Nositelj,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
Visoka škola ARCA,2,2,2,2,2,2,2,2,2,2,2,2
Europska poslovna škola Zagreb,4,4,4,4,4,4,4,4,4,4,4,4
EFFECTUS poduzetnički studiji - visoko učilište,6,6,6,6,6,6,6,6,6,6,6,6
Visoka škola Ivanić-Grad,6,6,6,6,6,6,6,6,6,6,6,6
"Visoka škola za sigurnost, s pravom javnosti u Zagrebu",9,9,9,9,9,9,9,9,9,9,9,9
Visoko evanđeosko teološko učilište u Osijeku,12,12,12,12,12,12,12,12,12,12,12,12
Visoka policijska škola,12,12,12,12,12,12,12,12,12,12,12,12
Veleučilište u Virovitici,15,15,15,15,15,15,15,15,15,15,15,15
Politehnika Pula – Visoka tehničko-poslovna škola s pravom javnosti,21,21,21,21,21,21,21,21,21,21,21,21
Visoka škola međunarodnih odnosa i diplomacije Dag Hammarskjöld-u tijeku je pripajanje Libertas Međunarodnom sveučilištu,24,24,24,24,24,24,24,24,24,24,24,24


In [4]:
df[df.Nositelj == 'Tehničko veleučilište u Zagrebu']

Unnamed: 0,Godina,Upisni rok,Nositelj,Vrsta,Izvođač,TipStudija,Studij,Mjesto,Ukupna upisna kvota,Broj prijava,Broj prvih izbora,Omjer prvih izbora i kvote,Ostvarili pravo upisa
18,2014,l,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Elektrotehnika; smjerovi: Energetska elektrote...,Zagreb,180,923.0,211.0,1.17,180
39,2014,l,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,"Graditeljstvo; smjerovi: Visokogradnja, Niskog...",Zagreb,120,473.0,100.0,0.83,120
73,2014,l,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Računarstvo; smjerovi: Programsko inženjerstvo...,Zagreb,80,870.0,189.0,2.36,81
125,2014,l,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Mehatronika (stručni),Zagreb,60,528.0,81.0,1.35,60
714,2017,l,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Elektrotehnika; smjerovi: Energetska elektrote...,Zagreb,180,772.0,165.0,0.92,181
...,...,...,...,...,...,...,...,...,...,...,...,...,...
18362,2018,j,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Računarstvo; smjerovi: Programsko inženjerstvo...,Zagreb,0,0.0,0.0,0.00,0
18417,2018,j,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Izvanredni,Računarstvo; smjerovi: Programsko inženjerstvo...,Zagreb,0,0.0,0.0,0.00,0
18424,2018,j,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Informatika; smjer: Organizacija i informatiza...,Zagreb,0,0.0,0.0,0.00,0
18425,2018,j,Tehničko veleučilište u Zagrebu,Javna veleučilišta,Tehničko veleučilište u Zagrebu,Redovni,Informatika; smjer: Elektroničko poslovanje (s...,Zagreb,0,0.0,0.0,0.00,0
