# 4. NACE, ESA a další kategorie žadatelů

In [1]:
import pandas as pd
import numpy as np
%matplotlib inline

## Načítání dat
Data od MMR máme zkombinována s daty of MFČR v souboru `vystupy/projekty-bez-popisu.csv` (můžeme použít i `projekty.csv`, ale ty jsou zbytečně velké pro naše potřeby).

In [2]:
df = pd.read_csv('vystupy/projekty-bez-popisu.csv', low_memory=False, dtype={'IČO': str})

In [3]:
df.shape

(73494, 18)

In [4]:
# nazvy sloupcu, at se to lip filtruje
prog = 'Program'
ico = 'IČO'
dat = 'Datum'
naz = 'Název'
celk = 'Celkové zdroje'
sml = 'Smlouva'
prop = 'Proplaceno'
zad = 'Žadatel'
prfo = 'Právní forma'
prfok = 'Právní forma (kód)'
nuts = 'NUTS4'
esa = 'ESA'
esak = 'ESA (kód)'
nace = 'NACE'
zam = 'Zaměstnanců'
kat = 'Kategorie'
ver = 'Veřejná instituce'

In [5]:
# df.loc[:, ico] = [str(j).rjust(8, '0') for j in df.loc[:, ico]]

## Právní formy

In [6]:
dfprf = (df.groupby(prfo)[[celk, sml, prop]].sum().sort_values(by=sml, ascending=False)/10**9)
dfprf.head(15).round(2)

Unnamed: 0_level_0,Celkové zdroje,Smlouva,Proplaceno
Právní forma,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Příspěvková organizace,197.3,135.21,125.86
Obec nebo městská část hlavního města Prahy,193.0,125.5,116.84
"Správa železniční dopravní cesty, státní organizace",128.99,88.63,79.11
Akciová společnost,194.52,87.27,82.55
Společnost s ručením omezeným,174.14,77.87,72.89
Organizační složka státu,79.56,66.3,57.95
Kraj,72.53,56.05,50.54
Vysoká škola,63.29,46.59,43.68
Svazek obcí,23.77,14.31,13.51
Veřejná výzkumná instituce,16.9,12.41,12.0


In [7]:
dfprf.round(3).to_csv('vystupy/tabulky/nejvetsi-pravni-formy.csv')
dfprf.round(3).to_excel('vystupy/tabulky/nejvetsi-pravni-formy.xlsx')

A největší projekty podle právních forem. **V milionech korun.**

In [43]:
df[zad] = df[zad].replace(np.nan, 'FO')

In [44]:
prfa = df.groupby([prfo, ico, zad, naz])[[celk, sml, prop]].sum()/10**6

In [45]:
xw = pd.ExcelWriter('vystupy/tabulky/nejvetsi-pravni-formy-projekty.xlsx')
for pf in prfa.index.levels[0]:
    prfa.loc[pf].reset_index().sort_values(by=sml, ascending=False).\
    head(100).round(3).to_excel(xw, pf[:31], index=False)
xw.save()

A největší *žadatelé* podle právních forem. **Opět v milionech.**

In [46]:
xw = pd.ExcelWriter('vystupy/tabulky/nejvetsi-pravni-formy-zadatele.xlsx')
for pf in prfa.index.levels[0]:
    prfa.loc[pf].groupby(level=[ico, zad]).sum().\
    reset_index().sort_values(by=sml, ascending=False).\
    head(100).round(3).to_excel(xw, pf[:31], index=False)
xw.save()

## ESA
ESA (ESA2010) je trochu jiná klasifikace než právní formy. Nejde tu o právní zařazení, jde o hrubší kategorie, např. *nefinanční podniky soukromé národní* (národní zde neznamená veřejná, jen že je pod národní kontrolou), kam patří všechna možná sročka, akciovky atd.

In [49]:
dfesa = df.groupby(esa)[[celk, sml, prop]].sum().sort_values(by=sml, ascending=False)/10**9
dfesa.round(2).head(10)

Unnamed: 0_level_0,Celkové zdroje,Smlouva,Proplaceno
ESA,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Ústřední vládní instituce,453.33,320.92,293.02
Místní vládní instituce,348.99,243.14,223.57
Nefinanční podniky soukromé národní,226.42,99.93,94.32
Nefinanční podniky veřejné,80.13,38.17,36.33
Neziskové instituce sloužící domácnostem soukromé národní,32.57,24.5,22.59
Nefinanční podniky soukromé pod zahraniční kontrolou,61.79,24.4,22.47
Fyzické osoby,14.68,7.69,7.43
Příjemci ostatních transferů,2.75,0.92,0.82
Evropská investiční banka,0.51,0.43,0.43
Neziskové instituce sloužící domácnostem pod zahraniční kontrolou,0.12,0.1,0.09


In [50]:
dfesa.round(3).to_csv('vystupy/tabulky/nejvetsi-esa.csv')
dfesa.round(3).to_excel('vystupy/tabulky/nejvetsi-esa.xlsx')

A největší *projekty* podle ESA kódů. **V milionech korun**

In [47]:
esapr = df.groupby([esa, ico, zad, naz])[[celk, sml, prop]].sum()/10**6

In [48]:
xw = pd.ExcelWriter('vystupy/tabulky/nejvetsi-esa-projekty.xlsx')
for pf in esapr.index.levels[0]:
    esapr.loc[pf].reset_index().sort_values(by=sml, ascending=False).\
    head(100).round(3).to_excel(xw, pf[:31], index=False)
xw.save()

A největší *zadavatelé* podle ESA kódů. **V milionech korun**

In [49]:
xw = pd.ExcelWriter('vystupy/tabulky/nejvetsi-esa-zadatele.xlsx')
for pf in esapr.index.levels[0]:
    esapr.loc[pf].groupby(level=[ico, zad]).sum().\
    reset_index().sort_values(by=sml, ascending=False).\
    head(100).round(3).to_excel(xw, pf[:31], index=False)
xw.save()

## NACE
Díky datům z Registru ekonomických subjektů máme i informace o NACE kategoriích. V registru je celkový seznam NACE, my bereme pouze primární NACE.

In [65]:
dfnace = df.groupby([ver, nace])[[celk, sml, prop]].sum()/10**9
dfnacevse = dfnace.groupby(level=1).sum().sort_values(by=sml, ascending=False)

dfnacevse.round(2).head(10)

Unnamed: 0_level_0,Celkové zdroje,Smlouva,Proplaceno
NACE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Všeobecné činnosti veřejné správy,349.17,246.35,224.6
Činnosti související s pozemní dopravou,270.31,181.51,165.83
Terciární vzdělávání,63.87,47.06,44.11
Ostatní výzkum a vývoj v oblasti přírodních a technických věd,26.53,18.85,18.28
Ústavní zdravotní péče,26.27,17.05,15.58
Městská a příměstská pozemní osobní doprava,37.06,16.75,15.66
Regulace a podpora podnikatelského prostředí,16.8,13.92,12.14
Činnosti ostatních organizací sdružujících osoby za účelem prosazování společných zájmů j. n.,10.88,8.35,7.69
Základní vzdělávání na druhém stupni základních škol,8.44,7.03,6.84
Ostatní peněžní zprostředkování,8.36,5.78,5.53


In [66]:
dfnacevse.round(3).head(100).to_csv('vystupy/tabulky/nejvetsi-nace.csv')
dfnacevse.round(3).head(100).to_excel('vystupy/tabulky/nejvetsi-nace.xlsx')

Možná si toto rozdělení zaslouží rozdělení na soukromé a veřejné podniky, jejich NACE budou dost jiné.

### NACE soukromé

In [91]:
dfnace = dfnace.reset_index()

In [98]:
dfsou = dfnace.loc[dfnace[ver] == False].groupby(nace)[[celk, sml, prop]].sum().sort_values(by=sml, ascending=False)

dfsou.round(2).head(10)

Unnamed: 0_level_0,Celkové zdroje,Smlouva,Proplaceno
NACE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Činnosti ostatních organizací sdružujících osoby za účelem prosazování společných zájmů j. n.,10.65,8.22,7.57
Pronájem a správa vlastních nebo pronajatých nemovitostí,12.06,5.04,4.66
"Výroba surového železa, oceli a feroslitin, plochých výrobků (kromě pásky za studena), tváření výrobků za tepla",6.66,4.1,4.05
Ostatní výzkum a vývoj v oblasti přírodních a technických věd,6.03,3.6,3.51
Výroba elektřiny,10.68,3.02,2.98
Ostatní vzdělávání j. n.,3.5,2.8,2.57
Programování,6.06,2.72,2.53
Činnosti náboženských organizací,3.02,2.38,2.24
Výroba ostatních dílů a příslušenství pro motorová vozidla,5.93,2.21,1.94
Obrábění,4.99,2.12,1.99


In [99]:
dfsou.round(3).head(100).to_csv('vystupy/tabulky/nejvetsi-nace-soukrome.csv')
dfsou.round(3).head(100).to_excel('vystupy/tabulky/nejvetsi-nace-soukrome.xlsx')

### NACE veřejné

In [100]:
dfver = dfnace.loc[dfnace[ver] == True].groupby(nace)[[celk, sml, prop]].sum().sort_values(by=sml, ascending=False)

dfver.round(2).head(10)

Unnamed: 0_level_0,Celkové zdroje,Smlouva,Proplaceno
NACE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Všeobecné činnosti veřejné správy,349.17,246.35,224.6
Činnosti související s pozemní dopravou,270.3,181.51,165.83
Terciární vzdělávání,63.29,46.59,43.68
Ústavní zdravotní péče,23.89,16.15,14.74
Městská a příměstská pozemní osobní doprava,35.29,16.05,14.99
Ostatní výzkum a vývoj v oblasti přírodních a technických věd,20.51,15.25,14.77
Regulace a podpora podnikatelského prostředí,16.8,13.92,12.14
Základní vzdělávání na druhém stupni základních škol,8.43,7.02,6.83
Ostatní peněžní zprostředkování,8.35,5.77,5.53
Střední odborné vzdělávání na středních odborných školách,6.6,5.1,4.79


In [101]:
dfver.round(3).head(100).to_csv('vystupy/tabulky/nejvetsi-nace-verejne.csv')
dfver.round(3).head(100).to_excel('vystupy/tabulky/nejvetsi-nace-verejne.xlsx')