# <u>Julkisista rahoista ja kunnallistaloudesta</u>

Elämme yhteiskunnassa, jonka pyörittämiseksi itse kukin maksaa veroja ja jonka osasina valtio ja kunnat sijoittavat varallisuuttaan erilaisiin kohteisiin. Mutta millaisista rahoista näissä tilanteissa oikeastaan puhutaan?

Alla on vinkkejä muutamille suomalaisille sivustoille jotka avaavat aihetta sekä esimerkkivilkaisu tarjolla olevaan aineistoon. Valtiovarainministeriön puollon avoimuudelle voi löytää täältä: [https://vm.fi/avoin-tieto](https://vm.fi/avoin-tieto).

***

## Avoindata.fi

[http://www.avoindata.fi/](http://www.avoindata.fi/) on valtiollisen DVV:n eli Digi- ja väestötietoviraston ylläpitämä portaali, jonne niin kunnat kuin erilaiset organisaatiotkin julkaisevat omia aineistojaan kansalaisten käytettäväksi. Kohta käsittelemämme Janakkalan ostolaskutiedot on ladattu täältä.

## Tutkihallintoa.fi

[https://www.tutkihallintoa.fi](https://www.tutkihallintoa.fi) tarjoaa kattavan katsauksen Suomen valtion varainkäyttöön. Erityisesti sen tarjoamat visualisaatiot valtion vuosittaisesta tilinpäätöksestä ovat hyvä yleiskuva erilaisen poliittisen keskustelun seuraamiseen [https://www.tutkihallintoa.fi/valtio/taloustiedot/valtion-tilinpaatos/](https://www.tutkihallintoa.fi/valtio/taloustiedot/valtion-tilinpaatos/).

## Tutkihankintoja.fi

[https://tutkihankintoja.fi/](https://tutkihankintoja.fi/) on valtiollisen julkishankintayksikön Hanselin ylläpitämä sivusto, joka hyödyntää muun muassa Avoindata.fi -portaalista saatavaa informaatiota tiivistääkseen erilaisten suurten yhteishankkeiden tilanteen niin päätöksenteon helpottamiseksi kuin kansalaisyhteiskunnan vastuullisuuden edistämiseksikin.

***

Tehdääs itsekin!

## 1. Työkalut 

In [None]:
# Aja tämä solu ensin.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

## 2. Aineisto - Janakkalan kunta

In [None]:
# Käytetty aineisto on haettu täältä
# https://www.avoindata.fi/data/fi/dataset/janakkalan-kunnan-ostolaskudata-2022

# Tiedosto oli merkistöltään hassu ja eroteltu puolipisteellä, joten korjataan asia parilla parametrilla.
data = pd.read_csv("Janakkala_ostolaskut_2022.csv", sep = ";", encoding = "iso8859_10", decimal = ",")

In [None]:
data

Huomaamme heti, että vuonna 2022 Janakkalan kunnan julkaistuissa ostolaskuissa on yli 42 000 tapahtumaa, joiden euromäärät heiluvat joulukuisesta parin euron sähkölaskusta useisiin tuhansiin. Jos etsimme, löydämme varmasti isompiakin eriä. Joten etsitään siis! 

## 3. Analyysiä

In [None]:
# Tarkastellaan ensin paljonko vuoden summa on ollut.
kirjat = data["Summa kirjanpidon valuuttana"].sum()
print(f"Yhteensä summasarakkeessa on {kirjat} euroa.")

No sehän on melkoinen potti. Jos katsomme Janakkalan kunnan verkkosivuille [https://www.janakkala.fi/kunta-ja-paatoksenteko/hallinto-ja-talous/talous/](https://www.janakkala.fi/kunta-ja-paatoksenteko/hallinto-ja-talous/talous/), löydämme sieltä varsinaiset tilinpäätökset vertailtaviksi. Mutta ihan peukalotuntumallakin voimme verrata äskeisten miljoonien määrää vuoden 2023 infografiikkaan: ![](https://www.janakkala.fi/wp-content/uploads/2024/03/tilinpaatos2023netti_paivitetty.jpg)

Tuntuuko summa realistiselta?

Vilkaistaanpa sarakkeen tarkempaan sisältöön.

In [None]:
# Etsitään kallein yksittäinen ostos.
kallein = data["Summa kirjanpidon valuuttana"].max()
print(f"Kallein ostos oli {kallein} euroa.")

# Millä rivillä se on?
paikka = data["Summa kirjanpidon valuuttana"].idxmax()
print(f"Sen rivi-indeksi on numero {paikka}.")

# Kuka se oli?
kohde = data.iloc[paikka]["Toimittajan nimi"]
print(f"Sen toimittaja oli siis {kohde}.")

# Milloin se tapahtui?
aika = data.iloc[paikka]["Kirjauspäivämäärä"]
print(f"Tapahtuma on kirjattu päivämäärälle {aika}.")

# Millaisesta osa-alueesta oli kyse?
ala = data.iloc[paikka]["Kustannuspaikan nimi"]
print(f"Osto on rekisteröity kategoriaan '{ala}'.")

Sellaista salapoliisintyötä. Voisimme myös halutessamme jaotella aineistoa jonkin teeman mukaan, laskea niistä osasummia tai keskimääräisiä arvoja. Itseasiassa, paljonkohan keskimääräinen ostos on ollut?

In [None]:
# Otetaas keskiarvoja.
KA = data["Summa kirjanpidon valuuttana"].mean()
print(f"Keskiarvo kaikkien ostosten välillä on ollut noin {KA} euroa.")

Keskimääräinen ostos on siis toista tonnia osan huidellessa miljoonissa. Mutta kuinka kuvaava tavallinen keskiarvo on? Jos jaottelisimme aineiston sen mukaan, miten suuri osuus lopulta jäisi tuon rajan yläpuolelle?

In [None]:
# Katsotaas millainen jakauma ostoksissa on.

pienet = data.query("`Summa kirjanpidon valuuttana` <= @KA")
isot = data.query("`Summa kirjanpidon valuuttana` > @KA")

print(f"Koko aineistossa on {len(data)} ostosta. Niistä {len(pienet)} jää alle keskiarvon {KA} € ja {len(isot)} ylittää sen.")
print(f"Täten keskiarvon suhdeluku ei tosiaankaan ole noin puolet ja puolet, vaan isompia on {len(isot)/len(pienet)}.")

# 3. Aineisto - Kokkolan kaupunki

Mutta hei, vaikka avoindata.fi -portista ei Kokkolaa vielä löydykään, kaupunki itse tarjoaa omilla sivuillaan [https://www.kokkola.fi/hallinto-ja-paatoksenteko/talous/](https://www.kokkola.fi/hallinto-ja-paatoksenteko/talous/) vastaavaa aineistoa tarkasteltavaksi. Käytäntö on alkanut vuodesta 2022.

In [None]:
# Jotkut Pythonin versiot eivät oletusarvoisesti tue pandaksen kautta Excel-tiedostojen lukemista. Alla oleva käsky auttaa virhetilanteessa.
%pip install openpyxl

In [None]:
# Haetaan aineisto suoraan kaupungin sivuilta.
kokkola = pd.read_excel("https://www.kokkola.fi/app/uploads/2024/06/9c81b62f-ostolaskudata-2023-kokkola.xlsx")

In [None]:
kokkola

In [None]:
# Vilkaistaas samalla tavalla Kokkolankin aineistoon.

# Etsitään kallein yksittäinen ostos.
kallein = kokkola["Summa"].max()
print(f"Kallein ostos oli {kallein} euroa.")

# Millä rivillä se on?
paikka = kokkola["Summa"].idxmax()
print(f"Sen rivi-indeksi on numero {paikka}.")

# Kuka se oli?
kohde = kokkola.iloc[paikka]["Reskontranro(T)"]
print(f"Sen toimittaja oli siis {kohde}.")

# Milloin se tapahtui?
aika = kokkola.iloc[paikka]["Jakso"]
print(f"Tapahtuma on kirjattu kuukaudelle {aika}.")

# Millaisesta osa-alueesta oli kyse?
ala = kokkola.iloc[paikka]["Tili(T)"]
print(f"Osto on rekisteröity kategoriaan '{ala}'.")

Siinähän on jo heti muutama milli kiinni.

Selvitäpä seuraavaksi itse paljonko ostoja tehtiin kokonaisuudessaa?

Paljonko ostoja tehtiin eri kuukausina?

Mikä kuukausi oli aktiivisin?

Miten suuri osuus ostoista liittyy vuokriin tai muihin aineettomiin ostoihin verrattuna esineiden liikutteluun?

In [None]:
# Koodaile tänne!