# <u>Julkisista rahoista ja kunnallistaloudesta</u>

Elämme yhteiskunnassa, jonka pyörittämiseksi itse kukin maksaa veroja ja jonka osasina valtio ja kunnat sijoittavat varallisuuttaan erilaisiin kohteisiin. Mutta millaisista rahoista näissä tilanteissa oikeastaan puhutaan?

Alla on vinkkejä muutamille suomalaisille sivustoille jotka avaavat aihetta sekä esimerkkivilkaisu tarjolla olevaan aineistoon. Valtiovarainministeriön puollon avoimuudelle voi löytää täältä: [https://vm.fi/avoin-tieto](https://vm.fi/avoin-tieto).

***

## Avoindata.fi

[http://www.avoindata.fi/](http://www.avoindata.fi/) on valtiollisen DVV:n eli Digi- ja väestötietoviraston ylläpitämä portaali, jonne niin kunnat kuin erilaiset organisaatiotkin julkaisevat omia aineistojaan kansalaisten käytettäväksi. Kohta käsittelemämme Janakkalan ostolaskutiedot on ladattu täältä.

## Tutkihallintoa.fi

[https://www.tutkihallintoa.fi](https://www.tutkihallintoa.fi) tarjoaa kattavan katsauksen Suomen valtion varainkäyttöön. Erityisesti sen tarjoamat visualisaatiot valtion vuosittaisesta tilinpäätöksestä ovat hyvä yleiskuva erilaisen poliittisen keskustelun seuraamiseen [https://www.tutkihallintoa.fi/valtio/taloustiedot/valtion-tilinpaatos/](https://www.tutkihallintoa.fi/valtio/taloustiedot/valtion-tilinpaatos/).

## Tutkihankintoja.fi

[https://tutkihankintoja.fi/](https://tutkihankintoja.fi/) on valtiollisen julkishankintayksikön Hanselin ylläpitämä sivusto, joka hyödyntää muun muassa Avoindata.fi -portaalista saatavaa informaatiota tiivistääkseen erilaisten suurten yhteishankkeiden tilanteen niin päätöksenteon helpottamiseksi kuin kansalaisyhteiskunnan vastuullisuuden edistämiseksikin.

***

Tehdääs itsekin!

## 1. Työkalut 

In [1]:
# Aja tämä solu ensin.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

## 2. Aineisto - Janakkalan kunta

In [None]:
# Käytetty aineisto on haettu täältä
# https://www.avoindata.fi/data/fi/dataset/janakkalan-kunnan-ostolaskudata-2022

# Tiedosto oli merkistöltään hassu ja eroteltu puolipisteellä, joten korjataan asia parilla parametrilla.
data = pd.read_csv("https://github.com/opendata-education/Tyopajat/raw/refs/heads/main/materiaali/data/Janakkala_ostolaskut_2022.csv", sep = ";", encoding = "iso8859_10", decimal = ",")

In [None]:
data

Huomaamme heti, että vuonna 2022 Janakkalan kunnan julkaistuissa ostolaskuissa on yli 42 000 tapahtumaa, joiden euromäärät heiluvat joulukuisesta parin euron sähkölaskusta useisiin tuhansiin. Jos etsimme, löydämme varmasti isompiakin eriä. Joten etsitään siis! 

## 3. Analyysiä

In [None]:
# Tarkastellaan ensin paljonko vuoden summa on ollut.
kirjat = data["Summa kirjanpidon valuuttana"].sum()
print(f"Yhteensä summasarakkeessa on {kirjat} euroa.")

No sehän on melkoinen potti. Jos katsomme Janakkalan kunnan verkkosivuille [https://www.janakkala.fi/kunta-ja-paatoksenteko/hallinto-ja-talous/talous/](https://www.janakkala.fi/kunta-ja-paatoksenteko/hallinto-ja-talous/talous/), löydämme sieltä varsinaiset tilinpäätökset vertailtaviksi. Mutta ihan peukalotuntumallakin voimme verrata äskeisten miljoonien määrää vuoden 2023 infografiikkaan: ![](https://www.janakkala.fi/wp-content/uploads/2024/03/tilinpaatos2023netti_paivitetty.jpg)

Tuntuuko summa realistiselta?

Vilkaistaanpa sarakkeen tarkempaan sisältöön.

In [None]:
# Etsitään kallein yksittäinen ostos.
kallein = data["Summa kirjanpidon valuuttana"].max()
print(f"Kallein ostos oli {kallein} euroa.")

# Millä rivillä se on?
paikka = data["Summa kirjanpidon valuuttana"].idxmax()
print(f"Sen rivi-indeksi on numero {paikka}.")

# Kuka se oli?
kohde = data.iloc[paikka]["Toimittajan nimi"]
print(f"Sen toimittaja oli siis {kohde}.")

# Milloin se tapahtui?
aika = data.iloc[paikka]["Kirjauspäivämäärä"]
print(f"Tapahtuma on kirjattu päivämäärälle {aika}.")

# Millaisesta osa-alueesta oli kyse?
ala = data.iloc[paikka]["Kustannuspaikan nimi"]
print(f"Osto on rekisteröity kategoriaan '{ala}'.")

Sellaista salapoliisintyötä. Voisimme myös halutessamme jaotella aineistoa jonkin teeman mukaan, laskea niistä osasummia tai keskimääräisiä arvoja. Itseasiassa, paljonkohan keskimääräinen ostos on ollut?

In [None]:
# Otetaas keskiarvoja.
KA = data["Summa kirjanpidon valuuttana"].mean()
print(f"Keskiarvo kaikkien ostosten välillä on ollut noin {KA} euroa.")

Keskimääräinen ostos on siis toista tonnia osan huidellessa miljoonissa. Mutta kuinka kuvaava tavallinen keskiarvo on? Jos jaottelisimme aineiston sen mukaan, miten suuri osuus lopulta jäisi tuon rajan yläpuolelle?

In [None]:
# Katsotaas millainen jakauma ostoksissa on.

pienet = data.query("`Summa kirjanpidon valuuttana` <= @KA")
isot = data.query("`Summa kirjanpidon valuuttana` > @KA")

print(f"Koko aineistossa on {len(data)} ostosta. Niistä {len(pienet)} jää alle keskiarvon {KA} € ja {len(isot)} ylittää sen.")
print(f"Täten keskiarvon suhdeluku ei tosiaankaan ole noin puolet ja puolet, vaan isompia on {len(isot)/len(pienet)}.")

# 3. Aineisto - Kokkolan kaupunki

Mutta hei, vaikka avoindata.fi -portista ei Kokkolaa vielä löydykään, kaupunki itse tarjoaa omilla sivuillaan [https://www.kokkola.fi/hallinto-ja-paatoksenteko/talous/](https://www.kokkola.fi/hallinto-ja-paatoksenteko/talous/) vastaavaa aineistoa tarkasteltavaksi. Käytäntö on alkanut vuodesta 2022.

In [2]:
# Jotkut Pythonin versiot eivät oletusarvoisesti tue pandaksen kautta Excel-tiedostojen lukemista. Alla oleva käsky auttaa virhetilanteessa.
%pip install openpyxl

Note: you may need to restart the kernel to use updated packages.


In [3]:
# Haetaan aineisto suoraan kaupungin sivuilta.
kokkola = pd.read_excel("https://www.kokkola.fi/app/uploads/2024/06/9c81b62f-ostolaskudata-2023-kokkola.xlsx")

In [4]:
kokkola

Unnamed: 0,Kuntanumero,Kunta,Y-tunnus,Tili,Tili(T),Tapahtumanumero,Reskontranro,Reskontranro(T),Y-tunnus.1,Maatunnus,Jakso,Summa
0,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200487391.0,220832.0,Rauta Juhinna Oy,3254973-5,FI,202301.0,8.86
1,272.0,Kokkola,0179377-8,4590.0,RAKENNUSMATERIAALI,200487391.0,220832.0,Rauta Juhinna Oy,3254973-5,FI,202301.0,36.91
2,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200488215.0,200705.0,Kokkolan Teollisuuskylä Oy,0179213-4,FI,202301.0,21.60
3,272.0,Kokkola,0179377-8,4860.0,MUUT VUOKRAT,200488215.0,200705.0,Kokkolan Teollisuuskylä Oy,0179213-4,FI,202301.0,90.00
4,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200488216.0,200705.0,Kokkolan Teollisuuskylä Oy,0179213-4,FI,202301.0,245.96
...,...,...,...,...,...,...,...,...,...,...,...,...
141104,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200549668.0,201607.0,Rakennusliike Antti Salonen Oy,1891434-5,FI,202312.0,1444.96
141105,272.0,Kokkola,0179377-8,4320.0,URAKAT/INVESTOINNIT,200549668.0,201607.0,Rakennusliike Antti Salonen Oy,1891434-5,FI,202312.0,6020.66
141106,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200549883.0,200028.0,Hartman Rauta Oy,0628046-1,FI,202312.0,-344.40
141107,272.0,Kokkola,0179377-8,4590.0,RAKENNUSMATERIAALI,200549883.0,200028.0,Hartman Rauta Oy,0628046-1,FI,202312.0,-1435.00


In [5]:
# Vilkaistaas samalla tavalla Kokkolankin aineistoon.

# Etsitään kallein yksittäinen ostos.
kallein = kokkola["Summa"].max()
print(f"Kallein ostos oli {kallein} euroa.")

# Millä rivillä se on?
paikka = kokkola["Summa"].idxmax()
print(f"Sen rivi-indeksi on numero {paikka}.")

# Kuka se oli?
kohde = kokkola.iloc[paikka]["Reskontranro(T)"]
print(f"Sen toimittaja oli siis {kohde}.")

# Milloin se tapahtui?
aika = kokkola.iloc[paikka]["Jakso"]
print(f"Tapahtuma on kirjattu kuukaudelle {aika}.")

# Millaisesta osa-alueesta oli kyse?
ala = kokkola.iloc[paikka]["Tili(T)"]
print(f"Osto on rekisteröity kategoriaan '{ala}'.")

Kallein ostos oli 8910000.0 euroa.
Sen rivi-indeksi on numero 28017.
Sen toimittaja oli siis Kuntarahoitus Oyj.
Tapahtuma on kirjattu kuukaudelle 202304.0.
Osto on rekisteröity kategoriaan 'KUNTARAHOITUS OY:LTÄ'.


Siinähän on jo heti muutama milli kiinni.

Selvitäpä seuraavaksi itse paljonko ostoja tehtiin kokonaisuudessaa?

Paljonko ostoja tehtiin eri kuukausina?

Mikä kuukausi oli aktiivisin?

Miten suuri osuus ostoista liittyy vuokriin tai muihin aineettomiin ostoihin verrattuna esineiden liikutteluun?

In [None]:
# Koodaile tänne!

In [6]:
# Jako tietyn kuukauden mukaan

ehto = 202310.0
jako = kokkola.query("Jakso == @ehto")
jako

Unnamed: 0,Kuntanumero,Kunta,Y-tunnus,Tili,Tili(T),Tapahtumanumero,Reskontranro,Reskontranro(T),Y-tunnus.1,Maatunnus,Jakso,Summa
289,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200490641.0,211944.0,NSA Invest Oy,MISSING,FI,202310.0,176.75
290,272.0,Kokkola,0179377-8,4820.0,HUONEISTOJEN VUOKRAT,200490641.0,211944.0,NSA Invest Oy,MISSING,FI,202310.0,736.45
315,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200490654.0,211944.0,NSA Invest Oy,MISSING,FI,202310.0,23.20
316,272.0,Kokkola,0179377-8,4820.0,HUONEISTOJEN VUOKRAT,200490654.0,211944.0,NSA Invest Oy,MISSING,FI,202310.0,96.65
335,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200490664.0,211944.0,NSA Invest Oy,MISSING,FI,202310.0,51.88
...,...,...,...,...,...,...,...,...,...,...,...,...
116611,272.0,Kokkola,0179377-8,4510.0,KIRJALLISUUS,200538856.0,201245.0,Funtor Oy,2225674-4,FI,202310.0,29.82
116616,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200538858.0,201245.0,Funtor Oy,2225674-4,FI,202310.0,5.90
116617,272.0,Kokkola,0179377-8,4510.0,KIRJALLISUUS,200538858.0,201245.0,Funtor Oy,2225674-4,FI,202310.0,58.99
116932,272.0,Kokkola,0179377-8,1808.0,PALAUTUSKELPOISET,200538987.0,200429.0,CGI Suomi Oy,0357502-9,FI,202310.0,217.85


In [9]:
# Toistosilmukka, jolla voidaan tutkia eri ostokategorioita

# Tässä eritellään erilaiset kategoriat
kategoriat = kokkola["Tili(T)"].unique()

# Tässä toistetaan käskyt jokaiselle kategorialle
for x in kategoriat:
    ala = kokkola.query("`Tili(T)` == @x")
    summa = ala["Summa"].sum()
    maksi = ala["Summa"].max()
    print(f"{x} ostojen summa oli {summa} euroa. Kallein yksittäinen ostos oli {maksi} euroa. \n")

PALAUTUSKELPOISET ostojen summa oli 13224251.530000001 euroa. Kallein yksittäinen ostos oli 158354.66 euroa. 

RAKENNUSMATERIAALI ostojen summa oli 1428409.99 euroa. Kallein yksittäinen ostos oli 100000.0 euroa. 

MUUT VUOKRAT ostojen summa oli 1668565.7699999998 euroa. Kallein yksittäinen ostos oli 367462.5 euroa. 

HUONEISTOJEN VUOKRAT ostojen summa oli 4763374.529999999 euroa. Kallein yksittäinen ostos oli 177224.85 euroa. 

VAKUUTUKSET ostojen summa oli 185019.31 euroa. Kallein yksittäinen ostos oli 21194.09 euroa. 

LAKISÄÄTEINEN TAPATURMAVAKUUTUS ostojen summa oli 256695.0 euroa. Kallein yksittäinen ostos oli 254361.51 euroa. 

KOULUTUSMATKAT ostojen summa oli 26411.510000000002 euroa. Kallein yksittäinen ostos oli 2352.31 euroa. 

PUHDISTUSAINEET JA TARVIKKEET ostojen summa oli 284381.3 euroa. Kallein yksittäinen ostos oli 4982.18 euroa. 

TOIMISTO- JA ASIANTUNTIJAPALVELUT ostojen summa oli 5484250.88 euroa. Kallein yksittäinen ostos oli 110814.62 euroa. 

RAKENNUSTEN VUOKRAT os

SOSIAALI-, TERVEYSPALVELUT ostojen summa oli 2038077.48 euroa. Kallein yksittäinen ostos oli 264577.89 euroa. 

MUUT HENKILÖSTÖPALVELUT ostojen summa oli 10511.85 euroa. Kallein yksittäinen ostos oli 758.56 euroa. 

LABORATORIOTARVIKKEET ostojen summa oli 5369.99 euroa. Kallein yksittäinen ostos oli 2328.17 euroa. 

ALUEIDEN KUNNOSSAPITO/PUUTARHA ostojen summa oli 16590.0 euroa. Kallein yksittäinen ostos oli 11445.0 euroa. 

MUUT KIINTEISTÖPALVELUT ostojen summa oli 28318.260000000002 euroa. Kallein yksittäinen ostos oli 5455.0 euroa. 

MYYNTIRESKONTRAN SELVITTELYTILI ostojen summa oli 23372.14 euroa. Kallein yksittäinen ostos oli 5958.44 euroa. 

ULKOMAISILTA RAHOITUS- JA VAK.LAITOKSIL ostojen summa oli 1158500.0 euroa. Kallein yksittäinen ostos oli 1158500.0 euroa. 

ULKOMAISILTA RAHOITUS- JA VAK.LAIT ostojen summa oli 1158500.0 euroa. Kallein yksittäinen ostos oli 1158500.0 euroa. 

PALVELUOSTOT KUNNILTA ostojen summa oli 242552.82999999996 euroa. Kallein yksittäinen ostos oli 19112