# ESIMERKKI: Lämpötiloista ja anomalioista

### Työn rakenne

Yksinkertainen projekti noudattaa yleensä simppeliä perusrakennetta:

1. Määritetään kiinnostuksen kohde (tutkimuskysymys)
2. Etsitään aineistoa (datankeruu)
3. Tarkastellaan löydöksiä (analyysi)
4. Arvioidaan, kritisoidaan (tulokset ja johtopäätökset)
5. Selitetään tarpeen mukaan käytetyt aineistot (lähteet)

## 1. Tutkimuskysymys

Globaaleja ilmastotilastoja esitetään usein varsinaisten mitattujen lämpötilojen sijaan lämpötila-anomalioina, eli poikkeamina jostain valitusta pohjatasosta. Tämä on yleensä keskiarvo 30-vuotisjaksolta tai kokonaiselta vuosisadalta.

<img src="https://earthobservatory.nasa.gov/ContentWOC/images/globaltemp/global_gis_2022.png">

(Kuva NASA:n Earth Observatory -sivuilta.)

Miten hyvin tällainen suurten linjojen kuvaus pätee pienemmällä, paikallisella tasolla? Kokonaisen planeetan tai edes pallonpuoliskon tarkastelu yhdellä kertaa muokkaa varmasti luonteensa vuoksi havaintojen muotoa, koska kyseessä on useiden paikkojen yhdistelmä, mutta onko niissä kuitenkin havaittavia yhteneväisyyksiä?

Vertaillaan kansainvälisten instituuttien (NASA, NOAA, JMA, MetOffice) globaaleja havaintoja suomalaisiin Ilmatieteen laitoksen mittauksiin.

## 2. Aineisto

YK:n ympäristöohjelman sivuilta (https://data.unep.org/climate/essential-climate-variables-ecv/global-temperature-change) löytyy näppärästi materiaalia jota verrata FMI:n latauspalvelusta saataviin materiaaleihin (https://www.ilmatieteenlaitos.fi/havaintojen-lataus).

In [None]:
# Tuodaan tarvittavat työkalukirjastot.

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [None]:
# Tuodaan halutut aineistot käyttöön nimettyinä muuttujina.

# Globaalit mittaukset.
data = pd.read_csv("https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/global-surface-temperature.csv") 

# Helsingin Kaisaniemen mittaukset.
KLam = pd.read_csv("https://raw.githubusercontent.com/opendata-education/Biologia/main/materiaali/data/KeskLam.txt", sep = "\t")


In [None]:
# Tarkastellaan miltä aineistot näyttävät.

data.head()

In [None]:
KLam.head()

## 3. Analyysi

Molemmat muuttujat sisältävät nyt Celsius-asteina taulukoituja tietoja 1800-luvulta nykypäivään. Kaisaniemen aseman tiedot ovat kuukausittaisia keskiarvoja, muut vuosittaisia. Korjataan asia laskemalla vuosiarvot Kaisaniemen tiedoista.

In [None]:
# Tämän solun ajaminen nostaa huomautuksen, älä välitä.
# Tehdään uusi, tyhjä sarake KLam-muuttujaan.

la = np.zeros(len(KLam))
KLam["KA"] = la

# Käydään tiedot rivi kerrallaan läpi, asettaen äskeiseen uuteen sarakkeeseen arvo. Mikä arvo?
# Miten siihen vaikuttaa, mikäli tietoaineistossa on puuttuvia kohtia (NaN, not a number)?
  
for i in range(len(KLam)):
    KLam["KA"][i] = (KLam["Tammi"][i]+KLam["Helmi"][i]+KLam["Maalis"][i]+KLam["Huhti"][i]+KLam["Touko"][i]
    +KLam["Kesä"][i]+KLam["Heinä"][i]+KLam["Elo"][i]+KLam["Syys"][i]+KLam["Loka"][i]
    +KLam["Marras"][i]+KLam["Joulu"][i])/12
    

**Miltä muuttuja KLam nyt näyttää? Kirjoita alle koodisoluun jotain joka näyttää sen.**

Tarkastellaan ensin yksinkertaisesti miltä vuositietomme näyttävät piirtämällä kuvaajat molemmista muuttujista.

In [None]:
# Globaali tilanne.

plt.figure(figsize = (20,10))

plt.plot(data["Category"], data["NOAA National Climatic Data Center"],
         label = "NOAA National Climatic Data Center")
plt.plot(data["Category"], data["NASA Goddard Institute for Space Studies"],
         label = "NASA Goddard Institute for Space Studies")
plt.plot(data["Category"], data["Japanese Meteorological Agency"],
         label = "Japanese Meteorological Agency")
plt.plot(data["Category"], data["Met Office Hadley Centre/Climatic Research Unit"],
         label = "Met Office Hadley Centre/Climatic Research Unit")

plt.axhline(0, linestyle='--', label = "Globaali vertailuarvo 1910-2000", color='k', alpha = 0.5)

plt.title("Globaali lämpötila-anomalia maanpinnalla 1880-2022 \n", fontsize = 20)
plt.ylabel("Poikkeama (°C)", fontsize = 20)
plt.xlabel("Vuosi", fontsize = 20)
plt.legend(fontsize = 20)
plt.show()

In [None]:
# Helsingin tilanne.

plt.figure(figsize = (20,10))

plt.scatter(KLam["Vuosi"], KLam["KA"], label = "Kaisaniemi")
plt.plot(KLam["Vuosi"], KLam["KA"], c = "y", alpha = 0.5)

plt.title("Lämpötila Helsingin Kaisaniemessä 1844-2020 \n", fontsize = 20)
plt.ylabel("Lämpötila (°C)", fontsize = 20)
plt.xlabel("Vuosi", fontsize = 20)
plt.legend(fontsize = 20)
plt.show()

Nyt meillä on globaalisti poikkeamat vuosien 1910-2000 keskiarvosta mutta mitatut (instrumentaaliset) arvot Kaisaniemestä, eli kuvaajia ei voi ihan hyvällä omallatunnolla verrata suoraan toisiinsa.

**Miten saamme aikaan vastaavan pohjatason Kaisaniemen tiedoista? Koodaa alle.**

```python
# Esimerkkinä .query()-käskyllä
val = KLam.query("(Vuosi > 2012) and (Vuosi < 2015)") 
# saataisiin val-muuttujaan pala alkuperäisestä taulukosta, jossa olisi vain vuosien 2013 tai 2014 tiedot.
```



```python
# Valitusta muuttujasta, jossa on yhä kaikki alkuperäiset sarakkeet, voidaan sitten
# ottaa keskiarvosarakkeesta pitkän ajan keskiarvo talteen. Tarkkana nimien kanssa.
UusiNimi = VanhaNimi["Sarakkeen nimi"].mean()

```

**Kun olet saanut laskettua Kaisaniemelle vertailupohjan, tehdään sen avulla anomaliakuvaaja.**

```python
# Napataan koko aineiston vuosiarvot kopiona uudeksi pätkäksi, jonka jokaisesta rivistä
# vähennetään vertailuajan pohja pois, eli ajetaan tulosta kohti nollaa kuten globaaleissakin
# tiedoissa oli.
Kaisa = KLam["KA"].copy()
Kaisa -= UusiNimi

```

**Piirretään kaikki viisi käyrää samaan kuvaajaan!**

In [None]:
plt.figure(figsize = (30,10))
plt.plot(data["Category"], data["NOAA National Climatic Data Center"],
         label = "NOAA National Climatic Data Center")
plt.plot(data["Category"], data["NASA Goddard Institute for Space Studies"],
         label = "NASA Goddard Institute for Space Studies")
plt.plot(data["Category"], data["Japanese Meteorological Agency"],
         label = "Japanese Meteorological Agency")
plt.plot(data["Category"], data["Met Office Hadley Centre/Climatic Research Unit"],
         label = "Met Office Hadley Centre/Climatic Research Unit")

plt.plot(KLam["Vuosi"], Kaisa, label = "Kaisaniemi")

plt.axhline(0, linestyle='--', label = "Globaali vertailuarvo 1910-2000", color='k', alpha = 0.5)

# Jos haluat hifistellä kuvaajaasi myös keskihajontarajat, laske hajo = np.std(Kaisa) mukaan. 
# plt.axhline(hajo, linestyle='--', label = "Kaisaniemen keskihajonta $\sigma$" , color='y', alpha = 0.3)
# plt.axhline(-hajo, linestyle='--', color='y', alpha = 0.3)

plt.title("Globaali lämpötila-anomalia maanpinnalla 1880-2022 \n", fontsize = 25)
plt.ylabel("Poikkeama (°C)", fontsize = 20)
plt.xlabel("Vuosi", fontsize = 20)
plt.legend(fontsize = 20)
plt.show()




**Entä jos tarkasteltaisiinkin kuukausittaista kehitystä sijaan? Miten tekisit kuvaajan vaikkapa huhtikuiden lämpötiloista Helsingissä? Saisiko sen 1900-luvusta vertailuarvoa mukaan?**

## 4. Tulokset ja johtopäätökset

Onko maailmanlaajuisessa ja paikallisessa lämpötilakäytöksessä yhteneväisyyksiä? Miksi tai miksei?

Millaisilla asemilla ja menetelmillä tulokset on saatu? Mitä epävarmuustekijöitä niihin liittyy?

Onko poikkeama sinusta suoria lämpötila-arvoja näppärämpi tapa kuvata asioita joissain yhteyksissä?



## 5. Lähteet

[1] https://data.unep.org/climate/essential-climate-variables-ecv/global-temperature-change

[2] https://www.ilmatieteenlaitos.fi/havaintojen-lataus