Aerosoli-työpajan datasetit ja tutkimuskysymykset#


Tutkimuskysymykset#

1. Milloin (/minkä kuukauden aikana) ilmanlaatu on kaikista heikoin vuonna 2021 Hämeenlinnassa?

2. Milloin (/minkä kuukauden aikana) ilmanlaatu on kaikista heikoin vuonna 2021 Muoniossa?

3. Miten hengitettävien hiukkasten määrä eroaa toisistaan Tammikuussa ja Huhtikuussa vuonna 2021? (Voit valita Muonion tai Hämeenlinnan ja mitkä tahansa kuukaudet)

4. Kuinka paljon PM2.5 -hiukkasten määrä vaihtelee vuoden 2021 aikana Helsingissä? (Voit myös valita yksittäisen kuukauden)

5. Kuinka paljon pienhiukkasten lukumäärä vaihtelee vuoden 2021 aikana Helsingissä? (Voit myös valita yksittäisen kuukauden)

6. Kuinka paljon sisäilmansaasteet ovat aiheuttaneet kuolemia Intiassa? (Voit valita minkä tahansa maan tai tarkastella asiaa globaalisti)

7. Millä tavalla sisäilmansaasteiden ja ulkoilmansaasteiden aiheuttamat kuolemat ovat muuttuneet Suomessa? (Voit valita minkä tahansa maan tai tarkastella asiaa globaalisti)

8. Tupakointi vai huono sisäilma – kuinka suuri ero näiden riskitekijöiden kuollesuuksissa on globaalisti? (Voit myös valita minkä tahansa maan tai tupakoinnin sijasta toisen riskitekijän)

9. Millä tavalla PM2.5 -hiukkasten päästöt ovat muuttuneet vuoteen 1970 verrattuna Iso-Britanniassa tai Yhdysvalloissa?

10. Miten typpimonoksidin tai hiilimonoksidin määrä on muuttunut vuodesta 1994 lähtien Hämeenlinnassa? (Valitse toinen)


Datasettivalikoima#

import pandas as pd

1. Ilmatieteenlaitos: Hämeenlinna, Niittykatu#

Lähde: ilmatieteenlaitos.fi

Ilmatieteenlaitos mittaa useita eri suureita, joilla voidaan tarkastella ilmanlaatua. Tässä datasetissä on tarjolla Hämeenlinnan Niittykadulla mitattuja tietoja vuodelta 2021, joista meitä kiinnostaa hengitettäviin hiukkasiin liittyvä tieto. Tämä tieto on annettu yksikössä ug/m$^3$, mikä tarkoittaa hiukkasten massapitoisuutta yhtä kuutiometriä kohden. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi hengitettäviä hiukkasia esiintyy ilmassa Niittykadulla.

Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa:

datasetti1 = pd.read_csv('...',
                   parse_dates = {"Aika":["Vuosi", "Kk", "Pv", "Klo"]}, keep_date_col = True)

Ennen kuin valmistelet y-akselille tulevaa tietoa, niin tarvitset alla näkyvää koodinpätkää. Kyseisen koodin avulla voidaan muuttaa hengitettävien hiukkasten tiedot sellaiseen muotoon, että ne voidaan järkevästi piirtää kuvaajaksi.


datasetti1['Hengitettävät hiukkaset (ug/m3)'] = datasetti1['Hengitettävät hiukkaset (ug/m3)'].apply(pd.to_numeric, downcast='float', errors='coerce')
# Ja kurkkaus datasetin sisään

datasetti1 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/ilmatiet_hml.csv')
datasetti1.head()
Vuosi Kk Pv Klo Aikavyöhyke Ilmanlaatuindeksi (index) Hiilimonoksidi (ug/m3) Typpidioksidi (ug/m3) Typpimonoksidi (ug/m3) Otsoni (ug/m3) Hengitettävät hiukkaset (ug/m3) Pienhiukkaset (ug/m3) musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) Haisevat rikkiyhdisteet (ugS/m3)
0 2021 1 1 00:00 UTC 1 - 8.5 2.6 - 10.2 - - - -
1 2021 1 1 01:00 UTC 1 - 6.9 2 - 6.5 - - - -
2 2021 1 1 02:00 UTC 1 - 5.3 1.4 - 4.9 - - - -
3 2021 1 1 03:00 UTC 1 - 4.5 1.2 - 5.3 - - - -
4 2021 1 1 04:00 UTC 1 - 5.4 1 - 5.8 - - - -

2. Ilmatieteenlaitos: Muonio, Sammaltunturi#

Lähde: www.ilmatieteenlaitos.fi

Ilmatieteenlaitos mittaa useita eri suureita, joilla voidaan tarkastella ilmanlaatua. Tässä datasetissä on tarjolla Muonion Sammaltunturilla mitattuja tietoja vuodelta 2021, joista meitä kiinnostaa hengitettäviin hiukkasiin liittyvä tieto. Tämä tieto on annettu yksikössä ug/m$^3$, mikä tarkoittaa hiukkasten massapitoisuutta yhtä kuutiometriä kohden. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi hengitettäviä hiukkasia esiintyy ilmassa Sammaltunturilla.

Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa:

datasetti2 = pd.read_csv('...',
                   parse_dates = {"Aika":["Vuosi", "Kk", "Pv", "Klo"]}, keep_date_col = True)

Ennen kuin valmistelet y-akselille tulevaa tietoa, niin tarvitset alla näkyvää koodinpätkää. Kyseisen koodin avulla voidaan muuttaa hengitettävien hiukkasten tiedot sellaiseen muotoon, että ne voidaan järkevästi piirtää kuvaajaksi.


datasetti2['Hengitettävät hiukkaset (ug/m3)'] = datasetti2['Hengitettävät hiukkaset (ug/m3)'].apply(pd.to_numeric, downcast='float', errors='coerce')
datasetti2 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/ilmatiet_muonio.csv')
datasetti2.head()
Vuosi Kk Pv Klo Aikavyöhyke Hiilimonoksidi (ug/m3) Typpidioksidi (ug/m3) Typpimonoksidi (ug/m3) Otsoni (ug/m3) Hengitettävät hiukkaset (ug/m3) Pienhiukkaset (ug/m3) musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) Haisevat rikkiyhdisteet (ugS/m3)
0 2021 1 1 00:00 UTC - 1.3 0.1 43.5 1.4 - - 0.6 -
1 2021 1 1 01:00 UTC - 1.2 0.1 44.8 1.1 - - 0.4 -
2 2021 1 1 02:00 UTC - 1.2 0.1 46.4 1.1 - - 0.5 -
3 2021 1 1 03:00 UTC - 1.2 0.1 47.7 1.2 - - 0.4 -
4 2021 1 1 04:00 UTC - 1.1 0.1 48.7 1.3 - - 0.4 -

3. SMEAR: PM2.5 massapitoisuus Helsingissä#

Lähde: https://smear.avaa.csc.fi/

SMEAR-asemat ovat maailmanluokan mittausasemia, joissa mitataan ekosysteemien ja ilmakehän välisiä yhteyksiä. Näitä mittausasemia löytyy Suomesta useita, esimerkiksi Helsingistä, Hyytiälästä, Kuivajärveltä, Siikanevalta ja Kuopiosta.

Tässä datasetissä tarkastellaan Helsingin Kumpulassa mitattua PM2.5 -hiukkasten massapitoisuutta vuoden 2021 ajalta, yksikkönä on ug/m$^3$ eli kuinka monta mikrogrammaa hiukkasia on yhden kuutiometrin kokoisella alueella. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi PM2.5-hiukkasia esiintyy ilmassa.

datasetti3 = pd.read_csv('...',
                   parse_dates = {"Aika":["Year", "Month", "Day", "Hour"]}, keep_date_col = True)
datasetti3 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/smeardata_pm25_20221124.csv')
datasetti3.head()
Year Month Day Hour Minute Second KUM_META.PM25_TEOM
0 2021 1 1 0 0 0 27.1021
1 2021 1 1 0 1 0 27.1865
2 2021 1 1 0 2 0 27.4222
3 2021 1 1 0 3 0 27.7240
4 2021 1 1 0 4 0 27.9015

4. SMEAR: hiukkaspitoisuus Helsingissä#

Lähde: https://smear.avaa.csc.fi/

SMEAR-asemat ovat maailmanluokan mittausasemia, joissa mitataan ekosysteemien ja ilmakehän välisiä yhteyksiä. Näitä mittausasemia löytyy Suomesta useita, esimerkiksi Helsingistä, Hyytiälästä, Kuivajärveltä, Siikanevalta ja Kuopiosta.

Tässä datasetissä tarkastellaan Helsingin Kumpulassa mitattua hiukkasten lukumääräpitoisuutta (particle number concentration) vuoden 2021 ajalta, yksikkönä on kpl/cm$^3$, eli kuinka monta kappaletta hiukkasia on yhden kuutiosenttimertin kokoisessa tilavuudessa. Yksi kuutiosenttimetri vastaa noin yhtä palasokeripalasta.

Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa

datasetti4 = pd.read_csv('...',
                   parse_dates = {"Aika":["Year", "Month", "Day", "Hour"]}, keep_date_col = True)
datasetti4 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/smeardata_particleconcentration.csv')
datasetti4.head()
Year Month Day Hour Minute Second KUM_META.cn
0 2021 1 1 0 0 0 6354.460
1 2021 1 1 0 1 0 7644.055
2 2021 1 1 0 2 0 6141.668
3 2021 1 1 0 3 0 6174.024
4 2021 1 1 0 4 0 7466.105

5. Ilmansaasteiden päästöt (emissiot)#

Lähde: https://ourworldindata.org/grapher/emissions-of-air-pollutants

Ilmansaasteiden saattaminen laskuun on ollut tavoitteena useissa eri maissa, useinkin hyvästä syystä – onhan kyseessä ihmisten terveys. Ilmansaasteita ovat esimerkiksi ammoniakki, rikkioksidi ja pienhiukkaset PM10 ja PM2.5.

Tässä datasetissä on esitelty Britannian (United Kingdom) ja Yhdysvaltojen (United States) ilmansaasteiden määrät suhteutettuna vuoteen 1970. Mitä tämä siis tarkoittaa? Vuoden 1970 arvoksi on annettu 100%, ja jos esimerkiksi vuoden 2000 arvo olisi 40(%), tarkoittaa tämä, että kyseisen ilmansaasteen määrä on laskenut 60% vuoteen 1970 verrattuna.

Tässä datasetissä voit valita kahden eri valtion väliltä, ja valtion valitseminen onnistuu komennolla:


maan_valinta = datasetti5[datasetti5['Entity'] == 'United States']
datasetti5 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/emissions-of-air-pollutants.csv')
datasetti5.head()
Entity Code Year PM₁₀ (Index) PM₂.₅ (Index) Non-methane volatile organic compounds (Index) Nitrogen oxides (Index) Ammonia (Index) Sulphur dioxide (Index)
0 United Kingdom GBR 1970 100.00 100.00 100.00 100.00 NaN 100.00
1 United Kingdom GBR 1971 92.64 89.16 100.42 99.05 NaN 94.61
2 United Kingdom GBR 1972 82.63 79.12 97.92 98.10 NaN 90.76
3 United Kingdom GBR 1973 86.54 80.72 103.75 103.17 NaN 93.22
4 United Kingdom GBR 1974 78.72 75.10 100.00 95.87 NaN 85.52

6. Terveysvaikutukset ja kuolleisuus#

Lähde: https://ourworldindata.org/grapher/number-of-deaths-by-risk-factor

Ilmanlaadulla on suuri vaikutus ihmisten terveyteen, ja ilmanlaatua voidaankin tarkastella erikseen myös ulkoilman sekä sisäilman osalta. On yleistä, että etenkin matalamman tulotason maissa ruuanlaitossa ja lämmityksessä käytetään kiinteitä polttoaineita, kuten satojätteitä, lantaa, puuta ja hiiltä, joiden polttaminen synnyttää aerosolipäästöjä ja siten heikentää sisäilmanlaatua. Näitä kiinteitä polttoaineita käytetään, koska parempia vaihtoehtoja joko ei ole saatavilla tai ne ovat liian kalliita.

The Global Burden of Disease on suuri maailmanlaajuinen tutkimus, jossa tutkittiin kuolleisuutta ja sairauksia arvioimalla erilaisia syitä ja ja riskitekijöitä. Tutkimuksen tulokset julkaistiin lääketieteen The Lancet -lehdessä. Tähän datasettiin on kerätty tiedot eri riskitekijöiden mahdollisesti aiheuttamista kuolemista muutaman viimeisen vuosikymmenen ajalta.

Tämä datasetti sisältää esikatselussa näkyvien sarakkeiden lisäksi myös seuraavat sarakkeet:
Secondhand smoke, Low birth weight, Child wasting, Unsafe sex, Diet low in nuts and seeds, Household air pollution from solid fuels, Diet low in vegetables, Low physical activity, Smoking, High fasting plasma glucose, Air pollution (indoor and outdoor).

Tässä datasetissä voit valita tarkasteluun joko jonkun tietyn maan (esimerkiksi Finland, Sweden, India, jne) tai globaalin tuloksen (World). Maan valinta onnistuu komennolla:


maan_valinta = datasetti6[datasetti6['Entity'] == 'World']
datasetti6 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/number-of-deaths-by-risk-factor.csv')
datasetti6.head()
Entity Code Year Outdoor air pollution High systolic blood pressure Diet high in sodium Diet low in whole grains Alcohol use Diet low in fruits Unsafe water source ... High body-mass index Unsafe sanitation No access to handwashing facility Drug use Low bone mineral density Vitamin A deficiency Child stunting Discontinued breastfeeding Non-exclusive breastfeeding Iron deficiency
0 Afghanistan AFG 1990 3169 25633 1045 7077 356 3185 3702 ... 9518 2798 4825 174 389 2016 7686 107 2216 564
1 Afghanistan AFG 1991 3222 25872 1055 7149 364 3248 4309 ... 9489 3254 5127 188 389 2056 7886 121 2501 611
2 Afghanistan AFG 1992 3395 26309 1075 7297 376 3351 5356 ... 9528 4042 5889 211 393 2100 8568 150 3053 700
3 Afghanistan AFG 1993 3623 26961 1103 7499 389 3480 7152 ... 9611 5392 7007 232 411 2316 9875 204 3726 773
4 Afghanistan AFG 1994 3788 27658 1134 7698 399 3610 7192 ... 9675 5418 7421 247 413 2665 11031 204 3833 812

5 rows × 31 columns


7. Pidemmän aikavälin ilmansaasteet Hämeenlinnassa#

Lähde: www.ilmatieteenlaitos.fi

Tämä datasetti sisältää Hämeenlinnan ilmanlaatuun liittyvää dataa vuodesta 1994 lähtien. Typpimonoksidi on teollisuuden palamisreaktioissa syntyvä kaasumainen ilmansaaste, joka aiheuttaa luonnon happamoitumista. Vastaavasti hiilimonoksidia eli häkää syntyy silloin, kun hiili tai hiiltä sisältävät aineet palavat epätäydellisesti.

Typpioksidin ja hiilimonoksidin arvot on annettu yksikössä ug/m$^3$ eli kuinka monta mikrogrammaa hiukkasia on yhden kuutiometrin kokoisessa tilavuudessa. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi kyseistä kaasua esiintyy ilmassa.

Jos otat tämän datasetin tarkasteluun, käytä seuraavaa komentoa datasetin lukemiseen:


datasetti7 = pd.read_csv('...',
                        parse_dates = ["Aika"])
datasetti7 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/HL94-22.csv')
datasetti7.head()
index Aika Vuosi Kk Pv Klo Aikavyöhyke Ilmanlaatuindeksi (index) Hiilimonoksidi (ug/m3) Typpidioksidi (ug/m3) Typpimonoksidi (ug/m3) Otsoni (ug/m3) Hengitettävät hiukkaset (ug/m3) Pienhiukkaset (ug/m3) musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) Haisevat rikkiyhdisteet (ugS/m3)
0 0 1994-01-01 00:00:00 1994 1 1 00:00 UTC - 372.7 17.7 3.7 NaN 22.2 - - - -
1 1 1994-01-01 01:00:00 1994 1 1 01:00 UTC - 465.9 21.4 7.5 NaN 16.1 - - - -
2 2 1994-01-01 02:00:00 1994 1 1 02:00 UTC - 372.7 17.7 4.7 NaN 10.1 - - - -
3 3 1994-01-01 03:00:00 1994 1 1 03:00 UTC - 186.4 13.0 0.0 NaN 5.1 - - - -
4 4 1994-01-01 04:00:00 1994 1 1 04:00 UTC - 186.4 8.4 0.0 NaN 6.1 - - - -