{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Aerosoli-työpajan datasetit ja tutkimuskysymykset"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"\n",
"### Tutkimuskysymykset\n",
" \n",
"**1. Milloin (/minkä kuukauden aikana) ilmanlaatu on kaikista heikoin vuonna 2021 Hämeenlinnassa?**\n",
"\n",
"**2. Milloin (/minkä kuukauden aikana) ilmanlaatu on kaikista heikoin vuonna 2021 Muoniossa?**\n",
"\n",
"**3. Miten hengitettävien hiukkasten määrä eroaa toisistaan Tammikuussa ja Huhtikuussa vuonna 2021?** (Voit valita Muonion tai Hämeenlinnan ja mitkä tahansa kuukaudet) \n",
"\n",
"**4. Kuinka paljon PM2.5 -hiukkasten määrä vaihtelee vuoden 2021 aikana Helsingissä?** (Voit myös valita yksittäisen kuukauden) \n",
"\n",
"**5. Kuinka paljon pienhiukkasten lukumäärä vaihtelee vuoden 2021 aikana Helsingissä?** (Voit myös valita yksittäisen kuukauden) \n",
"\n",
"**6. Kuinka paljon sisäilmansaasteet ovat aiheuttaneet kuolemia Intiassa?** (Voit valita minkä tahansa maan tai tarkastella asiaa globaalisti) \n",
"\n",
"**7. Millä tavalla sisäilmansaasteiden ja ulkoilmansaasteiden aiheuttamat kuolemat ovat muuttuneet Suomessa?** (Voit valita minkä tahansa maan tai tarkastella asiaa globaalisti) \n",
"\n",
"**8. Tupakointi vai huono sisäilma – kuinka suuri ero näiden riskitekijöiden kuollesuuksissa on globaalisti?** (Voit myös valita minkä tahansa maan tai tupakoinnin sijasta toisen riskitekijän) \n",
"\n",
"**9. Millä tavalla PM2.5 -hiukkasten päästöt ovat muuttuneet vuoteen 1970 verrattuna Iso-Britanniassa tai Yhdysvalloissa?**\n",
"\n",
"**10. Miten typpimonoksidin tai hiilimonoksidin määrä on muuttunut vuodesta 1994 lähtien Hämeenlinnassa?** (Valitse toinen)\n",
"***"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Datasettivalikoima"
]
},
{
"cell_type": "code",
"execution_count": 10,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"****\n",
"\n",
"### 1. Ilmatieteenlaitos: Hämeenlinna, Niittykatu\n",
"Lähde: ilmatieteenlaitos.fi\n",
"\n",
"Ilmatieteenlaitos mittaa useita eri suureita, joilla voidaan tarkastella ilmanlaatua. Tässä datasetissä on tarjolla Hämeenlinnan Niittykadulla mitattuja tietoja vuodelta 2021, joista meitä kiinnostaa hengitettäviin hiukkasiin liittyvä tieto. Tämä tieto on annettu yksikössä ug/m$^3$, mikä tarkoittaa hiukkasten massapitoisuutta yhtä kuutiometriä kohden. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi hengitettäviä hiukkasia esiintyy ilmassa Niittykadulla.\n",
"\n",
"Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa:\n",
"\n",
"```\n",
"datasetti1 = pd.read_csv('...',\n",
" parse_dates = {\"Aika\":[\"Vuosi\", \"Kk\", \"Pv\", \"Klo\"]}, keep_date_col = True)\n",
"```\n",
"\n",
"Ennen kuin valmistelet y-akselille tulevaa tietoa, niin tarvitset alla näkyvää koodinpätkää. Kyseisen koodin avulla voidaan muuttaa hengitettävien hiukkasten tiedot sellaiseen muotoon, että ne voidaan järkevästi piirtää kuvaajaksi.\n",
"\n",
"```\n",
"\n",
"datasetti1['Hengitettävät hiukkaset (ug/m3)'] = datasetti1['Hengitettävät hiukkaset (ug/m3)'].apply(pd.to_numeric, downcast='float', errors='coerce')\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 11,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"
\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Vuosi | \n",
" Kk | \n",
" Pv | \n",
" Klo | \n",
" Aikavyöhyke | \n",
" Ilmanlaatuindeksi (index) | \n",
" Hiilimonoksidi (ug/m3) | \n",
" Typpidioksidi (ug/m3) | \n",
" Typpimonoksidi (ug/m3) | \n",
" Otsoni (ug/m3) | \n",
" Hengitettävät hiukkaset (ug/m3) | \n",
" Pienhiukkaset (ug/m3) | \n",
" musta hiili PM2.5 (ug/m3) | \n",
" Rikkidioksidi (ug/m3) | \n",
" Haisevat rikkiyhdisteet (ugS/m3) | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 00:00 | \n",
" UTC | \n",
" 1 | \n",
" - | \n",
" 8.5 | \n",
" 2.6 | \n",
" - | \n",
" 10.2 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 1 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 01:00 | \n",
" UTC | \n",
" 1 | \n",
" - | \n",
" 6.9 | \n",
" 2 | \n",
" - | \n",
" 6.5 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 2 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 02:00 | \n",
" UTC | \n",
" 1 | \n",
" - | \n",
" 5.3 | \n",
" 1.4 | \n",
" - | \n",
" 4.9 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 3 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 03:00 | \n",
" UTC | \n",
" 1 | \n",
" - | \n",
" 4.5 | \n",
" 1.2 | \n",
" - | \n",
" 5.3 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 4 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 04:00 | \n",
" UTC | \n",
" 1 | \n",
" - | \n",
" 5.4 | \n",
" 1 | \n",
" - | \n",
" 5.8 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Vuosi Kk Pv Klo Aikavyöhyke Ilmanlaatuindeksi (index) \\\n",
"0 2021 1 1 00:00 UTC 1 \n",
"1 2021 1 1 01:00 UTC 1 \n",
"2 2021 1 1 02:00 UTC 1 \n",
"3 2021 1 1 03:00 UTC 1 \n",
"4 2021 1 1 04:00 UTC 1 \n",
"\n",
" Hiilimonoksidi (ug/m3) Typpidioksidi (ug/m3) Typpimonoksidi (ug/m3) \\\n",
"0 - 8.5 2.6 \n",
"1 - 6.9 2 \n",
"2 - 5.3 1.4 \n",
"3 - 4.5 1.2 \n",
"4 - 5.4 1 \n",
"\n",
" Otsoni (ug/m3) Hengitettävät hiukkaset (ug/m3) Pienhiukkaset (ug/m3) \\\n",
"0 - 10.2 - \n",
"1 - 6.5 - \n",
"2 - 4.9 - \n",
"3 - 5.3 - \n",
"4 - 5.8 - \n",
"\n",
" musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) \\\n",
"0 - - \n",
"1 - - \n",
"2 - - \n",
"3 - - \n",
"4 - - \n",
"\n",
" Haisevat rikkiyhdisteet (ugS/m3) \n",
"0 - \n",
"1 - \n",
"2 - \n",
"3 - \n",
"4 - "
]
},
"execution_count": 11,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# Ja kurkkaus datasetin sisään\n",
"\n",
"datasetti1 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/ilmatiet_hml.csv')\n",
"datasetti1.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 2. Ilmatieteenlaitos: Muonio, Sammaltunturi\n",
"Lähde: www.ilmatieteenlaitos.fi\n",
"\n",
"Ilmatieteenlaitos mittaa useita eri suureita, joilla voidaan tarkastella ilmanlaatua. Tässä datasetissä on tarjolla Muonion Sammaltunturilla mitattuja tietoja vuodelta 2021, joista meitä kiinnostaa hengitettäviin hiukkasiin liittyvä tieto. Tämä tieto on annettu yksikössä ug/m$^3$, mikä tarkoittaa hiukkasten massapitoisuutta yhtä kuutiometriä kohden. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi hengitettäviä hiukkasia esiintyy ilmassa Sammaltunturilla.\n",
"\n",
"Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa:\n",
"\n",
"```\n",
"datasetti2 = pd.read_csv('...',\n",
" parse_dates = {\"Aika\":[\"Vuosi\", \"Kk\", \"Pv\", \"Klo\"]}, keep_date_col = True)\n",
"```\n",
"\n",
"\n",
"Ennen kuin valmistelet y-akselille tulevaa tietoa, niin tarvitset alla näkyvää koodinpätkää. Kyseisen koodin avulla voidaan muuttaa hengitettävien hiukkasten tiedot sellaiseen muotoon, että ne voidaan järkevästi piirtää kuvaajaksi.\n",
"\n",
"```\n",
"\n",
"datasetti2['Hengitettävät hiukkaset (ug/m3)'] = datasetti2['Hengitettävät hiukkaset (ug/m3)'].apply(pd.to_numeric, downcast='float', errors='coerce')\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Vuosi | \n",
" Kk | \n",
" Pv | \n",
" Klo | \n",
" Aikavyöhyke | \n",
" Hiilimonoksidi (ug/m3) | \n",
" Typpidioksidi (ug/m3) | \n",
" Typpimonoksidi (ug/m3) | \n",
" Otsoni (ug/m3) | \n",
" Hengitettävät hiukkaset (ug/m3) | \n",
" Pienhiukkaset (ug/m3) | \n",
" musta hiili PM2.5 (ug/m3) | \n",
" Rikkidioksidi (ug/m3) | \n",
" Haisevat rikkiyhdisteet (ugS/m3) | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 00:00 | \n",
" UTC | \n",
" - | \n",
" 1.3 | \n",
" 0.1 | \n",
" 43.5 | \n",
" 1.4 | \n",
" - | \n",
" - | \n",
" 0.6 | \n",
" - | \n",
"
\n",
" \n",
" 1 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 01:00 | \n",
" UTC | \n",
" - | \n",
" 1.2 | \n",
" 0.1 | \n",
" 44.8 | \n",
" 1.1 | \n",
" - | \n",
" - | \n",
" 0.4 | \n",
" - | \n",
"
\n",
" \n",
" 2 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 02:00 | \n",
" UTC | \n",
" - | \n",
" 1.2 | \n",
" 0.1 | \n",
" 46.4 | \n",
" 1.1 | \n",
" - | \n",
" - | \n",
" 0.5 | \n",
" - | \n",
"
\n",
" \n",
" 3 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 03:00 | \n",
" UTC | \n",
" - | \n",
" 1.2 | \n",
" 0.1 | \n",
" 47.7 | \n",
" 1.2 | \n",
" - | \n",
" - | \n",
" 0.4 | \n",
" - | \n",
"
\n",
" \n",
" 4 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 04:00 | \n",
" UTC | \n",
" - | \n",
" 1.1 | \n",
" 0.1 | \n",
" 48.7 | \n",
" 1.3 | \n",
" - | \n",
" - | \n",
" 0.4 | \n",
" - | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Vuosi Kk Pv Klo Aikavyöhyke Hiilimonoksidi (ug/m3) \\\n",
"0 2021 1 1 00:00 UTC - \n",
"1 2021 1 1 01:00 UTC - \n",
"2 2021 1 1 02:00 UTC - \n",
"3 2021 1 1 03:00 UTC - \n",
"4 2021 1 1 04:00 UTC - \n",
"\n",
" Typpidioksidi (ug/m3) Typpimonoksidi (ug/m3) Otsoni (ug/m3) \\\n",
"0 1.3 0.1 43.5 \n",
"1 1.2 0.1 44.8 \n",
"2 1.2 0.1 46.4 \n",
"3 1.2 0.1 47.7 \n",
"4 1.1 0.1 48.7 \n",
"\n",
" Hengitettävät hiukkaset (ug/m3) Pienhiukkaset (ug/m3) \\\n",
"0 1.4 - \n",
"1 1.1 - \n",
"2 1.1 - \n",
"3 1.2 - \n",
"4 1.3 - \n",
"\n",
" musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) \\\n",
"0 - 0.6 \n",
"1 - 0.4 \n",
"2 - 0.5 \n",
"3 - 0.4 \n",
"4 - 0.4 \n",
"\n",
" Haisevat rikkiyhdisteet (ugS/m3) \n",
"0 - \n",
"1 - \n",
"2 - \n",
"3 - \n",
"4 - "
]
},
"execution_count": 12,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti2 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/ilmatiet_muonio.csv')\n",
"datasetti2.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 3. SMEAR: PM2.5 massapitoisuus Helsingissä\n",
"Lähde: https://smear.avaa.csc.fi/\n",
"\n",
"SMEAR-asemat ovat maailmanluokan mittausasemia, joissa mitataan ekosysteemien ja ilmakehän välisiä yhteyksiä. Näitä mittausasemia löytyy Suomesta useita, esimerkiksi Helsingistä, Hyytiälästä, Kuivajärveltä, Siikanevalta ja Kuopiosta.\n",
"\n",
"Tässä datasetissä tarkastellaan Helsingin Kumpulassa mitattua PM2.5 -hiukkasten massapitoisuutta vuoden 2021 ajalta, yksikkönä on ug/m$^3$ eli kuinka monta mikrogrammaa hiukkasia on yhden kuutiometrin kokoisella alueella. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi PM2.5-hiukkasia esiintyy ilmassa.\n",
"\n",
"```\n",
"datasetti3 = pd.read_csv('...',\n",
" parse_dates = {\"Aika\":[\"Year\", \"Month\", \"Day\", \"Hour\"]}, keep_date_col = True)\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 13,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Year | \n",
" Month | \n",
" Day | \n",
" Hour | \n",
" Minute | \n",
" Second | \n",
" KUM_META.PM25_TEOM | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 27.1021 | \n",
"
\n",
" \n",
" 1 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 27.1865 | \n",
"
\n",
" \n",
" 2 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 0 | \n",
" 27.4222 | \n",
"
\n",
" \n",
" 3 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 3 | \n",
" 0 | \n",
" 27.7240 | \n",
"
\n",
" \n",
" 4 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 4 | \n",
" 0 | \n",
" 27.9015 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Year Month Day Hour Minute Second KUM_META.PM25_TEOM\n",
"0 2021 1 1 0 0 0 27.1021\n",
"1 2021 1 1 0 1 0 27.1865\n",
"2 2021 1 1 0 2 0 27.4222\n",
"3 2021 1 1 0 3 0 27.7240\n",
"4 2021 1 1 0 4 0 27.9015"
]
},
"execution_count": 13,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti3 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/smeardata_pm25_20221124.csv')\n",
"datasetti3.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 4. SMEAR: hiukkaspitoisuus Helsingissä\n",
"Lähde: https://smear.avaa.csc.fi/\n",
"\n",
"SMEAR-asemat ovat maailmanluokan mittausasemia, joissa mitataan ekosysteemien ja ilmakehän välisiä yhteyksiä. Näitä mittausasemia löytyy Suomesta useita, esimerkiksi Helsingistä, Hyytiälästä, Kuivajärveltä, Siikanevalta ja Kuopiosta.\n",
"\n",
"Tässä datasetissä tarkastellaan Helsingin Kumpulassa mitattua hiukkasten lukumääräpitoisuutta (particle number concentration) vuoden 2021 ajalta, yksikkönä on kpl/cm$^3$, eli kuinka monta kappaletta hiukkasia on yhden kuutiosenttimertin kokoisessa tilavuudessa. Yksi kuutiosenttimetri vastaa noin yhtä palasokeripalasta. \n",
"\n",
"Jos valitsit tämän datasetin tarkasteluun, voit luoda uuden aika-sarakkeen (joka yhdistää kaikki erikseen annetut aikasuureet samaan sarakkeeseen), kun käytät tätä komentoa datasetin käyttöönotossa\n",
"\n",
"```\n",
"datasetti4 = pd.read_csv('...',\n",
" parse_dates = {\"Aika\":[\"Year\", \"Month\", \"Day\", \"Hour\"]}, keep_date_col = True)\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Year | \n",
" Month | \n",
" Day | \n",
" Hour | \n",
" Minute | \n",
" Second | \n",
" KUM_META.cn | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 6354.460 | \n",
"
\n",
" \n",
" 1 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 7644.055 | \n",
"
\n",
" \n",
" 2 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 0 | \n",
" 6141.668 | \n",
"
\n",
" \n",
" 3 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 3 | \n",
" 0 | \n",
" 6174.024 | \n",
"
\n",
" \n",
" 4 | \n",
" 2021 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 4 | \n",
" 0 | \n",
" 7466.105 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Year Month Day Hour Minute Second KUM_META.cn\n",
"0 2021 1 1 0 0 0 6354.460\n",
"1 2021 1 1 0 1 0 7644.055\n",
"2 2021 1 1 0 2 0 6141.668\n",
"3 2021 1 1 0 3 0 6174.024\n",
"4 2021 1 1 0 4 0 7466.105"
]
},
"execution_count": 14,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti4 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/smeardata_particleconcentration.csv')\n",
"datasetti4.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 5. Ilmansaasteiden päästöt (emissiot)\n",
"Lähde: https://ourworldindata.org/grapher/emissions-of-air-pollutants\n",
"\n",
"Ilmansaasteiden saattaminen laskuun on ollut tavoitteena useissa eri maissa, useinkin hyvästä syystä – onhan kyseessä ihmisten terveys. Ilmansaasteita ovat esimerkiksi ammoniakki, rikkioksidi ja pienhiukkaset PM10 ja PM2.5. \n",
"\n",
"Tässä datasetissä on esitelty Britannian (United Kingdom) ja Yhdysvaltojen (United States) ilmansaasteiden määrät suhteutettuna vuoteen 1970. Mitä tämä siis tarkoittaa? Vuoden 1970 arvoksi on annettu 100%, ja jos esimerkiksi vuoden 2000 arvo olisi 40(%), tarkoittaa tämä, että kyseisen ilmansaasteen määrä on laskenut 60% vuoteen 1970 verrattuna.\n",
"\n",
"Tässä datasetissä voit valita kahden eri valtion väliltä, ja valtion valitseminen onnistuu komennolla:\n",
"\n",
"```\n",
"\n",
"maan_valinta = datasetti5[datasetti5['Entity'] == 'United States']\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 15,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Entity | \n",
" Code | \n",
" Year | \n",
" PM₁₀ (Index) | \n",
" PM₂.₅ (Index) | \n",
" Non-methane volatile organic compounds (Index) | \n",
" Nitrogen oxides (Index) | \n",
" Ammonia (Index) | \n",
" Sulphur dioxide (Index) | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" United Kingdom | \n",
" GBR | \n",
" 1970 | \n",
" 100.00 | \n",
" 100.00 | \n",
" 100.00 | \n",
" 100.00 | \n",
" NaN | \n",
" 100.00 | \n",
"
\n",
" \n",
" 1 | \n",
" United Kingdom | \n",
" GBR | \n",
" 1971 | \n",
" 92.64 | \n",
" 89.16 | \n",
" 100.42 | \n",
" 99.05 | \n",
" NaN | \n",
" 94.61 | \n",
"
\n",
" \n",
" 2 | \n",
" United Kingdom | \n",
" GBR | \n",
" 1972 | \n",
" 82.63 | \n",
" 79.12 | \n",
" 97.92 | \n",
" 98.10 | \n",
" NaN | \n",
" 90.76 | \n",
"
\n",
" \n",
" 3 | \n",
" United Kingdom | \n",
" GBR | \n",
" 1973 | \n",
" 86.54 | \n",
" 80.72 | \n",
" 103.75 | \n",
" 103.17 | \n",
" NaN | \n",
" 93.22 | \n",
"
\n",
" \n",
" 4 | \n",
" United Kingdom | \n",
" GBR | \n",
" 1974 | \n",
" 78.72 | \n",
" 75.10 | \n",
" 100.00 | \n",
" 95.87 | \n",
" NaN | \n",
" 85.52 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Entity Code Year PM₁₀ (Index) PM₂.₅ (Index) \\\n",
"0 United Kingdom GBR 1970 100.00 100.00 \n",
"1 United Kingdom GBR 1971 92.64 89.16 \n",
"2 United Kingdom GBR 1972 82.63 79.12 \n",
"3 United Kingdom GBR 1973 86.54 80.72 \n",
"4 United Kingdom GBR 1974 78.72 75.10 \n",
"\n",
" Non-methane volatile organic compounds (Index) Nitrogen oxides (Index) \\\n",
"0 100.00 100.00 \n",
"1 100.42 99.05 \n",
"2 97.92 98.10 \n",
"3 103.75 103.17 \n",
"4 100.00 95.87 \n",
"\n",
" Ammonia (Index) Sulphur dioxide (Index) \n",
"0 NaN 100.00 \n",
"1 NaN 94.61 \n",
"2 NaN 90.76 \n",
"3 NaN 93.22 \n",
"4 NaN 85.52 "
]
},
"execution_count": 15,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti5 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/emissions-of-air-pollutants.csv')\n",
"datasetti5.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 6. Terveysvaikutukset ja kuolleisuus\n",
"Lähde: https://ourworldindata.org/grapher/number-of-deaths-by-risk-factor\n",
"\n",
"Ilmanlaadulla on suuri vaikutus ihmisten terveyteen, ja ilmanlaatua voidaankin tarkastella erikseen myös ulkoilman sekä sisäilman osalta. On yleistä, että etenkin matalamman tulotason maissa ruuanlaitossa ja lämmityksessä käytetään kiinteitä polttoaineita, kuten satojätteitä, lantaa, puuta ja hiiltä, joiden polttaminen synnyttää aerosolipäästöjä ja siten heikentää sisäilmanlaatua. Näitä kiinteitä polttoaineita käytetään, koska parempia vaihtoehtoja joko ei ole saatavilla tai ne ovat liian kalliita.\n",
"\n",
"_The Global Burden of Disease_ on suuri maailmanlaajuinen tutkimus, jossa tutkittiin kuolleisuutta ja sairauksia arvioimalla erilaisia syitä ja ja riskitekijöitä. Tutkimuksen tulokset julkaistiin lääketieteen _The Lancet_ -lehdessä. Tähän datasettiin on kerätty tiedot eri riskitekijöiden mahdollisesti aiheuttamista kuolemista muutaman viimeisen vuosikymmenen ajalta.\n",
"\n",
"Tämä datasetti sisältää esikatselussa näkyvien sarakkeiden lisäksi myös seuraavat sarakkeet: \n",
"Secondhand smoke, Low birth weight, Child wasting, Unsafe sex, Diet low in nuts and seeds, Household air pollution from solid fuels, Diet low in vegetables, Low physical activity, Smoking, High fasting plasma glucose, Air pollution (indoor and outdoor).\n",
"\n",
"Tässä datasetissä voit valita tarkasteluun joko jonkun tietyn maan (esimerkiksi Finland, Sweden, India, jne) tai globaalin tuloksen (World). Maan valinta onnistuu komennolla:\n",
"\n",
"```\n",
"\n",
"maan_valinta = datasetti6[datasetti6['Entity'] == 'World']\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Entity | \n",
" Code | \n",
" Year | \n",
" Outdoor air pollution | \n",
" High systolic blood pressure | \n",
" Diet high in sodium | \n",
" Diet low in whole grains | \n",
" Alcohol use | \n",
" Diet low in fruits | \n",
" Unsafe water source | \n",
" ... | \n",
" High body-mass index | \n",
" Unsafe sanitation | \n",
" No access to handwashing facility | \n",
" Drug use | \n",
" Low bone mineral density | \n",
" Vitamin A deficiency | \n",
" Child stunting | \n",
" Discontinued breastfeeding | \n",
" Non-exclusive breastfeeding | \n",
" Iron deficiency | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" Afghanistan | \n",
" AFG | \n",
" 1990 | \n",
" 3169 | \n",
" 25633 | \n",
" 1045 | \n",
" 7077 | \n",
" 356 | \n",
" 3185 | \n",
" 3702 | \n",
" ... | \n",
" 9518 | \n",
" 2798 | \n",
" 4825 | \n",
" 174 | \n",
" 389 | \n",
" 2016 | \n",
" 7686 | \n",
" 107 | \n",
" 2216 | \n",
" 564 | \n",
"
\n",
" \n",
" 1 | \n",
" Afghanistan | \n",
" AFG | \n",
" 1991 | \n",
" 3222 | \n",
" 25872 | \n",
" 1055 | \n",
" 7149 | \n",
" 364 | \n",
" 3248 | \n",
" 4309 | \n",
" ... | \n",
" 9489 | \n",
" 3254 | \n",
" 5127 | \n",
" 188 | \n",
" 389 | \n",
" 2056 | \n",
" 7886 | \n",
" 121 | \n",
" 2501 | \n",
" 611 | \n",
"
\n",
" \n",
" 2 | \n",
" Afghanistan | \n",
" AFG | \n",
" 1992 | \n",
" 3395 | \n",
" 26309 | \n",
" 1075 | \n",
" 7297 | \n",
" 376 | \n",
" 3351 | \n",
" 5356 | \n",
" ... | \n",
" 9528 | \n",
" 4042 | \n",
" 5889 | \n",
" 211 | \n",
" 393 | \n",
" 2100 | \n",
" 8568 | \n",
" 150 | \n",
" 3053 | \n",
" 700 | \n",
"
\n",
" \n",
" 3 | \n",
" Afghanistan | \n",
" AFG | \n",
" 1993 | \n",
" 3623 | \n",
" 26961 | \n",
" 1103 | \n",
" 7499 | \n",
" 389 | \n",
" 3480 | \n",
" 7152 | \n",
" ... | \n",
" 9611 | \n",
" 5392 | \n",
" 7007 | \n",
" 232 | \n",
" 411 | \n",
" 2316 | \n",
" 9875 | \n",
" 204 | \n",
" 3726 | \n",
" 773 | \n",
"
\n",
" \n",
" 4 | \n",
" Afghanistan | \n",
" AFG | \n",
" 1994 | \n",
" 3788 | \n",
" 27658 | \n",
" 1134 | \n",
" 7698 | \n",
" 399 | \n",
" 3610 | \n",
" 7192 | \n",
" ... | \n",
" 9675 | \n",
" 5418 | \n",
" 7421 | \n",
" 247 | \n",
" 413 | \n",
" 2665 | \n",
" 11031 | \n",
" 204 | \n",
" 3833 | \n",
" 812 | \n",
"
\n",
" \n",
"
\n",
"
5 rows × 31 columns
\n",
"
"
],
"text/plain": [
" Entity Code Year Outdoor air pollution \\\n",
"0 Afghanistan AFG 1990 3169 \n",
"1 Afghanistan AFG 1991 3222 \n",
"2 Afghanistan AFG 1992 3395 \n",
"3 Afghanistan AFG 1993 3623 \n",
"4 Afghanistan AFG 1994 3788 \n",
"\n",
" High systolic blood pressure Diet high in sodium \\\n",
"0 25633 1045 \n",
"1 25872 1055 \n",
"2 26309 1075 \n",
"3 26961 1103 \n",
"4 27658 1134 \n",
"\n",
" Diet low in whole grains Alcohol use Diet low in fruits \\\n",
"0 7077 356 3185 \n",
"1 7149 364 3248 \n",
"2 7297 376 3351 \n",
"3 7499 389 3480 \n",
"4 7698 399 3610 \n",
"\n",
" Unsafe water source ... High body-mass index Unsafe sanitation \\\n",
"0 3702 ... 9518 2798 \n",
"1 4309 ... 9489 3254 \n",
"2 5356 ... 9528 4042 \n",
"3 7152 ... 9611 5392 \n",
"4 7192 ... 9675 5418 \n",
"\n",
" No access to handwashing facility Drug use Low bone mineral density \\\n",
"0 4825 174 389 \n",
"1 5127 188 389 \n",
"2 5889 211 393 \n",
"3 7007 232 411 \n",
"4 7421 247 413 \n",
"\n",
" Vitamin A deficiency Child stunting Discontinued breastfeeding \\\n",
"0 2016 7686 107 \n",
"1 2056 7886 121 \n",
"2 2100 8568 150 \n",
"3 2316 9875 204 \n",
"4 2665 11031 204 \n",
"\n",
" Non-exclusive breastfeeding Iron deficiency \n",
"0 2216 564 \n",
"1 2501 611 \n",
"2 3053 700 \n",
"3 3726 773 \n",
"4 3833 812 \n",
"\n",
"[5 rows x 31 columns]"
]
},
"execution_count": 16,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti6 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/number-of-deaths-by-risk-factor.csv')\n",
"datasetti6.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"***\n",
"### 7. Pidemmän aikavälin ilmansaasteet Hämeenlinnassa\n",
"Lähde: www.ilmatieteenlaitos.fi\n",
"\n",
"Tämä datasetti sisältää Hämeenlinnan ilmanlaatuun liittyvää dataa vuodesta 1994 lähtien. Typpimonoksidi on teollisuuden palamisreaktioissa syntyvä kaasumainen ilmansaaste, joka aiheuttaa luonnon happamoitumista. Vastaavasti hiilimonoksidia eli häkää syntyy silloin, kun hiili tai hiiltä sisältävät aineet palavat epätäydellisesti.\n",
"\n",
"Typpioksidin ja hiilimonoksidin arvot on annettu yksikössä ug/m$^3$ eli kuinka monta mikrogrammaa hiukkasia on yhden kuutiometrin kokoisessa tilavuudessa. Jos massapitoisuus ei ole tuttu termi, niin esimerkiksi puhtaille aineille, kuten pelkälle vedelle tai raudalle, massapitoisuus kuvastaa aineen tiheyttä. Tässä tapauksessa massapitoisuus kuvastaa siis sitä, kuinka tiheästi kyseistä kaasua esiintyy ilmassa.\n",
"\n",
"Jos otat tämän datasetin tarkasteluun, käytä seuraavaa komentoa datasetin lukemiseen:\n",
"```\n",
"\n",
"datasetti7 = pd.read_csv('...',\n",
" parse_dates = [\"Aika\"])\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 17,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" index | \n",
" Aika | \n",
" Vuosi | \n",
" Kk | \n",
" Pv | \n",
" Klo | \n",
" Aikavyöhyke | \n",
" Ilmanlaatuindeksi (index) | \n",
" Hiilimonoksidi (ug/m3) | \n",
" Typpidioksidi (ug/m3) | \n",
" Typpimonoksidi (ug/m3) | \n",
" Otsoni (ug/m3) | \n",
" Hengitettävät hiukkaset (ug/m3) | \n",
" Pienhiukkaset (ug/m3) | \n",
" musta hiili PM2.5 (ug/m3) | \n",
" Rikkidioksidi (ug/m3) | \n",
" Haisevat rikkiyhdisteet (ugS/m3) | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 0 | \n",
" 1994-01-01 00:00:00 | \n",
" 1994 | \n",
" 1 | \n",
" 1 | \n",
" 00:00 | \n",
" UTC | \n",
" - | \n",
" 372.7 | \n",
" 17.7 | \n",
" 3.7 | \n",
" NaN | \n",
" 22.2 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 1 | \n",
" 1 | \n",
" 1994-01-01 01:00:00 | \n",
" 1994 | \n",
" 1 | \n",
" 1 | \n",
" 01:00 | \n",
" UTC | \n",
" - | \n",
" 465.9 | \n",
" 21.4 | \n",
" 7.5 | \n",
" NaN | \n",
" 16.1 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 2 | \n",
" 2 | \n",
" 1994-01-01 02:00:00 | \n",
" 1994 | \n",
" 1 | \n",
" 1 | \n",
" 02:00 | \n",
" UTC | \n",
" - | \n",
" 372.7 | \n",
" 17.7 | \n",
" 4.7 | \n",
" NaN | \n",
" 10.1 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 3 | \n",
" 3 | \n",
" 1994-01-01 03:00:00 | \n",
" 1994 | \n",
" 1 | \n",
" 1 | \n",
" 03:00 | \n",
" UTC | \n",
" - | \n",
" 186.4 | \n",
" 13.0 | \n",
" 0.0 | \n",
" NaN | \n",
" 5.1 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
" 4 | \n",
" 4 | \n",
" 1994-01-01 04:00:00 | \n",
" 1994 | \n",
" 1 | \n",
" 1 | \n",
" 04:00 | \n",
" UTC | \n",
" - | \n",
" 186.4 | \n",
" 8.4 | \n",
" 0.0 | \n",
" NaN | \n",
" 6.1 | \n",
" - | \n",
" - | \n",
" - | \n",
" - | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" index Aika Vuosi Kk Pv Klo Aikavyöhyke \\\n",
"0 0 1994-01-01 00:00:00 1994 1 1 00:00 UTC \n",
"1 1 1994-01-01 01:00:00 1994 1 1 01:00 UTC \n",
"2 2 1994-01-01 02:00:00 1994 1 1 02:00 UTC \n",
"3 3 1994-01-01 03:00:00 1994 1 1 03:00 UTC \n",
"4 4 1994-01-01 04:00:00 1994 1 1 04:00 UTC \n",
"\n",
" Ilmanlaatuindeksi (index) Hiilimonoksidi (ug/m3) Typpidioksidi (ug/m3) \\\n",
"0 - 372.7 17.7 \n",
"1 - 465.9 21.4 \n",
"2 - 372.7 17.7 \n",
"3 - 186.4 13.0 \n",
"4 - 186.4 8.4 \n",
"\n",
" Typpimonoksidi (ug/m3) Otsoni (ug/m3) Hengitettävät hiukkaset (ug/m3) \\\n",
"0 3.7 NaN 22.2 \n",
"1 7.5 NaN 16.1 \n",
"2 4.7 NaN 10.1 \n",
"3 0.0 NaN 5.1 \n",
"4 0.0 NaN 6.1 \n",
"\n",
" Pienhiukkaset (ug/m3) musta hiili PM2.5 (ug/m3) Rikkidioksidi (ug/m3) \\\n",
"0 - - - \n",
"1 - - - \n",
"2 - - - \n",
"3 - - - \n",
"4 - - - \n",
"\n",
" Haisevat rikkiyhdisteet (ugS/m3) \n",
"0 - \n",
"1 - \n",
"2 - \n",
"3 - \n",
"4 - "
]
},
"execution_count": 17,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"datasetti7 = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/HL94-22.csv')\n",
"datasetti7.head()"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.8.5"
}
},
"nbformat": 4,
"nbformat_minor": 4
}