Terveysongelmien jakautuminen muuttuvassa maailmassa#
The Global Burden of Disease on suuri maailmanlaajuinen tutkimus, jossa tutkittiin kuolleisuutta ja sairauksia arvioimalla erilaisia syitä ja ja riskitekijöitä. Tutkimuksen tulokset julkaistiin lääketieteen The Lancet -huippulehdessä vuonna 2021. Tähän datasettiin on kerätty tiedot eri riskitekijöiden mahdollisesti aiheuttamista kuolemista muutaman viimeisen vuosikymmenen ajalta.
Ilmanlaadulla on suuri vaikutus ihmisten terveyteen, ja ilmanlaatua voidaankin tarkastella erikseen myös ulkoilman sekä sisäilman osalta. On yleistä, että etenkin matalamman tulotason maissa ruuanlaitossa ja lämmityksessä käytetään kiinteitä polttoaineita, kuten satojätteitä, lantaa, puuta ja hiiltä, joiden polttaminen synnyttää aerosolipäästöjä ja siten heikentää sisäilmanlaatua. Näitä kiinteitä polttoaineita käytetään, koska parempia vaihtoehtoja joko ei ole saatavilla tai ne ovat liian kalliita.
Alkuperäiseen aineistoon pääsee kirjautumalla sivulle https://vizhub.healthdata.org/gbd-results/, mutta aineistoja saa myös visualisoitua näppärästi Our World in Data -sivuston kautta osoitteessa https://ourworldindata.org/grapher/number-of-deaths-by-risk-factor.
Tämän harjoitteen kannalta lähdemme kuitenkin kokeilemaan vähän omakätisemmin aineiston käsittelyä.
1. Työkalut#
# Aja tämä solu ensin.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
2. Aineisto#
Alla oleva GBD-aineisto kattaa noin vuodet 1990-2019.
data = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Tyopajat/main/materiaali/data/number-of-deaths-by-risk-factor.csv')
# Vilkaistaan yleisesti materiaalin muotoa.
data
Entity | Code | Year | Outdoor air pollution | High systolic blood pressure | Diet high in sodium | Diet low in whole grains | Alcohol use | Diet low in fruits | Unsafe water source | ... | High body-mass index | Unsafe sanitation | No access to handwashing facility | Drug use | Low bone mineral density | Vitamin A deficiency | Child stunting | Discontinued breastfeeding | Non-exclusive breastfeeding | Iron deficiency | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Afghanistan | AFG | 1990 | 3169 | 25633 | 1045 | 7077 | 356 | 3185 | 3702 | ... | 9518 | 2798 | 4825 | 174 | 389 | 2016 | 7686 | 107 | 2216 | 564 |
1 | Afghanistan | AFG | 1991 | 3222 | 25872 | 1055 | 7149 | 364 | 3248 | 4309 | ... | 9489 | 3254 | 5127 | 188 | 389 | 2056 | 7886 | 121 | 2501 | 611 |
2 | Afghanistan | AFG | 1992 | 3395 | 26309 | 1075 | 7297 | 376 | 3351 | 5356 | ... | 9528 | 4042 | 5889 | 211 | 393 | 2100 | 8568 | 150 | 3053 | 700 |
3 | Afghanistan | AFG | 1993 | 3623 | 26961 | 1103 | 7499 | 389 | 3480 | 7152 | ... | 9611 | 5392 | 7007 | 232 | 411 | 2316 | 9875 | 204 | 3726 | 773 |
4 | Afghanistan | AFG | 1994 | 3788 | 27658 | 1134 | 7698 | 399 | 3610 | 7192 | ... | 9675 | 5418 | 7421 | 247 | 413 | 2665 | 11031 | 204 | 3833 | 812 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
6835 | Zimbabwe | ZWE | 2015 | 2835 | 11483 | 1063 | 1354 | 4854 | 1820 | 4336 | ... | 5636 | 2879 | 4328 | 1068 | 407 | 138 | 730 | 21 | 734 | 282 |
6836 | Zimbabwe | ZWE | 2016 | 2781 | 11663 | 1082 | 1383 | 4915 | 1854 | 4244 | ... | 5849 | 2798 | 4295 | 1042 | 415 | 101 | 674 | 20 | 700 | 275 |
6837 | Zimbabwe | ZWE | 2017 | 2700 | 11819 | 1098 | 1409 | 4992 | 1883 | 4193 | ... | 6047 | 2744 | 4251 | 1007 | 424 | 82 | 629 | 19 | 678 | 267 |
6838 | Zimbabwe | ZWE | 2018 | 2669 | 12002 | 1117 | 1439 | 5044 | 1917 | 4013 | ... | 6248 | 2608 | 4153 | 969 | 434 | 85 | 607 | 17 | 644 | 261 |
6839 | Zimbabwe | ZWE | 2019 | 2680 | 12241 | 1140 | 1475 | 5156 | 1960 | 3914 | ... | 6475 | 2531 | 4113 | 963 | 438 | 81 | 585 | 16 | 631 | 259 |
6840 rows × 31 columns
Huomaamme, että aineistossa on tuhansia rivejä ja enemmän sarakkeita kuin mahtuu helposti näkyviin. Kaivetaan niiden sisällöt esiin helpommin luettaviksi listoiksi.
# Luetellaan uniikit alueet, jotka Entity-sarake sisältää.
data["Entity"].unique()
array(['Afghanistan', 'African Region (WHO)', 'Albania', 'Algeria',
'American Samoa', 'Andorra', 'Angola', 'Antigua and Barbuda',
'Argentina', 'Armenia', 'Australia', 'Austria', 'Azerbaijan',
'Bahamas', 'Bahrain', 'Bangladesh', 'Barbados', 'Belarus',
'Belgium', 'Belize', 'Benin', 'Bermuda', 'Bhutan', 'Bolivia',
'Bosnia and Herzegovina', 'Botswana', 'Brazil', 'Brunei',
'Bulgaria', 'Burkina Faso', 'Burundi', 'Cambodia', 'Cameroon',
'Canada', 'Cape Verde', 'Central African Republic', 'Chad',
'Chile', 'China', 'Colombia', 'Comoros', 'Congo', 'Cook Islands',
'Costa Rica', "Cote d'Ivoire", 'Croatia', 'Cuba', 'Cyprus',
'Czechia', 'Democratic Republic of Congo', 'Denmark', 'Djibouti',
'Dominica', 'Dominican Republic', 'East Asia & Pacific (WB)',
'Eastern Mediterranean Region (WHO)', 'Ecuador', 'Egypt',
'El Salvador', 'England', 'Equatorial Guinea', 'Eritrea',
'Estonia', 'Eswatini', 'Ethiopia', 'Europe & Central Asia (WB)',
'European Region (WHO)', 'Fiji', 'Finland', 'France', 'G20',
'Gabon', 'Gambia', 'Georgia', 'Germany', 'Ghana', 'Greece',
'Greenland', 'Grenada', 'Guam', 'Guatemala', 'Guinea',
'Guinea-Bissau', 'Guyana', 'Haiti', 'Honduras', 'Hungary',
'Iceland', 'India', 'Indonesia', 'Iran', 'Iraq', 'Ireland',
'Israel', 'Italy', 'Jamaica', 'Japan', 'Jordan', 'Kazakhstan',
'Kenya', 'Kiribati', 'Kuwait', 'Kyrgyzstan', 'Laos',
'Latin America & Caribbean (WB)', 'Latvia', 'Lebanon', 'Lesotho',
'Liberia', 'Libya', 'Lithuania', 'Luxembourg', 'Madagascar',
'Malawi', 'Malaysia', 'Maldives', 'Mali', 'Malta',
'Marshall Islands', 'Mauritania', 'Mauritius', 'Mexico',
'Micronesia (country)', 'Middle East & North Africa (WB)',
'Moldova', 'Monaco', 'Mongolia', 'Montenegro', 'Morocco',
'Mozambique', 'Myanmar', 'Namibia', 'Nauru', 'Nepal',
'Netherlands', 'New Zealand', 'Nicaragua', 'Niger', 'Nigeria',
'Niue', 'North America (WB)', 'North Korea', 'North Macedonia',
'Northern Ireland', 'Northern Mariana Islands', 'Norway',
'OECD Countries', 'Oman', 'Pakistan', 'Palau', 'Palestine',
'Panama', 'Papua New Guinea', 'Paraguay', 'Peru', 'Philippines',
'Poland', 'Portugal', 'Puerto Rico', 'Qatar',
'Region of the Americas (WHO)', 'Romania', 'Russia', 'Rwanda',
'Saint Kitts and Nevis', 'Saint Lucia',
'Saint Vincent and the Grenadines', 'Samoa', 'San Marino',
'Sao Tome and Principe', 'Saudi Arabia', 'Scotland', 'Senegal',
'Serbia', 'Seychelles', 'Sierra Leone', 'Singapore', 'Slovakia',
'Slovenia', 'Solomon Islands', 'Somalia', 'South Africa',
'South Asia (WB)', 'South Korea', 'South Sudan',
'South-East Asia Region (WHO)', 'Spain', 'Sri Lanka',
'Sub-Saharan Africa (WB)', 'Sudan', 'Suriname', 'Sweden',
'Switzerland', 'Syria', 'Taiwan', 'Tajikistan', 'Tanzania',
'Thailand', 'Timor', 'Togo', 'Tokelau', 'Tonga',
'Trinidad and Tobago', 'Tunisia', 'Turkey', 'Turkmenistan',
'Tuvalu', 'Uganda', 'Ukraine', 'United Arab Emirates',
'United Kingdom', 'United States', 'United States Virgin Islands',
'Uruguay', 'Uzbekistan', 'Vanuatu', 'Venezuela', 'Vietnam',
'Wales', 'Western Pacific Region (WHO)', 'World',
'World Bank High Income', 'World Bank Low Income',
'World Bank Lower Middle Income', 'World Bank Upper Middle Income',
'Yemen', 'Zambia', 'Zimbabwe'], dtype=object)
# Samaten listataan kaikki sarakkeiden nimet, jotta tiedämme mitä alamme kutsumaan.
data.columns
Index(['Entity', 'Code', 'Year', 'Outdoor air pollution',
'High systolic blood pressure', 'Diet high in sodium',
'Diet low in whole grains', 'Alcohol use', 'Diet low in fruits',
'Unsafe water source', 'Secondhand smoke', 'Low birth weight',
'Child wasting', 'Unsafe sex', 'Diet low in nuts and seeds',
'Household air pollution from solid fuels', 'Diet low in vegetables',
'Low physical activity', 'Smoking', 'High fasting plasma glucose',
'Air pollution (indoor and outdoor)', 'High body-mass index',
'Unsafe sanitation', 'No access to handwashing facility', 'Drug use',
'Low bone mineral density', 'Vitamin A deficiency', 'Child stunting',
'Discontinued breastfeeding', 'Non-exclusive breastfeeding',
'Iron deficiency'],
dtype='object')
3. Analyysi#
Nyt tiedämme alustavasti, mitä maita ja suureita tarkastelemamme aineisto sisältää. Tältä pohjalta pystymme rajaamaan käsittelemäämme tietoa relevantteihin palasiin kulloisenkin mielenkiinnonkohteemme mukaan.
# Valitaan yksittäinen alue uudeksi muuttujaksi. Voit vaihtaa aluetta vapaasti.
# Tämän harjoituksen monet muut solut nojaavat tässä tehtyyn valintaan.
valinta = data.query('Entity == "European Region (WHO)"')
# Tässä korjataan alkuperäiset rivi-indeksit pois ihan vain estetiikan nimissä.
valinta = valinta.reset_index(drop = True)
valinta
Entity | Code | Year | Outdoor air pollution | High systolic blood pressure | Diet high in sodium | Diet low in whole grains | Alcohol use | Diet low in fruits | Unsafe water source | ... | High body-mass index | Unsafe sanitation | No access to handwashing facility | Drug use | Low bone mineral density | Vitamin A deficiency | Child stunting | Discontinued breastfeeding | Non-exclusive breastfeeding | Iron deficiency | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | European Region (WHO) | NaN | 1990 | 627103 | 2399430 | 312367 | 518009 | 502397 | 194493 | 13734 | ... | 947836 | 10984 | 12806 | 42225 | 53617 | 774 | 11598 | 669 | 14556 | 763 |
1 | European Region (WHO) | NaN | 1991 | 630469 | 2425069 | 314023 | 527129 | 517232 | 198575 | 13177 | ... | 970124 | 10518 | 12236 | 45555 | 53913 | 682 | 10835 | 634 | 13604 | 736 |
2 | European Region (WHO) | NaN | 1992 | 637868 | 2470630 | 320816 | 541122 | 544850 | 205295 | 12801 | ... | 1002549 | 10197 | 11909 | 49690 | 54223 | 624 | 10277 | 609 | 12942 | 701 |
3 | European Region (WHO) | NaN | 1993 | 665431 | 2595573 | 335194 | 573947 | 591738 | 220395 | 12479 | ... | 1068318 | 9907 | 11825 | 55494 | 55692 | 578 | 9815 | 583 | 12411 | 676 |
4 | European Region (WHO) | NaN | 1994 | 679027 | 2666193 | 343373 | 592942 | 628806 | 229482 | 12398 | ... | 1113091 | 9785 | 11757 | 60581 | 56235 | 540 | 9452 | 565 | 12009 | 660 |
5 | European Region (WHO) | NaN | 1995 | 673676 | 2653770 | 340485 | 590665 | 636013 | 228384 | 11753 | ... | 1118495 | 9212 | 11421 | 63240 | 55798 | 501 | 8929 | 527 | 11349 | 636 |
6 | European Region (WHO) | NaN | 1996 | 653195 | 2602671 | 332560 | 577267 | 624779 | 222702 | 10900 | ... | 1105445 | 8447 | 10915 | 63854 | 54641 | 459 | 8290 | 479 | 10570 | 576 |
7 | European Region (WHO) | NaN | 1997 | 634043 | 2554006 | 324987 | 564840 | 612303 | 217502 | 10182 | ... | 1096584 | 7786 | 10433 | 62888 | 53518 | 403 | 7616 | 440 | 9864 | 540 |
8 | European Region (WHO) | NaN | 1998 | 616400 | 2517902 | 316431 | 556326 | 612386 | 213877 | 9372 | ... | 1092381 | 7054 | 9918 | 62759 | 53266 | 348 | 6895 | 401 | 9086 | 503 |
9 | European Region (WHO) | NaN | 1999 | 617364 | 2556348 | 317654 | 566083 | 636629 | 218825 | 8523 | ... | 1122999 | 6310 | 9475 | 67459 | 54229 | 292 | 6156 | 363 | 8296 | 497 |
10 | European Region (WHO) | NaN | 2000 | 609463 | 2555912 | 316765 | 566970 | 659411 | 219791 | 7653 | ... | 1136318 | 5583 | 9000 | 70816 | 54864 | 244 | 5447 | 322 | 7488 | 461 |
11 | European Region (WHO) | NaN | 2001 | 601779 | 2554402 | 315927 | 566321 | 677040 | 218833 | 6726 | ... | 1148543 | 4822 | 8515 | 71514 | 55734 | 192 | 4789 | 280 | 6681 | 418 |
12 | European Region (WHO) | NaN | 2002 | 604099 | 2581706 | 318211 | 572631 | 703045 | 220084 | 5917 | ... | 1174565 | 4142 | 8185 | 72755 | 56809 | 169 | 4235 | 241 | 5933 | 389 |
13 | European Region (WHO) | NaN | 2003 | 599531 | 2581306 | 318183 | 572008 | 725002 | 218842 | 5056 | ... | 1191221 | 3512 | 7807 | 75424 | 57585 | 141 | 3768 | 197 | 5257 | 357 |
14 | European Region (WHO) | NaN | 2004 | 582291 | 2517004 | 310301 | 557985 | 731485 | 212341 | 4382 | ... | 1179492 | 3005 | 7328 | 77534 | 56810 | 94 | 3332 | 165 | 4720 | 320 |
15 | European Region (WHO) | NaN | 2005 | 582573 | 2532746 | 313011 | 561388 | 759252 | 212854 | 3935 | ... | 1201556 | 2678 | 7124 | 83882 | 57498 | 74 | 2999 | 141 | 4293 | 309 |
16 | European Region (WHO) | NaN | 2006 | 565710 | 2447899 | 301339 | 540365 | 731117 | 202266 | 3689 | ... | 1171432 | 2499 | 6769 | 83565 | 56942 | 63 | 2755 | 126 | 4009 | 291 |
17 | European Region (WHO) | NaN | 2007 | 564401 | 2411406 | 295412 | 531363 | 714660 | 196496 | 3462 | ... | 1166489 | 2327 | 6510 | 84676 | 57343 | 55 | 2539 | 113 | 3743 | 281 |
18 | European Region (WHO) | NaN | 2008 | 569086 | 2403801 | 293866 | 528964 | 708224 | 193478 | 3288 | ... | 1175383 | 2196 | 6329 | 86530 | 58248 | 50 | 2347 | 105 | 3502 | 273 |
19 | European Region (WHO) | NaN | 2009 | 562023 | 2350346 | 287544 | 514846 | 676736 | 185572 | 3086 | ... | 1160346 | 2059 | 6068 | 84485 | 58054 | 47 | 2194 | 98 | 3289 | 278 |
20 | European Region (WHO) | NaN | 2010 | 560071 | 2343907 | 286565 | 512171 | 662632 | 183019 | 2943 | ... | 1166499 | 1952 | 5900 | 84791 | 58898 | 44 | 2045 | 91 | 3083 | 247 |
21 | European Region (WHO) | NaN | 2011 | 543822 | 2293863 | 279599 | 500596 | 627842 | 176545 | 2829 | ... | 1150167 | 1851 | 5731 | 83771 | 59320 | 41 | 1940 | 86 | 2937 | 238 |
22 | European Region (WHO) | NaN | 2012 | 530307 | 2284427 | 278073 | 496883 | 610660 | 173793 | 2780 | ... | 1154882 | 1788 | 5699 | 83729 | 60756 | 36 | 1851 | 84 | 2842 | 218 |
23 | European Region (WHO) | NaN | 2013 | 511590 | 2265253 | 274661 | 491663 | 595735 | 170820 | 2736 | ... | 1156417 | 1723 | 5673 | 82916 | 61742 | 33 | 1741 | 79 | 2695 | 219 |
24 | European Region (WHO) | NaN | 2014 | 494212 | 2260280 | 275670 | 488361 | 588698 | 168830 | 2674 | ... | 1165547 | 1656 | 5662 | 85173 | 62569 | 30 | 1634 | 74 | 2548 | 222 |
25 | European Region (WHO) | NaN | 2015 | 491367 | 2312963 | 280221 | 500986 | 594439 | 172750 | 2599 | ... | 1201639 | 1577 | 5721 | 87578 | 65053 | 26 | 1513 | 68 | 2369 | 219 |
26 | European Region (WHO) | NaN | 2016 | 467151 | 2301978 | 278169 | 497345 | 583706 | 170686 | 2517 | ... | 1203119 | 1506 | 5637 | 87567 | 65635 | 24 | 1394 | 63 | 2212 | 210 |
27 | European Region (WHO) | NaN | 2017 | 450446 | 2291072 | 276585 | 495289 | 574298 | 168768 | 2424 | ... | 1202591 | 1438 | 5499 | 85183 | 65636 | 22 | 1278 | 58 | 2047 | 204 |
28 | European Region (WHO) | NaN | 2018 | 455291 | 2327370 | 280305 | 503720 | 577701 | 170613 | 2337 | ... | 1223266 | 1373 | 5415 | 84878 | 66717 | 21 | 1197 | 55 | 1939 | 199 |
29 | European Region (WHO) | NaN | 2019 | 460353 | 2360893 | 283323 | 510860 | 583873 | 171882 | 2263 | ... | 1243937 | 1315 | 5357 | 84757 | 67787 | 19 | 1115 | 52 | 1834 | 195 |
30 rows × 31 columns
Yksinkertaisimmillaan haluaisimme jonkin kiinnostavan suureen kuvaajaksi. Otetaan yksi sarake tietoa ja kuvataan se aika-akselin kanssa.
plt.plot(valinta["Year"], valinta["Alcohol use"])
plt.show()

Hyvässä kuvaajassa on toki selitteet mukana, eli lisätään vähän tarkkuutta.
# Asetetaan mittasuhteet.
plt.figure(figsize = (10,5))
# Piirretään käyrät.
plt.plot(valinta["Year"], valinta["Alcohol use"], label = "Alkoholi", color = "green")
# Määritetään selitteet.
plt.title("Alkoholinkäytön aiheuttamat kuolemat valitulla alueella \n", fontsize = 20)
plt.ylabel("Kuolleet (n)", fontsize = 15)
plt.xlabel("\n Vuosi", fontsize = 15)
plt.legend(fontsize = 15)
# Näytetään tuotos.
plt.show()

Meidän ei toki tarvitse rajoittua yhteen suureeseen, vaan voimme piirtää niitä useampia rinnakkain samaan kuvaan. Voimme samalla huomata tehokkaan tietojenkäsittelijän olevan hieman laiska, eli kirjoittavan koodiaan sellaisella tavalla jossa muutettavia nimiä tarvitsee muuttaa vain yhdessä kohtaa. Kirjoittamalla suureisiin eri sarakeotsikoiden nimiä voit helposti vaihtaa kuvaajan sisältöä.
# Valitaan tarkasteltavat suureet
suure1 = "Outdoor air pollution"
suure2 = "Household air pollution from solid fuels"
suure3 = "Air pollution (indoor and outdoor)"
a = valinta[suure1]
b = valinta[suure2]
c = valinta[suure3]
aika = valinta["Year"]
# Mittasuhteet.
plt.figure(figsize = (10,5))
# Piirrellään kuvaajia.
plt.plot(aika, a, label = suure1)
plt.plot(aika, b, label = suure2)
plt.plot(aika, c, label = suure3)
# Määritetään selitteet.
plt.title("Eri syistä seuranneet kuolemat valitulla alueella \n", fontsize = 20)
plt.ylabel("Kuolleet (n)", fontsize = 15)
plt.xlabel("\n Vuosi", fontsize = 15)
plt.legend(fontsize = 15)
plt.legend()
plt.show()

Kuvaajan ohella saattaisimme haluta tarkastella yksittäisen vuoden tietoja helpommin luettavassa muodossa. Tätä varten jatkamme aineiston paloittelua ehtolauseilla, kuten vuosiluvun vastaavuudella.
# Vaihda tästä haluamasi vuosiluku.
vuosi = 1990
tiedot = valinta.query('Year == @vuosi')
tiedot
Entity | Code | Year | Outdoor air pollution | High systolic blood pressure | Diet high in sodium | Diet low in whole grains | Alcohol use | Diet low in fruits | Unsafe water source | ... | High body-mass index | Unsafe sanitation | No access to handwashing facility | Drug use | Low bone mineral density | Vitamin A deficiency | Child stunting | Discontinued breastfeeding | Non-exclusive breastfeeding | Iron deficiency | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | European Region (WHO) | NaN | 1990 | 627103 | 2399430 | 312367 | 518009 | 502397 | 194493 | 13734 | ... | 947836 | 10984 | 12806 | 42225 | 53617 | 774 | 11598 | 669 | 14556 | 763 |
1 rows × 31 columns
Yllä näkyvä rivi on yhä dataframe-muodossa. Repäistään rivi irti luettavaksi hieman yksinkertaisempana oliona.
# Otetaan halutulla rivillä olleet tiedot, nyt vain neljännestä sarakkeesta eteenpäin.
rivi = tiedot.iloc[0][3:]
print(rivi)
Outdoor air pollution 627103
High systolic blood pressure 2399430
Diet high in sodium 312367
Diet low in whole grains 518009
Alcohol use 502397
Diet low in fruits 194493
Unsafe water source 13734
Secondhand smoke 208726
Low birth weight 106917
Child wasting 66633
Unsafe sex 49293
Diet low in nuts and seeds 194706
Household air pollution from solid fuels 128366
Diet low in vegetables 103560
Low physical activity 181820
Smoking 1639113
High fasting plasma glucose 879141
Air pollution (indoor and outdoor) 751288
High body-mass index 947836
Unsafe sanitation 10984
No access to handwashing facility 12806
Drug use 42225
Low bone mineral density 53617
Vitamin A deficiency 774
Child stunting 11598
Discontinued breastfeeding 669
Non-exclusive breastfeeding 14556
Iron deficiency 763
Name: 0, dtype: object
Ylläoleva tuotos on sinänsä selkeä, mutta jos meillä olisi vaikkapa tuhat tarkempaa saraketta, meidän pitäisi silti järjestellä asioita uudelleen. Laitetaan tiedot suuruusjärjestykseen.
jarjestys = rivi.sort_values(ascending=False)
print(jarjestys)
High systolic blood pressure 2399430
Smoking 1639113
High body-mass index 947836
High fasting plasma glucose 879141
Air pollution (indoor and outdoor) 751288
Outdoor air pollution 627103
Diet low in whole grains 518009
Alcohol use 502397
Diet high in sodium 312367
Secondhand smoke 208726
Diet low in nuts and seeds 194706
Diet low in fruits 194493
Low physical activity 181820
Household air pollution from solid fuels 128366
Low birth weight 106917
Diet low in vegetables 103560
Child wasting 66633
Low bone mineral density 53617
Unsafe sex 49293
Drug use 42225
Non-exclusive breastfeeding 14556
Unsafe water source 13734
No access to handwashing facility 12806
Child stunting 11598
Unsafe sanitation 10984
Vitamin A deficiency 774
Iron deficiency 763
Discontinued breastfeeding 669
Name: 0, dtype: object
Erinomaista, olemme nyt siis saaneet listattua tietyn valitsemamme alueen tietyn vuoden tärkeimmät kuolemaan johtaneet riskitekijät. Mutta entä jos pyrkisimme automatisoimaan tällaista maksimiarvon etsimistä vielä hieman? Voisimme laittaa tietokoneen ilmoittamaan meille esimerkiksi seuraavaa:
print(f"Vuoden {vuosi} suurin vaikutus oli {str(rivi.max())}, kohdassa '{str(rivi.idxmax())}'.")
Vuoden 1990 suurin vaikutus oli 2399430, kohdassa 'High systolic blood pressure'.
Luvut saattavat olla myös joskus helpommin hahmotettavissa toisella tavoin kuvattuina.
plt.figure(figsize = (15,5))
ax = jarjestys.plot.barh()
ax.bar_label(ax.containers[0], padding = 3)
plt.title(f"Kuolemaan johtaneet riskitekijät valitulla alueella {vuosi} \n", fontsize = 20)
plt.xlabel("\n Kuolleisuus (miljoonaa ihmistä)", fontsize = (15))
plt.show()

Tee itse!#
Voit vapaasti vaihdella ylläolevia alue- tai riskitekijäsarakevalintojen nimiä ja ajaa koodia uudelleen. Tai voit kirjoittaa omaa koodiasi, joko tähän alle tai lisäilemällä soluja halusi mukaan pitkin matkaa. Alla on muutamia kiinnostavia mahdollisuuksia tutkiskeltaviksi:
Vertaile yksittäisen valtion tuloksia omaan maanosaansa (Suomi vs. Eurooppa, Angola vs. Afrikka jne.).
Vertaile taloudellisesti kehittyneitä valtioita köyhempiin valtioihin (Saksa vs. Zimbabwe, Yhdysvallat vs. Intia jne.).
Vertaile ilmastoltaan erilaisten alueiden kärkitekijöitä toisiinsa (Norja vs. Irak).
Tutki miten yksittäisen valtion riskitekijöiden kehitys on kulkenut 30 vuoden aikana.
# Koodaile tähän. Lisää soluja saa plusnapista tai b-näppäimellä kun et ole aktiivisen solun sisällä.