{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Intro 2: Statistik i Python"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"I denna notebook ska vi se på hur man importerar statistik till Python och presenterar den visuellt som en tabell, graf eller diagram.\n",
"\n",
"Vi kommer att använda **numpy**, som från tidigare är bekant, samt **pandas** och **matplotlib.pyplot**. Vi börjar med att importera paketen. Kör kodcellen, så att paketen är tillgängliga i resten av dokumentet."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"import matplotlib.pyplot as plt # matplotlib.pyplot innehåller verktyg för att rita grafer och diagram.\n",
"import pandas as pd # pandas låter oss läsa in en datafil och spara den som en variabel i python.\n",
"import numpy as np "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### CSV-filer"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Många datafiler är i .csv-format (comma separated values). En tabell i ett kalkylblad kan sparas som .csv, och ser då ut ungefär så här:\n",
"\n",
"\n",
"\n",
"Csv-filer kan importeras till python, och blir då till en typ av tabellvariabel som kallas DataFrame.\n",
"Eftersom största delen av open data-filer är tillgängliga som .csv, ska vi här se på hur man hanterar sådana tabeller."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Statistik: Världens energiproduktion"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Den Notebook som du läser nu finns online på GitHub. I samma system av mappar på GitHub finns en csv-fil med information om världens energiproduktion 1800-2019. På GitHub, såväl som lokalt på din dator, kan du hänvisa till en fil med en *relativ sökväg*. Tillsammans med denna notebook finns mappen **files** och i den finns filen **global-energy-substitution.csv**. Vi kan alltså hitta filen med sökvägen \"files/global-energy-substitution.csv\", och vi kan importera den till python med pandas-funktionen **pd.read_csv()**.\n",
"\n",
"Vi sparar csv-filen som en DataFrame-variabel med namnet **energi**. Därefter kan vi se de första raderna av tabellen med hjälp av kommandot **energi.head()**, bara så vi vet om den lästes in rätt."
]
},
{
"cell_type": "code",
"execution_count": 45,
"metadata": {
"scrolled": false
},
"outputs": [
{
"data": {
"text/html": [
"
\n", " | Year | \n", "Wind (TWh) | \n", "Oil (TWh) | \n", "Nuclear (TWh) | \n", "Hydropower (TWh) | \n", "Biomass (TWh) | \n", "Other renewables (TWh) | \n", "Biofuels (TWh) | \n", "Solar (TWh) | \n", "Coal (TWh) | \n", "Gas (TWh) | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1800 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "5556 | \n", "0 | \n", "0 | \n", "0 | \n", "97 | \n", "0 | \n", "
1 | \n", "1810 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "5833 | \n", "0 | \n", "0 | \n", "0 | \n", "128 | \n", "0 | \n", "
2 | \n", "1820 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "6111 | \n", "0 | \n", "0 | \n", "0 | \n", "153 | \n", "0 | \n", "
3 | \n", "1830 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "6389 | \n", "0 | \n", "0 | \n", "0 | \n", "264 | \n", "0 | \n", "
4 | \n", "1840 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "6944 | \n", "0 | \n", "0 | \n", "0 | \n", "356 | \n", "0 | \n", "