## Forelesning 2: Plotting og datahåndtering
I denne forelesningen skal vi se på datavisualisering og datahåndtering.
- enkel plotting (med matplotlib og seaborn)
- lese datafiler (med pandas)
- rydde og visualisere data (med pandas)

In [None]:
import matplotlib.pyplot as plt
import numpy as np

T = 290 # Temperatur i K
n = 1   # Stoffmengde i mol
R = 8.314 # Gasskonstanten i J/(molK)

V = np.linspace(1, 10, 10000) # Volum i m^3
P = n*R*T/V

plt.plot(V,P)
plt.xlabel("Volum (m$^3$)")
plt.ylabel("Trykk (Pa)")
plt.show()

Vi kan også plotte små datasett ved å benytte lister:

In [None]:
# pH i vann som funksjon av temperaturen i grader C
T = [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
pH = [7.48, 7.29, 7.10, 6.90, 6.72, 6.61, 6.50, 6.41, 6.32, 6.26, 6.19]

plt.plot(T,pH)
plt.xlabel("Temperatur ($^o$C)")
plt.ylabel("pH")
plt.grid()
plt.show()

## Store datafiler

Store datafiler kan vi lese inn direkte, enten ved hjelp av basisfunksjonene i Python eller ved hjelp av biblioteker som _numpy_ og _pandas_.

In [None]:
import pandas as pd

In [None]:
data = pd.read_csv("https://www.uio.no/studier/emner/matnat/ifi/IN-KJM1900/h21/datafiler/periodesystemet.csv")

In [None]:
data.head()

In [None]:
data.info()

In [None]:
plt.scatter(data["AtomicNumber"], data["Electronegativity"])

In [None]:
data_high_elec = data[data["Electronegativity"] > 3]

In [None]:
data_high_elec.head()

In [None]:
data.describe()

In [None]:
data["CombinedPoint"] = data["BoilingPoint"] + data["MeltingPoint"]

In [None]:
data.pop("CombinedPoint")

In [None]:
data.head()

Menti: www.menti.com/wzruzmq8cw

## Visualisering

Seaborn-biblioteket er en utvidelse av matplotlib som gir tilgang til mange fine visualiseringer.

In [None]:
import seaborn as sns

sns.jointplot(data=data, x = "Group", y = "Electronegativity", hue= "Phase")

In [None]:
sns.relplot(data = data, x = "AtomicNumber", y = "Electronegativity", hue = "Phase")

In [None]:
sns.histplot(data=data, x = "BoilingPoint", bins = 8)
plt.ylabel("Antall")