### Welke modules zijn al geinstalleerd?

In [None]:
help("modules") 

### In welke virtuele wereld werk ik vandaag?

In [None]:
import sys
print(sys.executable)

#### Of via anaconda

### Installeren van een module

In [None]:
!pip install tqdm

#### Of via anaconda

### Voorbeeld van het gebruik van een module

Onze data, een sondering met de volgende regels:

<pre>
z;qc;fs
 -5.0000E-03;2.0000E-02;2.0000E-04
 -1.0000E-02;2.0000E-02;4.0000E-04
 -1.5000E-02;2.0000E-02;7.0000E-04
 -2.0000E-02;2.0000E-02;7.0000E-04
 -2.5000E-02;2.0000E-02;9.0000E-04
 ...
</pre>

Opdracht; we willen de data inlezen en plotten

### Stap 1, de data inlezen

#### Inlezen zonder modules

In [None]:
lines = open('data/sample.gef', 'r').readlines()

lz, lqc, lfs = [], [], []

for line in lines[1:]:
    args = line.split(';')
    lz.append(float(args[0]))
    lqc.append(float(args[1]))
    lfs.append(float(args[2].strip()))
    
        
print(lz[:10])

#### inlezen met modules

https://docs.python.org/3/library/csv.html

![title](img/csv.png)

In [None]:
import csv

lz, lqc, lfs = [], [], []

with open("data/sample.gef") as csvfile:
    gefreader = csv.reader(csvfile, delimiter=';')        
    for row in gefreader:
        lz.append(float(row[0]))
        lqc.append(float(row[1]))
        lfs.append(float(row[2]))
        
        
print(lz[:10])

De standaard code werkt dus niet.. de eerste regel is een header en daar kun je geen getallen van maken. Er is ook geen optie om die header over te slaan.. help!

Denk erom, google / stackoverflow.. altijd behulpzaam...

https://stackoverflow.com/questions/14674275/skip-first-linefield-in-loop-using-csv-file

In [None]:
import csv

lz, lqc, lfs = [], [], []

with open("data/sample.gef") as csvfile:
    # volgens stackoverflow moet de volgende regel helpen
    next(csvfile)
    
    # en dan weer dezelfde code
    gefreader = csv.reader(csvfile, delimiter=';')    
    for row in gefreader:
        lz.append(float(row[0]))
        lqc.append(float(row[1]))
        lfs.append(float(row[2]))
        
print(lz[:10])

#### misschien een andere module dan?

https://docs.scipy.org/doc/numpy/reference/generated/numpy.loadtxt.html

of

https://stackoverflow.com/questions/3518778/how-do-i-read-csv-data-into-a-record-array-in-numpy

In [None]:
import numpy as np # krijg een een foutmelding doe dan eerst !pip install numpy

my_data = np.genfromtxt('data/sample.gef', delimiter=';')

my_data

In [None]:
type(my_data)

#### en nog een andere optie?

https://stackoverflow.com/questions/3518778/how-do-i-read-csv-data-into-a-record-array-in-numpy

In [None]:
import pandas as pd # krijg een een foutmelding doe dan eerst !pip install pandas

data = pd.read_csv('data/sample.gef', sep=';')

In [None]:
data

### Stap 2, plotten

We gaan matplotlib gebruiken

#### met de zelf ingelezen data:

In [None]:
import matplotlib.pyplot as plt

lines = open('data/sample.gef', 'r').readlines()

lz, lqc, lfs = [], [], []

for line in lines[1:]:
    args = line.split(';')
    lz.append(float(args[0]))
    lqc.append(float(args[1]))
    lfs.append(float(args[2].strip()))
    
_ = plt.plot(lqc, lz)

#### met de csv module

In [None]:
import csv

lz, lqc, lfs = [], [], []

with open("data/sample.gef") as csvfile:
    # volgens stackoverflow moet de volgende regel helpen
    next(csvfile)
    
    # en dan weer dezelfde code
    gefreader = csv.reader(csvfile, delimiter=';')    
    for row in gefreader:
        lz.append(float(row[0]))
        lqc.append(float(row[1]))
        lfs.append(float(row[2]))
        
_ = plt.plot(lqc, lz)

#### met de numpy module

In [None]:
import numpy as np

my_data = np.genfromtxt('data/sample.gef', delimiter=';')
_ = plt.plot(my_data[:,1], my_data[:,0])

#### met de pandas module

In [None]:
import pandas as pd

data = pd.read_csv('data/sample.gef', sep=';')
data.plot(x='qc',y='z')

#### maar moet je kijken wat pandas nog meer met je data doet!

In [None]:
data.head()

In [None]:
data.describe()

In [None]:
_ = data.hist('qc')

In [None]:
_ = data.plot.scatter(x='qc',y='z')

#### en kijk wat je kunt doen door twee bibliotheken te combineren! (gevorderden)

In [None]:
# maak via matplotlib ruimte voor een figuur van 10x15 inches
f, ax = plt.subplots(1, 1, figsize = (10, 15))

# plot op de verkregen figuur de qc tegen de diepte (gebruik de as uit de vorige regel)
data.plot(x='qc', y='z', label='qc', ax=ax) 

# bereken het wrijvingsgetal (pas op dat je eigenlijk eerst een check op qc > 0 moet doen!)
data['rf'] = data['fs'] / data['qc'] * 100.

# plot het wrijvingsgetal in dezelfde grafiek
data.plot(x='rf', y='z', label='Rf', ax=ax)

# toon het grid
ax.grid()