# An example machine learning notebook

### Notebook by [Paul van der Zee](http://www.google.com/)
#### Supported by [Reviewer](http://www.google.com/)
#### [Bedrijf waar je het voor doet met locatie](http://www.google.com/)

---

## Table of contents

1. [Introduction](#Introduction)

2. [The problem domain](#The-problem-domain)

4. [Business Understanding](#Business-Understanding)

5. [Required libraries](#Required-libraries)

6. [Data Understanding](#Data-Understanding)

7. [Data Prepartion](#Data-Preparation)

8. [Modeling](#Modeling)

9. [Evaluation](#Evaluation)

10. [Reproducibility](#Reproducibility)

---

# Introduction

[[ go back to the top ]](#Table-of-contents)

Wat je gaat benoemen in het notebook, eigenlijk een normale introductie van een document.

---

# The problem domain

[[ go back to the top ]](#Table-of-contents)

*Hier ga je een beetje benoemen waarom je het doet, maar vooral ga je het over het domein hebben en dit contextualiseren met bijvoorbeeld afbeeldingen, waardoor de lezer een beeld krijgt waar het over gaat, voorbeeld:*

We've been tasked by our partner company Noesis to do research what feature extraction is the best to create a machine learning model to predict specific audio.

### WAV plot
<img src="https://i.sstatic.net/xBtm6.png" width="600" height="300"/>

*uitleg wat het is en repeat voor alles wat relevant is*

---

# Business Understanding

[[ go back to the top ]](#Table-of-contents)

*In deze sectie ga je eerst benoemen wat het doel is van de klant, wat in de vorige sectie al kort benoemt is. Hier ga je wat meer de diepte in waarom ze het willen en welk probleem het oplost.* 

*Vervolgens ga jezelf een reeks aantal vragen stellen zoals:*
>Weet je wat je gaat oplossen?

*antwoord*

>Weet jij wat de KSF's zijn van het project? Wanneer is het project succesvol?

*antwoord*

>Begrijp jij de context van de vraag van de klant en de business of wetenschappelijke toepassing van het project? (dit helpt om een gerichter te werken naar een oplossing, bijvoorbeeld voor welke doelgroep doe je het)  
 
*antwoord*

>Is er een ontwerp of een eindvisie waar je naar toe moet werken?

*antwoord*

>Heb je overwogen dat de vraag wel opgelost kan worden met de huidige data?

*antwoord*

*Het idee is dat je de vragen kan beantwoorden voordat je code hebt geschreven, dus via interviews en literatuurstudie*

---

# Required Libraries

[[ go back to the top ]](#Table-of-contents)

*korte uitleg over de packages die je gebruikt om het project werkende te krijgen, voorbeeld van een random notebook online:*

If you don't have Python on your computer, you can use the [Anaconda Python distribution](http://continuum.io/downloads) to install most of the Python packages you need. Anaconda provides a simple double-click installer for your convenience.

This notebook uses several Python packages that come standard with the Anaconda Python distribution. The primary libraries that we'll be using are:

* **NumPy**: Provides a fast numerical array structure and helper functions.
* **pandas**: Provides a DataFrame structure to store data in memory and work with it easily and efficiently.
* **scikit-learn**: The essential Machine Learning package in Python.
* **matplotlib**: Basic plotting library in Python; most other Python plotting libraries are built on top of it.
* **Seaborn**: Advanced statistical plotting library.
* **watermark**: A Jupyter Notebook extension for printing timestamps, version numbers, and hardware information.

To make sure you have all of the packages you need, install them with `conda`:

    conda install numpy pandas scikit-learn matplotlib seaborn
    
    conda install -c conda-forge watermark

`conda` may ask you to update some of them if you don't have the most recent version. Allow it to do so.

**Note:** I will not be providing support for people trying to run this notebook outside of the Anaconda Python distribution.

In [None]:
# Data Manipulation and Analysis
import pandas as pd # type: ignore
import numpy as np # type: ignore

# Machine Learning and Data Preprocessing
from sklearn.preprocessing import LabelEncoder # type: ignore
from sklearn.model_selection import train_test_split # type: ignore

# Visualization
import matplotlib.pyplot as plt # type: ignore

# System and File Management
import sounddevice as sd # type: ignore
import sys
import os
import time

# AI packages
import tensorflow as tf # type: ignore
import tensorflow_probability as tfp # type: ignore

# Add a path to the scripts directory
sys.path.append(os.path.abspath(os.path.join('..', 'scripts')))

# Project-Specific Modules

---

# Data Understanding

[[ go back to the top ]](#Table-of-contents)

*hier ga je echt diep de data in doormiddel van stapsgewijze analyze. Bijvoorbeeld:

>eerst kijken wat in de data zit met df.head()

"Oh ik zie dat er veel data ontbreekt" *verwijdert ontbrekende data*

>df.describe()

"ik zie nu x" *doe Y*

>enzovoort

*Het idee is dus dat je elke regel uitlegt waarom je wat doet. Je eindigt altijd met een opsomming van je bevindingen*

---

# Data Preparation

[[ go back to the top ]](#Table-of-contents)

*Simpel gezegd opschonen van je data tot het punt dat je het in een model kan stoppen, kan soms heel klein zijn of heel veel. Hier geldt ook weer, elke stap onderbouwen*

---

# Modeling

[[ go back to the top ]](#Table-of-contents)

*Korte uitleg wat voor model je gebruikt en waarom*

---

# Evaluation 

[[ go back to the top ]](#Table-of-contents)

*Doormiddel van visualisaties laten zien waarom het wel of niet werkt en benoem de vervolgstappen voor vervolg onderzoek*

---

# Reproducibility

[[ go back to the top ]](#Table-of-contents)

*Als je notebook niet nagemaakt kan worden is het een slecht notebook, wat je hier kan benoemen is dat er een requirements.txt is met de versies en een compacte versie van je code in 1 codeblock*

---

Je kan dit ook nog toevoegen:

<div class="alert alert-block alert-success"><b>Success:</b> This alert box indicates a successful or positive action.</div>

<div class="alert alert-block alert-warning"><b>Example:</b> Use yellow boxes for examples that are not inside code cells, or use for mathematical formulas if needed. Typically also used to display warning messages.</div>

<div class="alert alert-block alert-info"><b>Tip:</b> Use blue boxes (alert-info) for tips and notes.</div>

<div class="alert alert-block alert-danger"><b>Danger:</b> This alert box indicates a dangerous or potentially negative action.</div>

Zo'n markdown block is gewoon HTML-code