# TVVL Cursus | Intro Python | Deel 2
Middels het gebruik van de Quandl API kan data van aandelen worden gebruikt om een aantal basisfunctionaliteiten van de Python Libary Pandas rondom Iime Series data toe te lichten.

## Python Libary Imports
We beginnen met het importeren van de benodigde Python Libaries. Voor deze intro hebben we naast Pandas ook de Libary Quandl nodig. Deze Libary is door Quandl specifiek ontwikkeld om data vanuit de Quandl databases te downloaden middels Python. Meer informatie over het Quandl data platform is te vinden via https://www.quandl.com/. Meer informatie over de Quandl Python Libary functionaliteiten is te vinden via https://www.quandl.com/tools/python

In [None]:
# Importeren Pandas Libary
import quandl
import pandas as pd

## Lees data uit Quandl API en verken datasets
Middels het gebruik van de '.get()' functionaliteiten kunnen we voor specifieke bedrijven informatie ophalen over de prijs van het aandeel. In dit voorbeeld gebruiken we data van het bedrijf Apple (stock_apple) en Microsoft (stock_ms).

In [None]:
stock_apple = quandl.get("WIKI/AAPL")
stock_ms = quandl.get("WIKI/MSFT")

Vervolgens controleren we de eigenschappen van de ingelezen data middels de 'info()' functionaliteit. Hierbij krijg je informatie over de hoeveelheid datapunten per kolom en de specieke datatypes die de dataset bevat.

In [None]:
stock_apple.info()

# Print een paar lege regels tussen de informatie
print('-----\n \n \n \n-----')

stock_ms.info()

De ingelezen data is direct ingeladen in een pandas DataFrame. Elke kolom bevat het 'float64' datatype, wat betekend dat het nummers betreft. Om dit te controlleren bekijken we een stukje van beide datasets middels de 'head()' functie. Daarnaast is de index van de DataFrame een 'DatetimeIndex'. Dit betekend dat de dataset eenvoudig is te bewerken door gebruik te maken van datums.

In [None]:
stock_apple.head()

In [None]:
stock_ms.head()

Beide datasets bevatten enkel getallen die informatie bevatten over de aandelen prijs. Middels de 'isnull()' functionaliteit controlleren we de kwaliteit van de data. Hieruit is te concluderen data beide datasets geen lege cellen of 'NaN' waardes bevatten.

In [None]:
stock_apple.isnull().sum()

In [None]:
stock_ms.isnull().sum()

# Data bewerking
Nu we weten met wat voor datasets we te maken hebben, kunnen we - afhankelijk van de analyse die we willen uitvoeren - beginnen met het bewerken van de data waarnodig. In deze tutorial willen we voor de periode tussen 2017 en 2018 willen we de 'Adj. Close' analyseren ten opzichten van elkaar. 

## Selecteren van time range
Voor beide datasets willen we de data tussen 2017 en 2018 rondom de 'Adj. Close' hebben. Doordat de index van de DataFrame een 'DatetimeIndex' is, kunnen we eenvoudig de datasets filteren door gebruik te maken van datums. Eerst kijken we naar de data van 2017 in de 'Adj. Close' kolom. Door na de variable naam bijvoorbeeld ['2017'] toe te voegen, krijg je de data uit 2017 terug.

In [None]:
stock_apple["2017"]["Adj. Close"].plot()

Om de data per maand te bekijken kan er bijvoorbeeld '2017-03' worden ingevuld.

In [None]:
stock_ms["2017-03"]["Adj. Close"].plot()

Vervolgens willen we de data tussen 2017 en 2018 van de kolom 'Adj. Close' voor zowel de Apple als Microsoft dataset opslaan in een nieuwe variable. Hierbij maken we gebruik van de 'loc[]' functionaliteit om een specifieke time range te selecteren. Let op dat deze nieuwe variable niet direct een nieuw DataFrame oplevert. Zodoende moet de "stock_ms.loc[]" functionaliteit binnen de functie "pd.DataFrame()" functionaliteit worden geplaatst.

In [None]:
price_17_18_ms = pd.DataFrame(stock_ms.loc["2017-01-01":"2018-12-31"]["Adj. Close"])
price_17_18_ms.plot()

price_17_18_apple = pd.DataFrame(stock_apple.loc["2017-01-01":"2018-12-31"]["Adj. Close"])
price_17_18_apple.plot()

## Samenvoegen en kolom namen wijzigen

Nu we voor beide datasets de 'Adj. Close' data hebben opgeslagen in een nieuwe variable, kunnen we beide variable samenvoegen. Hierbij maken we gebruik van de 'join()' functionaliteit.

In [None]:
price_17_18_ms.rename(columns={"Adj. Close":"MSFT"}, inplace=True)
price_17_18_ms.head()

In [None]:
price_17_18_apple.rename(columns={"Adj. Close":"AAPL"}, inplace=True)
price_17_18_apple.max()

Vervolgens voegen we beide losse datasets samen in een DataFrame. Hierbij maken we gebruik van de 'join()' functionaliteit.

In [None]:
both_stocks = price_17_18_apple.join(price_17_18_ms,how="inner")
both_stocks.head()

# Time series analyse & resultaten

Nu we de gewenste dataset hebben, kunnen we gaan analyseren.

## Wat eerste statistieken
Vanuit de dataset die we nu hebben halen we eerst een aantal statestieken naar voren middels de 'describe()' functie.

In [None]:
both_stocks.describe()

Vervolgens kijken we middels een line plot naar de trend van de data in beide kolomen.

In [None]:
both_stocks.plot()

## Analyse van prijsontwikkeling

Uit de bovenstaande plot kunnen we waarnemen dat de prijs van het Apple aandeel van ±120 naar ±180 is gegaan (toename van ±60). De prijs van het Microsoft aandeel is van ±60 naar ±90 gegaan (toename van ±30). Over de afgelopen 2 jaar is de stijging van het aandeel groter geweest bij Apple. Om deze stijging over deze periode exact te berekenen, kunnen we het verschil tussen elke dag uitrekenen middels de 'diff()' functie, om vervolgens de resultaten bij elkaar op te tellen middels 'sum()'.

In [None]:
both_stocks.diff().sum()

De schommelingen in prijs lijken bij Apple vele malen groten dan die bij Microsoft. Om dit inzichtelijk te krijgen kunnen we de standaarddeviatie uitrekenen over een bepaald interval. Door gebruik te maken van 'rolling()' functie in combinatie met 'std()' functie kan de standaarddeviatie bijvoorbeeld worden uitgerekend voor elke 20 handelsdagen ('window=20' = 20 handelsdagen), waarbij in een 'window' minimaal 10 dagen ('min_periods=10') zitten.

In [None]:
both_stocks.rolling(min_periods=10,window=20,center=False).std().plot()

De standaarddeviatie laat goed zien dat die voor het Apple aandeel aanmerkelijk hoger ligt. Door in plaats van 'std()' de 'mean()' functie te gebruiken krijgen we over elke 20 handelsdagen de gemiddelde prijs.

In [None]:
both_stocks.rolling(min_periods=10,window=20,center=False).mean().plot()

# Conclusie & aanbevelingen
In deze sectie kunnen de conclusies uit de data analyse worden neergezet. In het kort kunnen we concluderen dat de prijs van een Apple aandeel harder is gestegen dan die van Microsoft tussen 2017 en 2018. Echter is de schommeling in de prijs bij het Apple aandeel wel groter.