<figure>
   <IMG SRC="https://mamba-python.nl/images/logo_basis.png" WIDTH=125 ALIGN="right">
</figure>

# Modules en Packages
_door Onno Ebbens_
<hr>

Deze notebook laat zien hoe Python modules en packages zijn opgebouwd. Daarbij zijn er opgaven met antwoorden

### Inhoudsopgave<a id="top"></a>
1. [Packages & modules](#1)
2. [Structuur module](#structuur_mod)   
3. [Structuur package](#structuur_pack)
4. [Installatie package](#installatie)
5. [Antwoorden](#Antwoorden)

## 1. [Packages & modules](#top)<a id="1"></a>

De termen packages & modules worden vaak door elkaar gebruikt omdat ze erg op elkaar lijken. Toch betekenen de termen niet hetzelfde. 
- Een module is een bestand met een .py extensie waarin Python code staat. 
- Een package is een map (directory) met daarin in ieder geval een `__init__.py` bestand. Meestal staan er ook nog andere .py bestanden en/of mappen in een package. Een Python package bestaat dus uit één of meerdere Python modules.

Zowel packages als modules kan je importeren in een Python script. Hieronder laten we zien hoe dit werkt.

### importeren module
We importeren de module `example_module.py`. Dit bestand bevat de volgende code:
```
01    def my_add(argument1, argument2):
02        """
03        adds two input arguments.
04        
05        Parameters
06        ----------
07        argument1 : int, float, str
08            input argument 1
09        argument2 : int, float, str
10            input arguement 2
11            
12        Returns
13        -------
14        results : int, float or str
15            the two added input arguments   
16        """
17        result = argument1 + argument2
18        return result
```

In [None]:
import example_module

Nadat we de module geïmporteerd hebben kunnen we de functie gebruiken die is gedefinieerd in de module.

In [None]:
example_module.my_add(5,10)

Wanneer je een module probeert te importeren met `import <modulenaam>` gaat Python op zoek naar het bestand met de naam `<modulenaam>.py`. Python zoekt in een aantal, vooraf gedefinieerde mappen. Deze mappen zijn gedefinieerd in `sys.path`. Het bestand `example_module.py` staat in één van de mappen in `sys.path` dus lukt het Python deze te importeren.

Welke mappen in `sys.path` staan kan je eenvoudig opvragen met onderstaande code.

In [None]:
import sys
sys.path

**Let Op!**<br>
Als je een module importeert worden de mappen in `sys.path` één voor één doorlopen. Op het moment dat in de map een .py bestand staat met de juiste naam stopt Python met zoeken en importeert hij deze module. Wanneer je meerdere modules met dezelfde naam hebt kan het lastig zijn om te achterhalen uit welke map de module is geïmporteerd. Het is daarom aan te raden altijd een unieke naam te kiezen voor een module. Het is ook mogelijk te achterhalen vanuit welke map een module is geïmporteerd. Het volledige path van de module is namelijk opslagen in de `__file__` attribute van de module (zie code hieronder).

In [None]:
print(f'module path is -> {example_module.__file__}')

### importeren package
Het importeren van een package lijkt op het importeren van een module. Waar je bij een module de naam van het .py bestand gebruikt om deze te importeren gebruik je bij een package de naam van map (directory) waarin de package bestanden staan. Ook voor een package geldt dat Python zoekt in de `sys.path` mappen naar een map met de naam van de package.

Hieronder staat code om een package met de naam `somepackage` te importeren. Omdat deze package niet in één van de mappen in `sys.path` staat, voegen we eerst de map waarin de package staat toe aan `sys.path`. Dit is de map: 'example_package'. Vervolgens roepen we ook weer de `my_add` functie aan die in `somepackage` zit.

In [None]:
sys.path.append('example_package')
import somepackage

In [None]:
somepackage.my_add(5, 10)

## 2. [Structuur module](#top)<a id="structuur_mod"></a>

In een Python module kan je variabelen, functies en classes definiëren. De module `example_module` die we hierboven hebben geïmporteerd bevat één enkele functie. Wanneer je zelf een module maakt moet is het belangrijk om na te denken over de structuur. Er zijn veel verschillende manieren waarop je je code kan structureren. Voor de basis zijn er een aantal conventies:
- Zet alle import statements bovenaan je .py bestand. Zo is meteen duidelijk welke packages, classes, functies en submodules worden gebruikt in je module
- Maak voor alle functies en classes in je module een [docstring](https://www.python.org/dev/peps/pep-0257) aan.
- De naam van een module is bij voorkeur [kort en met kleine letters](https://www.python.org/dev/peps/pep-0008/#package-and-module-names).

#### Opgave 1 <a name="opdr1"></a>

Maak een module met een functie die de `numpy` functie `mean` gebruikt om het gemiddelde te berekenen van elke kolom in deze array:

`[[1. 5. 8. 9.]
  [9. 4. 3. 1.]]`
  
Zodat je dit antwoord krijgt:

`[5.  4.5 5.5 5. ]`

Importeer je module en roep je functie aan. Je maakt de module in een text editor (bijv. kladblok) buiten Jupyter Notebook om.

In [None]:
import numpy as np
# gebruik deze array om te testen.
arr = np.array([[1., 5., 8., 9.],[9., 4., 3., 1.]])

# importeer module en roep functie aan

<a href="#antw1">Antwoord opgave 1</a>

Op het moment dat we een module importeren wordt de code in deze module uitgevoerd. Bij voorkeur staan er in een module geen stukken script maar enkel variabele-, functie- en class definities. Wanneer er toch scripts in de module staan worden deze uitgevoerd bij het importeren.

Hieronder importeren we `example_module2`, in deze module staat nog een stuk code (`print(my_add(2,4))`). Op het moment dat we de module importeren wordt deze code uitgevoerd en als resultaat het getal 6 geprint. Dit kan erg verwarrend zijn en wordt daarom sterk afgeraden

In [None]:
import example_module2

#### Bonusopgave 1 <a name="bonus1"></a>

Deze opgave vraagt behoorlijk wat zelfonderzoek en is niet persé nodig om de rest van dit notebook te begrijpen. Toch kan het nuttig zijn voor wat meer achtergrondkennis.

Pas het bestand `example_module2.py` aan zodat de code `print(my_add(2,4))` alleen wordt uitgevoerd wanneer deze module als hoofdbestand wordt aangeroepen en niet wanneer deze wordt geïmporteerd. Gebruik hiervoor de code `if __name__ == '__main__':` en [deze stackoverflow uitleg](https://stackoverflow.com/questions/419163/what-does-if-name-main-do)

Tip: Als je een module probeert te importeren die al eerder is geïmporteerd dan wordt deze niet opnieuw geïmporteerd. Python gebruikt de module die al in het geheugen zit. De code in de module wordt dan ook niet opnieuw gerund. Als je een module aanpast en opnieuw wil importeren zal je de kernel moeten restarten. 

<a href="#antwbonus1">Antwoord bonusopgave 1</a>

#### Dependencies

In de module die je hebt gemaakt bij opgave 1 wordt een functie uit `numpy` gebruikt. De module is nu afhankelijk (dependent) geworden van de `numpy` package. We zeggen ook wel dat `numpy` valt onder de dependencies van je module.

Bij het maken van een modules en packages is het belangrijk om na te denken over de dependencies. Bedenk hierbij het volgende:
- Iedereen die je module/package wil gebruiken moet ook de dependencies installeren. Sommige packages zijn lastig te installeren, als je module/package een dependency heeft op zo'n package maakt dat je module/package ook lastig te installeren.
- Packages worden continu aangepast en verbeterd. Aanpassingen aan de dependencies kunnen ervoor zorgen dat je module/package niet meer werkt. Over het algemeen wordt bij veelgebruikte packages nagedacht over backward compatability maar hoe meer depedencies je hebt hoe meer inspanning er nodig is om alles draaiende te houden.

## 3. [Structuur package](#top)<a id="structuur_pack"></a>

De structuur van een Python package bepaalt hoe je functies en classes in de package kan aanroepen. De package `somepackage` die we zojuist hebben geïmporteerd heeft de volgende structuur:

```
somepackage/
    __init__.py
    add.py
    shout.py
    version.py
```

#### `__init__.py`
Het `__init__.py` bestand in de "somepackage" map is de constructor van de package. Hierin is aangegeven welke modules, functies en variabelen deel uitmaken van de package. Ons `__init__.py` bestand bevat de volgende code:

```
01    from .version import __version__
02    from .add import my_add
03    from . import shout
```

In dit geval wordt de `__init__.py` gebruikt om een variabele, functie en module te importeren. Bij het importeren gebruiken we de `.` (in `.version`, `.add` en `.`) om aan te geven dat voor deze import alleen in de huidige map moet worden gekeken, en dus niet in alle andere mappen uit `sys.path`. Het gebruik van de `.` wordt aangeraden om zo expliciet te maken vanuit welke map modules worden geïmporteerd. Hieronder is per regel uitgelegd wat er gebeurt.

**`01    from .version import __version__`**

Deze regel geeft aan dat vanuit de `version` module de variabele `__version__` geïmporteerd moet worden. Deze variabele wordt daarmee onderdeel van de package en kan worden opgevraagd met `somepackage.__version__`. Dit is de standaard manier om de versie van een package te definiëren en op te vragen.

In [None]:
print(f'somepackage version is {somepackage.__version__}')

In [None]:
# De meeste grote packages werken met het __version__ attribute
import numpy as np
print(f'numpy version is {np.__version__}')
import re
print(f're version is {re.__version__}')

**`02    from .add import my_add`**

Vanuit de `add` module wordt de functie `my_add` geïmporteerd. Vervolgens wordt deze functie onderdeel van de `somepackage` en kan worden aangeroepen.

In [None]:
somepackage.my_add(5,10)

**`03    from . import shout`**

De `shout` module wordt geïmporteerd. Hiermee wordt de `shout` module een submodule van `somepackage`. De functie `shout_and_repeat` welke in de `shout` module zit kan met de code hieronder worden aangeroepen.

In [None]:
somepackage.shout.shout_and_repeat("wat fijn zo'n package ")

#### Opgave 2 <a name="opdr2"></a>
In de `somepackage` map staat een bestand met de naam `visualise.py`. In dit bestand is de functie `make_wordcloud` gedefinieerd. Voeg deze module toe aan `somepackage` zodat je met onderstaande code een wordcloud kan maken.

Tip: Als je een package aanpast en opnieuw wil importeren moet je de kernel restarten. Als je dat niet doet blijft de oude versie van de package in het geheugen.

In [None]:
%matplotlib inline
a = somepackage.shout.shout_and_repeat("wat fijn zo'n package ")
tst = somepackage.visualise.make_wordcloud(a);

<a href="#antw2">Antwoord opgave 2</a>

#### Opgave 3<a name="opdr3"></a>
Doe hetzelfde als bij opgave 2, behalve dat je nu alleen de `make_wordcloud` functie toevoegt aan `somepackage` in plaats van de volledige `visualise` module. Je kan dan met onderstaande code dezelfde resultaten verkrijgen.

In [None]:
%matplotlib inline
a = somepackage.shout.shout_and_repeat("wat fijn zo'n package ")
tst = somepackage.make_wordcloud(a);

<a href="#antw3">Antwoord opgave 3</a>

#### functies of modules?

In de opgaves hierboven heb je gezien dat er verschillende manieren zijn om functies toe te voegen aan een package. je kan de hele module toevoegen als submodule of juist alleen een bepaalde functie. Welke manier het beste is hangt af van hoe je de package wil gebruiken. 

Wanneer je een package maakt met als doel één actie uit te voeren is het handig om de functie die je gebruikt expliciet te importeren in de `__init__.py`. De `wordcloud` package is een voorbeeld daarvan.

Er zijn ook packages die een hele set aan tools bevatten. Een voorbeeld daarvan is de `numpy` package. Dan wordt er vaker voor gekozen om een hele set aan functies en submodules te importeren in de `__init__.py`.

Uiteindelijk kies je zelf hoe je de package zo overzichtelijk mogelijk houdt. 

## 4. [Installatie](#top)<a id="installatie"></a>

Hierboven hebben we de package `somepackage` geïmporteerd zonder dat we deze ooit hebben geïnstalleerd. Als we een package vaker, vanuit meerdere scripts en met verschillende collega's willen gebruiken is het handig om een package te installeren. Bij het installeren van een package gebeuren een aantal dingen waaronder:
1. De package wordt in de centrale map met packages geplaatst. Deze map is onderdeel van `sys.path`. Hierna kan je de package importeren zonder mappen toe te voegen aan `sys.path`.
2. De dependencies van de package kunnen automatisch meegeïnstalleerd worden zodat dit niet apart hoeft te gebeuren. Je kan ook aangeven welke versies nodig zijn van andere packages.

De installatie van een package kan het eenvoudigst met `pip` (de Python package manager). Om een package te kunnen installeren met `pip` heb je een `setup.py` bestand nodig. In de map 'example_package' is een voorbeeld van een `setup.py` bestand gegeven. Om `somepackage` te installeren met dit `setup.py` bestand navigeer je in (anaconda) prompt naar de map 'example_package' en type je `pip install -e .`. Als het goed is zie je dan de volgende tekst (of vergelijkbaar) in je (anaconda) prompt:

```
Obtaining file:///C:/Users/onno_/02_git_repos/course-material/practical_examples/08_modules_and_packages/example_package
Requirement already satisfied: matplotlib>=3.0 in c:\anaconda3\lib\site-packages (from somepackage==1.2.3) (3.1.3)
Requirement already satisfied: wordcloud>=1.8.1 in c:\anaconda3\lib\site-packages (from somepackage==1.2.3) (1.8.1)
Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in c:\anaconda3\lib\site-packages (from matplotlib>=3.0->somepackage==1.2.3) (2.4.6)
Requirement already satisfied: python-dateutil>=2.1 in c:\anaconda3\lib\site-packages (from matplotlib>=3.0->somepackage==1.2.3) (2.8.1)
Requirement already satisfied: numpy>=1.11 in c:\anaconda3\lib\site-packages (from matplotlib>=3.0->somepackage==1.2.3) (1.18.1)
Requirement already satisfied: kiwisolver>=1.0.1 in c:\anaconda3\lib\site-packages (from matplotlib>=3.0->somepackage==1.2.3) (1.1.0)
Requirement already satisfied: cycler>=0.10 in c:\anaconda3\lib\site-packages (from matplotlib>=3.0->somepackage==1.2.3) (0.10.0)
Requirement already satisfied: pillow in c:\anaconda3\lib\site-packages (from wordcloud>=1.8.1->somepackage==1.2.3) (7.0.0)
Requirement already satisfied: six>=1.5 in c:\anaconda3\lib\site-packages (from python-dateutil>=2.1->matplotlib>=3.0->somepackage==1.2.3) (1.14.0)
Requirement already satisfied: setuptools in c:\anaconda3\lib\site-packages (from kiwisolver>=1.0.1->matplotlib>=3.0->somepackage==1.2.3) (45.2.0.post20200210)
Installing collected packages: somepackage
  Running setup.py develop for somepackage
Successfully installed somepackage
```

De text hierboven kunnen we verklaren aan de hand van het `setup.py` bestand. In het `setup.py` bestand op regel 27 zijn twee dependencies gedefinieerd `matplotlib` en `wordcloud`. Bij het installeren van `somepackage` wordt eerst gecheckt of de dependencies geïnstalleerd zijn. Dit is te zien bovenin de output van (anaconda) prompt. In ons geval waren deze al geïnstalleerd dus worden de meldingen `Requirement already satisfied: matplotlib...` & `Requirement already satisfied: wordcloud...` getoond.

Vervolgens zien we dat nog een hele rits aan checks komt voor andere packages. Dit zijn de dependencies van `matplotlib` en `worcloud` (of de dependencies van de dependencies van `matplotlib`). Bij de installatie worden dus alle dependencies van alle benodigde packages gecheckt en zo nodig geïnstalleerd. In ons geval waren deze allemaal al geïnstalleerd waardoor steeds het bericht `Requirement already satisfied: ...` wordt getoond.

Als laatste wordt `somepackage` zelf geïnstalleerd. Als dit goed is gegaan verschijnt het bericht:

```
Installing collected packages: somepackage
  Running setup.py develop for somepackage
Successfully installed somepackage
```

Nu is de package geïnstalleerd en kan deze vanuit ieder script worden geïmporteerd.

#### Opgave 4 <a name="opdr4"></a>
Maak een nieuwe module waarin je onderstaande functie `check_sentinment` opneemt. Voeg deze functie toe aan `somepackage`. Voeg de benodigde dependencies toe aan `setup.py`. Verhoog het versienummer van de package naar `1.2.4`, installeer de vernieuwde package en check of de juiste dependencies worden meegeïnstalleerd. Check tot slot of je de code hieronder kan runnen.

In [None]:
from textblob import TextBlob

def check_sentiment(text):
    '''
    checks the polarity and subjectivity of a message,
    a polarity > 0 indicates a positive message, 
    a polirity < 0 indicates a negative message
    
    Parameters
    ----------
    text : str
        text to analyse
        
    Returns
    -------
    textblob.en.sentiments.Sentiment
        sentiment analysis of text
    '''
    
    testimonial = TextBlob(text)
    return testimonial.sentiment

In [None]:
# code om te checken of je aangepaste package werkt
import somepackage
print(somepackage.check_sentiment("This package is amazing!"))
print(somepackage.check_sentiment("This package is awful!"))

<a href="#antw4">Antwoord opgave 4</a>

## [Antwoorden](#top)<a id="Antwoorden"></a>

#### <a href="#opdr1">Antwoord opgave 1</a> <a name="antw1"></a>

Maak een text bestand aan met een .py extensie, bijv. `np_func.py`. Zorg ervoor dat dit bestand in dezelfde map staat als dit notebook. Schrijf in dit bestand een functie die het gemiddelde berekent van een kolom in een `array`:

```
01    import numpy as np
02    
03    def column_mean(arr):
04    """ berekent het gemiddelde van elke kolom in een 2d array
05    
06
07    Parameters
08    ----------
09    arr : np.array
10        2 dimensionale numpy array.
11
12    Returns
13    -------
14    mean_col : np.array
15        1 dimensionale numpy array met gemiddelde per kolom.
16
17    """
18    
19    mean_col = np.mean(arr, axis=0)
20    
21    return mean_col
```

Vervolgens kan je in dit Jupyter Notebook deze module importeren en de functie aanroepen.

In [None]:
import numpy as np
# gebruik deze array om te testen.
arr = np.array([[1., 5., 8., 9.],[9., 4., 3., 1.]])

# importeer module en roep functie aan
import numpy_func
numpy_func.column_mean(arr)

#### <a href="#bonus1">Antwoord bonusopgave 1</a> <a name="antwbonus1"></a>



Het bestand `example_module2.py` moet er zo uit komen te zien:
    
```
01    def my_add(argument1, argument2):
02        """
03        adds two input arguments.
04        
05        Parameters
06        ----------
07        argument1 : int, float, str
08            input argument 1
09        argument2 : int, float, str
10            input arguement 2
11            
12        Returns
13        -------
14        results : int, float or str
15            the two added input arguments   
16        """
17        result = argument1 + argument2
18        return result
19    
20    if __name__ == '__main__':
21        print(my_add(2,4))
```

Nadat je `example_module2.py` hebt aangepast, de kernel hebt gerestart en de module opnieuw importeert zal deze niet meer het getal 6 printen. Wanneer je het [example_module2.py](./example_module2.py) bestand los runt met Python zal deze wel het getal 6 printen. Als je niet weet hoe je een .py bestand los runt, kijk dan [hier](https://stackoverflow.com/questions/39995380/how-to-use-anaconda-python-to-execute-a-py-file). 

De `if __name__ == '__main__':` code wordt vaak gebruikt om de functies in een module te testen. Als je de module los runt worden alle functies doorlopen, als je de module importeert worden alleen de functies aangemaakt. Voor simpele modules is dit een goede oplossing. Wanneer je met complexere modules binnen packages gaat werken is het handiger om de tests los van de code op te slaan.

#### <a href="#opdr2">Antwoord opgave 2</a> <a name="antw2"></a>

Voeg aan het `__init__.py` bestand de volgende code toe: `from . import visualise`. 

Het bestand komt er dan zo uit te zien:

```
01    from .version import __version__
02    from .add import my_add
03    from . import shout
04    from . import visualise
```

Restart de kernel en importeer `somepackage` opnieuw. Je kan nu de code bij opgave 1 runnen.

In [None]:
%matplotlib inline
a = somepackage.shout.shout_and_repeat("wat fijn zo'n package ")
tst = somepackage.visualise.make_wordcloud(a);

#### <a href="#opdr3">Antwoord opgave 3</a> <a name="antw3"></a>

Voeg aan het `__init__.py` bestand de volgende code toe: `from .visualise import make_wordcloud`. 

Het bestand komt er dan zo uit te zien:

```
01    from .version import __version__
02    from .add import my_add
03    from . import shout
04    from .visualise import make_wordcloud
```

Restart de kernel en importeer `somepackage` opnieuw. Je kan nu de code bij opgave 3 runnen.

In [None]:
%matplotlib inline
a = somepackage.shout.shout_and_repeat("wat fijn zo'n package ")
tst = somepackage.make_wordcloud(a);

#### <a href="#opdr4">Antwoord opgave 4</a> <a name="antw4"></a>

De volgende stappen moeten worden uitgevoerd (volgorde niet van belang):
- maak een nieuwe module aan, bijvoorbeeld `text_analysis.py`. Zorg dat dit bestand in de `somepackage` map staat. Kopieer de getoond functie naar dit bestand. Het bestand ziet er dan zo uit:
    ```
    from textblob import TextBlob

    def check_sentiment(text):
        '''
        checks the polarity and subjectivity of a message,
        a polarity > 0 indicates a positive message, 
        a polirity < 0 indicates a negative message

        Parameters
        ----------
        text : str
            text to analyse

        Returns
        -------
        textblob.en.sentiments.Sentiment
            sentiment analysis of text
        '''

        testimonial = TextBlob(text)
        return testimonial.sentiment
    ```

- Voeg de regel `from .text_analysis import check_sentiment` toe aan `__init__.py`. Vervang `text_analysis` door de naam die je de module hebt gegeven bij de vorige stap. Het bestand ziet er nu zo uit:

    ```

    from .version import __version__
    from .add import my_add
    from . import shout
    from .visualise import make_wordcloud
    from .text_analysis import check_sentiment
    ```
- Pas het `setup.py` bestand aan. Voeg op regel 27 een extra dependency toe: `'textblob>=0.15.3'`. Het `setup.py` bestand ziet er dan zo uit:

    ```
    from setuptools import setup
    import os
    import sys

    _here = os.path.abspath(os.path.dirname(__file__))

    if sys.version_info[0] < 3:
        with open(os.path.join(_here, 'README.rst')) as f:
            long_description = f.read()
    else:
        with open(os.path.join(_here, 'README.rst'), encoding='utf-8') as f:
            long_description = f.read()

    version = {}
    with open(os.path.join(_here, 'somepackage', 'version.py')) as f:
        exec(f.read(), version)

    setup(
        name='somepackage',
        version=version['__version__'],
        description=('Show how to structure a Python project.'),
        long_description=long_description,
        author='Onno Ebbens',
        author_email='onno.ebbens@mamba-python.nl',
        license='MPL-2.0',
        packages=['somepackage'],
        install_requires=['matplotlib>=3.0','wordcloud>=1.8.1', 'textblob>=0.15.3'],
        include_package_data=True,
        classifiers=[
            'Development Status :: 5 - Production/Stable',
            'Intended Audience :: Science/Research',
            'Programming Language :: Python :: 2.7',
            'Programming Language :: Python :: 3.6'],
        )
    ```
- Pas het bestand `version.py` aan. Verhoog het versienummer van 1.2.3. naar 1.2.4. Het bestand ziet er dan zo uit:
    ```
    __version__ = '1.2.4'
    ```
    
Voer tot slot de volgende stappen uitgevoerd (volgorde wel van belang):
1. Navigeer in (anaconda) prompt naar de map "example_package". Installeer `somepackage` opnieuw met `pip install -e .` Check of bij de installatie de dependency op `textblob` wordt gezien. 
2. Restart de kernel
3. Run de regels code van de opgave.
4. Vier je succes!

In [None]:
# code om te checken of je aangepaste package werkt
import somepackage
print(somepackage.check_sentiment("This package is amazing!"))
print(somepackage.check_sentiment("This package is awful!"))

## Acknowledgement

the following sources were used to create this notebook:
- https://github.com/bast/somepackage
