![](../images/python.png)

* is ontworpen en ontwikkeld door [Guido van Rossum](https://twitter.com/gvanrossum) in 1989 (eerste release in februari 1991, versie 0.9.0)
* is open source software waarvan de ontwikkeling wordt geleid door de [Python Software Foundation](https://www.python.org/psf) onder leiding van [Guido van Rossum](https://www.python.org/psf/records/board/history)
* is ontworpen als object-georiënteerde programmeertaal
* heeft als ontwerpfilosofie _code readability_ (o.a. door middel van _indentation_ en _code blocks_)
* heeft zijn naam te danken aan het favoriete televisieprogramma van Guido van Rossum, Monty Python's Flying Circus
* is een _general purpose_ programmeertaal veel modules voor data science en data analyse (o.a. [pandas](https://pandas.pydata.org), [NumPy](http://www.numpy.org), [SciPy](https://www.scipy.org), [SymPy](http://www.sympy.org), [matplotlib](https://matplotlib.org), [Bokeh](https://bokeh.pydata.org), [IPython](http://ipython.org), [Scrapy](https://scapy.net)  et cetera
* wordt gebruikt door veel organisatie, waaronder [Google](www.google.com), [Facebook](www.facebook.com), [NASA](https://www.nasa.gov), [Yahoo](https://www.yahoo.com), [IBM](https://www.ibm.com) en [Dropbox](www.dropbox.com)

>The joy of coding Python should be in seeing short, concise, readable classes that express a lot of action in a small amount of clear code -- not in reams of trivial code that bores the reader to death.  
>
>Guido van Rossum

## Indentation & Code Blocks

De wijze waarop wordt 'ingesprongen' is bepalend voor de werking van je script.  
De code die bij elkaar hoort, zet je in hetzelfde 'blok' door het op dezelfde wijze uit te lijnen.

In [1]:
# één code block
for x in [5, 15, 25]:
    x += 5
    print(x)

10
20
30


In [2]:
# twee code blocks
for x in [5, 15, 25]:
    x += 5

print(x)

30


Daarom worden er in Python ook geen 'accolades' gebruikt (zoals in R) om de _code blocks_ te markeren.  
Waarom 'accolades' gebruiken als de _code blocks_ al duidelijk zijn op basis van _indentation_?  
In Python worden veelal 'enkele quotes' gebruikt. 

```R
# voorbeeld in R
omdraaien <- function(tekst) {
  letters <- strsplit(tekst, NULL)[[1]]
  omgedraaid <- letters[length(letters):1]
  return(paste(omgedraaid, collapse = ""))
}

omdraaien("Python")
```

```
[1] "nohtyP"
```

```python
# voorbeeld in Python
def omdraaien(tekst):
    letters = [letter for letter in tekst]
    letters.reverse()
    return ''.join(letters)

omdraaien("Python")
```

```
'nohtyP'
```

## Class & Instance

Python is een object-georiënteerde programmeertaal. Paktisch alles binnen Python is een object. Een object is een voorkomen (_instance_) van een objecttype (_class_).  

Een _class_ kun je zien als een blauwdruk voor een object en kun je zien als een logische groepingen van data en functies. Een _class_ wordt gedefinieerd met het keyword `class` en een functie met het keyword `def`.  

Een _class function_ wordt veelal een _method_ genoemd. In Python kun je eenvouding nieuwe objecttypen en objecten definiereren.

>Enkele synoniemen:  
>
>* object type = object template = class
>* object = class instance = instance
>* class function = class method = instance method (need a _self_ to work!) = method

In [3]:
# definieer class Persoon
class Persoon:
    """
    Dit is de 'docstring'... bedoeld voor
    het documenteren van dit objecttype.
    """

    def __init__(self, voornm, achternm):
        self.voornaam = voornm
        self.achternaam = achternm

    def naam(self):
        return self.voornaam + ' ' + self.achternaam

In [4]:
# definieer object van objecttype Persoon
guido = Persoon('Guido', 'van Rossum')

In [5]:
help(Persoon)

Help on class Persoon in module __main__:

class Persoon(builtins.object)
 |  Dit is de 'docstring'... bedoeld voor
 |  het documenteren van dit objecttype.
 |  
 |  Methods defined here:
 |  
 |  __init__(self, voornm, achternm)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  naam(self)
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



In [6]:
# guido is een instantie van Persoon
isinstance(guido, Persoon)

True

In [7]:
# data
print(guido.voornaam)
print(guido.achternaam)

Guido
van Rossum


In [8]:
# de data zelf is ook van een bepaald objecttype
type(guido.achternaam)

str

In [9]:
# method
guido.naam()

'Guido van Rossum'

In [10]:
# de methode zelf is ook van een bepaald objecttype, namelijk van het objecttype 'method'
type(guido.naam)

method

In [11]:
# de return value van de methode is ook van een bepaald objecttype
type(guido.naam())

str

In [12]:
# welke methods kent het objecttype 'str'?
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(...)
 |      S.__format__(format_spec) -> str
 |      
 |      Return a formatted version of S as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getatt

In [13]:
# upper()
guido.voornaam.upper()

'GUIDO'

In [14]:
# count()
guido.naam().count('u')

2

In [15]:
# method chaining
print('1:', guido.naam())
print('2:', guido.naam().upper())
print('3:', guido.naam().upper().replace('GUIDO', ''))
print('4:', guido.naam().upper().replace('GUIDO', '').lstrip())
print('5:', guido.naam().upper().replace('GUIDO', '').lstrip().center(16, '='))
print('6:', guido.naam().upper().replace('GUIDO', '').lstrip().center(16, '=').split('='))
print('7:', guido.naam().upper().replace('GUIDO', '').lstrip().center(16, '=').split('=').count(''))
print('8:', guido.naam().upper().replace('GUIDO', '').lstrip().center(16, '=').split('=').count('').__float__())
print('9:', guido.naam().upper().replace('GUIDO', '').lstrip().center(16, '=').split('=').count('').__float__().is_integer())

1: Guido van Rossum
2: GUIDO VAN ROSSUM
3:  VAN ROSSUM
4: VAN ROSSUM
5: ===VAN ROSSUM===
6: ['', '', '', 'VAN ROSSUM', '', '', '']
7: 6
8: 6.0
9: True


Waarschijnlijk is je al opgevallen dat tijdens het 'chainen' van 'methods' het objecttype kan veranderen.
Zo zijn de eerst 5 resultaten van het type `str`. Het volgende resultaat van het type `list`, gevolgd door de typen `int`, `float` en `bool`.

De methods met de dubble underscores in de naam, zowel aan het begin als aan het eind, worden wel _magic methods_ genoemd. Deze Deze _magic methods_ zijn 'gereserveerd' voor Python zelf. Hoewel ze direct aan te roepen zijn `x.__float__()` zijn de bedoeld om indirect gebruikt te worden `float(x)`.

In [16]:
var = 10
var.__float__() == float(var)

True

In [17]:
var = ['A', 'B', 'C']
var.__len__() == len(var)

True

## Belangrijkste punten

* Python is _object oriented_
* Python gebruikt _indentation_ om _code blocks_ te onderscheiden
* Maak gebruik van _methods_ waar mogelijk en ga geen functionaliteit coderen die al is geïmplementeerd
* Maak gebruik van _method chaining_, maar houd je code vooral leesbaar
* Documenteer je code door gebruik te maken van docstrings `"""docstring"""` en comments `# comment`
* Don't forget the Zen of Python...

## The Zen of Python

In [18]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
