# Introductie R & Python

![](../images/r-vs-python.jpg)

# Introductie R

* R is is een implementatie van de programmeertaal [S](https://en.wikipedia.org/wiki/S_(programming_language)). 
* R is een open source programmeeromgeving primair gericht op statitische analyse en onderzoek en is te download via [https://cran.r-project.org](https://cran.r-project.org).
* R heeft een command line interface, maar wordt meestal gebruikt in combinatie met een IDE (Integrated Development Environment) zoals [RStudio](www.rstudio.com).
* De basisfunctionaliteit van R kan worden uitgebreid door middel van packages. Deze kunnen door een gebruiker zelf worden gecreëerd. Op dit moment (september 2018) zijn er meer dan 15.000 packages beschikbaar via [CRAN (Comprehensive R Archive Network)](https://cran.r-project.org) en/of [Github](https://github.com).

# Intoductie Python

* Python is ontworpen en ontwikkeld door [Guido van Rossum](https://twitter.com/gvanrossum) in 1989 (eerste release in februari 1991, versie 0.9.0)
* Python is open source software waarvan de ontwikkeling wordt geleid door de [Python Software Foundation](https://www.python.org/psf) onder leiding van [Guido van Rossum](https://www.python.org/psf/records/board/history) als Benevolent dictator for life.
* Python is ontworpen als object-georiënteerde programmeertaal.
* Python heeft als ontwerpfilosofie _code readability_ (o.a. door middel van _indentation_ en _code blocks_)
* Python heeft zijn naam te danken aan het favoriete televisieprogramma van Guido van Rossum, Monty Python's Flying Circus
* is een _general purpose_ programmeertaal met veel modules voor data science en data analyse (o.a. [pandas](https://pandas.pydata.org), [NumPy](http://www.numpy.org), [SciPy](https://www.scipy.org), [SymPy](http://www.sympy.org), [matplotlib](https://matplotlib.org), [Bokeh](https://bokeh.pydata.org), [IPython](http://ipython.org), [Scrapy](https://scapy.net)  et cetera
* wordt gebruikt door veel organisatie, waaronder [Google](www.google.com), [Facebook](www.facebook.com), [NASA](https://www.nasa.gov), [Yahoo](https://www.yahoo.com), [IBM](https://www.ibm.com) en [Dropbox](www.dropbox.com)

# Voorbeeld code R

```R
# voorbeeld in R
omdraaien <- function(tekst) {
  letters <- strsplit(tekst, NULL)[[1]]
  omgedraaid <- letters[length(letters):1]
  return(paste(omgedraaid, collapse = ""))
}

omdraaien("pihseeniarT ecneicS ataD")
```

```
[1] "Data Science Traineeship"
```

# Voorbeeld code Python 

```python
# voorbeeld in Python
def omdraaien(tekst):
    letters = [letter for letter in tekst]
    letters.reverse()
    return ''.join(letters)

omdraaien('pihseeniarT ecneicS ataD')
```

```
'Data Science Traineeship'
```

# Enkele syntactische verschillen

* In R worden _code blocks_ gemarkeerd door _curly braces_
* In Python worden _code block_ gemarkeerd door _indentation_ (inspringen)

* R is geen object georienteerde taal
* Python is object orientend by design

* Als conventie wordt in R veel met "dubbele quotes" gewerkt
* In Pytrhon wordt veelal met 'enkele quotes gewerkt'

# Voorbeeld werking code blocks in Python

De wijze waarop wordt 'ingesprongen' is bepalend voor de werking van je script.  
De code die bij elkaar hoort, zet je in hetzelfde 'blok' door het op dezelfde wijze uit te lijnen.

In [1]:
# één code block
for x in [5, 15, 25]:
    x += 5
    print(x)

10
20
30


In [2]:
# twee code blocks
for x in [5, 15, 25]:
    x += 5

print(x)

30


# Korte intro object orientation

### R

```R
all_digits <- "123"
all_letters <- "abc"

grepl("[A-Za-z]", all_digits, perl=T) # will be FALSE
grepl("[A-Za-z]", all_letters, perl=T) # will be TRUE
```

```
[1] FALSE
[1] TRUE
```

Er wordt een functie gebruikt met enkele parameters om de juist output te genereren.  
De gedefinieerde strings worden als parameter meegegeven aan deze functie.

### Python

In [20]:
all_digits = '123'
all_letters = 'abc'

print(all_digits.isalpha()) # will be True
print(all_letters.isalpha()) # will be False

False
True


De methode `isalpha()` van het objecttype `string` wordt aangeroepen voor de instances `all_digits` en `all_letters`.  
Een 'method' kun je zien als een 'object-eigen functie'.

In [22]:
type(all_digits)

str

In [23]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(...)
 |      S.__format__(format_spec) -> str
 |      
 |      Return a formatted version of S as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getatt

# Method chaining is cool!

In [34]:
'd@T@ sCIENCE tR@INEESHIP'.replace('@', 'A').swapcase().split(' ')

['Data', 'Science', 'Traineeship']

# The Zen of Python... maar wat ons betreft ook 'Zen of R'

In [35]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


# Leuk voor thuis: interview met 'polderpionier Guido van Rossum'

[![Polderpioniers: Guido van Rossum, de man achter Python](https://img.youtube.com/vi/USTL2gxhRkg/0.jpg)](https://www.youtube.com/watch?v=USTL2gxhRkg)  