<H1>Grundlagen: Einführung in Python</H1>
<H3>Einführung Data Science - HTW Berlin - Heinke Hihn</H3>

Wir werden die praktischen Übungen in Python umsetzen. Falls Sie damit noch wenig oder keine Erfahrung gesammelt haben, können Sie dieses Notebook als Einstieg durcharbeiten.

# 1 Einführung

Python ist die Standardsprache für Data Science Projekte. Statistische Software, Analysetools, sowie Machine Learning Frameworks sind in Python verfügbar. Wir können nicht alle Aspekte der Sprache behandeln, daher finden Sie hier noch

**Tutorials & weiterführendes Material**:

* https://www.codecademy.com/learn/python
* http://docs.python-guide.org/en/latest/intro/learning/
* https://learnpythonthehardway.org/book/
* https://www.codementor.io/learn-python-online
* https://websitesetup.org/python-cheat-sheet/

sowie

**Python in Notebooks**:

* http://mbakker7.github.io/exploratory_computing_with_python/


# 2 Aufbau der Sprache

Python ist eine schwach typisierte imperative Programmiersprache, die auf Anweisungen aufbaut. Eine Anweisung kann beispielsweise sein:

* ein einfacher Ausdruck
* eine Zuweisung
* ein Methodenaufruf
* eine Methodendefinition

Schwach typisiert bedeutet, dass bei der Variablendeklaration kein Typ angegeben werden muss und dass sich der Typ ändern kann:

```
x = 1
x = "hallo"
```

Gegenteilig dazu sind stark typisierte Sprachen:

```
int x = 3;
char c = 'c';
```

Zur Formatierung der Sprache werden keine Klammern genutzt. Codeblöcke werden durch Einrückung zusammengefasst:

```
def sum(x, y):
  return x + y
```

In C++ sieht das beispielsweise so aus:

```
int sum(int x, int y) {
  return x + y;
}
```

# 3 Variablen

Variablen werden impliziet dargestellt, d.h. durch die Zuweisung. Es gibt drei wesentliche Typen:

* Zahlen
  * integers `int`
  * floating-point `float`
* strings `str`
* boolean values [bool](https://)
* lists and dicts

## 3.1 Zahlen

In [None]:
# int
x = 1

In [None]:
# float
x = 1.0

In [None]:
# bool
x = True

In [None]:
# das ergebnis einer operation hat immer den größten datentypen der beteiligten operanden.
# mit "größe" ist der bereich der gültigen werte gemeint
# hier wird aus der summe ein float, weil float der größte datentyp ist
# int
a = 1
# float
b = 2.0
c = a + b
print("Das Ergebnis ist", c)

Das Ergebnis ist 3.0


## 3.2 Strings

In [None]:
# deklaration mit einfachen oder doppeltem anführungszeichen
str1 = 'apple'
str2 = "apple"

In [None]:
# string operation: concatenation
a = "hallo"
print(a + "!")

hallo!


In [None]:
# string operation: vergleich
a = "hallo"
b = " hallo"
print(a == b)

False


In [None]:
# string operation: strings sind nicht veränderbar
a = "hallo"
a[1] = "!"
print(a)

TypeError: ignored

## 3.3 Boolean Values
Boolen values sind Wahrheitswerte, können also entweder ```False``` oder ```True``` sein. Sie werden zum Kontrollfluss eingesetzt:

```
if(x):
  print("Pfad 1")
else:
  print("Pfad 2")
```

In [None]:
# binäre werte: True und False
a = True
b = False

In [None]:
# durch boolesche operatoren beliebig kombinierbar
print(a or b)
print(a and b)
print(not a)
print(not(a or b))
print(not(a and b))

True
False
False
False
True


## 3.4 Listen

In [None]:
# listen können beliebige objekte halten
x = [0, 1, 3, 'hallo']

In [None]:
# elementweiser zugriff
x[1] = 3
print(x[1])

3


In [None]:
# element anhängen. -1 ist das letze element, -2 das vorletzte, etc
print(x[-1])
print("füge neues element ein")
x.append("letztes element")
print(x[-1])

letztes element
füge neues element ein
letztes element


## 3.4 Dicts

Dictionaries sind hash tables. Sie ermöglichen einen direkten Zugriff auf die Elemente, wenn diese einen im Dict eindeutigen Schlüssel haben.

In [None]:
# deklaration und zugriff
d = {"apple": "fruit", "parsely": "herb", "monkey": "mammal"}
print(d["apple"])

a fruit


In [None]:
# dicts können auch geschachtelt sein und komplexere datentypen haben
d = {
    "type": 0,
    "parameters": {
        "data": [0, 1, 2, 3],
        "user": "wwhite01",
    }
}
print(d["parameters"]["user"])

wwhite01


## 3.5 Methoden- und Funktionsaufrufe




Es gibt zwei Möglichkeiten Funktionen in Python aufzurufen:
1. durch vordefinierte infix Operatoren
2. durch den Funktionsnamen mit Argumenten in Klammern


In [None]:
# infix bedeutet dass der operator zwischen den operanden steht
1 + 2

3

In [None]:
# aufruf als funktionsname und argument
abs(-1)

#3.6 Besondere Werte

```None``` stellt einen Null-Objekt dar, also ein nicht definiertes Objekt.

In [None]:
None

## 3.7 Funktionsdefinition
Schlüsselwort ```def``` markiert den Beginn einer Funktionsdefinition. Es folgt der Name und in runden Klammern die Argumente. Der Funktionsname muss im Gültigkeitsbereich einmalig sein. Das Schlüsselwort ```return``` markiert den Rückgabewert der Funktion. Fehlt ein ```return```, so gibt die Funktion immer ```None``` zurück.

In [None]:
# funktion namens plus mit zwei argumenten
def plus(a, b):
    return a + b

In [None]:
# funktionsaufruf
plus(3, 4)

In [None]:
def plus(a, b):
    a + b

In [None]:
plus(3, 4)

What happened? All functions return *something*, even if you don't specify it. If you don't specify a return value, then it will default to returning `None`.

In [None]:
"a" + 1

<div style="background-color: lightgrey">
<h2>Sidebar 2-1: How to Read Python Error Messages</h2>

<p>
Python error messages
<p>
<tt>TypeError: Can't convert 'int' object to str implicitly</tt>
</p>

<p>Above the error message is the "traceback" also called the "call stack". This is a representation of the sequence of procedure calls that lead to the error. If the procedure call originated from code from a file, the filename would be listed after the word "File" on each line. If the procedure call originated from a notebook cell, then the word "ipython-input-#-HEX".
</p>
</div>

## 1.2 Equality

### 1.2.1 ==

In [None]:
1 == 1

### 1.2.2 is

In [None]:
[] is []

In [None]:
list() is list()

In [None]:
tuple() is tuple()

In [None]:
57663463467 is 57663463467

# 2. Advanced Topics

The Zen of Python:

In [None]:
import this

Python evolves. But there are limits:

In [None]:
from __future__ import braces

## 2.1 Python Warts

* http://web.archive.org/web/20031002184114/www.amk.ca/python/writing/warts.html
*
* https://www.python.org/dev/peps/pep-3099/

## 2.2 Scope of variables

Is not always clear:

In [None]:
y = 0
for x in range(10):
    y = x

In [None]:
x

In [None]:
[x for x in range(10, 20)]

In [None]:
x

## 2.3 Scope

Python follows the LEGB Rule (after https://www.amazon.com/dp/0596513984/):

* L, Local: Names assigned in any way within a function (def or lambda)), and not declared global in that function.
* E, Enclosing function locals: Name in the local scope of any and all enclosing functions (def or lambda), from inner to outer.
* G, Global (module): Names assigned at the top-level of a module file, or declared global in a def within the file.
* B, Built-in (Python): Names preassigned in the built-in names module : open, range, SyntaxError,...

In [None]:
x = 3
def foo():
    x=4
    def bar():
        print(x)  # Accesses x from foo's scope
    bar()  # Prints 4
    x=5
    bar()  # Prints 5

In [None]:
foo()

See [scope_resolution_legb_rule.ipynb](scope_resolution_legb_rule.ipynb) for some additional readings on scope.

## 2.4 Generators

In [None]:
def function():
    for i in range(10):
        yield i

In [None]:
function()

In [None]:
for y in function():
    print(y)

## 2.5 Default arguments

In [None]:
def do_something(a, b, c):
    return (a, b, c)

In [None]:
do_something(1, 2, 3)

In [None]:
def do_something_else(a=1, b=2, c=3):
    return (a, b, c)

In [None]:
do_something_else()

In [None]:
def some_function(start=[]):
    start.append(1)
    return start

In [None]:
result = some_function()

In [None]:
result

In [None]:
result.append(2)

In [None]:
other_result = some_function()

In [None]:
other_result

## 3.2 List comprehension

"List comprehension" is the idea of writing some code inside of a list that will generate a list.

Consider the following:

In [None]:
[x ** 2 for x in range(10)]

In [None]:
temp_list = []
for x in range(10):
    temp_list.append(x ** 2)
temp_list

But list comprehension is much more concise.

## 3.3 Plotting

In [None]:
%matplotlib notebook

After the magic, we then need to import the matplotlib library:

In [None]:
import matplotlib.pyplot as plt

Python has many, many libraries. We will use a few over the course of the semester.

To create a simple line plot, just give a list of y-values to the function plt.plot().

In [None]:
plt.plot([5, 8, 2, 6, 1, 8, 2, 3, 4, 5, 6])

But you should never create a plot that doesn't have labels on the x and y axises, and should always have a title. Read the documentation on matplotlib and add labels and a title to the plot above:

http://matplotlib.org/api/pyplot_api.html

Another commonly used library (especially with matplotlib is numpy). Often imported as:

## 2.6 Closures

Are functions that capture some of the local bindings to variables.

In [None]:
def return_a_closure():
    dict = {}
    def hidden(operator, value, other=None):
        if operator == "add":
            dict[value] = other
        else:
            return dict[value]
    return hidden

In [None]:
thing = return_a_closure()

In [None]:
thing("add", "apple", 42)

In [None]:
thing("get", "apple")

In [None]:
thing.dict

Where is dict?

See http://www.programiz.com/python-programming/closure for more examples.