# Python

Η [Python](https://www.python.org/) είναι μια δυναμική γλώσσα προγραμματισμού, με αυτόματη διαχείριση μνήμης που υποστηρίζει αντικειμενοστραφή, συναρτησιακό και διαδικαστικό προγραμματισμό.

Υποστηρίζονται παράλληλα 2 εκδόσεις της python: η **2.7** και η **3.6**. Εμείς στα πλαίσια του εργαστηρίου θα χρησιμοποιήσουμε την 3.6.

## Διαφορές Python 2 me 3

Δεν υπάρχουν μεγάλλες διαφορές ανάμεσα στις python 2 και 3. Η κυριότερες από αυτές που συναντάμε είναι η εντολή `print` και ο τελεστής της διαίρεσης `/`:

```
# python 2:
print 'hi'
# python 3:
print('hi')

# python 2:
5/2 # κάνει 2
# python 3:
5/2 # κάνει 2.5
```

Η python 3 είχε αργή υιοθέτηση από τις ήδη υπάρχουσες βιβλιοθήκες της python, ενώ οι περισσότερες από αυτές εξακολουθούν να υποστίηρζουν python 2. Έχουν υπάρξει και προσπάθειες ενοποίησης της συμπεριφοράς των 2 γλωσσών ([\_\_future\_\_](https://docs.python.org/2/library/__future__.html), [six](https://pythonhosted.org/six/) modules) ώστε ο ίδιος κώδικας να τρέχει και σε python2 και σε python3.

Πιο αναλυτικά οι διαφορές των 2 εκδόσεων υπάρχουν [εδώ](http://sebastianraschka.com/Articles/2014_python_2_3_key_diff.html).

## Package Management

Το βασικό αποθετήριο πακέτων για την python είναι το [PyPI](https://pypi.python.org/pypi), ενώ η εγκατάστασή τους γίνεται μέσω του [pip](https://pip.pypa.io/en/stable/).

Για την εγκατάσταση του pip κατεβάζουμε το [get-pip.py](https://bootstrap.pypa.io/get-pip.py) και το τρέχουμε με την παρακάτω εντολή:

```
python get-pip.py
```

Τώρα μπορούμε να εγκαθιστούμε πια πακέτα μέσω του pip. Πχ για την εγκατάσταση του πακέτου *numpy* αρκεί να γράψουμε την παρακάτω εντολή:

```
pip install numpy
```

## Λίγα λόγια για τη δομή του προγράμματος

Προκειμένου να κρατήσει πιο απλή και ευανάγνωστη σύνταξη, η python **δεν** υποστηρίζει ερωτηματικά `(;)` και μπλόκ κώδικα σε αγκύλες `{...}` όπως μπορεί να έχουμε δει σε άλλες γλώσσες. Αντίθετα θεωρεί ότι κάθε γραμμή είναι (συνήθως) μια εντολή και **επιβάλλει** τη σωστή στοίχιση του προγράμματος.

Για στοίχιση μπορούμε να χρησιμοποιήσουμε είτε tab είτε κενά αλλά όχι και τα δύο! [Spaces or Tabs](https://legacy.python.org/dev/peps/pep-0008/#tabs-or-spaces)

Όταν αποθηκεύουμε τιμές μέσα σε μεταβλητές δεν χρειάζεται να δηλώσουμε τον τύπο τους, ενώ αυτός επιτρέπεται να αλλάζει στη διάρκεια του προγράμματος.

Σχόλια βάζουμε στον κώδικα με την δίεση `#`.


## Hello World!

Για να τυπώσουμε κάτι στην python χρησιμοποιούμε την εντολή `print`: 

In [1]:
print('Hello world!')

Hello world!


## Τύποι δεδομένων

Οι βασικότεροι τύποι δεδομένων που βρίσκονται στη βασική έκδοση της python είναι οι εξής:

- Αριθμητικά δεδομένα: `int`, `float`, `long`, `complex`, κτλ.
- Ακολουθιακά δεδομένα: `string`, `list`, `tuple`, κτλ.
- Λοιπά: `dict`, `set`, κτλ.

### Αριθμητικά δεδομένα

Στην Python δεν χρειάζεται να ορίζουμε τον τύπο της μεταβλητής μαζί με το όνομά της.

In [2]:
a = 5 # integer
b = 2.2 # float

print('a + b =', a + b, 'vvrr')
print('a - b =', a - b)
print('a / b =', a / b)
print('a * b =', a * b)
print('a ** b =', a ** b) # δύναμη

a + b = 7.2 vvrr
a - b = 2.8
a / b = 2.2727272727272725
a * b = 11.0
a ** b = 34.493241536530384


Για πιο σύνθετες πράξεις πρέπει να χρησιμοποιήσουμε κάποια εξωτερική βιβλιοθήκη.

In [3]:
import math # ορίζουμε ποιο πακέτο θα χρησιμοποιήσουμε

print('exp(a) =', math.exp(a)) # τρέχουμε τις αντίστοιχες συναρτήσεις
print ('cos(b) =', math.cos(b))

exp(a) = 148.4131591025766
cos(b) = -0.5885011172553458


### Strings

Στην python μπορούμε να ορίσουμε stings είτε μέσα σε μονά ('...') είτε σε διπλά ("...") εισαγωγικά. 

In [4]:
s = 'my String'

print ("lowercase:", s.lower())
print ('uppercase:', s.upper())
print ('replace y-->e:', s.replace('y', 'e'))
print ('a={}, b={}, s={}'.format(a, b, s)) # χρήση του format για να εισάγουμε μεταβλητές μέσα στο sting

lowercase: my string
uppercase: MY STRING
replace y-->e: me String
a=5, b=2.2, s=my String


### Lists & tuples

Οι λίστες είναι ο πιο "ευέλικτος" τύπος δεδομένων στην Python. Μια λίστα μπορεί να περιέχει ότι τύπο δεδομένων θέλουμε, ακόμα και άλλες λίστες! Δεν χρειάζεται να ορίσουμε το μέγεθος της λίστας εκ των προτέρων, ενώ αυτό μπορεί να αλλάξει πιο μετά στον κώδικά μας. Οι λίστες στην python ορίζονται μέσα σε αγκύλες [].

In [5]:
l = [1, 2, 3, 'abc', a, b, s]
print ('original list:', l)
print ('4th element:', l[3]) # αναφορά στο 4ο στοιχείο της λίστας (η αρίθμηση ξεκινάει από το 0)
print ('first 3 elements:', l[:3])
print ('last 2 elements:', l[-2:])
print ('pop:', l.pop()) # αφαιρεί το τελευταίο στοιχείο της λίστας και το επιστρέφει σαν αποτέλεσμα
l.append('new element') # τοποθετεί ένα νέο στοιχείο στο τέλος της λίστας
del l[3] # διαγράφει το 4ο στοιχείο της λίστας
print ('new list:', l)

original list: [1, 2, 3, 'abc', 5, 2.2, 'my String']
4th element: abc
first 3 elemetns: [1, 2, 3]
last 2 elements: [2.2, 'my String']
pop: my String
new list: [1, 2, 3, 5, 2.2, 'new element']


Ένας ειδικός τύπος λίστας είναι το `range` το οποίο επιστρέφει μια **λίστα από ακεραίους**. 

- Αν βάλουμε ένα όρισμα: επιστρέφει μια λίστα ακεραίων από το 0 μέχρι και τον προηγούμενο του αριθμού αυτού.
- Αν βάλουμε δυο ορίσματα: επιστρέφει μια λίστα ακεραίων από τον πρώτο μέχρι τον προηγούμενο του δεύτερου αριθμού.
- Αν βάλουμε τρία ορίσματα: επιστρέφει μια λίστα ακεραίων από τον πρώτο μέχρι τον προηγούμενο του δεύτερου αριθμού με βήμα ίσο με τον τρίτο αριθμό.

In [6]:
print (range(5)) # λίστα ακεραίων από το 0 μέχρι το 4
print (range(3,9)) # λίστα ακεραίων από το 3 μέχρι το 8
print (range(5,15,2)) # λίστα περιττών ακεραίων από το 5 μέχρι το 14

for i in range(5,15,2):
  print (i)

range(0, 5)
range(3, 9)
range(5, 15, 2)
5
7
9
11
13


Τα tuples είναι δομές δεδομένων παρόμοιες με τις λίστες μόνο που **δεν μπορούν να αλλάξουν** κατά τη διάρκεια του προγράμματος. Τα tuples ορίζονται μέσα σε παρενθέσεις ().

In [11]:
t = [1,2,3, 'abc'] # immutable object
print(t[0])
del t[1]
t

1


[1, 3, 'abc']

### Dictionaries

Τα dictionaries **δεν έχουν αρίθμηση** όπως είδαμε πρίν με τις λίστες και τα tuples. Λειτουργούν με τη λογική των κλειδιών (**keys**) και των τιμών (**values**). Τα dictionaries ορίζονται μέσα σε άγκυστρα {}.

In [12]:
d = {'name':'John', 'age': 26}
print ('original dictionary:', d)
print ('d[name]: ', d['name'])
d['address'] = 'Downtown' # πρoσθήκη νέου στοιχείου
del d['age'] # διαγραφή στοιχείου
print ('new dictionary:', d)
print ('dictionary keys:', d.keys()) # επιστρέφει όλα τα κλειδιά
print ('dictionary values:', d.values()) # επιστρέφει όλες τις τιμές
for i in d.keys():
  print (d[i])

original dictionary: {'name': 'John', 'age': 26}
d[name]:  John
new dictionary: {'name': 'John', 'address': 'Downtown'}
dictionary keys: dict_keys(['name', 'address'])
dictionary values: dict_values(['John', 'Downtown'])
John
Downtown


## Έλεγχος ροής

Προσοχή θέλει η στοίχιση καθώς καθορίζει τα μπλοκ των `if`, `for` και `while`.

### Εντολή if

In [None]:
x = 5

if x > 6:
    print ('x is greater than 6')    
elif x < 6 and x > 4:
    print ('x is smaller than 6 and greater than 4')
else:
    print ('x is smaller than 4')

### Εντολή while

In [None]:
x = 0

while x < 5:
    print (x)
    x += 1

### Εντολή for

In [None]:
for i in l: # διατρέχει τη λίστα l 
    print (i) # και τυπώνει τα στοιχεία της



for i in range(3, 11, 2): # το range δημιουργεί μια λίστα ακεραίων από το 3 μέχρι το 11 με βήμα 2
    print (i)

Η python υποστηρίζει και τις εντολές break, continue και pass, για ακόμα μεγαλύτερο έλεγχο στην επανάληψη.

Όπως είπαμε και προηγουμένως έχει μεγάλη σημασία η στοίχιση των εντολών!

In [None]:
for i in range(5):
    if i < 2:
        print (i, 'is smaller than 2')
    elif i == 2:
        print ('{} is equal to 2'.format(i))
    else:
        print ('{} is greater than 2'.format(i))

### List comprehension

Μια πολύ βολική σύνταξη της python για τον ορισμό λιστών.

Πχ θέλουμε να φτιάξουμε μια λίστα (`squares`) που να περιέχει τα τετράγωνα των αριθμών από το 0 μέχρι το 9. Με όσα έχουμε μάθει μέχρι στιγμής αυτό θα το γράφαμε ως εξής:

In [13]:
squares = []
for i in range(10):
    squares.append(i**2)
print (squares)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Κάνοντας χρήση του list comprehension το παραπάνω γράφεται πιο απλά ως εξής

In [14]:
squares = [x ** 2 for x in range(10)]
print (squares)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Το list comprehension μπορεί να γίνει πιο σύνθετο βάζοντας παραπάνω από μια `for` και `if` μέσα. Η παρακάτω εντολή πάιρνει ένα string (`'hello world!'`) και κάνει τα φωνίεντά του κεφαλαία.

In [15]:
print (''.join([x.upper() if x in 'aeioyu' else x for x in 'hello world!']))

hEllO wOrld!


## Συναρτήσεις

Οι συναρτήσεις της python δέχονται [δύο τύπους ορισμάτων](https://docs.python.org/2/glossary.html#term-argument) τα **keyword (optional) arguments** και τα **positional arguments**. Τα πρώτα είναι προεραιτικά (αν δεν τα ορίσει ο χρήστης παίρνουν μια default τιμή), έχουν όνομα και μπορεί να τα τοποθετήσουμε με όποια σειρά θέλουμε κατά την κλήση της συνάρτησης. Τα δεύτερα είναι υποχρεωτικά και πρέπει να μπουν με τη σειρά. 

### Positional Arguments

In [16]:
def my_func(a, b):
    return a * (a + b)

print(my_func(3,4))

21


### Keyword Arguments

In [17]:
def my_func2(a=0, b=0):
    return a * (a + b)

print (my_func2(3,4)) # δέχεται a=3, b=4
print (my_func2()) # δέχεται τις default τιμές: a=0, b=0
print (my_func2(3)) # δέχεται a=3, b=0
print (my_func2(a=3)) # δέχεται a=3, b=0
print (my_func2(b=3)) # δέχεται b=3, a=0
print (my_func2(b=3, a=4))  # δέχεται a=4, b=3

21
0
9
9
0
28


## Άσκηση 1:

Φτιάξτε μια συνάρτηση που να δέχεται μια παράμετρο Ν και να επιστρέφει τους πρώτους αριθμούς μέχρι το Ν σε μορφή λίστας.

In [49]:
def find_prime_until(N):
    possible = list(range(1, N))
    if N < 2:
        return [1]
    else:
        pos = possible.index(2)
        p = possible[pos]
        while(p < N):
            k = p
            j = 2
            i = k*j
            while(i < N):
                if i in possible:
                    possible.remove(i)
                j += 1
                i = j*k
            pos = possible.index(k) + 1
            if (pos < len(possible)): 
                p = possible[pos]
            else:
                break
    return possible

In [54]:
find_prime_until(10)

[1, 2, 3, 5, 7]

## Αρχεία

Για να γράψουμε σε να αρχείο χρησιμοποιούμε την συνάρτση `open()` της python. Δέχεται 2 ορίσματα:

- Το όνομα του αρχείου που θα ανοίξει/δημιουργήσει (ή το path του)
- Το mode στο οποίο θα το ανοίξει (πχ για εγγραφή, για ανάγνωση)

In [None]:
f = open('doc.txt', 'w') # ανοίγουμε ένα αρχείο σε mode 'w' --> write
f.write('my first line\n') # γράφουμε μια γραμμή στο αρχείο
f.close() # κλείνουμε το αρχείο

Η παραπάνω εντολή δημιούργησε ένα αρχείο στον φάκελο από τον οποίο τρέχουμε το notebook. Αν θέλαμε άλλη τοποθεσία θα έπρεπε να βάλουμε το path του αρχείου μαζί με το όνομά του (πχ σε linux `'/home/thanos/Desktop/doc.txt'`)
Πρέπει να δίνουμε προσοχή να κλείνουμε το αρχείο! Για να μην το ξεχνάμε προτιμάμε να χρησιμοποιούμε την παρακάτω σύνταξη:

In [None]:
with open('doc.txt', 'a') as f: # ανοίγουμε σε mode 'a' --> append
    f.write('my second line\n')

Ανάγνωση κειμένου.

In [None]:
with open('doc.txt', 'r') as f: # ανοίγουμε σε mode 'r' --> read
    doc = []
    for line in f: # διατρέχουμε το κείμενο γραμμή-γραμμή
        doc.append(line) # αποθηκεύουμε κάθε γραμμή ξεχωριστά σε μια λίστα
        
print(doc)

## Πίνακες

Η python από μόνη της δεν υποστηρίζει πράξεις πινάκων. Για το λόγο αυτό χρησιμοποιούμε τη βιβλιοθήκη [numpy](http://www.numpy.org/). Προσοχή μην μπλέκουμε τύπους δεδομένων σε πίνακες (δηλ. **κάθε πίνακας να έχει δεδομένα του ίδιου τύπου**, π.χ. float32)

In [None]:
import numpy as np

a = np.array([[1,2,3],[4,5,6],[7,8,9]])
b = np.array([[11,22,33],[44,55,66],[77,88,99]])

print (a)
print (b)
print ('a + b =\n', a + b) 
print ('elementwise: a * b =\n', a * b) # elementwise
print ('matrix multiplication: a * b =\n', np.dot(a, b))

Η numpy υποστηρίζει και πράξεις ανάμεσα σε πίνακες με ασύμβατες διαστάσεις μέσω του [broadcasting](http://www.astroml.org/_images/fig_broadcast_visual_1.png).

In [None]:
c = np.array([0.5, 1, 1.5])
print ('a + c =\n', a + c) # επαναλαμβάνει τον πίνακα c 3 φορές ώστε να ταιριάξει με τις διαστάσεις του a πριν κάνει την πράξη
print ('a + 1 =\n', a + 1) # elementwise
print(a)

### Στατιστικά στοιχεία πίνακα

In [None]:
print ('τύπος δεδομένων:', a.dtype)
print ('διαστάσεις:', a.shape)
print ('άθροισμα στοιχείων πίνακα:', a.sum())
print ('άθροισμα στοιχείων ανά γραμμή:\n', a.sum(axis=1)) # ανά στήλη θα ήταν axis=0
print ('μέγιστη τιμή πίνακα:', a.max())
print ('μέγιστo στοιχείο ανά στήλη:\n', a.max(axis=0))
print ('μέγιστo στοιχείο:\n', a.max())

### Δημιουργία πινάκων

In [None]:
z = np.zeros((2,2)) # φτιάχνει έναν πίνακα με μηδενικά σχήματος 2x2
print (z)
d = np.arange(1,10) # φτιάχνει έναν πίνακα με τιμές από το 1 μέχρι το 9
print (d)

### Indexing & slicing

In [None]:
print (d[4]) # δείχνει το 5ο στοιχείο του d
print (a[1,2]) # δείχνει το 3ο στοιχείο από τη δεύτερη γραμμή του a

print (a[:,:]) # φέρνει όλα τα στοιχεία της πρώτης στήλης του a

### Αλλαγή σχήματος πίνακα

In [None]:
print ('old shape:', d.shape)
d = d.reshape((3,3)) # αλλάζουμε το σχήμα σε 3x3
print ('new shape:', d.shape)
print (d)

Επίσης υποστηρίζονται και λογικές πράξεις μεταξύ πινάκων.

In [None]:
d = np.arange(9,0,-1).reshape((3,3))
print ('a =\n', a)
print ('d =\n', d)

print ('a > d =\n', a > d)

## Άσκηση 2:

Φτιάξτε μια συνάρτηση που να δέχεται 2 πίνακες Α, Β, να ελέγχει αν αυτοί έχουν τις ίδιες διαστάσεις και να εκτελεί την πράξη Α - Β.

In [55]:
import numpy as np
def matrix_substraction(a,b):
    shape1 = a.shape
    shape2 = b.shape
    if (shape1 == shape2):
        return(np.subtract(a, b))

a = np.array([[1,2,3],[4,5,6],[7,8,9]])
b = np.array([[11,22,33],[44,55,66],[77,88,99]])
c = np.array([[11,22,33],[44,55,66]])

matrix_substraction(a,b)


array([[-10, -20, -30],
       [-40, -50, -60],
       [-70, -80, -90]])

## Κλάσεις και αντικείμενα

In [None]:
class Rectangle:
    
    def __init__(self, h, w):
        # constructor
        
        self.height = h # δεν υπάρχουν private μεταβλητές στην python
        self.width = w
        
    def area(self):
        return self.height * self.width
    
    def perimeter(self):
        return 2 * (self.height + self.width)
    
    def diagonal(self):
        return math.sqrt(self.height ** 2 + self.width ** 2)

In [None]:
rec1 = Rectangle(4,2)
rec2 = Rectangle(3,3)

print ('Equal areas?', rec1.area() == rec2.area())
print ('Equal perimeters?', rec1.perimeter() == rec2.perimeter())
print ('Equal diagonals?', rec1.diagonal() == rec2.diagonal())

## Άσκηση 3:

Φτιάξτε μια κλάση με όνομα Circle η οποία θα έχει 2 μεθόδους που θα υπολογίζουν την περιφέρεια και το εμβαδόν του. Χρησιμοποιήστε την σταθερά math.pi

In [69]:
class Circle:
    
    def __init__(self, r):
        # constructor
        self.radius = r

    def circumference(self):
        return 2 * np.pi * self.radius

    def area(self):
        return np.pi * self.radius**2.0

In [71]:
circle1 = Circle(1)

print("Circumference of circle: %f" % circle1.circumference())
print("Area of circle: %f" % circle1.area())

Circumference of circle: 6.283185
Area of circle: 3.141593


## Χειρισμός αρχείων csv

Ένα πολύ χρήσιμο format αρχείων είναι το **csv** (comma separated values), το οποίο μας επιτρέπει εύκολα να αποθηκεύουμε και να διαβάζουμε πίνακες.

In [None]:
print (a)
np.savetxt('myarray.csv', a, delimiter=' ') # αποθηκεύουμε σε ένα αρχείο τον πίνακά μας
                                            # τα κελιά χωρίζονται με , και οι γραμμές με \n

Για να το φορτώσουμε το αρχείο:

In [None]:
loaded_arr = np.loadtxt('myarray.csv', delimiter=' ')
print (loaded_arr)

## Pandas

Η [pandas](http://pandas.pydata.org/) είναι μια βιβλιοθήκη της python που περιέχει καινούργια data structures (όπως το [series](https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.html) και το [dataframe](https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html)) καθώς και εργαλεία ανάλυσης δεδομένων. Εμείς θα την χρησιμοποιήσουμε κυρίως για το input-output. Η βασική δομή που θα χρησιμοποιήσουμε είναι το **dataframe** το οποίο είναι ένας πίνακας που, σε αντίθεση με το numpy, μπορεί και δέχεται διαφορετικούς  τύπους δεδομένων ανά στήλη.

In [None]:
import pandas as pd
df = pd.DataFrame({'A' : range(5,10),
                   'B' : 'blabla',
                   'C' : np.arange(0,5)[::-1],
                   'D' : 1})
print (df)

Για να δούμε τους τύπους δεδομένων του dataframe:

In [None]:
print (df.dtypes)

Οι στήλες του dataframe έχουν ονόματα με τα οποία μπορούμε να αναφερθούμε σε αυτές (σαν ένα dictionary). Για να δούμε τα ονόματα αυτά μπορούμε να πατήσουμε την εντολή df.columns. Αντίστοιχα υπάρχει και η df.index για τα index των γραμμών. Για να απομονώσουμε τα στοιχεία της δεύτερης στήλης (που έχουμε ονομάσει *B*):

In [None]:
print (df['B'])

Στις γραμμές το slicing γίνεται όπως και στο numpy.

In [None]:
df[1:5]

Προσοχή θέλει όταν θέλουμε να πάρουμε μια μοναδική γραμμή. Δεν δουλεύει το indexing όπως στην numpy:

In [None]:
df[3]

Αντίθετα πρέπει να χρησιμοποιήσουμε το `.loc` ή το `.iloc`.

In [None]:
print(df['A'].loc[3])

Βασικά στατιστικά στοιχεία πίνακα:

In [None]:
df.describe() # δουλεύει για τις στήλες που περιέχουν αριθμητικά δεδομένα

Μια ενδιαφέρουσα εφαρμογή στο pandas είναι η εφαρμογή φίλτρων στο dataframe. Π.χ. αν θέλουμε να πάρουμε τις γραμμές στις οποίες η στήλη *C* έχει τιμή μικρότερη από 3:

In [None]:
df[df['C'] < 3 ]

Το pandas παρέχει και τις δικές του συναρτήσεις για εγγραφή και ανάγνωση απο csv (`to_csv()` και `read_csv()` αντίστοιχα). Προσοχή θέλει το δεύτερο γιατί το pandas θεωρεί ότι από default η πρώτη γραμμή είναι τα ονόματα των στηλών. Αν το csv μας έχει (όπως στην προηγούμενη περίπτωση με το numpy) μόνο τιμές, πρέπει να ορίσουμε `header=None` ως επιπλέον παράμετρο της συνάρτησης. 

# Βιβλιογραφία

Προτεινόμενο βιβλίο

Python Cookbook (Third edition) - David Beazley and Brian K. Jones

![alt text](https://covers.oreillystatic.com/images/0636920027072/lrg.jpg)

[Άλλες επιλογές](https://data-flair.training/blogs/best-python-book/)
