# Δομές δεδομένων στην Python

**Note**: This notebook is heavily influenced by the lectures of Dr. Thomas Erben @ University of Bonn

Μπορούμε να διαχωρίσουμε τις δομές δεδομένων σύμφωνα με τις παρακάτω ιδιότητες:

- Τι είδους δεδομένα μπορεί να έχει μία δομή δεδομένων (μόνο συγκεκριμένου τύπου, ομοιογενή δεδομένα);


- Είναι η δομή δεδομένων μεταβλητή (μπορεί να αλλάξει μετά τη δημιουργία της);


- Υπάρχει κάποια διάταξη των δεδομένων στη συγκεκριμένη δομή;


Μέχρι στιγμής, η μοναδική σύνθετη δομή δεδομένων που έχουμε δει είναι η συμβολοσειρά. Αυτού του είδους η δομή είναι μια **διατεταγμένη** ακολουθία **συγκεκριμένου τύπου** δεδομένων (αλφαριθμητικών χαρακτήρων) και είναι **αμετάβλητη**.



Στη συνέχεια θα αναφερθούμε σε ακόμα τρεις *πολύ* διαδεδομένες και βασικές δομές δεδομένων: τις **λίστες**, τις **πλειδάδες** και τα **λεξικά**.

Οι δομές δεδομένων σε καμία περίπτωση δεν περιορίζονται μόνο σε αυτές στις οποίες θα αναφερθούμε εδώ. Προχωρώντας θα συναντήσουμε και θα δουλέψουμε με κάποιες επιπρόσθετες δομές (π.χ. **numpy-arrays**) ενώ κάποιες άλλες -αν και εξαιρετικά δημοφιλείς και χρήσιμες- δεν θα έχουμε την ευκαιρία να τις αναλύσουμε (π.χ. **κλάσεις**, **σύνολα** κτλ).


## Λίστες

Οι λίστες είναι οι πιο **γενικές, διατεταγένες και ετερογενείς** ακολουθίες που μπορούν να **μεταβληθούν**.

### Δημιουργία, περιεχόμενα και προσπέλαση λίστας

- Μία λίστα ορίζεται από το όνομά της ακολουθούμενο από ένα ζευγάρι τετραγωνικών παρενθέσεων έχοντας τη δομή:

                                 l = [element1, element2, element3, ...]



- Τα στοιχεία μίας λίστας είναι διατεταγμένα που σημαίνει ότι, όπως και στις συμβολοσειρές, σε κάθε στοιχείο της λίστας αντιστοιχεί ένας δείκτης από το 0 (πρώτο στοιχείο) μέχρι το μήκος της λίστας μειον 1.


- Οι τρόποι με τους οποίους μπορούμε να έχουμε πρόσβαση στα στοιχεία μίας λίστας είναι παρόμοιοι με αυτούς που χρησιμοποιούμε για την πρόσβαση των αλφαριθμητικών στοιχείων μιας συμβολοσειράς.

In [None]:
# Lists live within square brackets and the individual elements are separated by commas:
# Be careful though: the word 'list' is a keyword and cannot be used as a variable's name 
l = [1, 2, 3, 4] 

print(type(l))

print(l[0], l[2])   # Print the first and third element of the list 'l'.
                    # Indices of cbontainer elements start with 0 and end with 'n-1
                    # (for a container with 'n' elements) as in C)
        
print(len(l))       # Length of a list

print(l[-1], l[-2]) # Negative indices i access indices n - i if n is
                    # the number of elements in the container!

- Τα στοιχεία μίας λίστας μπορεί να είναι ο,τιδήποτε: ακέραιοι, δεκαδικοί, αλφαριθμητικά, μιγαδικοί αριθμοί, συναρτήσεις, modules κτλ.

In [None]:
# Lists can be heterogeneous and contain 'everything'(!)
import numpy 

# More on functions later...
def square(x):
    return x**2

# The following list contains an int, a float, another list, a module, a function and a complex number!
l = [1, 3.0, "Maria", [1, 2], numpy, square, 2+3j]

print(l[2], l[3], l[4].pi, l[5](5), l[6])

- Οι λίστες σπάνια δημιουργούνται "με το χέρι". Συνήθως είναι το αποτέλεσμα κλήσης κάποιας συνάρτησης ή προσπέλασης κάποιου αρχείου δεδομένων.

In [None]:
l = [1, 2, 3, 4]  # most simple list creation
print(l)

n = list(range(10)) # list of running numbers used for for-looping
print(n)

# looping over list elements is the primary way to work with this container!
for num in n:
    print(num)

- Όπως και με τις συμβολοσειρές, μπορούμε να πάρουμε ένα μόνο τμήμα μιας λίστας χρησιμοποιώντας τους ίδιους κανόνες τεμαχισμού.



- Σε αντίθεση όμως με τις συμβολοσειρές, οι λίστες μπορούν να μεταβληθούν μετά τη δημιουργία τους.

In [None]:
# sublists can be accessed via slicing
l = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

print(l[3])    # access of an individual element

print(l[1:3])  # access the sublist from the second (inclusive) to
               # the fourth (exclusive) elements
    
print(l[4:])   # access the sublist from the fifth element up to the end

print(l[::2])  # access the sublist with each other element

print(l[1:-1]) # negative indices also work for slices


l[1:4] = [20, 21, 22]  # note that you can use slicing also on the left
                       # side of an assigment! In that case the structure
                       # of the right side (size of the container)
                       # has to match the sliced container. Note that
                       # this operation is only available for mutable
                       # containers!
                    
print(l)  

- Όπως είδαμε, μία λίστα μπορεί να περιέχει οποιοδήποτε τύπο δεδομένων. Αυτό σημαίνει ότι τα στοιχεία της μπορεί να είναι άλλες λίστες θυμίζοντας έτσι έναν πίνακα.


- Έστω λίστα ``l = [[1,2,3], [4,5,6], [7,8,9]]``. Πως μπορούμε να αναφερθούμε στο στοιχείο 6; 


![matrix_list.png](attachment:matrix_list.png)

- Η απάντηση είναι χρησιμοποιώντας αλυσιδωτή προσπέλαση: ``l[1][2]``

In [None]:
# Nested lists -> similar to matrix
l = [[1,2,3], [4,5,6], [7,8,9]]
print(l)

# access second element
print(l[1])

# chained access
print(l[1][2])

# this does not exist!
#print(l[1,2])

### Μέθοδοι της κλάσης \<list\>

Δουλεύοντας με μία ετερογενή δομή δεδομένων, δεν μπορούμε να ορίσουμε πολλές πράξεις που να βγάζουν νόημα. Όλες οι μέθοδοι που προσφέρονται για τα αντικείμενα της κλάσης \<list\> αφορούν μετατροπές, επεκτάσεις και ταξινομήσεις (εαν γίνεται). Οι δύο γνωστοί τελεστές ``+`` και ``*`` υπάρχουν και σε αυτή τη περίπτωση επιτελούν την ίδια λειτουργία όπως στην περίπτωση των συμβολοσειρών.


Μερικές πολύ χρήσιμες μέθοδοι είναι οι ακόλουθες:

- ``append()``
    
- ``extend()``

- ``remove()``

- ``pop()``

- ``sort()``


Χρησιμοποιήστε τις built-in συναρτήσεις ``dir`` και ``help`` για να δείτε τις διαθέσιμες μεθόδους της κλάσης \<list\> και να κατανοήσετε τη λειτουργία τους.

In [None]:
l = [1, 2, 3]
m = [4, 5, 6]

print(l * 2)
print(l + m)

# Append number 8 to an existing list
l.append(8)
print(l)

**Προσοχή:** Ιδιαίτερη προσοχή πρέπει να δίνεται για μεθόδους που τροποποιούν μία υπάρχουσα λίστα (in-place methods) και μεθόδους που διαχειρίζονται ένα νέο αντικείμενο (πιθανόν ένα αντίγραφο της λίστας).

In [None]:
l = ["Savvas", "Elias", "Nikos"]

# l.sort is an 'in place sort'
# Use it if you do not need the old list anymore
# (memory efficiency)
l.sort()
print(l)

In [None]:
l = ["Savvas", "Elias", "Nikos"]

# sorted creates a new object with a sorted version of l
# Use it if you still need the original list.
m = sorted(l)
print(m, l)

### Συνοπτική λίστα (list comprehension)

Οι συνοπτικές λίστες είναι μία άλλη μέθοδος για την δημιουργία κάποιας λίστας χωρίς τη χρήση δομής επανάληψης for. Οι συνοπτικές λίστες προσφέρουν έναν πιο ευανάγνωστο (με λίγη εξοικείωση), πιο γρήγορο και πιο αποδοτικό τρόπο για τη δημιουργία μιας λίστας.

Η γενική μορφή μιας συνοπτικής λίστας είναι:
```python
                                    [έκφραση(x) for x in Obj if συνθήκη]
```
και η οποία παράγει μία λίστα με στοιχεία τις έκφραση(x) για κάθε τιμή του x που ανήκει στο αντικείμενο Obj και που ικανοποιεί τη συνθήκη.

In [None]:
# Regular approach to populate a list in a given range of numbers
my_list = []

for i in range(5, 16):
    my_list.append(i)
    
print(my_list)

# A better (and faster) way to do things
my_pythonic_list = [j for j in range(5, 16)]
print(my_pythonic_list)

my_pythonic_list_dec = [j/10 for j in range(1, 10)]
print(my_pythonic_list_dec)

In [None]:
# What if we want to apply a condition?
some_list = []

for i in range(5, 16):
    if i <= 13 and i >= 9:
        # We want the string of the floating representation of number i
        i = str(float(i))
        some_list.append(i)
        
print(some_list)

# You can create a list comprehension equipped with a simple condition
some_pythonic_list = [str(float(x)) for x in range(5, 16) if (x <= 13) and (x >= 9)]
print(some_pythonic_list)

**Challenge**

Προσπαθείστε να απαντήσετε τα επόμενα ερωτήματα πριν εκτελέσετε κάποιον κώδικα. Αν γίνεται, καταφύγετε στην εκτέλεση του κώδικα μόνο προς επιβεβαίωση. Χρησιμοποιήστε τις βοηθητικές συναρτήσεις ``help``, ``dir`` αν δεν είστε σίγουροι/ες για το αποτέλεσμά σας. Για κάθε άσκηση θα πρέπει να είστε σε θέση να εξηγήσετε ΓΙΑΤΙ παίρνετε τα συγκεκριμένα αποτελέσματα! 


- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
s = "Jane Doe"
print(s[1], s[-1], s[1:3], s[1:3:-1], s[3:1:-1], s[:3], s[::2], s[::-1])
````


- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
for x in "Mississippi".split("i"):
    print(x, end="")
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
xlist = []
xlist.append(5)
xlist.append(10)
print(xlist)
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
zlist = []
zlist.append([5, 10])
print(zlist)
````


- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
xlist = list(range(-3, 3))
print(xlist)
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
xlist = [2, 1, 3]
ylist = sorted(xlist)
print(xlist, ylist)
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
xlist = [2, 1, 3]
ylist = xlist.sort()
print(xlist, ylist)
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
xlist = [3, 2, 1, 0]

for item in xlist:
    print(item, end=" ")
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
a = 1
b = 2
xlist = [a, b, a + b]
a = 0
b = 0

print(xlist)
````

- Αφού εκτελεστούν οι ακόλουθες εντολές, ποιά είναι η τιμή του x;

````python
s = "this is a test"
x = s.split()
````

- Ποιό είναι το αποτέλεσμα του παρακάτω κώδικα;

````python
a = 123456
s = str(a)
print(s[5] + s[4] + s[3] + s[2])
````

## Πλειάδες

Οι πλειάδες (tuples) είναι μία δομή δεδομένων που είναι πανομοιότυπη με τις λίστες με την εξής διαφορά: είναι **αμετάβλητες**. Αυτό σημαίνει ότι, σε αντίθεση με τις λίστες, οι πλειάδες δεν μπορούν να τροποποιηθούν μετά τη δημιουργία τους.


- Μία πλειάδα ορίζεται από το όνομά της ακολουθούμενο από ένα ζευγάρι παρενθέσεων έχοντας τη δομή:

                            t = (element1, element2, element3, ...)


- Η δημιουργία, τα περιεχόμενα και η προσπέλαση είναι παρόμοια με αυτά μιας λίστας.

In [None]:
t = (1, 2, 3, 4)  # tuples live in parentheses
print(type(t))
print(t[1:3])     # slicing and all over other element accesses that do not change the tuple as for lists

v = (1,)  # definition of a tuple with one element!
print(v)
print(type(v))

u = 'a', 2.0, 5   # The parentheses can be ommitted for tuple creation!
print(type(u))

for elem in u:
    print(elem)
    
# This raises an error; tuples are immutable!
# u[1] = 'b' 

- Έχουμε ήδη δει ότι η Python υποστηρίζει την ταυτόχρονη εκχώρηση τιμών σε πολλαπλές μεταβλητές. Αυτή η διαδικασία μπορεί να θεωρηθεί ως το ξε-πακετάρισμα των τιμών μιας πλειάδας.

In [None]:
x, y = 1, 2   # simultaneous assigment to two variables
print(type(x))

z = 1, 2  # creation of a tuple!
print(type(z))

x, y = z  # The tuple in upacked!
print(x, y)

# This also works with lists:
l = ['a', 'b']
print(l)

s, t = l
print(s, t)

**Spoiler:** Το ίδιο συμβαίνει και για μία συνάρτηση που επιστρέφει περισσότερες από μία τιμές. Μπορεί κανείς να θεωρήσει ότι μία τέτοια συνάρτηση επιστρέφει μία πλειάδα που περιέχει το σύνολο των μεμονωμένων τιμών.

In [None]:
import numpy as np

def xy2polar(x, y):
    """
    A function that converts cartesian coordinates to 
    polar coordinates
    """
    r = np.sqrt(x**2 + y**2)
    phi = np.arctan2(y, x)
    
    return r, phi

def polar2xy(r, phi):
    """
    A function that converts polar coordinates to 
    cartesian coordinates
    """
    x = r * np.cos(phi)
    y = r * np.sin(phi)
    
    return x, y

x, y = 1.0, 1.0

r, phi = xy2polar(x, y)
print(r, phi)

c = xy2polar(x, y)
print(c)

## Λεξικά

Τα λεξικά είναι **μη-διατεταγμένες και ετερογενείς** δομές δεδομένων που μπορούν να **μεταβληθούν**.

- Τα λεξικά στην Python ακολουθούν την ίδια φιλοσοφία με τα γνωστά γλωσσικά λεξικά που χρησιμοποιούμε για τον ορισμό των λέξεων. Σε ένα τέτοιο γλωσσικό λεξικό, έχουμε μία λέξη (κλειδί) στην οποία αντιστοιχεί ένας ορισμός (τιμή). Εμείς ως χρήστες του λεξικού, χρησιμοποιούμε την λέξη ως ευρετήριο για τον ορισμό που ψάχνουμε.



- Παρόμοια, τα λεξικά στην Python αποτελούνται από τέτοια ζευγάρια "κλειδιών-τιμών". Επειδή τα λεξικά αποτελούν μη-διατεταγμένες ακολουθίες, αυτό σημαίνει ότι δεν υπάρχει κάποια δεικτοδότηση όπως στην περίπτωση των συμβολοσειρών, λιστών ή πλειάδων. Αντίθετα, για την προσπέλαση των στοιχείων ενός λεξικού χρησιμοποιούμε ως ευρετήριο τα κλειδιά για να πάρουμε την τιμή που αντιστοιχεί σε αυτό το κλειδί.



- Ένα λεξικό ορίζεται από το όνομά του ακολοθούμενο από ένα ζευγάρι αγκυλωτών παρενθέσεων έχοντας τη δομή:

                           d = {key1:value1, key2:value2, key3:value3,...}
                           
                           
                           
- Τα κλειδιά, εφόσον χρησιμεύουν ως ευρετήριο, θα πρέπει να είναι μοναδικά. Επίσης, πρέπει να είναι αντικείμενα αμετάβλητου τύπου (π.χ. συμβολοσειρές, αριθμοί, πλειάδες) και όχι λίστες ή λεξικά.

### Δημιουργία, περιεχόμενα και προσπέλαση λεξικού

In [None]:
# Keys must be unique and immutable, values can be anything
tutors = {
    "name": ["Savvas", "Elias", "Nikos"],
    "email": ["schanlaridis@physics.uoc.gr", "ekyritsis@physics.uoc.gr", "nmandarakas@physics.uoc.gr"],
    "office": 230,
    "research_field": "Physics" 
}


print(type(tutors))

# Length of a dictionary is the number of keys
print(len(tutors))

- Αν προσπαθήσουμε να πάρουμε την τιμή που αντιστοιχεί σε ένα κλειδί που **δεν** υπάρχει στο λεξικό, τότε παίρνουμε την εξαίρεση ``KeyError``.


- Πολλές φορές είναι προτιμότερο να χρησιμοποιούμε συγκεκριμένες μεθόδους της κλάσης ``<dict>`` για την προσπέλαση των στοιχείων (π.χ. ``get()``, δες παρακάτω).

In [None]:
print(tutors["name"])
print(tutors["office"])

# What if you try to get a key that doesn't exist
# print(tutors["phone"])

In [None]:
# looping over the elements of a dictionary might not 
# be so intuitive

# This will print out only the keys
for k in tutors:
    print(k)

### Μέθοδοι της κλάσης \< dict\>

In [None]:
print(dir(dict))

# print(help(dict.get))

In [None]:
# Access a value using the get method
print(tutors.get('email'))

# Try to access the value of a non-existing key
print(tutors.get('phone'))

# you can even customize it
print(tutors.get('phone', 'not found'))

In [None]:
# 3 very useful methods
print(tutors.items())
print()

print(tutors.keys())
print()
print(tutors.values())

In [None]:
# looping over the elements of a dictionary
for key, val in tutors.items():
    print(key, val)
    
print()
# Check out the functionality of zip() -- see also the enumerate() function
for key, val in zip(tutors.keys(), tutors.values()):
    print(key, val)

### Προσθήκη και διαγραφή μιας καταχώρησης

In [None]:
# Adding an entry
tutors["phone"] = "2810-123456"

print(tutors.get('phone', 'not found'))

# Replacing an existing entry
tutors["research_field"] = 'Astrophysics'

print(tutors.get('research_field'))

# Deleting an entry
del tutors['phone']

print(tutors.get('phone', 'not found'))

# Update parts of a dictionary
tutors.update({"office":[230, 232], "phone":123456})

print(tutors)