# Podstawy programowania w analizie danych

## Tomasz Rodak

2017/2018, semestr letni

Wykład IV

# Zasięgi zmiennych

## Przestrzeń nazw (namespace)

* **Przestrzeń nazw** to przyporządkowanie od nazw do obiektów.
* Każdy **moduł** definiuje własną **globalną** przestrzeń nazw. 
* Zmienne w globalnej przestrzeni nazw nazywamy **globalnymi**.
* Globalne przestrzenie nazw są rozłączne.


## Moduł `builtins`

Moduł zawierający wbudowaną przestrzeń nazw.

In [8]:
import builtins

print(dir(builtins)[::5]) # Co piąta wartość



## Inne moduły

Kilka przykładów.

Moduł|Przykład funkcji|Przykład stałej
---|---|---
`math`|`sin()`|`pi`
`numpy`|`sin()`|`pi`
`random`|`choice()`|`TWOPI`
`functools`|`reduce()`|`WRAPPER_ASSIGNMENTS`
`os`|`listdir()`|`linsep`

## `import`

* Każdy plik z kodem Pythona jest modułem z własną przestrzenią nazw.
* Instrukcja **`import`** jest sposobem na odwołanie się z jednego modułu do drugiego.
* Wykonanie
  ```python
  import pewien_moduł
  ```
  powoduje, że w przestrzeni nazw pojawia się zmienna `pewien_moduł` wskazująca na importowany moduł.
  Przestrzenie nazw nie ulegają wymieszaniu.
* Przestrzeń nazw modułu `pewien_moduł` jest widoczna w globalnej przestrzeni nazw w postaci atrybutów tego modułu
  ```python
  pewien_moduł.atrybut
  ```

Po wykonaniu importu

In [11]:
import math, numpy

funkcje `sin()` z modułów `math` i `numpy` mogą być używane równocześnie

In [12]:
math.sin(3.14), numpy.sin(3.14)

(0.0015926529164868282, 0.0015926529164868282)

Stałe `pi` z tych modułów są równe.

In [13]:
math.pi, numpy.pi, math.pi == numpy.pi

(3.141592653589793, 3.141592653589793, True)

Ale tego

In [14]:
numpy.sin(range(5))

array([ 0.        ,  0.84147098,  0.90929743,  0.14112001, -0.7568025 ])

`sin()` z `math` nie potrafi

In [15]:
math.sin(range(5))

TypeError: a float is required

## `from...import`

Instrukcja
```python
from pewien_moduł import coś
```
powoduje, że do globalnej przestrzeni nazw dostaje się `coś`. Jeśli jakiś obiekt posiadał tę samą nazwę co `coś`, to zostanie ona przesłonięta.


In [16]:
from numpy import sin

sin(range(5))

array([ 0.        ,  0.84147098,  0.90929743,  0.14112001, -0.7568025 ])

In [17]:
from math import sin

sin(range(5))

TypeError: a float is required

## `from...import as`

Instrukcja
```python
from pewien_moduł import coś as nazwa
```
powoduje, że do globalnej przestrzeni nazw dostaje się `coś` ale pod nazwą `nazwa`. Ta technika pozwala na: 
* uniknięcie konfliktu między nazwami,
* skrócenie długich nazw.

## Lokalna przestrzeń nazw

* Każde wywołanie funkcji tworzy nową lokalną przestrzeń nazw.
* W zakresie lokalnym można odwoływać się do zmiennych globalnych.
* Wykonanie przypisania w ciele funkcji, tworzy zmienną lokalną. 
* Przypisanie w zakresie lokalnym  przesłania zmienną globalną (o ile taka zmienna istnieje), chyba że użyto deklaracji `global`.

## Zagadka

Jaki będzie skutek wykonania tego kodu?

In [0]:
s = 'Jestem Ziemianinem!'

def f():
    s = 'Jestem Marsjaninem!'
    print(s)

f()
print(s)

In [20]:
s = 'Jestem Ziemianinem!' # Zmienna globalna

def f():
    # Zmienna lokalna; przesłania globalne s ale tylko lokalnie
    s = 'Jestem Marsjaninem!' 
    print(s)

f()
print(s) # Zmienna globalna nie została zmieniona

Jestem Marsjaninem!
Jestem Ziemianinem!


## Zagadka

A teraz?

In [0]:
s = 'Jestem Ziemianinem!'

def f():
    print(s)
    s = 'Jestem Marsjaninem!'
    print(s)

f()
print(s)

In [23]:
s = 'Jestem Ziemianinem!' # Zmienna globalna

def f():
    # Błąd! s jest przypisana w ciele funkcji, jest więc
    # traktowana jak lokalna. Odwołać się do niej można
    # dopiero po przypisaniu.
    print(s) 
    s = 'Jestem Marsjaninem!' # Zmienna lokalna, przesłania globalne s
    print(s)

f()
print(s) # Zmienna globalna nie została zmieniona

UnboundLocalError: local variable 's' referenced before assignment

## Instrukcja `global`

Deklaracja `global` informuje o tym, że zmienna przypisana w ciele funkcji ma być traktowana jak globalna.

In [1]:
s = 'Jestem Ziemianinem!'

def f():
    global s
    print(s)
    s = 'Jestem Marsjaninem!'
    print(s)

f()
print(s) # s została zmieniona 

Jestem Ziemianinem!
Jestem Marsjaninem!
Jestem Marsjaninem!


## Zagadka

Czy ten program wykona się bez błędu?

In [0]:
def f():
    s = 'Jestem Marsjaninem!'
    print(s)

f()
print(s)

Nie, chyba że `s` istnieje w zakresie globalnym.

In [1]:
def f():
    s = 'Jestem Marsjaninem!'
    print(s)

f()
# Błąd, jeśli s nie została zdefiniowana wcześniej w zakresie globalnym.
# Zmienna z funkcji nie jest widoczna poza funkcją.
print(s) 

Jestem Marsjaninem!


NameError: name 's' is not defined

**Uwaga:** Zrestartuj środowisko, aby zobaczyć ten błąd.

## Obiekty zmienne

Na globalnych obiektach zmiennych funkcja może działać w miejscu. 

Referencja w ciele funkcji do globalnej zmiennej `kwadraty`. Funkcja nie zwraca nic, ale **zmienia stan** listy `kwadraty`.

In [28]:
kwadraty = [1, 4, 9]

def f():
    kwadraty.append(16)

print(kwadraty)
f()
print(kwadraty)

[1, 4, 9]
[1, 4, 9, 16]


Teraz funkcja ma parametr `x`. W czasie wykonania `f(kwadraty)` wykonane zostaje przypisanie `x = kwadraty` co powoduje, że `x` jest aliasem zmiennej `kwadraty`. Operacje znów są wykonywane "w miejscu".

In [7]:
kwadraty = [1, 4, 9]

def f(x):
    x.append(16)

print(kwadraty)
f(kwadraty)
print(kwadraty)

[1, 4, 9]
[1, 4, 9, 16]


Funkcja równocześnie zwraca wartość i działa "w miejscu" (zmienia stan). 

In [2]:
kwadraty = [1, 4, 9]

def f(x):
    x.append(16)
    return x

print(kwadraty)
y = f(kwadraty)
print(kwadraty)

[1, 4, 9]
[1, 4, 9, 16]


Zwrócona wartość jest aliasem do listy `kwadraty`.

In [6]:
y is kwadraty

True

## Przykład: [sortowanie przez wybieranie](https://pl.wikipedia.org/wiki/Sortowanie_przez_wybieranie)

Dla tablicy `A[1], ..., A[n]` algorytm przedstawia się następująco:

* dla każdego `i = 1, ..., n`:
  * wyszukaj `k = i, i + 1, ..., n` z minimalną wartością `A[k]`;
  * zamień `A[k]` z `A[i]`.

In [3]:
def wyb_sort(A):
    n = len(A)
    for i in range(n - 1):
        min_i = i
        for k in range(i + 1, n):
            if A[k] < A[min_i]:
                min_i = k
        A[i], A[min_i] = A[min_i], A[i]

### Sortowanie listy liczb

In [4]:
lst = [3, 1, 5, 3, 8, 6, 3, 2, 1, 4, 5]

lst

[3, 1, 5, 3, 8, 6, 3, 2, 1, 4, 5]

In [5]:
wyb_sort(lst)

lst

[1, 1, 2, 3, 3, 3, 4, 5, 5, 6, 8]

### Sortowanie listy znaków

In [6]:
lst = list('monty python')

lst

['m', 'o', 'n', 't', 'y', ' ', 'p', 'y', 't', 'h', 'o', 'n']

In [7]:
wyb_sort(lst)

lst

[' ', 'h', 'm', 'n', 'n', 'o', 'o', 'p', 't', 't', 'y', 'y']

## Ostrzeżenie

Nie używaj obiektów zmiennych jako wartości domyślnych!

Wartości domyślne są obliczane tylko raz, gdy funkcja jest definiowana. Kolejne wywołania odwołują się do obliczonej na początku wartości, a ta może zmieniać stan, jeśli jest zmienna.

In [19]:
def f(lst=[]):
    lst.append('X')
    print(lst)

f()
f()
f()

['X']
['X', 'X']
['X', 'X', 'X']


### Obejście

In [20]:
def f(lst=None):
    if lst is None:
        lst = []
    lst.append('X')
    print(lst)

f()
f()
f()

['X']
['X']
['X']


## [Obiekty pierwszej klasy](https://en.wikipedia.org/wiki/First-class_citizen)

W językach programowania obiekt pierwszej klasy to taki, który:

* może być wartością zmiennej;
* może być argumentem funkcji;
* może być zwrócony z funkcji;
* może zostać zmodyfikowany.

## Obiekty pierwszej klasy w Pythonie

Zamierzeniem projektowym Pythona było, aby **wszystkie** obiekty były obiektami pierwszej klasy.

> One of my goals for Python was to make it so that all objects were "first class." By this, I meant that I wanted   all objects that could be named in the language (e.g., integers, strings, functions, classes, modules, methods,   etc.) to have equal status. That is, they can be assigned to variables, placed in lists, stored in dictionaries,   passed as arguments, and so forth.

> Guido van Rossum

## Funkcje są obiektami pierwszej klasy

...co prowadzi do pytań o zasięg zmiennych:

In [16]:
def fabryka_potęg(wykładnik):
    def potęga(podstawa):
        return podstawa ** wykładnik
    return potęga

In [42]:
kwadrat = fabryka_potęg(2)
sześcian = fabryka_potęg(3)

kwadrat(5), sześcian(5)

(25, 125)

* Funkcja `fabryka_potęg()` zwraca funkcję `potęga()`.
* Funkcja `potęga()` odnosi się do zmiennej lokalnej `wykładnik`.
* Po wykonaniu 
  ```python
  kwadrat = fabryka_potęg(2)
  ```
  `fabryka_potęg()` kończy działanie. 
* Zmienna `wykładnik` przestaje istnieć, gdyż jest to zmienna lokalna. 
* Istnieje jednak funkcja `kwadrat()`, która odwołuje sie do nie istniejącej zmiennej `wykładnik`.
* **Skąd funkcja `kwadrat()` wie, że `wykładnik`, który ma użyć jest równy `2`?**

## <a href="https://en.wikipedia.org/wiki/Closure_(computer_programming)">Domknięcie (closure)</a>

Domknięcie to mechanizm polegający na dołączeniu do funkcji pewnych informacji o stanie, ze środowiska w którym funkcja została utworzona.

Funkcje `kwadrat()` i `sześcian()` przechowują informację o zmiennej swobodnej `wykładnik` i jej wartości.

Atrybut `__code__.co_freevars` zawiera **zmienne swobodne**.

In [18]:
kwadrat.__code__.co_freevars, sześcian.__code__.co_freevars

(('wykładnik',), ('wykładnik',))

Atrybut `__closure__[0].cell_contents` zawiera odpowiadające im wartości.

In [19]:
kwadrat.__closure__[0].cell_contents, sześcian.__closure__[0].cell_contents

(2, 3)

## Zmienne swobodne

* Zmienna swobodna to zmienna, która jest widoczna w pewnej przestrzeni nazw, ale nie została w tej przestrzeni zdefiniowana.
* Zmienna swobodna może być globalna, ale nie musi.

W przykładzie
```python
def fabryka_potęg(wykładnik):
    def potęga(podstawa):
        return podstawa ** wykładnik
    return potęga
```
`wykładnik` jest widoczny w ciele funkcji `fabryka_potęg()`. Funkcja `potęga()` tworzy przestrzeń nazw, w której zmienna `wykładnik` jest swobodna.

## Przykład: `uśredniacz()` z książki L. Ramahlo

In [23]:
def uśredniacz():
    wartości = []
    def średnia(wartość):
        wartości.append(wartość)
        return sum(wartości) / len(wartości)
    return średnia

In [25]:
oceny = uśredniacz()

In [26]:
oceny(5)

5.0

In [27]:
oceny(3)

4.0

In [28]:
oceny(5)

4.333333333333333

In [29]:
oceny.__code__.co_freevars

('wartości',)

In [30]:
oceny.__closure__[0].cell_contents

[5, 3, 5]

## Refaktoryzacja funkcji `uśredniacz()`

Aby obliczyć średnią wystarczy pamiętać dotychczasową sumę wartości i ich liczbę.

Oto pierwsza próba. Jest błędna. Widzisz błąd?

In [31]:
def uśredniacz():
    suma, liczba = 0, 0
    def średnia(wartość):
        suma += wartość
        liczba += 1
        return suma / liczba
    return średnia

* Zmienne `suma` i `liczba` są przypisane w ciele funkcji `średnia()`
* Są to zatem zmienne lokalne.

In [32]:
oceny = uśredniacz()

In [33]:
oceny(5)

UnboundLocalError: local variable 'suma' referenced before assignment

## Rozwiązanie -- instrukcja `nonlocal`

Deklaracja `nonlocal` każe traktować zmienną jak zmienną swobodną, nawet wtedy, gdy zmienna ta jest przypisana.

In [34]:
def uśredniacz():
    suma, liczba = 0, 0
    def średnia(wartość):
        nonlocal suma, liczba
        suma += wartość
        liczba += 1
        return suma / liczba
    return średnia

In [35]:
oceny = uśredniacz()

In [36]:
oceny(5)

5.0

In [37]:
oceny(3)

4.0

In [38]:
oceny(5)

4.333333333333333

In [39]:
oceny.__code__.co_freevars

('liczba', 'suma')

In [41]:
oceny.__closure__[0].cell_contents, oceny.__closure__[1].cell_contents

(3, 13)