<div align="left">
    <img src="images/logo_ismc_spbu.jpg" alt="logo_ismc_spbu" />
</div>

# Введение в программирование на Python 

### Занятие 1. Знакомство с курсом и языком

<br />
<br />
Александр Авдюшенко <br />
3 сентября 2020

![Monty Python](images/monty_python.jpg)

### Основные цели

* сделать первый шаг, после которого можно продолжить самостоятельное изучение
* изучить основные особенности Python, его отличия от других языков программирования
* учиться писать качественный код на Python
* познакомиться с типичными задачами собеседований в IT компании и их решениями


### Темы

* Введение. Базовые типы, условия, циклы. Структуры данных и их представление в памяти
* Функции, ввод-вывод, строки, файлы
* Неймспейсы, замыкания, декораторы
* Пример подготовки даных и обучения градиентного бустинга на Python  


## Язык Python
 * легко [начать использовать](https://colab.research.google.com/)
 * free and open source
 * (почти) portable
 * высокоуровневый
 * интерпретируемый, а не компилируемый
 * REPL = read eval print loop

<div align="center">
    <img src="images/python_interpretation.jpg" alt="Python interpretation" />
</div>

<div align="center">
    <img src="images/python_after_cpp.jpg" alt="Python after C++" />
</div>

In [1]:
# обратите внимание на отступы — это часть синтаксиса
# они выделяют вложенные блоки кода
for i in range(5):
    if not (i % 3 == 0):
        print(i ** 2)

1
4
16


### Ещё пример
Писать на Python — будто писать псевдокод
$$e^x=\sum_{k=0}^\infty \frac{1}{k!}x^k$$

In [2]:
def e(x):
    sum_, k, term = 1, 0, 1
    while True:
        # like return, but creates generator object
        yield sum_
        k += 1
        term *= x / k
        sum_ += term

In [3]:
x = 1
gen_e_x = e(x)

In [4]:
[next(gen_e_x) for _ in range(5)]

[1, 2.0, 2.5, 2.6666666666666665, 2.708333333333333]

In [5]:
[next(gen_e_x) for _ in range(5)]

[2.7166666666666663,
 2.7180555555555554,
 2.7182539682539684,
 2.71827876984127,
 2.7182815255731922]

# Всё в Питоне — это объект

### У любого объекта
* **id** — где лежит (~адрес в памяти)
* **type** — множество значений и операций над этими значениями
* **value** — значение

In [6]:
id(1), id('1')

(140703595602320, 2647426611120)

In [7]:
type(1), type('1') 

(int, str)

In [8]:
a = 1
b = 1

In [9]:
id(a) == id(1), id(a) == id(b), type(a) == type(1)

(True, True, True)

In [10]:
a, b = 257, 257
id(a) == id(257), id(a) == id(b), type(a) == type(1)

(False, False, True)

In [11]:
a is b # equivalent to id(a) == id(b)

False

## [Size of int in the Python](https://www.quora.com/How-many-bytes-does-an-integer-data-occupy-in-the-Python-language)

Как думаете, сколько памяти занимает int? <br />
Вообще 1 бит это 0 или 1, <br />
1 байт = 8 бит, и это уже от 0 до 255 <br />

Может быть в зависимости от платформы <br />
4 байта (32 бита) или <br />
8 байт (64 бита)?

In [3]:
# давайте проверим!
import sys

def print_sizeof(x):
    return f'{x} — {sys.getsizeof(x)} bytes'

print('\n'.join(['Size of int in Python'] + 
          [print_sizeof(x) for x in (0, 1, 10**10, 10**11, 10**50)]))

Size of int in Python
0 — 24 bytes
1 — 28 bytes
10000000000 — 32 bytes
100000000000 — 32 bytes
100000000000000000000000000000000000000000000000000 — 48 bytes


## Почему так много и [не одинаково](https://stackoverflow.com/questions/10365624/sys-getsizeofint-returns-an-unreasonably-large-value)?

In [13]:
isinstance(1, object)

True

[cpython open source realization](https://github.com/python/cpython/blob/ba85d69a3e3610bdd05f0dd372cf4ebca178c7fb/Include/longintrepr.h#L70)
```c++
struct _longobject {
    // macros with
    // 1. the object’s reference count (8 bytes) 
    // 2. and a pointer to the corresponding type object (8 bytes)
    // 3. and extension field ob_size (8 bytes) 
    PyObject_VAR_HEAD 
    // int value adds 0, 4 or 8 bytes 
    digit ob_digit[1]; 
};
```

In [14]:
[method for method in dir(1) if not method.startswith('__')]

['bit_length',
 'conjugate',
 'denominator',
 'from_bytes',
 'imag',
 'numerator',
 'real',
 'to_bytes']

In [15]:
print('\n'.join(['Size of objects in Python'] + 
        [print_sizeof(x) for x in (0.0, 1.0)] + [''] +
        [print_sizeof(x) for x in ("a", "aa", "aaa")] + [''] +
        [print_sizeof(x) for x in (list(), ["a"], ["a", "aaa"])] + [''] +
        [print_sizeof(x) for x in (tuple(), ("a",), ("a", "aaa"))] + [''] +
        [print_sizeof(x) for x in (set(), {"a"})] + [''] +
        [print_sizeof(x) for x in (dict(), {1: "a"})] + ['']))

Size of objects in Python
0.0 — 24 bytes
1.0 — 24 bytes

a — 50 bytes
aa — 51 bytes
aaa — 52 bytes

[] — 64 bytes
['a'] — 72 bytes
['a', 'aaa'] — 80 bytes

() — 48 bytes
('a',) — 56 bytes
('a', 'aaa') — 64 bytes

set() — 224 bytes
{'a'} — 224 bytes

{} — 240 bytes
{1: 'a'} — 240 bytes



Словари (dict) и множества (set) в Python реализованы как hash-таблицы, [подробности тут](https://stackoverflow.com/questions/327311/how-are-pythons-built-in-dictionaries-implemented).

| index | slot |
| :----: | :---------------: |
| 0 | <hash\|key\|value> |
| 1 | ... |
| . | ... |
| i | ... |
| . | ... |
| n | ... |

 ## Язык Python
 * мультипарадигменный (объектно-ориентированный, функциональный)
 * «батарейки в комплекте» (богатая стандартная библиотека)
 * PEP (python enhanced proposal), [новое в Python 3.8](https://docs.python.org/3/whatsnew/3.8.html)
 * строгая динамическая типизация*

## Куайн (квайн, англ. quine) 
Компьютерная программа, которая выдаёт на выходе точную копию своего исходного текста. <br />
При этом программы, использующие внешние данные (чтение текста программы из файла, ввод его с клавиатуры и так далее), куайнами не считаются.

In [16]:
_='_=%r;print (_%%_)';print (_%_)

_='_=%r;print (_%%_)';print (_%_)


### Задача 7 из первого домашнего задания. 
**Сумма двух.** На входе список целых чисел и заданное целое число. Нужно вернуть индексы двух чисел из списка, сумма которых равна заданному числу. 

Предполагается, что есть ровно одно решение и нельзя использовать один и то же элемент дважды.

In [17]:
%%writefile two_sum_tests.py

def two_sum(nums, target):
    ans = [0, 1]
    return ans

def test_sorted():
    nums = [2, 7, 11, 15]
    target = 9
    expected = [0, 1]
    output = two_sum(nums, target)
    assert output == expected
    
def test_not_sorted():
    nums = [2, -7, 11, 15]
    target = 4
    expected = [1, 2]
    output = two_sum(nums, target)
    assert output == expected

Writing two_sum_tests.py


In [18]:
!pytest two_sum_tests.py

platform win32 -- Python 3.7.6, pytest-5.3.5, py-1.8.1, pluggy-0.13.1
rootdir: C:\
plugins: hypothesis-5.5.4, arraydiff-0.3, astropy-header-0.1.2, doctestplus-0.5.0, openfiles-0.4.0, remotedata-0.3.2
collected 2 items

two_sum_tests.py .F                                                      [100%]

_______________________________ test_not_sorted _______________________________

    def test_not_sorted():
        nums = [2, -7, 11, 15]
        target = 4
        expected = [1, 2]
        output = two_sum(nums, target)
>       assert output == expected
E       assert [0, 1] == [1, 2]
E         At index 0 diff: 0 != 1
E         Use -v to get the full diff

C:\cygwin64\home\avalur\ismc\python-2020-main\lessons\01.intro.python\two_sum_tests.py:18: AssertionError


[Репозиторий курса на Гитхабе](https://github.com/ismc-spbu-courses/python-2020)

Спасибо за внимание, всё на сегодня.