# Python и инструменты машинного обучения


<img src="https://www.python.org/static/community_logos/python-logo-master-v3-TM.png" align="right" style="height: 200px;"/>

# Занятие 1. Знакомство с Python. Типы данных. Условия

# Jupyter Notebook и Google Colab

Для работы мы будем использовать Jupyter Notebook'и.

<img src="https://jupyter.org/assets/homepage/main-logo.svg" width=200/>

Название проекта Jupyter - это ссылка на три основных языка программирования, поддерживаемых Jupyter: Julia, Python и R, а также дань уважения записным книжкам Галилея, записывающим открытие лун Юпитера. Проект Jupyter разработал и поддержал интерактивные вычислительные продукты Jupyter Notebook, JupyterHub и JupyterLab, версию следующего поколения Jupyter Notebook. Философия проекта Jupyter заключается в поддержке интерактивной науки о данных.

Чем удобен Jupyter Notebook? Блокнот (notebook) объединяет в себе:

- код и его вывод
- визуализации
- повествовательный текст, математические уравнения и другие мультимедиа.

Это свойство способствует итеративной и быстрой разработке, что делает ноутбуки все более популярным выбором для представления в данных и их анализа.

С практической точки зрения, в ноутбуке есть два типа ячеек: ячейки с текстом (как эта) и ячейки с кодом (встретимся дальше). Текстовые ячейки поддерживают язык разметки [Markdown](https://paulradzkov.com/2014/markdown_cheatsheet/), что позволяет красиво оформлять текст!

Сейчас мы находимся в ноутбуке, размещенном на сервисе Google Colab. Он позволяет без установки программ на ваш компьютер выполнять код на Python с использованием вычислительных мощностей Google. Имеется короткий [туториал от Google](https://colab.research.google.com/notebooks/welcome.ipynb#scrollTo=GJBs_flRovLc).

# Знакомство с Python

# Историческая справка

Язык Python разрабатывался Гвидо ван Россумом с 1989 г.

![guido](https://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Guido_van_Rossum_OSCON_2006.jpg/400px-Guido_van_Rossum_OSCON_2006.jpg)

*Source: [Wikipedia](https://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Guido_van_Rossum_OSCON_2006.jpg/400px-Guido_van_Rossum_OSCON_2006.jpg)*

Назван в честь популярного британского комедийного телешоу 1970-х "Летающий цирк Монти Пайтона".

**Основные (мажорные) версии:**
* Python 1.0 — январь 1994
* Python 2.0 — 16.10.2000
  * Python 2.7.18 - 20.04.2020 (последний релиз, больше не поддерживается)
* Python 3.0 — 3.12.2008
  * Python 3.10.0 - 04.10.2021

Python вобрал в себя множество удобных и полезных аспектов других языков программирования (ABC, Lisp, Haskell, C, C++).

Благодаря своей нацеленности на ясный синтаксис, Python играл центральную роль в проекте "Computer Programming for Everybody", предназначенном сделать программирование доступным для большего числа людей, на основе получения базовой «компьютерной грамотности». 





# Основные свойства Python


## Интерпретируемость

### Лирическое отступление. Чем отличаются компилируемые и интерпретируемые языки?

Компьютер не понимает синтаксис языков программирования напрямую, ему нужно передавать *компьютерный код*.

- В **компилируемых** используется специальная программа - **компилятор**, которая берет программу **целиком** и преобразует (компилирует) ее в исполняемый компьютерный код. После этого компьютер может исполнять скомпилиированную программу. Компилятор способен выполнять многие или даже все операции: предварительную обработку исходной программы, парсинг, семантический анализ, преобразование входных программ в промежуточное представление, оптимизацию и генерацию кода.

    ![compiler](https://cdn-images-1.medium.com/max/533/0*OaEDlCa01FEDRIQ8)
    
    *Source: [NoP](https://nuancesprog.ru/p/12524/)*

- В **интерпретируемых** преобразование осуществляется **интерпретатором** последовательно - оператор за оператором.

    ![interpreter](https://cdn-images-1.medium.com/max/533/0*MddNw1pcH9OJiekl)

    *Source: [NoP](https://nuancesprog.ru/p/12524/)*


И **компилятор**, и **интерпретатор** выполняют одну и ту же работу  —  преобразовывают язык программирования высокого уровня в машинный код. Однако **компилятор** преобразовывает исходный материал в машинный код **перед запуском** программы. **Интерпретатор** выполняет эту функцию **при ее запуске**.

Примеры компилируемых языков программирования - C, C++.

Примеры интерпретируемых языков программирования - Perl, Python и Matlab.

#### Преимущества и недостатки

**Преимущества компилятора:**
- Программный код переводится целиком - можно оптимизировать его на низком уровне, тем самым сделать **быстрее**
- Объектные программы **лучше защищены от изменения** пользователем сложнее изменить, чем исходный код
- Компилятор **проверяет исходный код** на наличие синтаксических ошибок во время компиляции

**Недостатки компилятора:**
- Поскольку переводится вся программа, она **использует гораздо больше памяти** компьютера
- При работе с компилятором **невозможно\* изменить программу**, не вернувшись к исходному коду
- Компилирование может занимать **очень много времени**

    ![compiling](https://xkcd.ru/i/303_v2.png)

    *Source: [xkcd.ru](https://xkcd.ru/303/)*
- Исходный код должен быть **на 100% верным** для создания исполняемого файла
- Компилирование выполняется **только под определенную платформу** (x86, arm, ...)

**Преимущества интерпретатора:**
- С интерпретатором **проще работать с исходным кодом**
- Перевод по одной инструкции за раз, поэтому использует **минимальный объем памяти**

**Недостатки интерпретатора:**
- Каждый раз, когда программа выполняется, тратится время на интерпретацию, из-за чего **затягивается время исполнения**
- Для запуска интерпретируемой программы **необходим интерпретатор**

Python является **интерпретируемым** языком программирования. Его интепретатор называется `python`:

In [None]:
!python --version

Python 3.7.13


**Замечание 1:** вот мы и дошли до первой ячейки с кодом. Чтобы выполнить ее содержимое, есть несколько способов:
*   ctrl + enter  (ячейка выполнится)
*   shift + enter (ячейка выполнится + перейдем вниз)
*   треугольничек в левой части строки

**Замечание 2:** восклицательный знак перед `python` необходим, если вы хотите выполнить терминальную команду из Jupyter Notebook. Если вы запускаете интерпретатор из консоли, то восклицательный знак не нужен.

По этой причине мы можем выполнять команды из языка Python поштучно и сразу наблюдать их результат, чем и будем пользоваться на занятиях.

## Сильная динамическая неявная типизация

**Типизация** — это то, как язык распознаёт типы переменных.
    

### Сильная / слабая типизации

Также известны как строгая / нестрогая типизации. Показывает можно ли совершать операции с разными типами данных.

В языках со слабой типизацией возможны операции типа: `число + строка`. Обычно это достигается за счет определенных правил приведения типов, которые применяются неявно. Это может быть как удобно, так и запутывающе:

![weak_typo](http://sun9-41.userapi.com/impf/c852136/v852136356/1abb55/B-qZf_l-sQk.jpg?size=604x604&quality=96&sign=dd974c5903dc07517b1026f7f963dac8&type=album)

*Source: [/dev/null](https://vk.com/wall-72495085_997870)*

**Примеры:**
- **Сильная:** Perl, Ruby, Python
- **Слабая:** C, C++





Пример сильной типизации в Python:

In [None]:
3 + 'string'

TypeError: ignored

**Замечание 1:** мы с вами впервые столкнулись с ошибкой на Python. В большинстве случаев чтобы понять, что происходит не так, достаточно посмотреть на какую строчку ругается Python и перевести текст ошибки. Поэтому для программистов рекомендуется знать английский хотя бы на базовом уровне.

**Замечание 2:** часто Python используют не столько как язык программирования, как продвинутый калькулятор, позволяющий удобно выполнять большие вычисления.

### Статическая / динамическая

При статической типизации конечные типы переменных устанавливаются до выполнения программы, обычно на этапе компиляции. Так, в динамически типизированном языке у одной и той же переменной могут быть разные типы в разных частях программы, а в статически типизированном, если вы задали переменной тип string, у неё будет только тип string.

**Примеры:**
- **Статическая:** C, Java, C#
- **Динамическая:** Python, JavaScript, Ruby, Objective-C

Пример динамической типизации в Python:

In [None]:
a = 3
type(a)

int

In [None]:
a = 'hello'
type(a)

str

**Замечание:** здесь мы сталкиваемся с незнакомой функцией `type`. Пока ее можно воспринимать как функцию, возвращающую тип переменной. Сегодняшнее занятие - во многом вводное в плане Python, и ко многим вещам мы впоследствии вернемся и рассмотрим подробнее.

### Явная / неявная типизация

Явно-типизированные языки отличаются тем, что тип новых переменных, функций и их аргументов нужно задавать явно. Языки с неявной типизацией перекладывают эту задачу на компилятор / интерпретатор.

**Примеры:**
- **Явная:** C++, C#, Rust
- **Неявная:** Python, PHP, JavaScript

Пример неявной типизации в Python:

In [None]:
a = 0
type(a)

int

## Управление памятью

Выделение и освобождение памяти в Python происходит автоматически - не нужно следить за выделяемой памятью и чистить за собой. Тем не менее, забить память все еще можно.

Подробности работы сбора мусора можно узнать [здесь](https://towardsdatascience.com/memory-management-and-garbage-collection-in-python-c1cb51d1612c).

In [None]:
a

'hello'

In [None]:
del a

In [None]:
a

NameError: ignored

# Дзен Python

**Дзен Python** — это набор из 19 «руководящих принципов» написания программ, влияющих на структуру языка программирования Python. 

In [None]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Трудности перевода

Как понять принцип: `Complex is better than complicated.`, ведь `complex`, и `complicated` переводятся как `сложный`?

### Пояснение


*Source: [StackOverflow](https://stackoverflow.com/a/4568733)*

**Complex:** Does a lot. Usually unavoidable.

**Complicated:** Difficult to understand.

I like this quote (source):

>A complex person is like an iPod. That is to say that they are consistent, straightforward and ‘user friendly’ while also being rather sophisticated. Unlike the complicated person, interacting with a complex person does not require special knowledge of their complicated ways-because their ways are not complicated. When mistakes are made, they tend to be very forgiving because they understand that people are imperfect. In short, they are mature, sensible human beings.

# Основы Python

В Python создание переменной и присваивание\* ей значения выполняется следующим образом: 

In [None]:
variable = 4

Чтобы вывести значение переменной, можно воспользоваться функцией `print` или просто написать имя этой переменной (только в интерактивном режиме!):

In [None]:
print(variable)

4


In [None]:
variable

4

В Python еще можно делать так:

In [None]:
x = y = 500
x, y, x is y

(500, 500, True)

In [None]:
x, y = 100, 300
x, y = y, x
x, y

(300, 100)

In [None]:
print(x, y)
z = x
x = y
y = z
print(x, y)

300 100
100 300


Крайне полезная для вас функция - `help`. Она позволяет получить справку по разным объектам. Сейчас нам она полезна для того, чтобы получать документацию по функциям, например для функций `print` и `id`:

In [None]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [None]:
print(x, y, sep='\n', end='test')

100
300test

In [None]:
help(id)

Help on built-in function id in module builtins:

id(obj, /)
    Return the identity of an object.
    
    This is guaranteed to be unique among simultaneously existing objects.
    (CPython uses the object's memory address.)



In [None]:
id(x)

11259232

# Базовая арифметика

Одна из основных задач языка программирования - выполнять арифметические операции над переменными. Само собой, Python тоже позволяет это делать:

`+`, `-`, `*`, `/` - простейшие операции

In [None]:
(1 + 6) / 4 - 2 * 3

-4.25

`//`, `%` - целочисленное деление и остаток от деления

In [None]:
45 // 6, 45 % 6

(7, 3)

`**` - возведение в степень

In [None]:
2 ** 10

1024

Также в Python имеются специальные значения для бесконечностей и значения "not a number" aka `nan`:

In [None]:
float('inf'), 2 * float('inf'), float('inf') + 1000000

(inf, inf, inf)

In [None]:
float('-inf'), 2 * float('-inf'), float('-inf') + 1000000

(-inf, -inf, -inf)

In [None]:
float('Inf') - float('Inf')

nan

In [None]:
1 / 0

ZeroDivisionError: ignored

Кроме того, в Python есть такие небольшие удобства для записи чисел как разделители и экспоненциальная запись чисел:

In [None]:
100_000_000

100000000

In [None]:
1.5e-2

0.015

Помимо стандартного оператора присваивания\*, в Python есть вспомогательные операторы, которые перед присваиванием выполняют арифметическую операцию:

In [None]:
a = 1900
a += 1   # a = a + 1
a -= 2   # a = a - 2
a *= 3   # a = a * 3
a /= 4   # a = a / 4
a //= 2  # a = a // 2
a **= 2  # a = a ** 2
a %= 6   # a = a % 6

# Базовые типы данных

## int

`int` - целочисленный тип данных:

In [None]:
42, type(42)

(42, int)

Этот тип данных поддерживает длинную арифметику (подробнее [тут](https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk)):

In [None]:
2 ** 10000

1995063116880758384883742162683585083823496831886192454852008949852943883022194663191996168403619459789933112942320912427155649134941378111759378593209632395785573004679379452676524655126605989552055008691819331154250860846061810468550907486608962488809048989483800925394163325785062156830947390255691238806522509664387444104675987162698545322286853816169431577562964076283688076073222853509164147618395638145896946389941084096053626782106462142733339403652556564953060314268023496940033593431665145929777327966577560617258203140799419817960737824568376228003730288548725190083446458145465055792960141483392161573458813925709537976911927780082695773567444412306201875783632550272832378927071037380286639303142813324140162419567169057406141965434232463880124885614730520743199225961179625013099286024170834080760593232016126849228849625584131284406153673895148711425631511108974551420331382020293164095759646475601040584584156607204496286701651506192063100418642227590867090057460641785695191145605506

## float

`float` - тип данных, хранящий число с плавающей точкой (дробное число). В качестве разделителя используется только точка `.`:


In [None]:
42.42, type(42.42)

(42.42, float)

Тип `float` основан на `double` из C, поэтому поддерживает значения только в определенном диапазоне и с определенной точностью:

In [None]:
from sys import float_info

precision = float_info.min * float_info.epsilon
max_value = float_info.max

In [None]:
print(max_value, max_value * 2)

1.7976931348623157e+308 inf


In [None]:
print(precision, precision / 2)

5e-324 0.0


Для округления чисел с плавающей точкой в Python имеется функция `round`, работающая по правилу ["округления банкира"](https://ru.wikipedia.org/wiki/%D0%9E%D0%BA%D1%80%D1%83%D0%B3%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5#:~:text=banker's%20rounding%20%E2%80%94%20%C2%AB%D0%BE%D0%BA%D1%80%D1%83%D0%B3%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B1%D0%B0%D0%BD%D0%BA%D0%B8%D1%80%D0%B0%C2%BB,(%D0%BC%D0%BE%D0%B6%D0%B5%D1%82%20%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D1%82%D1%8C%D1%81%D1%8F%20%D0%B2%20%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B5)) (до ближайшего четного числа):

In [None]:
round(0.3)

0

In [None]:
round(0.5)

0

In [None]:
round(1.5)

2

Дополнительно можно указать до какого знака стоит округлять:

In [None]:
round(3.1415, 1)

3.1

### Арифметика с плавающей точкой

In [None]:
0.1 + 0.2

0.30000000000000004

Подробнее про числа с плавающей точкой - https://habr.com/ru/post/112953/

## complex

`complex` - тип для работы с комплексными числами. Мнимая часть описывается с помощью символа `j` (вместо `i` в математике): 

In [None]:
2 + 3j, type(2 + 3j)

((2+3j), complex)

In [None]:
(2 + 3j) * (2 + 3j)

(-5+12j)

## bool

`bool` - логический тип данных. Может принимать лишь два значения - `True` и `False` (именно с заглавной буквы):

In [None]:
True, type(True)

(True, bool)

 Тип `bool` является подтипом `int`, поэтому между ними возможны операции сравнения без явного приведения типов:

In [None]:
True == 1

True

In [None]:
True > 2

False

## str

`str` - строковый тип данных, т.е. может хранить в себе символьные строки произвольной длины:

In [None]:
"abc", type("abc")

('abc', str)

Выделяется двойными или одинарными кавычками (открывающая и закрывающая должны быть одинаковы!):

In [None]:
'abc'

'abc'

In [None]:
'abc"

SyntaxError: ignored

В Python также возможны многострочные строки:

In [None]:
string = """и 
я 
тоже
строка"""
print(string)

SyntaxError: ignored

Кроме того, в Python (как и во многих других ЯП) имеются комментарии - строки кода, которые игнорируются при запуске программы. Однострочные комменатарии начинаются с `#`:

In [None]:
# Я однострочный комментарий

In [None]:
print('a')
"""
print('a')
print('a')
print('a')
"""
print('a')

a
a


Строки можно складывать, строку можно домножать на целое число, можно проверять вхождение подстроки в строку:

In [None]:
s1 = "very_big_string"
s2 = 'string'

In [None]:
s1 + s2

'very_big_stringstring'

In [None]:
s2 * 4

'stringstringstringstring'

Несмотря на то, что по-умолчанию операции между разными типами данных запрещены, некоторые все-же возможны:

In [None]:
'abc' * 4

'abcabcabcabc'

У строк в Python имеется огромное количество полезных методов (грубо, функций), которые вы найдете полезными в ходе работы. Подробнее мы остановимся на них позднее, а пока можете ознакомиться с ними в статье [по ссылке](https://pythonworld.ru/tipy-dannyx-v-python/stroki-funkcii-i-metody-strok.html).

Сейчас же остановимся на одном из них - метод `split`. Он позволяет разбить строку по подстроке. Проще всего это понять на примере:

In [None]:
string = "one two three two three four"
substring = "two"

print(string.split(substring))

['one ', ' three ', ' three four']


In [None]:
a = "1 2 3"
a.split()

['1', '2', '3']

**Замечание:** методы вызываются для переменных следующим образом - `variable.method(arguments)`.

На выходе получаем список строк, которые были разделены между собой подстрокой `substring`.

К отдельным символам строки можно получить доступ по их индексу (порядковый номер). Как и во всех взрослых языках програмирования, Python использует 0-индексацию (самый первый элемент имеет индекс 0):

In [None]:
string = "hello world!"
print(string[0], string[1], string[5])

h
e
 


Кроме того, Python поддерживает отрицательную индексацию, с помощью которой удобно брать элементы с конца строки:

In [None]:
print(string[-2])

d


## NoneType

`NoneType` - специальный тип данных для объекта `None`:

In [None]:
None, type(None)

(None, NoneType)

### Что такое `None`?

`None` - специальное значение переменной, означающее "ничего" или "отсутствие значения". Является аналогом `null` из других языков программирования.

Существует много случаев, когда следует использовать None.

Часто вы хотите выполнить действие, которое может работать либо завершиться неудачно. Используя `None`, вы можете проверить успех действия.

**Пример:** в своей программе вы хотите подключиться к базе данных с помощью библиотеки и хотите проверить, создалась ли ваша база данных, вы можете осуществить эту проверку, сравнив переменную базы данных с None. Примерно так:

```
database = MyDatabase(db_host, db_user, db_password, db_database)

if database is None:
    print('Пусто')
```

## Приведение базовых типов

Базовые типы данных часто можно преобразовывать из одного в другой следующим образом:

In [None]:
int('123')

123

In [None]:
str(345)

'345'

In [None]:
float(5)

5.0

In [None]:
int(234.5)

234

**Замечание:** при преобразовании переменной из `float` в `int` дробная часть отбрасывается:

In [None]:
int(3.14)

3

In [None]:
int(-3.14)

-3

In [None]:
int(2.73)

2

Но преобразование не всегда возможно:

In [None]:
float('12.a')

ValueError: ignored

### Приведение к bool

Для `int` и `float`: `0` и `0.0` переводятся в `False`, все остальное - в `True`:

In [None]:
bool(0), bool(0.0)

(False, False)

In [None]:
bool(1), bool(24.1)

(True, True)

In [None]:
bool(-2), bool(-12.3)

(True, True)

Для `str`: пустые строки - в `False`, остальное - в `True`:

In [None]:
bool(''), bool('')

(False, False)

In [None]:
bool(None)

False

In [None]:
bool(1+0j)

True

In [None]:
bool(0+1j)

True

In [None]:
bool(0+0j)

False

# Контейнеры

**Контейнеры** - типы данных, экземпляры которых содержат в себе один или несколько других элементов.

- `list` - список
- `tuple` - кортеж
- `dict` - словарь
- `set` - множество

Сейчас лишь познакомимся с ними, а подробнее рассмотрим их на следующем занятии.

## list

**Список** аналогичен `vector` из C++, но может содержать элементы разных типов:

In [None]:
l = [1, 2.0, 'string!', None, True]  # или list(...)
l

[1, 2.0, 'string!', None, True]

Доступ к элементам по индексу (0-индексация):

In [None]:
l[0], l[2]

(1, 'string!')

Поддерживает отрицательные индексы, позволяющие брать элементы с конца списка:

In [None]:
l[-1], l[-3]

(True, 'string!')

Можно добавлять, удалять и изменять элемента:

In [None]:
l.append('new_element')
l

[1, 2.0, 'string!', None, True, 'new_element']

In [None]:
l.remove(2.0)
l

[1, 'string!', None, True, 'new_element']

In [None]:
l[0] = 122
l

[122, 'string!', None, True, 'new_element']

In [None]:
l1 = [0, 1, 2, 1, 3, 3]
print(l1)
l1.remove(1)
print(l1)

[0, 1, 2, 1, 3, 3]
[0, 2, 1, 3, 3]


In [None]:
help(l1.remove)

Help on built-in function remove:

remove(value, /) method of builtins.list instance
    Remove first occurrence of value.
    
    Raises ValueError if the value is not present.



In [None]:
l1.remove(1)

In [None]:
l1.remove(1)

ValueError: ignored

Кроме того, списки можно соединять между собой с помощью операции сложения:

In [None]:
[1] + [2, 3]

[1, 2, 3]

Как и строки, списки можно домножать на целое число:

In [None]:
[2, 3, 4] * 3

[2, 3, 4, 2, 3, 4, 2, 3, 4]

## tuple

**Кортеж** так же является массивом элементов разных типов и во многом идентичен списку:

In [None]:
t = (1, 2.0, 'string!', None, True)  # или tuple(...)
t

(1, 2.0, 'string!', None, True)

Доступ к элементам кортежа так же осуществляется по индексу, так же поддерживаются отрицательные индексы:

In [None]:
t[0], t[-1]

(1, True)

Кортежи так же можно складывать между собой и домножать на число:

In [None]:
t + (1, 2, 3)

(1, 2.0, 'string!', None, True, 1, 2, 3)

In [None]:
2 * t

(1, 2.0, 'string!', None, True, 1, 2.0, 'string!', None, True)

**Основное отличие** - кортеж в отличие от списка является **неизменяемым**, т.е. у него отсутствуют операции добавления, удаления и изменения элементов:


In [None]:
t[0] = 122
t

TypeError: ignored

In [None]:
t.append(1)

AttributeError: ignored

In [None]:
t.remove(1)

AttributeError: ignored

Будьте осторожны при создании кортежа из одного элемента:

In [None]:
tup = (1)
print(tup, type(tup))

tup = (1, )
print(tup, type(tup))

1 <class 'int'>
(1,) <class 'tuple'>


In [None]:
t1 = (1,2,[3])
print(t1, type(t1))
t1[2].append(4)
print(t1)

(1, 2, [3]) <class 'tuple'>
(1, 2, [3, 4])


**Вопрос** - зачем нужен `tuple`, если есть более удобный в использовании `list`?

### Spoiler

**Преимущества кортежа:**
1. **Кортежи работают быстрее списков.** Если нужен константный массив, то лучше использовать кортежи.
2. **Защита данных от записи.** Кортежи позволяют явно защитить данные от изменений.
3. **Могут быть использованы как ключи для словарей.** Некоторые кортежи являются хэшируемыми, и поэтому могут использоваться в качестве ключей для словарей.

## dict

**Словарь** - key-value хранилище (хранит пары "ключ-значение"), позволяет получать доступ к объектам не по целочисленному индексу, а по объекту-ключу. В качестве ключа может использоваться любой **хэшируемый** объект.

Аналогичен `map` из C++, но может работать с несколькими типами данных в рамках одного хранилища.

In [None]:
d = {11: "data", 2.3: "more_data", True: 42}  # или dict(...)
d

{11: 'data', 2.3: 'more_data', True: 42}

Получение данных происходит либо с помощью $[$key$]$, либо с помощью метода `get()`:

In [None]:
d[11], d.get(2.3)

('data', 'more_data')

Если в словаре нет запрашиваемого ключа, то первым способом получим ошибку, а вторым - `None`:

In [None]:
d.get(2)

In [None]:
d[2]

KeyError: ignored

Поскольку в качестве ключа может использоваться любой хэшируемый объект, то можем использовать некоторые (но не все) кортежи и не можем использовать списки:

In [None]:
d[(1, 2, 3)] = 'success1!'
d[(1, 2, 3)]

'success1!'

In [None]:
d[(1, 2, [3])] = 'success2!'

TypeError: unhashable type: 'list'

In [None]:
d[[1, 2, 3]] = 'success3!'

TypeError: unhashable type: 'list'

## set

**Множество** - набор уникальных объектов. Можем добавлять и удалять элементы из множества, а также проверять наличие элемента в множестве.

Аналогичен `ordered_set` из C++, но может содержать объекты разных типов.

In [None]:
s = {1, 2.0, "3", False, None}  # или set(...)
s

{1, 2.0, '3', False, None}

**Замечание** - пустое множество создается только как `set()`, в случае `{}` создастся пустой словарь.

In [None]:
t = {}
type(t)

dict

Для добавления, удаления и проверки наличия элемента в множестве существуют методы `add` и `remove` и оператор `in`:

In [None]:
s.add(-4)
s

{-4, 1, 2.0, '3', False, None}

In [None]:
s.remove('3')
s

{-4, 1, 2.0, False, None}

In [None]:
1 in s

True

Поскольку множество содержит лишь **уникальные** элементы, то добавление одинаковых элементов не меняет множество: 

In [None]:
print(s)
s.add(1)
s.add(1)
s.add(2.0)
s.add(2.0)
print(s)

{False, 1, 2.0, None, -4}
{False, 1, 2.0, None, -4}


## Приведение контейнеров

Можно изменить тип данных с помощью `set()`, `list()`, `tuple()`:

In [None]:
l = [1, 2, 1, 5, 5, 6]
set(l)

{1, 2, 5, 6}

In [None]:
t = (1, 5)
list(t)

[1, 5]

In [None]:
s = "abab"
tuple(s)

('a', 'b', 'a', 'b')

### Приведение к bool

Для `tuple`, `list`, `set`, `dict`: пустые контейнеры - в `False`, остальное - в `True`:

In [None]:
bool((1, 2)), bool(())

(True, False)

In [None]:
bool(['x', 'y',]), bool([])

(True, False)

In [None]:
bool({12.5, 45.7}), bool(set())

(True, False)

In [None]:
bool({'1': 1, '2': '2'}), bool({})

(True, False)

## Функция len

Поскольку контейнеры содержат в себе несколько элементов, хотелось бы узнавать точно это количество. Здесь на помощь приходит функция `len`:

In [None]:
string = "Hello, world!"

print(len(string))

13


# Срезы

В Python имеется удобный способ выбирать диапазон элементов из строк, списков и кортежей. Он называется срез (slicing) и выглядит следующим образом:

```python
variable[start:stop:step]
```
где `start` - индекс начала выборки (включается), `stop` - индекс завершения выборки (исключается), `step` - шаг выборки. Если не указывать значения, то берутся значения по умолчанию: `start=0`, `end=len(...)`, `step=1`.

Рассмотрим на примере:

In [None]:
string = "abcdefgh"
print(string[1:7:2])

bdf


В итоге мы взяли все элементы, начиная с индекса `1` (b) до индекса `7` (h, исключая) с шагом 2.

Аналогично срезы работают и для списков и кортежей:

In [None]:
lst = [1, 2, 3, 4, 5.0]

print(lst[::2])

[1, 3, 5.0]


Полученный срез часто удобно сохранять в отдельную переменную:

In [None]:
sub_lst = lst[::3]
print(sub_lst)

[1, 4]


Заметим, что шаг необязательно должен быть положительным:

In [None]:
print(lst[::-1])

[5.0, 4, 3, 2, 1]


# Оператор `in`

Для проверки вхождения объекта в контейнер в Python существует операторы `in` и `not in`:

In [None]:
l = [1, 2, 3, 'check', 'mate']
print(1 in l, 2 not in l, 'check' in l)

True False True


Его же можно использовать и для проверки вхождения подстроки в строку:

In [None]:
string = "hello world"
substring = "ell"

print(substring in string)

True


# Почему присваивание со звездочкой?




В Python по сути нет оператора присваивания в классическом понимании, т.е. оператора который всегда выделяет новую ячейку в памяти и записывает в нее значение. Вместо этого оператор `=` является оператор связывания, который связывает имя переменной с адресом объекта в пямяти.

### Пример 1

Создадим произвольный список `x`:

In [None]:
x = [1, 2, 3]

Теперь создадим переменную `y` и присвоим ее `x`, а переменной `z` присвоим то же значение, что и у `x`:

In [None]:
y = x
z = [1, 2, 3]

Воспользуемся функцией `id` и проверим физические адреса в оперативной памяти переменных `x` и `y`:

In [None]:
print(id(x), id(y), id(z))

139644467485984 139644467485984 139644467161280


Как видим, адреса у `x` и `y` одинаковые, т.е. они фактически указывают на один и тот же объект.

Попробуем изменить список `x`:

In [None]:
x.append(4)
print(x, y, z)

[1, 2, 3, 4] [1, 2, 3, 4] [1, 2, 3]


Как видим, изменилась и переменная `y`, т.к. ссылается на тот же самый участок памяти. 

## Пример 2

Теперь мы поняли, что лучше явно указывать значения переменных, если хотим, чтобы они были независимы. Попробуем явно создать две переменные и посмотрим на их id:

In [None]:
x = 13
y = 13
print(id(x), id(y))

11256448 11256448


In [None]:
x = -6
id(x)

140558737427408

In [None]:
x -= 1
id(x)

140558737427792

In [None]:
y = -6
id(y)

140558726399344

Странно, мы же создали переменные явно несвязанными, тогда почему у них одинаковый id?

Это связано с тем, что в Python целые числа от -5 до 256 являются *синглтонами*, т.е. существуют в памяти только в единственном экземпляре. При попытке создать переменную в этом диапазоне в итоге она будет всегда ссылаться на этот объект.

Это же верно и для `True`, `False` и `None`.

# Оператор `is`

Оператор `is` позволяет сравнивать две переменные и возвращает `True`, если обе переменные ссылаются на одну и ту же область памяти.

Другими словами, оператор `is` проверяет идентичность двух переменных.

In [None]:
a = 13
b = 13
print(a is b)

True


In [None]:
a = 40000
b = 40000
print(a is b)

False


# Логические операторы

Python позволять логические операции:

- `and` - логическое И, логическое произведение
- `or` - логическое ИЛИ, логическая сумма
- `not` - логическое НЕ

In [None]:
a, b = True, False

In [None]:
a and b

False

In [None]:
a or b

True

In [None]:
not b

True

# Операторы сравнения

- `<`, `<=` - "меньше", "меньше или равно"
- `>`, `>=` - "больше", "больше или равно"
- `==`, `!=` - "равно", "не равно"

In [None]:
4 < 5

True

In [None]:
3 >= 2

True

In [None]:
1 != 1

False

Также можно сравнивать строки, списки и кортежи. Сравнение происходит лексикографически (как в словаре):

In [None]:
'a' < 'b'

True

In [None]:
'aa' < 'ab'

True

In [None]:
'aaaa' < 'ab'

True

In [None]:
[2] < [1, 3]

False

In [None]:
(2,) > (1, 3)

True

# Побитовые операторы

Python позволяет вполнять и побитовые операции:

- `&` - побитовое И
- `|` - побитовое ИЛИ
- `^` - побитовое ИЛИ НЕ (исключающее ИЛИ)
- `~` - побитовое НЕ (инвертирование)
- `<<` - бинарный сдвиг влево
- `>>` - бинарный сдвиг вправо

In [None]:
help(format)

Help on built-in function format in module builtins:

format(value, format_spec='', /)
    Return value.__format__(format_spec)
    
    format_spec defaults to the empty string.
    See the Format Specification Mini-Language section of help('FORMATTING') for
    details.



In [None]:
a, b = 60, 13
print(a, format(a, "08b"))  # format(x, "08b") выдает битовое представление числа
print(b, format(b, "08b"))

60 00111100
13 00001101


In [None]:
a & b, format(a & b, "08b")    # bitwise AND

(12, '00001100')

In [None]:
a | b, format(a | b, "08b")    # bitwise OR

(61, '00111101')

In [None]:
a ^ b, format(a ^ b, "08b")    # bitwise XOR

(49, '00110001')

# Работа с вводом-выводом

Для считывания данных из `stdin` (стандартный ввод) используется функция `input()`:

In [None]:
t = input()
t

213567ываыва


'213567ываыва'

In [None]:
s = input("Input here: ")
s

Input here: йцукен


'йцукен'

Для вывода данных в `stdout` (стандартный вывод) используется `print()`:

In [None]:
print('spam', 'and', 'eggs', end='!', sep='_')

spam_and_eggs!

In [None]:
print('e', end='')
print('n', end='')
print('d', end='')

end

# Условный оператор

В программах часто приходится проверять выполнимость или невыполнимость каких-то условий. Синтаксис следующий

```
if <условие1 (булевское выражение)> :
    <код, который выполнится, если условие верно>
elif <условие2 (булевское выражение)>:
    <код, который выполнится, если условие1 было неверно, а условие2 верно>
else:
    <код, который выполнится, если условие1 и условие2 были неверны>
```

Обратите внимание, что код, который должен выполняться внутри каждого условия, записывается с отступом в 4 пробела от уровня if, elif и else: в питоне области видимости переменных обозначаются отступами.

*То есть, отступы позволяют понять, где начинается код, который должен выполняться при выполнении условия в if, и где заканчивается*

Рассмотрим пример: пусть в нашем коде есть переменная x. Пусть мы хотим вывести на экран сообщение "x отрицателен", если x<0, "x равен нулю", если x=0 и "x положителен", если x>0. Код будет следующий:

вместо булевского выражения можно подставить любой объект, который может быть приведен к типу bool

In [None]:
a = 1

if a > 0:
    print(a)




    print('hello')

1
hello


In [None]:
a = 1

if a > 0:
    print(a)

elif a == 0:
    print("a eq 0")

1


In [None]:
a = 0

if a > 0:
    print(a)
elif a == 0:
    print("a eq 0")
elif a == -1:
    print("a eq -1")
else:
    print('else')

a eq 0


In [None]:
x = 0
# определим знак числа

if x < 0:
    print("x отрицателен")
elif x == 0:
    print("x равен нулю")
elif x > 0:
    print("x положителен")
    
# этот код уже не "внутри" else, потому что записан без отступа в 4 пробела. Поэтому он выполнится 
# в любом случае после отработки if-elif-else
print("Done")

x равен нулю
Done


Но в `if` можно подставлять и более сложные булевские выражения:

In [None]:
bool(-42)

In [None]:
if True or False:
    print('odin')

odin


In [None]:
x = 17
if x > 14 and x < 21:
    print(x)
    # тоже выполнится при выполнения условия после if, так как этот код тоже записан с отступом в 4 пробела
    print("nice")
else:
    print("not teenager")

17
nice


In [None]:
x = 17
if 14 < x < 21:
    print(x)
    # тоже выполнится при выполнения условия после if, так как этот код тоже записан с отступом в 4 пробела
    print("nice")
else:
    print("not teenager")

17
nice


In [None]:
# if внутри if:
x = 2
y = 5

if x == 3:
    if y > 6:
        # отступ в 4 пробела от внутреннего if
        print("y greater than 6")
    else:
        print("y not grater than 6")
        
    # отступ в 4 пробела от внешнего if, поэтому код выполнится если x==3 
    # и при любом значении y

    print("x is equal to 3")

x is equal to 3


# Как запустить программу на Python

Сначала нужно установить Python. Проще всего поставить его из магазинов приложений / менеджеров пакетов вашей ОС (Windows Store, App Store, apt, pacman etc).

Запустить программу на Python можно несколькими способами:

## Интерпретатор из командной строки

Самый простой способ. Удобен для небольшой работы, например, когда нужно что-то быстро посчитать (Python как продвинутый научный калькулятор):

```bash
user@computer:~$ python3
Python 3.8.10 (default, Nov 26 2021, 20:14:08)
[GCC 9.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>   
```

## Запуск интерпретации файла

Второй вариант создания программ на Python - писат код в текстовом редакторе в файл, а затем запускать процесс его интерпретации командой: 

```bash
python hello_world.py
```

## Продвинутые интерпретаторы командной строки

Командная строка - не самая удобная среда для разработки. Проект [ipython](https://ipython.org/) улучшает работу в консоли с помощью разных [доработок](https://ipython.readthedocs.io/en/stable/interactive/python-ipython-diff.html), например, возможности дополнения кода (tab-completion).

<div><img src="https://s3-us-west-1.amazonaws.com/plotly-tutorials/plotly-documentation/images/ipython-console.png" height=300px/></div>

*Source: [Plotly](https://plotly.com/python/ipython-vs-python/)*

Дальнейшим развитием ipython стал [Jupyter Notebook](https://jupyter.org/), который по сути вы сейчас и используете. Он позволяет выполнять редактирование кода в окне браузера (в том числе на удаленном сервере) и вставлять не только ячейки с кодом на Python, но и с markdown (облегченный язык разметки текста, см. [туториал](https://www.markdownguide.org/cheat-sheet/)).

## Базовая среда разработка

Одна из самых простых IDE (Integrated Development Environment, интегрированная среда разработки) - [IDLE](https://docs.python.org/3/library/idle.html). Название с одной стороны является искажением IDE (с добавлением Learning), а с другой - отсылка на комика из группы "Монти Пайтон" Эрика Айдла.

<div><img src="https://upload.wikimedia.org/wikipedia/commons/4/45/IDLE_%D0%B4%D0%BB%D1%8F_windows.jpg"></div>

*Source: [Wiki](https://ru.wikipedia.org/wiki/IDLE#/media/%D0%A4%D0%B0%D0%B9%D0%BB:IDLE_%D0%B4%D0%BB%D1%8F_windows.jpg)*

**Занимательный факт** - IDLE написан на Python с использованием библиотеки tkinter.



## Продвинутые IDE

Создавать большие продвинутые проекты на Python в командной строке, обычном текстовом редакторе и даже в IDLE не очень удобно - хотелось бы иметь многие инструменты, такие как поддердка VCS, продвинутое автодополнение, дебаггинг, возможности рефакторинга и т.д. Здесь на помощь приходит [PyCharm](https://www.jetbrains.com/ru-ru/pycharm/).

<div><img src="https://www.jetbrains.com/lp/pycharm-pro/static/1-go-to-declaration-8637ad4640eeb0b1f807592885d7ffbf.png"></div>

*Source: [JetBrains](https://www.jetbrains.com/lp/pycharm-pro/static/1-go-to-declaration-8637ad4640eeb0b1f807592885d7ffbf.png)*

У JetBrains имеется бесплатная версия PyCharm Community Edition, которой более чем хватит для обучения.

