<a href="https://colab.research.google.com/github/Boryan71/mipt_python/blob/main/python_programming.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python и инструменты машинного обучения


<img src="https://www.python.org/static/community_logos/python-logo-master-v3-TM.png" align="right" style="height: 200px;"/>

# Содержание

1. Что такое программирование?
2. Язык программирования Python
3. Основные типы данных в Python
4. Среды разработки (программы для написания программ)

---

5. Условные операторы

...

# Что такое программирование?

**Программирование** - написание инструкций для компьютеров для решения желаемой задачи.

Подробную инструкцию для компьютера, описывающую набор шагов для решения задачи, называют **алгоритмом**.

Подавляющее большинство задач выглядит следующим образом:

**Входные данные** (описание задачи) ---> **Алгоритм** --> **Выходные данные** (получаемый результат)

## Что представляет собой алгоритм?

>**Компьютеры очень глупы! Алгоритм для них должен быть сформулирован очень подробно!**

Например, нельзя просто сказать ему: "Переведи полученное количество градусов по Цельсию в градусы по Фаренгейту", ему нужно расписать все подробно:

1. Считай число и запомни его как `a`
2. Домножь запомненное число `a` на 9 и запомни как `a`
3. Раздели число `a` на 5 и запомни как `a`
4. Прибавь 32 к числу `a` и запомни как `a`
5. Верни число `a`

И так по сути нужно для решения каждой задачи!

>**Примечание:** в современных языках программирования вам не нужно всегда настолько подробно все расписывать, многие частоиспользуемые наборы действий (вспомогательные алгоритмы) уже написаны другими программистами, и вы можете их использовать.

Помимо арифметических операций и операций запоминания значений имеются и другие, например:
- условные операторы - выбор одного из двух наборов действий в зависимости от какого-либо условия
- циклы - повторить набор действий некоторое количество раз

Более того, компьютеры до жути формалисты и все воспринимают дословно! Программистам для написания программ порой приходится мыслить "как компьютер", и часто это мышление отличается от бытового:

>Жена отправляет мужа-программиста в магазин:<br>
>— Купи батон хлеба, если будут яйца — возьми десяток.<br>
>Муж возвращается из магазина с десятью батонами.<br>
>— Ты зачем столько хлеба купил?<br>
>— Так ведь яйца были.

## Как именно написать алгоритм?

>**Компьютеры очень глупы!**

Компьютеры совсем не понимают человеческий язык, при чем любой! Они понимают лишь набор нулей и единиц\* (бинарный код) - для них это очень эффективный способ общения.

К сожалению, люди плохо воспринимают код бинарный код, например, сообщение:

>I love programming

воспринимается гораздо лучше, чем:

>010010010010000001101100011011110111011001100101001000000111000001110010011011110110011101110010011000010110110101101101011010010110111001100111

>**Примечание:** команды для компьютера (точнее для процессора) представляют собой не просто набор нулей и единиц, а набор специальных команд - машинный код. Но в эту область мы углубляться не будем.

В давние времена инструкции для компьютера и набирали с помощью нулей и единиц, например, с помощью перфокарт:

![](https://droider.ru/wp-content/uploads/2022/08/image15-1.png)

**Языки программирования** (ЯП) позволяют формулировать инструкции для компьютеров с помощью более понятных человеку слов и выражений.

>**Примечание:** чаще всего ЯП в своей основе используют английский, поэтому если не знаете / плохо знаете английский, то советую начать изучать, а пока активно пользоваться онлайн-переводчиками.

С помощью ЯП вы формулируете инструкции для компьютера.

>**Основная задача программиста** - разбить решение задачи на отдельные шаги и описать их выполнение для компьютера с помощью ЯП.

## Компиляторы и интерпретаторы

Итак, программист пишет набор инструкций (код) на ЯП, который понятен нам, но как компьютер понимает, что именно мы написали?

Для этого нам нужен переводчик - специальная программа, которая преобразует инструкции, написанные на ЯП, в машинный код!

Обычно для каждого языка программирования есть такая программа-переводчик.

В итоге запуск программы состоит из следующих этапов:
1. Программист пишет программу на ЯП
2. Программа-переводчик переводит написанные команды в машинный код
3. Компьютер исполняет машинный код

Есть 2 основных\* способа перевода инструкций в машинный код - переводить всю программу целиком или переводить ее по кусочкам (по отдельным командам). По этому принципу языки разделяют на компилируемые и интерпретируемые:

- В **компилируемых** используется специальная программа - **компилятор**, которая берет программу **целиком** и преобразует (компилирует) ее в исполняемый компьютерный код. После этого компьютер может исполнять скомпилированную программу. Компилятор способен выполнять многие или даже все операции: предварительную обработку исходной программы, парсинг, семантический анализ, преобразование входных программ в промежуточное представление, оптимизацию и генерацию кода.

    ![compiler](https://cdn-images-1.medium.com/max/533/0*OaEDlCa01FEDRIQ8)
    
    *Source: [NoP](https://nuancesprog.ru/p/12524/)*


- В **интерпретируемых** преобразование осуществляется **интерпретатором** последовательно - оператор за оператором.

    ![interpreter](https://cdn-images-1.medium.com/max/533/0*MddNw1pcH9OJiekl)

    *Source: [NoP](https://nuancesprog.ru/p/12524/)*

И **компилятор**, и **интерпретатор** выполняют одну и ту же работу  —  преобразовывают язык программирования высокого уровня в машинный код. Однако **компилятор** преобразовывает исходный материал в машинный код **перед запуском** программы. **Интерпретатор** выполняет эту функцию **при ее запуске**.

- Компилируемые ЯП - C, C++.
- Интерпретируемые ЯП - Perl, Python и Matlab.

### Преимущества и недостатки

**Преимущества компилятора:**
- Программный код переводится целиком - можно оптимизировать его на низком уровне, тем самым сделать **быстрее**
- Объектные программы **лучше защищены от изменения** пользователем сложнее изменить, чем исходный код
- Компилятор **проверяет исходный код** на наличие синтаксических ошибок во время компиляции

**Недостатки компилятора:**
- Поскольку переводится вся программа, она **использует гораздо больше памяти** компьютера
- При работе с компилятором **невозможно\* изменить программу**, не вернувшись к исходному коду
- Компилирование может занимать **очень много времени**

    ![compiling](https://xkcd.ru/i/303_v2.png)

    *Source: [xkcd.ru](https://xkcd.ru/303/)*
- Исходный код должен быть **на 100% верным** для создания исполняемого файла
- Компилирование выполняется **только под определенную платформу** (x86, arm, ...)

**Преимущества интерпретатора:**
- С интерпретатором **проще работать с исходным кодом**
- Перевод по одной инструкции за раз, поэтому использует **минимальный объем памяти**

**Недостатки интерпретатора:**
- Каждый раз, когда программа выполняется, тратится время на интерпретацию, из-за чего **затягивается время исполнения**
- Для запуска интерпретируемой программы **необходим интерпретатор**

## Хранение данных

Часто в процессе написания программ вам нужно как-либо сохранить промежуточные результаты работы вашего алгоритма.

Например, в задаче из анекдота "Купи батон хлеба, если будут яйца — возьми десяток." вам нужно запомнить есть ли в магазине яйца, а затем в зависимости от этого сделать одно или другое действие.

Но как и где компьютер хранит необходимые для работы программы данные?

### Оперативная память

Все данные, которыми оперирует компьютер при исполнении программы, хранятся в **оперативной памяти**.

Все данные в оперативной памяти хранятся в двоичной форме в отдельных ячейках. У каждой ячейки есть свой адрес (порядковый номер), зная нужный адрес, компьютер может считать значение из ячейки или записать в нее новое значение.

**Как компьютер узнает адрес ячейки?**

За выделение отдельным работающим на компьютере программам (не только нашей) отвечает **операционная система** (ОС). Она следит за тем, какая программа занимает какие ячейки памяти и какие ячейки еще свободны (не используются).

Исполняемая программа обращается к ОС и запрашивает свободную ячейку, ОС дает адрес свободной ячейки и закрепляет ее за этой программой.

### Переменные

С ячейками оперативной памяти есть 2 основных проблемы:
1. Одной ячейки чаще всего не хватает для хранения какой-либо информации

    Например, число 10 в двоичной системе записывается как `1010`, для его записи нужна **группа** из минимум 4 ячеек

2. Числовые адреса ячеек неудобны

    Обращаться ко всем данных как `переменная1, переменная2` или по адресу вида `0x7fb41711c130` крайне неудобно нам, человекам

Эти проблемы решаются с помощью **переменных**. По сути они являются объединение нескольких ячеек памяти, обращение к ним происходит по **уникальному имени**.

Поэтому в программах не напрямую с ячейками памяти, а именно с переменными.

## Типы данных

Итак, все данные хранятся в переменных в виде наборов нулей и единиц. 

Но как программа понимает, что именно представлено этим набором? Ведь и числа, и строки, и что-то посложнее для программы являются набором нулей и единиц, но при этом умножить одно число на другое можно, а вот строки - нет. 

Для этого существуют **типы данных** - вспомогательные данные о том, что именно хранится в той или иной переменной.

С некоторыми типами данных мы познакомимся сегодня.

### Типизация данных в ЯП

Разные ЯП по разному работают с типами данных. От этого зависит то, как вы должны и как вы можете обращаться с переменными.

Существует несколько классификаций:

#### Сильная / слабая типизации





Также известны как строгая / нестрогая типизации. Показывает можно ли совершать операции с разными типами данных.

В языках со слабой типизацией часто возможны операции типа: `число + строка`. Обычно это достигается за счет определенных правил приведения типов, которые применяются неявно. Это может быть как удобно, так и запутывающе:

![weak_typo](http://sun9-41.userapi.com/impf/c852136/v852136356/1abb55/B-qZf_l-sQk.jpg?size=604x604&quality=96&sign=dd974c5903dc07517b1026f7f963dac8&type=album)

*Source: [/dev/null](https://vk.com/wall-72495085_997870)*



**Примеры:**
- **Сильная:** Perl, Ruby, Python
- **Слабая:** C, C++

#### Статическая / динамическая

При статической типизации конечные типы переменных устанавливаются до выполнения программы, обычно на этапе компиляции. Так, в динамически типизированном языке у одной и той же переменной могут быть разные типы в разных частях программы, а в статически типизированном, если вы создали переменную типа "строка", то записать в нее что-то кроме строки вы не сможете.

**Примеры:**
- **Статическая:** C, Java, C#
- **Динамическая:** Python, JavaScript, Ruby, Objective-C

#### Явная / неявная типизация

Явно-типизированные языки отличаются тем, что тип новых переменных нужно задавать явно. Языки с неявной типизацией перекладывают эту задачу на компилятор / интерпретатор.

**Примеры:**
- **Явная:** C++, C#, Rust
- **Неявная:** Python, PHP, JavaScript

# Знакомство с Python





## Историческая справка

Язык Python разрабатывался Гвидо ван Россумом с 1989 г.

![guido](https://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Guido_van_Rossum_OSCON_2006.jpg/400px-Guido_van_Rossum_OSCON_2006.jpg)

*Source: [Wikipedia](https://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Guido_van_Rossum_OSCON_2006.jpg/400px-Guido_van_Rossum_OSCON_2006.jpg)*

Назван в честь популярного британского комедийного телешоу 1970-х "Летающий цирк Монти Пайтона".

**Основные (мажорные) версии:**
* Python 1.0 — январь 1994
* Python 2.0 — 16.10.2000
  * Python 2.7.18 - 20.04.2020 (последний релиз, больше не поддерживается)
* Python 3.0 — 3.12.2008
  * Python 3.11.0 - 24.10.2022

Python вобрал в себя множество удобных и полезных аспектов других языков программирования (ABC, Lisp, Haskell, C, C++).

Благодаря своей нацеленности на ясный синтаксис, Python играл центральную роль в проекте "Computer Programming for Everybody", предназначенном сделать программирование доступным для большего числа людей, на основе получения базовой «компьютерной грамотности».

## Дзен Python

**Дзен Python** — это набор из 19 «руководящих принципов» написания программ, влияющих на структуру языка программирования Python. 

In [None]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Основные свойства Python


### Интерпретируемость

Python является **интерпретируемым** языком программирования. Его интепретатор называется `python`:

In [None]:
!python --version

Python 3.7.13


**Замечание 1:** вот мы и дошли до первой ячейки с кодом. Чтобы выполнить ее содержимое, есть несколько способов:
*   ctrl + enter  (ячейка выполнится)
*   shift + enter (ячейка выполнится + перейдем вниз)
*   треугольничек в левой части строки

**Замечание 2:** восклицательный знак перед `python` необходим, если вы хотите выполнить терминальную команду из Jupyter Notebook. Если вы запускаете интерпретатор из консоли, то восклицательный знак не нужен.

По этой причине мы можем выполнять команды из языка Python поштучно и сразу наблюдать их результат, чем и будем пользоваться на занятиях.

### Сильная динамическая неявная типизация   

**Пример сильной типизации в Python:**

In [None]:
3 + 'string'

TypeError: ignored

**Замечание 1:** мы с вами впервые столкнулись с ошибкой на Python. В большинстве случаев чтобы понять, что происходит не так, достаточно посмотреть на какую строчку ругается Python и перевести текст ошибки. Поэтому для программистов рекомендуется знать английский хотя бы на базовом уровне.

**Замечание 2:** часто Python используют не столько как язык программирования, как продвинутый калькулятор, позволяющий удобно выполнять большие вычисления.

**Пример динамической типизации в Python:**

In [None]:
a = 3
type(a)

int

In [None]:
a = 'hello'
type(a)

str

**Замечание:** здесь мы сталкиваемся с незнакомой функцией `type`. Пока ее можно воспринимать как функцию, возвращающую тип переменной. Сегодняшнее занятие - во многом вводное в плане Python, и ко многим вещам мы впоследствии вернемся и рассмотрим подробнее.

**Пример неявной типизации в Python:**

In [None]:
a = 0
type(a)

int

### TODO Управление памятью

Выделение и освобождение памяти в Python происходит автоматически - не нужно следить за выделяемой памятью и чистить за собой. Тем не менее, забить память все еще можно.

Подробности работы сбора мусора можно узнать [здесь](https://towardsdatascience.com/memory-management-and-garbage-collection-in-python-c1cb51d1612c).

In [None]:
a

'hello'

In [None]:
del a

In [None]:
a

NameError: ignored

# Основы Python

## Создание переменных

В Python создание переменной и присваивание\* ей значения выполняется следующим образом: 

In [None]:
variable = 4

Чтобы вывести значение переменной, можно воспользоваться функцией `print` или просто написать имя этой переменной (только в интерактивном режиме!):

In [None]:
print(variable)

4


In [None]:
variable

4

### Какие имена переменных разрешены?

Имена переменных удовлетворяют следующим правилам:

- имя должно содержать только буквы, цифры и знаки нижнего подчеркивания (`_`)
- имя должно начинаться только с буквы или нижнего подчеркивания 

**Примечания:**

1. Имена переменных чувстсвительны к регистру - `age`, `Age` и `AGE` являются тремя разными именами
2. Технически у вас есть возможность использовать не только буквы английского алфавита, но и русские, однако, так категорически не рекомендуется делать
3. Советую называть переменные осмысленно, чтобы другой программист смог понять за что именно отвечает та или иная переменная

### Множественное присваивание

В Python добавлено очень много вещей, которые облегчают жизнь программисту, хоть и не являются критичными (можно обойтись и без них) - **синтаксический сахар**.

В Python можно одновременно присваивать двум переменным одно значение:

In [None]:
x = y = 500

(500, 500, True)

In [None]:
x

In [None]:
y

Можно присваивать двум переменным разные значения одновременно:

In [None]:
x, y = 100, 300

(300, 100)

In [None]:
x

In [None]:
y

Таким образом можно легко поменять значения двум переменным:

In [None]:
x, y = 100, 300
x, y = y, x
x, y

Без этого "приема" пришлось бы вводить новую переменную:

In [None]:
print(x, y)

In [None]:
z = x
x = y
y = z

300 100
100 300


In [None]:
print(x, y)

## Функция `help`

Крайне полезная для вас функция - `help`. Она позволяет получить справку по разным объектам. Сейчас нам она полезна для того, чтобы получать документацию по функциям, например для функции `print`:

In [None]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [None]:
print(x, y, sep='sep', end='end')

100
300test

## Базовая арифметика

Одна из основных задач языка программирования - выполнять арифметические операции над переменными. Само собой, Python тоже позволяет это делать:

`+`, `-`, `*`, `/` - простейшие операции

In [None]:
(1 + 6) / 4 - 2 * 3

-4.25

`//`, `%` - целочисленное деление и остаток от деления

In [None]:
45 // 6, 45 % 6

(7, 3)

`**` - возведение в степень

In [None]:
2 ** 10

1024

Помимо стандартного оператора присваивания\*, в Python есть вспомогательные операторы, которые перед присваиванием выполняют арифметическую операцию:

In [None]:
a = 1900
a += 1   # a = a + 1
a -= 2   # a = a - 2
a *= 3   # a = a * 3
a /= 4   # a = a / 4
a //= 2  # a = a // 2
a **= 2  # a = a ** 2
a %= 6   # a = a % 6

# Базовые типы данных

## `int`

`int` - целочисленный тип данных:

In [None]:
42, type(42)

(42, int)

Этот тип данных поддерживает длинную арифметику (подробнее [тут](https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk)):

In [None]:
2 ** 10000

1995063116880758384883742162683585083823496831886192454852008949852943883022194663191996168403619459789933112942320912427155649134941378111759378593209632395785573004679379452676524655126605989552055008691819331154250860846061810468550907486608962488809048989483800925394163325785062156830947390255691238806522509664387444104675987162698545322286853816169431577562964076283688076073222853509164147618395638145896946389941084096053626782106462142733339403652556564953060314268023496940033593431665145929777327966577560617258203140799419817960737824568376228003730288548725190083446458145465055792960141483392161573458813925709537976911927780082695773567444412306201875783632550272832378927071037380286639303142813324140162419567169057406141965434232463880124885614730520743199225961179625013099286024170834080760593232016126849228849625584131284406153673895148711425631511108974551420331382020293164095759646475601040584584156607204496286701651506192063100418642227590867090057460641785695191145605506

Удобная форма записи длинных целых чисел:

In [None]:
100_000_000

100000000

## `float`

`float` - тип данных, хранящий число с плавающей точкой (дробное число). В качестве разделителя используется только точка `.`:


In [None]:
42.42, type(42.42)

(42.42, float)

Имеется удобная форма записи - экспоненциальная:

In [None]:
1.5e-2

0.015

Также в Python имеются специальные значения для бесконечностей и значения "not a number" (`nan`):

In [None]:
float('inf'), 2 * float('inf'), float('inf') + 1000000

(inf, inf, inf)

In [None]:
float('-inf'), 2 * float('-inf'), float('-inf') + 1000000

(-inf, -inf, -inf)

In [None]:
float('Inf') - float('Inf')

nan

Тип `float` основан на `double` из C, поэтому поддерживает значения только в определенном диапазоне и с определенной точностью:

In [None]:
from sys import float_info

precision = float_info.min * float_info.epsilon
max_value = float_info.max

In [None]:
print(max_value, max_value * 2)

1.7976931348623157e+308 inf


In [None]:
print(precision, precision / 2)

5e-324 0.0


Для округления чисел с плавающей точкой в Python имеется функция `round`, работающая по правилу ["округления банкира"](https://ru.wikipedia.org/wiki/%D0%9E%D0%BA%D1%80%D1%83%D0%B3%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5#:~:text=banker's%20rounding%20%E2%80%94%20%C2%AB%D0%BE%D0%BA%D1%80%D1%83%D0%B3%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B1%D0%B0%D0%BD%D0%BA%D0%B8%D1%80%D0%B0%C2%BB,(%D0%BC%D0%BE%D0%B6%D0%B5%D1%82%20%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D1%82%D1%8C%D1%81%D1%8F%20%D0%B2%20%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B5)) (до ближайшего четного числа):

In [None]:
round(0.3)

0

In [None]:
round(0.5)

0

In [None]:
round(1.5)

2

Дополнительно можно указать до какого знака стоит округлять:

In [None]:
round(3.1415, 1)

3.1

### Арифметика с плавающей точкой

Т.к. в оперативной памяти для записи дробного числа отведено фиксированное кол-во бит (ячеек памяти), то часто мы не можем абсолютно точно записать число и абсолютно точно проводить операции над ними, часто возникает небольшая погрешность:

In [None]:
0.1 + 0.2

0.30000000000000004

Этого пугаться не стоит, такое поведение свойственно всем языкам программировани.

Подробнее про числа с плавающей точкой - https://habr.com/ru/post/112953/

## `complex`

`complex` - тип для работы с комплексными числами. Мнимая часть описывается с помощью символа `j` (вместо `i` в математике): 

In [None]:
2 + 3j, type(2 + 3j)

((2+3j), complex)

In [None]:
(2 + 3j) * (2 + 3j)

(-5+12j)

## `bool`

`bool` - логический тип данных. Может принимать лишь два значения - `True` и `False` (именно с заглавной буквы):

In [None]:
True, type(True)

(True, bool)

 Тип `bool` является подтипом `int`, поэтому между ними возможны операции сравнения без явного приведения типов:

In [None]:
True == 1

True

In [None]:
True > 2

False

## str

`str` - строковый тип данных, т.е. может хранить в себе символьные строки произвольной длины:

In [None]:
"abc", type("abc")

('abc', str)

Выделяется двойными или одинарными кавычками (открывающая и закрывающая должны быть одинаковы!):

In [None]:
'abc'

'abc'

In [None]:
'abc"

SyntaxError: ignored

В Python также возможны многострочные строки (multiline string):

In [None]:
string = """и 
я 
тоже
строка"""
print(string)

Кроме того, в Python (как и во многих других ЯП) имеются комментарии - строки кода, которые игнорируются при запуске программы. Однострочные комменатарии начинаются с `#`:

In [None]:
# Я однострочный комментарий

In [None]:
print('a')
"""
print('a')
print('a')
print('a')
"""
print('a')

a
a


Строки можно складывать, строку можно домножать на целое число, можно проверять вхождение подстроки в строку:

In [None]:
s1 = "very_big_string"
s2 = 'string'

In [None]:
s1 + s2

'very_big_stringstring'

In [None]:
s2 * 4

'stringstringstringstring'

In [None]:
s2 in s1

Оператор `in` мы увидем и в других более сложных типах данных.

Несмотря на то, что по-умолчанию операции между разными типами данных запрещены, некоторые все-же возможны:

In [None]:
'abc' * 4

'abcabcabcabc'

У строк в Python имеется огромное количество полезных методов (функций), которые вы найдете полезными в ходе работы. Подробнее мы остановимся на них позднее, а пока можете ознакомиться с ними в статье [по ссылке](https://pythonworld.ru/tipy-dannyx-v-python/stroki-funkcii-i-metody-strok.html).

Сейчас же остановимся на одном из них - метод `split`. Он позволяет разбить строку по подстроке. Проще всего это понять на примере:

In [None]:
string = "one two three two three four"
substring = "two"

print(string.split(substring))

['one ', ' three ', ' three four']


In [None]:
a = "1 2 3"
a.split()

['1', '2', '3']

**Замечание:** методы вызываются для переменных следующим образом - `variable.method(arguments)`.

На выходе получаем список строк, которые были разделены между собой подстрокой `substring`.

К отдельным символам строки можно получить доступ по их индексу (порядковый номер). Как и во всех взрослых языках програмирования, Python использует 0-индексацию (самый первый элемент имеет индекс 0):

In [None]:
string = "hello world!"
print(string[0], string[1], string[5])

h
e
 


Кроме того, Python поддерживает отрицательную индексацию, с помощью которой удобно брать элементы с конца строки:

In [None]:
print(string[-2])

d


### Срезы

В Python имеется удобный способ выбирать диапазон элементов из строк, списков и кортежей. Он называется срез (slicing) и выглядит следующим образом:

```python
variable[start:stop:step]
```
где `start` - индекс начала выборки (включается), `stop` - индекс завершения выборки (исключается), `step` - шаг выборки. Если не указывать значения, то берутся значения по умолчанию: `start=0`, `end=len(...)`, `step=1`.

Рассмотрим на примере:

In [None]:
string = "abcdefgh"
print(string[1:7:2])

bdf


В итоге мы взяли все элементы, начиная с индекса `1` (b) до индекса `7` (h, исключая) с шагом 2.

Аналогично срезы работают и для списков и кортежей:

In [None]:
lst = [1, 2, 3, 4, 5.0]

print(lst[::2])

[1, 3, 5.0]


Полученный срез часто удобно сохранять в отдельную переменную:

In [None]:
sub_lst = lst[::3]
print(sub_lst)

[1, 4]


Заметим, что шаг необязательно должен быть положительным:

In [None]:
print(lst[::-1])

[5.0, 4, 3, 2, 1]


## NoneType

`NoneType` - специальный тип данных для объекта `None`:

In [None]:
None, type(None)

(None, NoneType)

### Что такое `None`?

`None` - специальное значение переменной, означающее "ничего" или "отсутствие значения". Является аналогом `null` из других языков программирования.

Существует много случаев, когда следует использовать None.

Часто вы хотите выполнить действие, которое может работать либо завершиться неудачно. Используя `None`, вы можете проверить успех действия.

**Пример:** в своей программе вы хотите подключиться к базе данных с помощью библиотеки и хотите проверить, создалась ли ваша база данных, вы можете осуществить эту проверку, сравнив переменную базы данных с None. Примерно так:

```
database = MyDatabase(db_host, db_user, db_password, db_database)

if database is None:
    print('Пусто')
```

## Приведение базовых типов

Базовые типы данных часто можно преобразовывать из одного в другой следующим образом:

In [None]:
int('123')

123

In [None]:
str(345)

'345'

In [None]:
float(5)

5.0

In [None]:
int(234.5)

234

**Замечание:** при преобразовании переменной из `float` в `int` дробная часть отбрасывается:

In [None]:
int(3.14)

3

In [None]:
int(-3.14)

-3

In [None]:
int(2.73)

2

Но преобразование не всегда возможно:

In [None]:
float('12.a')

ValueError: ignored

### Приведение к bool

Для `int` и `float`: `0` и `0.0` переводятся в `False`, все остальное - в `True`:

In [None]:
bool(0), bool(0.0)

(False, False)

In [None]:
bool(1), bool(24.1)

(True, True)

In [None]:
bool(-2), bool(-12.3)

(True, True)

Для `str`: пустые строки - в `False`, остальное - в `True`:

In [None]:
bool(''), bool('')

(False, False)

In [None]:
bool(None)

False

In [None]:
bool(1+0j)

True

In [None]:
bool(0+1j)

True

In [None]:
bool(0+0j)

False

# Операторы сравнения

- `<`, `<=` - "меньше", "меньше или равно"
- `>`, `>=` - "больше", "больше или равно"
- `==`, `!=` - "равно", "не равно"

In [None]:
4 < 5

True

In [None]:
3 >= 2

True

In [None]:
1 != 1

False

Также можно сравнивать строки, списки и кортежи. Сравнение происходит лексикографически (как в словаре):

In [None]:
'a' < 'b'

True

In [None]:
'aa' < 'ab'

True

In [None]:
'aaaa' < 'ab'

True

### Логические операторы

Python позволять логические операции:

- `and` - логическое И, логическое произведение
- `or` - логическое ИЛИ, логическая сумма
- `not` - логическое НЕ

In [None]:
a, b = True, False

In [None]:
a and b

False

In [None]:
a or b

True

In [None]:
not b

True

# Работа с вводом-выводом

Для считывания данных из `stdin` (стандартный ввод) используется функция `input()`:

In [None]:
t = input()
t

213567ываыва


'213567ываыва'

In [None]:
s = input("Input here: ")
s

Input here: йцукен


'йцукен'

Для вывода данных в `stdout` (стандартный вывод) используется `print()`:

In [None]:
print('spam', 'and', 'eggs', end='!', sep='_')

spam_and_eggs!

In [None]:
print('e', end='')
print('n', end='')
print('d', end='')

end

# Как запустить программу на Python

Сначала нужно установить Python. Проще всего поставить его из магазинов приложений / менеджеров пакетов вашей ОС (Windows Store, App Store, apt, pacman etc).

Запустить программу на Python можно несколькими способами:

## Интерпретатор из командной строки

Самый простой способ. Удобен для небольшой работы, например, когда нужно что-то быстро посчитать (Python как продвинутый научный калькулятор):

```bash
user@computer:~$ python3
Python 3.8.10 (default, Nov 26 2021, 20:14:08)
[GCC 9.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>   
```

## Запуск интерпретации файла

Второй вариант создания программ на Python - писат код в текстовом редакторе в файл, а затем запускать процесс его интерпретации командой: 

```bash
python hello_world.py
```

## Продвинутые интерпретаторы командной строки

Командная строка - не самая удобная среда для разработки. Проект [ipython](https://ipython.org/) улучшает работу в консоли с помощью разных [доработок](https://ipython.readthedocs.io/en/stable/interactive/python-ipython-diff.html), например, возможности дополнения кода (tab-completion).

<div><img src="https://s3-us-west-1.amazonaws.com/plotly-tutorials/plotly-documentation/images/ipython-console.png" height=300px/></div>

*Source: [Plotly](https://plotly.com/python/ipython-vs-python/)*

### Jupyter Notebook и Google Colab

Дальнейшим развитием ipython стал [Jupyter Notebook](https://jupyter.org/), который по сути вы сейчас и используете. Он позволяет выполнять редактирование кода в окне браузера (в том числе на удаленном сервере) и вставлять не только ячейки с кодом на Python, но и с markdown (облегченный язык разметки текста, см. [туториал](https://www.markdownguide.org/cheat-sheet/)).

<img src="https://jupyter.org/assets/homepage/main-logo.svg" width=200/>

Название проекта Jupyter - это ссылка на три основных языка программирования, поддерживаемых Jupyter: Julia, Python и R, а также дань уважения записным книжкам Галилея, записывающим открытие лун Юпитера. Проект Jupyter разработал и поддержал интерактивные вычислительные продукты Jupyter Notebook, JupyterHub и JupyterLab, версию следующего поколения Jupyter Notebook. Философия проекта Jupyter заключается в поддержке интерактивной науки о данных.

Чем удобен Jupyter Notebook? Блокнот (notebook) объединяет в себе:

- код и его вывод
- визуализации
- повествовательный текст, математические уравнения и другие мультимедиа.

Это свойство способствует итеративной и быстрой разработке, что делает ноутбуки все более популярным выбором для представления в данных и их анализа.

С практической точки зрения, в ноутбуке есть два типа ячеек: 
- ячейки с текстом (как эта) - ячейки поддерживают язык разметки [Markdown](https://paulradzkov.com/2014/markdown_cheatsheet/), что позволяет красиво оформлять текст!
- ячейки с кодом (запускали код в них) - позволяет выполнять код отдельными фрагментами с сохранением текущего состояния

В рамках нашего курса мы будем использовать "разновидность" Jupyter Notebook'и - продукт Google Colab. Он позволяет без установки программ на ваш компьютер выполнять код на Python с использованием вычислительных мощностей Google. Имеется короткий [туториал от Google](https://colab.research.google.com/notebooks/welcome.ipynb#scrollTo=GJBs_flRovLc).

## Базовая среда разработка



Одна из самых простых IDE (Integrated Development Environment, интегрированная среда разработки) - [IDLE](https://docs.python.org/3/library/idle.html). Название с одной стороны является искажением IDE (с добавлением Learning), а с другой - отсылка на комика из группы "Монти Пайтон" Эрика Айдла.

<div><img src="https://upload.wikimedia.org/wikipedia/commons/4/45/IDLE_%D0%B4%D0%BB%D1%8F_windows.jpg"></div>

*Source: [Wiki](https://ru.wikipedia.org/wiki/IDLE#/media/%D0%A4%D0%B0%D0%B9%D0%BB:IDLE_%D0%B4%D0%BB%D1%8F_windows.jpg)*

**Занимательный факт** - IDLE написан на Python с использованием библиотеки tkinter.

## Продвинутые IDE



Создавать большие продвинутые проекты на Python в командной строке, обычном текстовом редакторе и даже в IDLE не очень удобно - хотелось бы иметь многие инструменты, такие как поддердка VCS, продвинутое автодополнение, дебаггинг, возможности рефакторинга и т.д. Здесь на помощь приходит [PyCharm](https://www.jetbrains.com/ru-ru/pycharm/).

<div><img src="https://www.jetbrains.com/lp/pycharm-pro/static/1-go-to-declaration-8637ad4640eeb0b1f807592885d7ffbf.png"></div>

*Source: [JetBrains](https://www.jetbrains.com/lp/pycharm-pro/static/1-go-to-declaration-8637ad4640eeb0b1f807592885d7ffbf.png)*

У JetBrains имеется бесплатная версия PyCharm Community Edition, которой более чем хватит для обучения.