# ОСНОВЫ PYTHON - теория

## Краткий обзор

### Возможности

Пример некоторых задач (и сторонних библиотек), которые можно решить с помощью Python:

- создавать web-приложения (Django, Flask),
- разрабатывать игры (Pygame),
- заниматься математическими вычислениями и анализом данных (NumPy, Pandas, Matplotlib),
- работать с текстовыми файлами, изображениями, аудио и видео файлами (PyMedia),
- реализовывать графический интерфейс пользователя (PyQT, PyGObject)

и многое другое.

### Рейтинг языков программирования

<div style="width: 700px"><img src="https://cs.sberbank-school.ru/image/full/full/resize/24128d78-3791-11ea-8e61-005056011b68" alt="Рейтинг популярности языков программирования" /></div>
Рейтинг популярности языков программирования по данным индекса TIOBE на январь 2020 года.

Рейтинг TIOBE составляется из всех актуальных языков программирования (около 100), этим объясняется кажущийся поначалу невысокий рейтинг популярности представленных языков (17 % у самого популярного). Как видно из рейтинга, Python входит в тройку популярных языков программирования. Такой успех можно объяснить возможностью выполнения широкого спектра задач и удобством языка. Удобство заключается в том, что Python - высокоуровневый язык. Это означает, что сложные описания структур машинного кода выполнены в удобно читаемом для человека виде. Стоит отметить, что при изучении языка необходимо уделять больше времени пониманию того, как работают стандартные функции, поскольку это позволит быстрее прокачивать свой навык программирования.

## 2. Типы и объекты

### Типы данных

Язык Python характерен своей неявной динамической типизацией. Это означает, что при задании какой-либо переменной, нам не надо объявлять ее тип (число, строка, и т.д.), как это сделано в языке С. То есть достаточно просто присвоить ей значение и в зависимости от того, какое это значение, Python сам определит тип переменной.

>_**Между делом**_  
_Говоря о присвоении значения переменной, стоит отметить, что в реальности происходит процесс связывания ссылки на объект с объектом, находящемся в памяти посредством оператора = . Таким образом в инструкции типа var = 12, "var" - ссылка на объект, а "12" - объект целочисленного типа. Каждый раз, когда в тексте будет упоминаться процесс присвоения значения - помните, что в этот момент происходит процесс связывания ссылок с объектами.
Существует несколько видов типов данных - встроенные и не встроенные. Встроенные - те типы, которые встроены в интерпретатор, не встроенные - типы данных, которые можно импортировать из других модулей. В данном курсе нам достаточно рассмотреть только встроенные типы._

**None type** - тип, представляющий отсутствие значения.

- **None** - неопределенное значение переменной.

Зачастую, чтобы отловить какую-то ошибку записи значения куда-либо, мы применяем проверку на отсутствие значения в переменной, ячейке базы данных, таблицы и т.д. или используем в качестве значения по умолчанию:

In [3]:
null_variable = None 
not_null_variable = 'something' 
if null_variable == None: 
    print('null_variable is None') 
else: 
    print('null_variable is not None') 
if not_null_variable == None: 
    print('not_null_variable is None') 
else: 
    print('not_null_variable is not None')


null_variable is None
not_null_variable is not None


**Логический тип данных (bool)** удобно использовать, когда результатом условия может быть только "да" или "нет". В математическом представлении True = 1, False = 0.

- True - логическая переменная, истина
- False - логическая переменная, ложь

In [4]:
a = 0
b = 0
print(a < b)
print(a > b)
print(a == b)


False
False
True


**Целые числа** используются для стандартных арифметических операций, когда нас не интересует точность, до n-го знака.

- **int** (integer) - целое число
Напротив, числа, применяющиеся для точных вычислений до n-го знака после запятой - **числа с плавающей точкой** (floats). При арифметическом взаимодействии двух типов (int и float), результат всегда будет иметь тип float.

- **float** - число с плавающей точкой
Комплексные числа предназначены для более сложных математических вычислений, они состоят из вещественной и мнимой части.

- **complex** - комплексное число
Более подробно об этих типах будет рассказано в разделе "Числа".

**Строки** (strings)  мы используем для формирования сообщений, каких-либо сочетаний символов, текстовой информации. Более подробно об этом типе будет рассказано в разделе "Строки".

- **str** - строка

### Типы коллекций
**Списки** являются своего рода хранилищем данных разного типа, другими словами списки это массивы, только хранить они могут данные разных типов. Более подробно об этом типе будет рассказано в разделе "Списки".

- **list** - список
 

**Кортеж** - это список, который после создания нельзя изменить, очень полезно его использовать для защиты "от дурака", чтобы по ошибке данные не были изменены.

Более подробно об этом типе будет рассказано в разделе "Кортежи".

- **tuple** - кортеж
 

**Генератор списков** используется, когда нам нужно вывести последовательность целых чисел. Более подробно об этом типе будет рассказано в уроке "Циклы".

- **range** - диапазон, неизменяемая последовательность целых чисел.
 

**Множества** - коллекции для неповторяющихся данных, хранящие эти данные в случайном порядке.

- **set** - множество
- **frozenset** - неизменяемое множество
Более подробно об этих типах будет рассказано в разделе "Множества".


**Словари** - являются набором пар "ключ"-"значение", довольно удобный тип данных для формирований структур. Более подробно об этом типе будет рассказано в разделе "Словари".

- **dict** - словарь

Следующие два типа перечислены для ознакомления, в дальнейшем мы не будем уделять им практического значения в рамках данного курса.

**Байт**  - это минимальная единица хранения и обработки цифровой информации. Данный тип допускает возможность производить изменение кодировки символов в зависимости от задач.

- **bytes** - байты
 

**Последовательность байт**  - представляет собой некую информацию (текст, картинка и т.д.). Помимо изменения кодировки, имеет дополнительные возможности применять методы к перекодированным строкам и вносить изменения.

- **bytearray** - массивы байт

## 3. Типы операторов

### Арифметические операторы

>Простым языком  
>Оператором является элемент выражения, который указывает на то, какое действие необходимо произвести между элементами. То есть, в выражении "21 - 4" символ "-" является оператором, указывающим на то, что нужно произвести вычитание. "21" и "4" при этом называются операндами.

'+' 
Оператор суммы  
print(5 + 8)  
13  

'-' 
Оператор разности  
print(31 - 2)  
29

*
Оператор произведения  
print(12 * 9)
108


/ 
Оператор деления  
print(6 / 4)
1.5


% 
Оператор получения остатка от деления
print(6 % 4)  
2


**
Оператор возведения в степень  
print(9 * * 2)  
81


//
Оператор целочисленного деления  
print(6 // 4)
1

### Операторы сравнения (реляционные)

== 
Проверяет, равны ли операнды между собой. Если они равны, то выражение становится истинным.  
print(5 == 5)  
True  
print(6 == 44)  
False


!= 
Проверяет, равны ли операнды между собой. Если они не равны, то выражение становится истинным.  
print(12 != 12)  
False  
print(1231 != 0.4)  
True


'>'
Проверяет, больше ли левый операнд чем правый, если больше, то выражение становится истинным.  
print(53 > 23)  
True  
print(432 >500)  
False  


<
Проверяет, меньше ли левый операнд чем правый, если меньше, то выражение становится истинным.  
print(5 < 51)  
True  
print(6 < 4)  
False  


'>='
Проверяет, больше левый операнд, чем правый, или равен ему. Если больше или равен, то выражение становится истинным.  
print(5 >= 5)  
True  
print(6 >=44)  
False  


<=
Проверяет, меньше левый операнд, чем правый, или равен ему. Если меньше или равен, то выражение становится истинным.  
print(32 <= 232)  
True  
print(65 <= 9)  
False


### Операторы присваивания

=
Присваивает значение правого операнда левому  
var = 5  
print(var)  
5


+=
Прибавляет значение правого операнда к левому и присваивает левому. a += b эквивалентно записи
a=a+b  
var = 5  
var += 4  
print(var)  
9


-=
Отнимает значение у левого операнда правое и присваивает левому. a -= b эквивалентно записи a = a -b  
var = 5  
var -= 2  
print(var)  
3


*=
Умножает значение левого операнда на правое и присваивает левому. a *= b эквивалентно записи a=a*b  
var = 5  
var *= 10  
print(var)  
50  


/=
Делит значение левого операнда на правое и присваивает левому. a /= b эквивалентно записи a=a/b  
var = 5  
var /= 4  
print(var)  
1.25


%=
Делит с остатком значение левого операнда на правое и присваивает остаток левому. a %= b эквивалентно записи a = a % b
var = 5  
var %= 10  
print(var)  
5


**=
Возводит значение левого операнда в степень правого и присваивает левому. a **= b эквивалентно записи a = a ** b  
var = 5  
var **= 8  
print(var)  
390625  


//=
Целочисленно делит значение левого операнда на правое и присваивает левому. a //= b эквивалентно записи a = a // b  
var = 5  
var //= 30  
print(var)  
0

### Побитовые операторы
Данные операторы работают с данными в двоичной системе счисления. Например число 13 в двоичной системе будет равно 1101.

&  
Бинарный "И" оператор, копирует бит в результат, только если бит присутствует в обоих операндах  
0&0=0  
1&0=0  
0&1=0  
1&1=1  
101 & 110 = 100  


|
Бинарный "ИЛИ" оператор копирует бит, если тот присутствует в хотя бы в одном операнде  
0|0=0  
1|0=1  
0|1=1  
1|1=1  
101 | 110 = 111

In [69]:
# 1 == 001 in base2
# 3 == 011 in base2
# 4 == 100 in base2
# result == 111 (i.e. 7 in base10)

print(1|3|4)

7


^
Бинарный "Исключительное ИЛИ" оператор копирует бит только если бит присутствует в одном из операндов, но не в обоих сразу  
0^0=0  
1^0=1  
0^1=1  
1^1=0  
101 ^ 110 = 011

~
Побитовая операция "НЕ". Для числа a соответствует -(a+1)  
~1 = -10  
~0 = -1  
~101 = -110  


'>>'
Побитовый сдвиг вправо. Значение левого операнда "сдвигается" вправо на количество бит указанных в правом операнде  
100 >> 2 = 001  


<<
Побитовый сдвиг влево. Значение левого операнда "сдвигается" влево на количество бит указанных в правом операнде  
100 << 2 = 10000  

### Логические операторы

and
Логический оператор "И". Условие будет истинным если оба операнда истина  
True and True = True.  
True and False = False.  
False and True = False.  
False and False = False.  


or
Логический оператор "ИЛИ". Если хотя бы один из операндов истинный, то и все выражение будет истинным  
True or True = True.  
True or False = True.  
False or True = True.  
False or False = False.


not
Логический оператор "НЕ". Изменяет логическое значение операнда на противоположное  
not True = False.  
not False = True.  

### Операторы членства
Данные операторы участвуют в поиске данных в некоторой последовательности.

in
Возвращает истину, если элемент присутствует в последовательности, иначе возвращает ложь  
print('he' in 'hello')  
True  

print(5 in [1, 2, 3, 4, 5])  
True  

print(12 in [1, 2, 4, 56])  
False


not in
Возвращает истину, если элемента нет в последовательности  
результаты противоположны примерам выше


### Операторы тождественности
Данные операторы помогают сравнить размещение двух объектов в памяти компьютера  

is
Возвращает истину, если оба операнда указывают на один объект  
a = 12  
b = 12  
a is b  
True

c = 22  
a is c  
False  


is not
Возвращает ложь, если оба операнда указывают на один объект  
результаты противоположны примерам выше

## 4. Условные операторы

Основную часть пропускаю, выделяю неочевидное.

Стоит обратить внимание, что в случае, когда вы используете оператор if несколько раз на одном уровне вложенности инструкций, то они работают независимо друг от друга и не образуют одну общую инструкцию:

In [26]:
var = 10
if var == 10:
    print("var equal 10")
if var < 10:
    print("var less than 10")
else:
    print("var more than 10")

var equal 10
var more than 10


Оператор if всегда задает начало новой инструкции. В примере выше переменная var попадает на проверку в несколько инструкций, сперва мы получаем результат True в выражении var == 10, после чего выводится первое сообщение. Далее var опять проверяется следующей инструкцией, получается результат False и программа выводит второе сообщение, после оператора else. Давайте для наглядности построим блок-схему данной программы:

<div><img src="https://cs.sberbank-school.ru/image/full/full/resize/3df89eb6-4cd7-11ea-aaf1-005056011b68" alt="блок-схема" style="width: 1000px; margin-right: 75%; margin-left: 0; padding: 0"></div>

В данном случае будет корректно заменить второй if на elif, тогда мы получим единую инструкцию, которая выведет только одно верное сообщение:

In [27]:
var = 10
if var == 10:
    print("var equal 10")
elif var < 10:
    print("var less than 10")
else:
    print("var more than 10")

var equal 10


И блок-схема данной программы будет выглядеть следующим образом:

<div><img src="https://cs.sberbank-school.ru/image/full/full/resize/8e2ebccc-4cd6-11ea-97df-005056011b68" alt="блок-схема" style="width: 1000px; margin-right: 75%; margin-left: 0; padding: 0"></div>

Конструкции if-elif-else можно использовать на разных уровнях вложенности для более сложных программ:

In [None]:
if (условие):
    if (дополнительное условие):
        (выполнение дополнительного условия)
    elif (другое дополнительное условие):
         (выполнение другого дополнительного условия)
    elif ...
         ... 
    ...
    else: 
         ...
elif (другое условие):
    (выполнение другого условия)
elif ... 
     ...
else: 
     ...

## 6. Как не надо называть переменные
Пример правильно именования переменных. По истечении некоторого времени можно восстановить логику алгоритма.

In [8]:
zero =  ["  ***  ", " *   * ", "*     *", "*     *", "*     *"," *   * ","  ***  "]
one =   [" * ", "** ", " * ", " * ", " * ", " * ", "***"]
two =   [" *** ", "*   *", "*  * ", "  *  ", " *   ", "*    ", "*****"]
three = [" *** ", "*   *", "    *", "  ** ", "    *", "*   *", " *** "]
four =  ["   *  ", "  **  ", " * *  ", "*  *  ", "******", "   *  ", "   *  "]
five =  ["*****", "*    ", "*    ", " *** ", "    *", "    *", "**** "]
six =   ["*    ", "*    ", "*    ", "**** ", "*   *", "*   *", "**** "]
seven = ["*****", "    *", "   * ", "  *  ", " *   ", "*    ", "*    "]
eight = [" *** ", "*   *", "*   *", " *** ", "*   *", "*   *", " *** "]
nine =  [" ****", "*   *", "*   *", " ****", "    *", "    *", "    *"]

digits = [zero, one, two, three, four, five, six, seven, eight, nine]
number = '0123456789'
for row in range(7):
    line = ""
    for digit in number:
        line += digits[int(digit)][row] + " "
    print(line)

  ***    *   ***   ***     *   ***** *     *****  ***   **** 
 *   *  **  *   * *   *   **   *     *         * *   * *   * 
*     *  *  *  *      *  * *   *     *        *  *   * *   * 
*     *  *    *     **  *  *    ***  ****    *    ***   **** 
*     *  *   *        * ******     * *   *  *    *   *     * 
 *   *   *  *     *   *    *       * *   * *     *   *     * 
  ***   *** *****  ***     *   ****  ****  *      ***      * 


Тот же алгоритм, но с бессмысленными именами переменных. Понять логику намного сложнее.

In [None]:
var1 =  ["  ***  ", " *   * ", "*     *", "*     *", "*     *"," *   * ","  ***  "]
var2 =   [" * ", "** ", " * ", " * ", " * ", " * ", "***"]
var3 =   [" *** ", "*   *", "*  * ", "  *  ", " *   ", "*    ", "*****"]
var4 = [" *** ", "*   *", "    *", "  ** ", "    *", "*   *", " *** "]
var5 =  ["   *  ", "  **  ", " * *  ", "*  *  ", "******", "   *  ", "   *  "]
var6 =  ["*****", "*    ", "*    ", " *** ", "    *", "    *", "**** "]
var7 =   ["*    ", "*    ", "*    ", "**** ", "*   *", "*   *", "**** "]
var8 = ["*****", "    *", "   * ", "  *  ", " *   ", "*    ", "*    "]
var9 = [" *** ", "*   *", "*   *", " *** ", "*   *", "*   *", " *** "]
var10 =  [" ****", "*   *", "*   *", " ****", "    *", "    *", "    *"]
array = [var1, var2, var3, var4, var5, var6, var7, var8, var9, var10]
string = '0123456789'
for i in range(7):
    a = ""
    for l in string:
        a += array[int(l)][i] + " "
    print(a)

 Стоит отдельно отметить, что использование маленькой буквы "l"(эль), и заглавной буквы "I"(ай) в качестве однобуквенных идентификаторов при использовании некоторых шрифтов может вызывать путаницу, так как они схожи с цифрой 1. Такая же история с заглавной буквой "O" и нулем.

### Reserved words in Python

Ключевые слова

В стандартном пакете Python 3 существуют ключевые слова, которым отведен определенный функционал. Далее мы перечислим их, чтобы вы ознакомились с ними и в будущем избежали совпадений в названии своих переменных.

### Ключевые слова:

False - показатель ложности для булева типа;

True - показатель истинности для булева типа;

None - "пустой" объект;

and - логический оператор И;

with/as - менеджер контекста;

assert - условие, вызывающее исключение, если условие ложно;

break - оператор выхода из цикла;

class - тип, состоящий из методов и атрибутов;

continue - оператор перехода на следующую итерацию цикла;

def - обозначение функции;

del - определение функции;

elif - условный оператор в противном случае-если;

else - условный оператор в противном случае;

except - оператор перехвата исключения;

finally - выполняет инструкцию вне зависимости от исключения;

for - оператор цикла for;                

from - оператор импорта из модуля;

global - оператор создания доступности обращения к переменной за пределами функции;

if - условный оператор если;

import - оператор импорта модуля;

in - оператор проверки на вхождение;

is - оператор проверки ссылаются ли 2 объекта на одно место в памяти;

lambda - определение анонимной функции;

nonlocal - оператор создания доступности обращения к переменной в объемлющей инструкции;

not - логический оператор не;

or - логический оператор или;

pass - ничего не выполняющий оператор;

raise - оператор вызова исключения;

return - оператор возвращения результата;

try - выполнить инструкции, перехватив исключения;

while - условно-циклический оператор до тех пор;

yield - определение функции-генератора.

### Помимо ключевых слов, в Python 3 присутствуют встроенные функции:

bool(x) - преобразование к типу bool, использующая стандартную процедуру проверки истинности. Если х является ложным или опущен, возвращает значение False, в противном случае она возвращает True.

bytearray([источник [, кодировка [ошибки]]]) - преобразование к bytearray. Bytearray - изменяемая последовательность целых чисел в диапазоне 0≤X<256. Вызванная без аргументов, возвращает пустой массив байт.

bytes([источник [, кодировка [ошибки]]]) - возвращает объект типа bytes, который является неизменяемой последовательностью целых чисел в диапазоне 0≤X<256. Аргументы конструктора интерпретируются как для bytearray().

complex([real[, imag]]) - преобразование к комплексному числу.

dict([object]) - преобразование к словарю.

float([X]) - преобразование к числу с плавающей точкой. Если аргумент не указан, возвращается 0.0.

frozenset([последовательность]) - возвращает неизменяемое множество.

int([object], [основание системы счисления]) - преобразование к целому числу.

list([object]) - создает список.

memoryview([object]) - создает объект memoryview.

object() - возвращает безликий объект, являющийся базовым для всех объектов.

range([start=0], stop, [step=1]) - арифметическая прогрессия от start до stop с шагом step.

set([object]) - создает множество.

slice([start=0], stop, [step=1]) - объект среза от start до stop с шагом step.

str([object], [кодировка], [ошибки]) - строковое представление объекта. Использует метод __str__.

tuple(obj) - преобразование к кортежу.

abs(x) - возвращает абсолютную величину (модуль числа).

all(последовательность) - возвращает True, если все элементы истинные (или, если последовательность пуста).

any(последовательность) - возвращает True, если хотя бы один элемент - истина. Для пустой последовательности возвращает False.

ascii(object) - как repr(), возвращает строку, содержащую представление объекта, но заменяет не-ASCII символы на экранированные последовательности.

bin(x) - преобразование целого числа в двоичную строку.

callable(x) - возвращает True для объекта, поддерживающего вызов (как функции).

chr(x) - возвращает односимвольную строку, код символа которой равен x.

classmethod(x) - представляет указанную функцию методом класса.

compile(source, lename, mode, ags=0, dont_inherit=False) - компиляция в программный код, который впоследствии может выполниться функцией eval или exec. Строка не должна содержать символов возврата каретки или нулевые байты.

delattr(object, name) - удаляет атрибут с именем 'name'.

dir([object]) - список имен объекта, а если объект не указан, список имен в текущей локальной области видимости.

divmod(a, b) - возвращает частное и остаток от деления a на b.

enumerate(iterable, start=0) - возвращает итератор, при каждом проходе предоставляющем кортеж из номера и соответствующего члена последовательности.

eval(expression, globals=None, locals=None) - выполняет строку программного кода.

exec(object[, globals[, locals]]) - выполняет программный код на Python.

filter(function, iterable) - возвращает итератор из тех элементов, для которых function возвращает истину.

format(value[,format_spec]) - форматирование (обычно форматирование строки).

getattr(object, name ,[default]) - извлекает атрибут объекта или default.

globals() - словарь глобальных имен.

hasattr(object, name) - имеет ли объект атрибут с именем 'name'.

hash(x) - возвращает хеш указанного объекта.

help([object]) - вызов встроенной справочной системы.

hex(х) - преобразование целого числа в шестнадцатеричную строку.

id(object) - возвращает "адрес" объекта. Это целое число, которое гарантированно будет уникальным и постоянным для данного объекта в течение срока его существования.

input([prompt]) - возвращает введенную пользователем строку. Prompt - подсказка пользователю.

isinstance(object, ClassInfo) - истина, если объект является экземпляром ClassInfo или его подклассом. Если объект не является объектом данного типа, функция всегда возвращает ложь.

issubclass(класс, ClassInfo) - истина, если класс является подклассом ClassInfo. Класс считается подклассом себя.

iter(x) - возвращает объект итератора.

len(x) - возвращает число элементов в указанном объекте.

locals() - словарь локальных имен.

map(function, iterator) - итератор, получившийся после применения к каждому элементу последовательности функции function.

max(iter, [args ...] * [, key]) - максимальный элемент последовательности.

min(iter, [args ...] * [, key]) - минимальный элемент последовательности. next(x) - возвращает следующий элемент итератора.

oct(х) - преобразование целого числа в восьмеричную строку.

open(le, mode='r', buering=None, encoding=None, errors=None, newline=None, closefd=True) - открывает файл и возвращает соответствующий поток.

ord(с) - код символа.

pow(x, y[, r]) - идентично выражению ( x ** y ) % r.

reversed(object) - итератор из развернутого объекта.
repr(obj) - представление объекта.

print([object, ...], *, sep=" ", end='\n', le=sys.stdout) - вывод результата на экран.

property(fget=None, fset=None, fdel=None, doc=None) - возвращает специальный объект дескриптора.

round(X [, N]) - округление до N знаков после запятой.

setattr(объект, имя, значение) - устанавливает атрибут объекта.

sorted(iterable[, key][, reverse]) - отсортированный список.

staticmethod(function) - статический метод для функции.

sum(iter, start=0) - сумма членов последовательности.

super([тип [, объект или тип]]) - доступ к родительскому классу.

type(object) - возвращает тип объекта.

type(name, bases, dict) - возвращает новый экземпляр класса name.

vars([object]) - словарь из атрибутов объекта. По умолчанию - словарь локальных имен.

zip(*iters) - итератор, возвращающий кортежи, состоящие из соответствующих элементов аргументов-последовательностей.

## 7. Числа 

### Целые числа INT

a + b
Сложение

a - b
Вычитание

a * b
Умножение

a / b
Деление

a // b
Получение целой части от деления

a % b
Остаток от деления

-a
Смена знака числа

abs(a)
Модуль числа

divmod(a,b)
Получение пары чисел (a // b, a % b)

a ** b
Возведение в степень

pow(a, b[, c])
a в степени b. Если указано число c, тогда вычисляется остаток от деления на число c

Над целыми числами также можно производить битовые операции (&, | , ^, <<, >>, ~).

Также целые числа можно переводить в другие системы счисления используя методы:
- bin(a) - перевод числа в двоичную систему счисления
- hex(a) - перевод числа в 16-тиричную систему счисления
- oct(a) - перевод числа в 8-миричную системы счисления

После того как мы перевели число в другую систему счисления, перед самим числом обычно записывается символьное обозначение системы, в которой записано число. Так: 
- двоичная система обозначается символами "0b", 
- 16-тиричная - "0x", 
- 8-ричная - "0o".

In [7]:
>>> bin(3)
'0b11'
>>> hex(123)
'0x7b'
>>> oct(15)
'0o17'

'0o17'

### Числа с плавающей точкой (float)
Вещественные числа поддерживают те же операции, что и целые, однако из-за компьютерного представления, могут возникать неточности.

Для округления вещественного числа можно применить метод round().

Если к вещественному числу применить метод int(), т.е. привести его к целочисленному типу, тогда дробная часть просто отсекается.

In [None]:
>>> round(16.76)
17
>>> int(123.823)
123

### Комплексные числа (complex)
Комплексные числа - это числа вида a + bi, где a и b - действительные числа, а i - мнимая единица (квадратный корень из -1). Часть а является действительной частью, а часть b - мнимой. В математике мнимая единица записывается в виде буквы i, но **в Python она обозначается буквой j, исходя из инженерной традиции**.

Данный тип хранит пару значений float. Комплексные числа имеют особое математическое значение, поэтому мы не будем более подробно останавливаться на этом типе.

In [None]:
>>> z = -14.3 + 7.083j
>>> z.real 
-14.3 
>>> z.imag
7.083

## 8. Строки

### Операции со строками
Строки можно складывать:

In [11]:
s_1 = 'Python'
s_2 = ' '
s_3 = 'is awesome!'
print(s_1 + s_2 + s_3)

Python is awesome!


Или дублировать:

In [12]:
print('Spam! ' * 3)

Spam! Spam! Spam! 


С помощью метода **len()** можно узнать количество символов в строке:

In [14]:
len('Python')

6

Можно обращаться к элементам по их индексу **(индексация ведется от нуля)**:

In [43]:
s = 'Python'
print(s[0])

P


In [42]:
s = 'Python'
print(s[5])

n


По индексу можно извлекать несколько символов, тогда это будет называться **срез**:

In [40]:
s = 'Python'
print(s[1:2])

y


In [38]:
s = 'Python'
print(s[0:])

Python


In [39]:
s = 'Python'
print(s[:3])

Pyt


In [41]:
s = 'Python'
print(s[:])

Python


Срез с шагом

In [11]:
s = 'Python'
print(s[1::4])
print(s[::4])
print(s[5:1:-2])
print(s[::-1])  # reversed string

yn
Po
nh
nohtyP


### Методы работы со строками 
Рассмотрим часть наиболее популярных методов:

- **find(str, [start],[end])** - Поиск подстроки в строке. Возвращает номер первого вхождения или -1

In [15]:
s = 'PythonohtyP'
s.find('t')

2

- **rfind(str, [start],[end])** - Поиск подстроки в строке. Возвращает номер последнего вхождения или -1

In [17]:
s = 'PythonohtyP'
s.rfind('t')

8

- **index(str, [start],[end])** - Поиск подстроки в строке. Возвращает номер первого вхождения или вызывает ValueError

In [18]:
s = 'Python'
s.index('t')

2

- **rindex(str, [start],[end])** - Поиск подстроки в строке. Возвращает номер последнего вхождения или вызывает ValueError

In [19]:
s = 'PythonohtyP'
s.rindex('t')

8

- **isdigit()** - Состоит ли строка из цифр

In [24]:
s = 'Python'
s.isdigit()

False

- **isalpha()** - Состоит ли строка из букв

In [26]:
s = 'Python'
s.isalpha()

True

- **isalnum()** - Состоит ли строка из цифр или букв

In [27]:
s = 'Python'
s.isalnum()

True

- **islower()** - Состоит ли строка из символов в нижнем регистре

In [1]:
s = 'Python'
s.islower()

False

- **isupper()** - Состоит ли строка из символов в верхнем регистре

In [29]:
s = 'Python'
s.isupper()

False

- **istitle()** - Начинаются ли слова в строке с заглавной буквы

In [30]:
s = 'Python'
s.istitle()

True

- **upper()** - Преобразование строки к верхнему регистру

In [31]:
s = 'Python'
s.upper()

'PYTHON'

- **lower()** - Преобразование строки к нижнему регистру

In [32]:
s = 'Python'
s.lower()

'python'

- **startswith(str)** - Начинается ли строка S с шаблона str

In [33]:
s = 'Python'
s.startswith('P')

True

- **endswith(str)** - Заканчивается ли строка S шаблоном str

In [34]:
s = 'Python'
s.endswith('a')

False

- **join(list)** - Сборка строки из списка с разделителем S

In [36]:
s = ' Python '
s.join(['a','b','c'])

'a Python b Python c'

- **replace(шаблон, замена)** - Замена шаблона

In [22]:
s = 'Python'
s.replace('P', 'AAA')

'AAAython'

- **split(символ)** - Разбиение строки по разделителю

In [23]:
s = 'Python'
s.split('t')

['Py', 'hon']

## 9. Списки

### Описание
Списками в Python называются массивы. Они могут содержать данные различных типов. Для создания списка автоматически можно использовать метод list():

In [1]:
list('Python')
['P','y','t','h','o','n']

['P', 'y', 't', 'h', 'o', 'n']

Также можно это сделать напрямую, присвоив переменной значение типа list:

In [3]:
# Пустой список
s = []
# список с данными разных типов
l = ['s', 'p', ['isok'], 2]

print(s)
print(l)

[]
['s', 'p', ['isok'], 2]


Также можно использовать генераторы списков:

In [7]:
a = ['P', 'y', 't', 'h', 'o', 'n']
b = [i * 3 for i in a]
print(b)

['PPP', 'yyy', 'ttt', 'hhh', 'ooo', 'nnn']


Количество элементов в списке можно узнать с помощью функции len():

In [5]:
a = ['P', 'y', 't', 'h', 'o', 'n']
len(a)

6

В списках, так же как и в строках, можно обратиться к элементу через индекс s[2] или s[3], для сравнение или вывода на печать:

In [28]:
s = ['P', 'y', 't', 'h', 'o', 'n'] 
print(s[2], s[3])

t h


Генераторы списков позволяют создавать и заполнять списки. Генератор списков предполагает наличие итерируемого объекта или итератора, на основании которого будет создаваться новый список, а также выражения, которое будет производить манипуляции с извлеченными из последовательности элементами перед тем как добавить их в формируемый список. 

### Методы для работы со списками

Методы списков вызываются по схеме: **list.method()**. Ниже будут перечислены полезные методы для работы со списками:

- **append(a)** - добавляет элемент a в конец списка

In [10]:
var = ['l', 'i', 's', 't']
var.append('a')
print(var)

['l', 'i', 's', 't', 'a']


- **extend(L)** - расширяет список, добавляя к концу все элементы списка L

In [11]:
var = ['l', 'i', 's', 't']
var.extend(['l', 'i', 's', 't'])
print(var)

['l', 'i', 's', 't', 'l', 'i', 's', 't']


- **insert(i, a)** - вставляет на i позицию элемент a

In [12]:
var = ['l', 'i', 's', 't']
var.insert(2,'a')
print(var)

['l', 'i', 'a', 's', 't']


- **remove(a)** - удаляет первое найденное значение элемента в списке со значением `a`, возвращает ошибку, если такого элемента не существует

In [13]:
var = ['l', 'i', 's', 't', 't']
var.remove('t')
print(var)

['l', 'i', 's', 't']


- **pop(i)** - удаляет i-ый элемент и возвращает его; если индекс не указан, удаляет последний элемент

In [15]:
var = ['l', 'i', 's', 't']
var.pop(0)
print(var)

['i', 's', 't']


- **index(a)** - возвращает индекс элемента `a` (индексация начинается с `0`)

In [3]:
var = ['l', 'i', 's', 't']
var.index('t')

3

- **count(a)** - возвращает количество элементов со значением `a`

In [18]:
var = ['l', 'i', 's', 't']
var.count('t')

1

- **sort([key = функция])** - сортирует список на основе функции, можно не прописывать функцию, тогда сортировка будет происходить по встроенному алгоритму

In [19]:
var = ['l', 'i', 's', 't']
var.sort()
print(var)

['i', 'l', 's', 't']


- **reverse()** - разворачивает список

In [20]:
var = ['l', 'i', 's', 't']
var.reverse()
print(var)

['t', 's', 'i', 'l']


- **copy()** - поверхностная копия списка; при присвоении переменной копии списка значение данного списка не изменяется в случае изменения первого. Если переменной присвоить список через "=", тогда значение этой переменной будет меняться при изменении оригинала

In [22]:
var = ['l', 'i', 's', 't']
asd = var.copy()
print(asd)

['l', 'i', 's', 't']


In [26]:
var = ['l', 'i', 's', 't']
asd = var
print(asd)
print(var)

var.reverse()
print(asd)
print(var)

['l', 'i', 's', 't']
['l', 'i', 's', 't']
['t', 's', 'i', 'l']
['t', 's', 'i', 'l']


In [24]:
var = ['l', 'i', 's', 't']
asd = var.copy()
print(asd)
print(var)

var.reverse()
print(asd)
print(var)

['l', 'i', 's', 't']
['l', 'i', 's', 't']
['l', 'i', 's', 't']
['t', 's', 'i', 'l']


- **clear()** - очищает список

In [27]:
var = ['l', 'i', 's', 't']
var.clear()
print(var)

[]


## 10. Кортежи

### Описание
Как говорилось ранее, кортежи это неизменяемые списки. Их удобно использовать для защиты данных, которые не должны быть изменены. Создать кортеж можно следующим образом:

In [29]:
a = (1, 2, 3, 4, 5, 6)
print(a)

(1, 2, 3, 4, 5, 6)


Чтобы создать пустой кортеж, необходимо применить метод **tuple()**:

In [30]:
a = tuple()
print(a)

()


Если вам нужен кортеж из одного элемента, то он создается следующим образом:

In [31]:
a = (1,)
print(a)

(1,)


Если не указать на конце запятую, тогда мы получим не кортеж, а элемент того типа, который мы указали:

In [32]:
a = (1)
print(a)

1


Кстати, необязательно даже указывать скобки, кортеж можно создать и без них:

In [33]:
a = 1, 2, 3, 4
print(a)

(1, 2, 3, 4)


Над кортежами работают все операции, работающие со списками, которые не вносят изменения в список.

## 11. Словари

### Описание
Словари - это неупорядоченные коллекции пар "ключ-значение". В качестве ключей могут использоваться ссылки на хешируемые объекты, а в качестве значений - ссылки на объекты любого типа. Т.к. словари являются неупорядоченными коллекциями, то к ним не применяется понятие индекса элемента и не применяется операция извлечения среза.

### Определение

**Хешируемые объекты** - объекты, которые имеют метод **\_\_hash\_\_()** и могут участвовать в операциях сравнения на равенство с помощью метода **\_\_eq\_\_()**.

Метод **\_\_hash\_\_()** возвращает одно и то же значение объекта на протяжении его жизненного цикла.

Чтобы создать словарь можно использовать метод **dict()**:

In [35]:
d = dict(short='dict', long='dictionary')
print(d)

{'short': 'dict', 'long': 'dictionary'}


In [36]:
d = dict([(1, 1), (2, 4)])
print(d)

{1: 1, 2: 4}


В созданных выше словарях мы получили пары "ключ-значение", в частности ключ **short** и соответствующее ему значение **dict**.

Также можно создать словарь следующим образом:

In [37]:
d = {}
print(d)

{}


In [38]:
d = {'dict': 1, 'dictionary': 2}
print(d)

{'dict': 1, 'dictionary': 2}


Еще один способ - использовать метод **fromkeys()**:

In [39]:
d = dict.fromkeys(['a', 'b'])
print(d)

{'a': None, 'b': None}


In [40]:
d = dict.fromkeys(['a', 'b'], 100)
print(d)

{'a': 100, 'b': 100}


Также можно использовать генератор словарей:

In [42]:
d = {a: a ** 2 for a in range(7)}
print(d)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36}


Как можно работать со словарями:

In [43]:
d = {1: 2, 2: 4, 3: 9}
print(d[1])

2


In [44]:
d = {1: 2, 2: 4, 3: 9}
d[4] = 4 ** 2
print(d)

{1: 2, 2: 4, 3: 9, 4: 16}


In [45]:
d = {1: 2, 2: 4, 3: 9}
d['1']

KeyError: '1'

В первом случае мы обратились к ключу "1", после чего получили вывод на экран его значения "2". Затем мы создали новый ключ "4" и присвоили ему значение "16", после чего эта пара добавилась к нашему словарю. В последнем примере мы попробовали обратиться к несуществующему ключу, поскольку значение '1' стоит в кавычках, а значит это другой тип данных, которого нет в нашем словаре, после чего получили сообщение о том, что такого ключа нет.

### Методы для работы со словарями
Методы вызываются по схеме: **dict.method()**. Ниже будут перечислены полезные методы для работы со словарями:

- **clear()** - очищает словарь

In [46]:
d = {'a': 1, 'b': 2}
d.clear()
print(d)

{}


- **copy()** - возвращает копию словаря

In [47]:
d = {'a': 1, 'b': 2}
b = d.copy()
print(b)

{'a': 1, 'b': 2}


- **fromkeys(seq[,value])** - создает словарь с ключами из seq и значением value

In [73]:
print(d.fromkeys(['a', 'b'], 10))
print(d.fromkeys('a', 10))

{'a': 10, 'b': 10}
{'a': 10}


- **get(key[, default])** - возвращает значение ключа, но если его нет, возвращает default

(Вранье. Смотреть _Dr Chuck_ **"Python for Everybody"** - .get дает возможность не просто получить значение, а перезаписать любой ключ и его значение, что очень удобно для подсчета, то есть действует как .update, но удобнее)

In [80]:
d = {'a': 1, 'b': 2}

print(d.get('a'))
print(d.get('c'))

1
None


Вот сравнить .get и .update:

In [1]:
d = {'a': 1, 'b': 2}

d['c'] = d.get('c', 0)
d['e'] = d.get('e')
d['f'] = d.get('c')

print(d)

{'a': 1, 'b': 2, 'c': 0, 'e': None, 'f': 0}


- **update([other])** - обновляет словарь, добавляя пары (ключ, значение) из other. Существующие ключи перезаписываются

In [75]:
d = {'a': 1, 'b': 2}
d.update({'d':5})

print(d.update({'d':5}))
print(d)

None
{'a': 1, 'b': 2, 'd': 5}


- **keys()** - возвращает ключи в словаре

In [54]:
d = {'a': 1, 'b': 2}
print(d.keys())

dict_keys(['a', 'b'])


- **values()** - возвращает значения в словаре

In [67]:
d = {'a': 1, 'b': 2}
d.values()

dict_values([1, 2])

- **items()** - возвращает пары (ключ, значение) в виде списка кортежей пар

In [53]:
d = {'a': 1, 'b': 2}
d.items()

dict_items([('a', 1), ('b', 2)])

- **pop(key[, default])** - удаляет ключ и возвращает значение. Если ключа нет, возвращает default

In [71]:
d = {'a': 1, 'b': 2}
print(d.pop('a'))
print(d.pop('c', None))
print(d)

1
None
{'b': 2}


- **popitem()** - удаляет и возвращает пару (ключ, значение) с конца

In [58]:
d = {'a': 1, 'b': 2}
print(d.popitem())
print(d)

('b', 2)
{'a': 1}


- **setdefault(key[, default])** - возвращает значение ключа, но если его нет, создает ключ с значением default

In [65]:
d = {'a': 1, 'b': 2}

d.setdefault('e', 6)
print(d.setdefault('e', 6))

d.setdefault('f')
print(d.setdefault('f'))
print(d)

6
None
{'a': 1, 'b': 2, 'e': 6, 'f': None}


## 12. Множества

### Описание
Как говорилось ранее, множества содержат неповторяющиеся данные в произвольном порядке. Создадим множество несколькими способами:

In [2]:
a = set()
print(a)

set()


In [2]:
a = set('hello')
a

{'e', 'h', 'l', 'o'}

In [3]:
a = {'a', 'b', 'c', 'd'}
a

{'a', 'b', 'c', 'd'}

In [4]:
a = {i ** 2 for i in range(10)}
a

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

Множества удобно использовать для удаления повторяющихся элементов:

In [11]:
words = ['hello', 'daddy', 'hello', 'mum']
set(words)

{'daddy', 'hello', 'mum'}

### Методы для работы со множествами
Методы множеств, в основном, вызываются по схеме: **set.method()**. Ниже будут перечислены полезные методы для работы с множествами:

- **len(s)** - число элементов в множестве (размер множества)

In [13]:
a = {'a', 'b', 'c', 'd'}
len(a)

4

- x **in** s - принадлежит ли x множеству s

In [14]:
a = {'a', 'b', 'c', 'd'}
'a' in a

True

- **isdisjoint(other)** - истина, если set и other не имеют общих элементов

In [15]:
a = {'a', 'b', 'c', 'd'}
a.isdisjoint('a')

False

In [17]:
a = {'a', 'b', 'c', 'd'}
a.isdisjoint('f')

True

- **issubset(other)** или **set <= other** - истина, если все элементы set принадлежат other

In [18]:
a = {'a', 'b', 'c', 'd'}
a.issubset({'a', 'b', 'c', 'd','f','e'})

True

- **issuperset(other)** или **set >= other** - аналогично

- **union(other, ...)** или **set | other | ...** - возвращает объединение нескольких множеств

In [20]:
a = {'a', 'b', 'c', 'd'}
a.union({'f','d'})

{'a', 'b', 'c', 'd', 'f'}

- **update(other, ...)** или **set |= other | ...** - объединение множеств. Метод, вносящий изменения в множество

In [26]:
a = {'a', 'b', 'c', 'd'}
a.update({'w','z'})
print(a)

{'d', 'a', 'w', 'c', 'b', 'z'}


- **intersection(other, ...)** или **set & other & ...** - возвращает пересечение множеств

In [21]:
a = {'a', 'b', 'c', 'd'}
a.intersection({'f','a'})

{'a'}

- **intersection_update(other, ...)** или **set &= other & ...** - пересечение множеств. Метод, вносящий изменения в множество

In [27]:
a = {'a', 'b', 'c', 'd'}
a.intersection_update({'a','d'})
print(a)

{'d', 'a'}


- **difference(other, ...)** или **set - other - ...** - вычитание множества other; возвращает множество из всех элементов set, не принадлежащих ни одному из other

In [22]:
a = {'a', 'b', 'c', 'd'}
a.difference({'a','f','d'})

{'b', 'c'}

- **difference_update(other, ...)** или **set -= other | ...** - вычитание множеств. Метод, вносящий изменения в множество

In [28]:
a = {'a', 'b', 'c', 'd'}
a.difference_update({'a','d'})
print(a)

{'c', 'b'}


- **symmetric_difference(other)** или **set ^ other** - симметрическая разность; возвращает множество из элементов, встречающихся в одном множестве, но не встречающиеся в обоих

In [23]:
a = {'a', 'b', 'c', 'd'}
a.symmetric_difference({'a','d'})

{'b', 'c'}

- **symmetric_difference_update(other)** или **set ^= other** - симметрическая разность; множество из элементов, встречающихся в одном множестве, но не встречающихся в обоих. Метод, вносящий изменения в множество

In [29]:
a = {'a', 'b', 'c', 'd'}
a.symmetric_difference_update({'a','b'})
print(a)

{'d', 'c'}


- **copy()** - копия множества

In [25]:
a = {'a', 'b', 'c', 'd'}
d = a.copy()
print(d)

{'d', 'a', 'c', 'b'}


- **add(elem)** - добавляет элемент в множество. Метод, вносящий изменения в множество

In [30]:
a = {'a', 'b', 'c', 'd'}
a.add('r')
print(a)

{'r', 'c', 'd', 'a', 'b'}


- **remove(elem)** - удаляет элемент из множества. KeyError, если такого элемента не существует. Метод, вносящий изменения в множество

In [31]:
a = {'a', 'b', 'c', 'd'}
a.remove('b')
print(a)

{'d', 'a', 'c'}


- **discard(elem)** - удаляет элемент, если он находится в множестве. Метод, вносящий изменения в множество

In [32]:
a = {'a', 'b', 'c', 'd'}
a.discard('c')
print(a)

{'d', 'a', 'b'}


- **pop()** - удаляет первый элемент из множества. Так как множества не упорядочены, нельзя точно сказать, какой элемент будет первым. Метод, вносящий изменения в множество

In [34]:
a = {'a', 'b', 'c', 'd'}
a.pop()
print(a)

{'a', 'c', 'b'}


- **clear()** - очистка множества. Метод, вносящий изменения в множество

In [35]:
a = {'a', 'b', 'c', 'd'}
a.clear()
print(a)

set()


**frozenset**: единственное отличие от **set** заключается в том, что frozenset не меняется, соответственно, к frozenset можно применить только те методы, которые не меняют множество.

## 13. Функции

### Описание
Функции в Python - это объекты, принимающие аргументы и возвращающие значение. Функции определяются с помощью инструкции **def**:

In [36]:
def sum(x, y):
    return x + y

Функции позволяют упаковывать часть кода для его последующего повторного вызова. В примере выше определена функция с именем sum, которая принимает два параметра x и y и возвращает результат их суммы. Обратившись к этой функции по имени и задав параметры, мы можем получить результат:

In [39]:
sum(34, 12)

46

In [38]:
sum('abc', 'def')

'abcdef'

Инструкция **return** позволяет вернуть значение, которое нам необходимо. Это необходимо для того, чтобы получить определенный результат и затем дальше использовать его в программе.

Функция может быть любой сложности, внутри конструкции **def -> return**, мы можем написать любой код. Смысл в функциях заключается в том, чтобы не писать один и тот же код повторно, а просто, в нужный момент, вызывать заранее написанную функцию. Так же функция может быть без параметров или может не возвращать какое-то конкретное значение или не заканчиваться инструкцией **return** вовсе:

In [51]:
def fun():
    var = 'Python'
    if len(var) >= 7:
        print(var)
    return           # В этом случае функция вернет значение None

fun()

Код под инструкцией **def** будет относиться к функции до тех пор, пока он вложен в эту инструкцию, то есть отступает от **def**.

Функции бывают разных типов:

- **Глобальные функции** - такие функции доступны из любой части кода файла, в котором они написаны. Глобальные функции доступны из других модулей, но об этом мы расскажем в разделе "Подключение модулей".

In [52]:
# Объявляем функцию 
def solve(s):
    c = []
    for i in range(len(s)):
        if i%2 == 0:
            c.append(s[i])
    return c

# вызываем функцию solve с заданными параметрами и выводим результат ее работы
print(solve([1, 2, 3, 4, 5, 6, 7, 8]))

[1, 3, 5, 7]


- **Локальные функции** - функции, объявленные внутри других функций. Вызвать их можно только внутри функции, в которой они объявлены. Их удобно использовать, если необходима небольшая вспомогательная функция, которая больше нигде не используется.

- **Лямбда-функции** - особые, анонимные функции, имеющие ряд ограничений, по сравнению с обычными функциями. Они локально решают единственную задачу. Применение такой функции выглядит, как выражение, давайте посмотрим на примере:

In [53]:
# Обычная функция 
def search_len(arg_1):
    return len(arg_1)

# Лямбда-функция 
result = lambda x: len(x)

Обычно, лямбда-функции применяют при вызове функций, которые в качестве аргументов содержат функции. Проблема использования лямбда-функций состоит в том, что иногда усложняется читаемость кода.

In [56]:
func = lambda x, y: x + y

print(func(1, 2))
print(func('a', 'b'))

print((lambda x, y: x + y)(1, 2))
print((lambda x, y: x + y)('a', 'b'))

3
ab
3
ab


Лямбда-функции не имеют имени, поэтому могут возникать проблемы с отловом ошибки. В рамках данного курса мы не будем более подробно останавливаться на данном виде функций и рекомендуем использовать стандартный, более явный тип.

- **Методы** - функции, работающие в связке с тем типом данных, который ассоциирован с данной функцией. В прошлых разделах приводились примеры методов для каждого типа. Более подробный разбор методов является частью объектно-ориентированного программирования и не входит в рамки данного курса.

Функции могут принимать произвольное количество аргументов, для этого необходимо поставить символ * перед именем аргумента функции:

In [59]:
def func(*args):
    return args

func(1, 2, 3, 'abc')

(1, 2, 3, 'abc')

Как мы видим в таком случае образуется **кортеж** из этих аргументов. Также можно принимать аргументы в виде **словаря**, для этого необходимо использовать символ \**:

In [60]:
def func(**kwargs):
    return kwargs

func(a=1, b=2, c=3)

{'a': 1, 'b': 2, 'c': 3}

Очень важно **документировать** описание к любой функции, чтобы каждый раз не разбирать написанное заново. Для этого используют строки, заключенные в тройные кавычки. Поскольку описание функции зачастую состоит более, чем из 1 строки, использование строк с тройными кавычками очень удобно. Обычно под документирование выделяют место между определением функции и началом основного кода:

In [62]:
def solve(s):
    ''' Функция solve(s) принимает список 
        создает пустой список   
        находит элементы с четным индексом (включая 0) 
        заносит их в созданный список и возвращает его 
    '''
    c = []
    for i in range(len(s)):
        if i%2 == 0:
            c.append(s[i])
    return c

Переменные, которые объявляются внутри функций являются, **локальными**. Изменение этих переменных и обращение к ним происходят только внутри функций, где они были объявлены. 

Если же переменные объявлены вне функций, они являются **глобальными**. С глобальными переменными надо обходиться осторожно. Их удобно использовать, потому что к ним можно обращаться из любой части кода и даже из других модулей, но, если в коде происходит неконтролируемое изменение глобальной переменной, то поиск ошибки может перерасти в головную боль. Рассмотрим пример:

In [2]:
var_1 = [1,2,3]
  
def func(a):
    var_1 = []
    for i in a:
        var_1.append(i*2)
    return var_1


**Глобальная** переменная var_1 в данном случае остается неизменной, т.к. она используется только в качестве параметра для функции и нигде не происходит манипуляций над ней. Внутри этой функции изменения происходят с **локальной** переменной var_1. Результат выполнения такой программы будет следующий:

In [9]:
# !Run the previous cell
print(func(var_1))
print(var_1)

[2, 4, 6, 24]
[1, 2, 3, 12]


Теперь приведем пример **плохого кода**, в котором происходят манипуляции с глобальной переменной:

In [5]:
var_1 = [1,2,3]
  
def func(a):
    var_2 = []
    for i in a:
        var_2.append(i*2)
    return var_2

var_3 = var_1
var_3.append(12)

print(func(var_1))
print(var_1)


[2, 4, 6, 24]
[1, 2, 3, 12]


За счет того, что var_3 связывается с тем же объектом, что и var_1, то изменения над глобальной переменной var_3 приведет к изменению другой глобальной переменной  var_1. В итоге эта цепочка меняет результат выполнения функции, поскольку на вход подаются уже другие данные. Вот пример неосторожного обращения с глобальными переменными. А теперь представьте, что у вас сотни строк кода и десяток функций, можете представить, сколько времени понадобится на поиск подобной ошибки? 

## Дополнительно
Давайте еще раз рассмотрим один из примеров данного раздела:

In [7]:
def solve(s):
    ''' Функция solve(s) принимает список
        создает пустой список   
        находит элементы с четным индексом (включая 0)
        заносит их в созданный список и возвращает его
    ''' 
    c = []
    for i in range(len(s)):
        if i%2 == 0:
            c.append(s[I])
    return c


В описании к функции написано, что она принимает список. А что, если ей на вход попадёт строка или словарь? 

В случае со строкой все будет нормально, но вот словарь вызовет ошибку. Чтобы избежать подобную ситуацию, мы можем прописать условия проверки входного параметра. Сделать это можно с помощью условия **assert**:

In [8]:
def solve(s):
    ''' Функция solve(s) принимает список
        создает пустой список   
        находит элементы с четным индексом (включая 0)
        заносит их в созданный список и возвращает его
    '''
    assert type(s) == list
    c = []
    for i in range(len(s)):
        if i%2 == 0:
            c.append(s[I])
    return c


Теперь, если на вход функции solve() попадет какой-либо тип кроме списка, assert проверит это и выведет ошибку определенного рода:

In [10]:
# !Run the previous cell
solve({1:2, 3:4})

AssertionError: 

Данный инструмент полезно использовать для выявления неустранимых ошибок программы. То есть в данном случае наша функция не предполагает получения данных, отличных от типа "список". Однако в случае, когда что-то пошло не так, с помощью **assert** мы будем знать об этом.

## 14. Исключения

Предисловие
Исключения - это объекты, которые выводятся на экран как строка с текстом сообщения. Обычно они вызываются функциями и методами при возникновении ошибок или других важных событий при выполнении программы. В предыдущем разделе мы ловили ошибку с помощью assert. Данная функция вызывала исключение:

In [None]:
Traceback (most recent call last):
  File "solve.py", line 11, in <module>
    print(solve(123))
  File "solve.py", line 3, in solve
    assert type(s) == list
AssertionError

Существует множество видов исключений, вот только некоторые из них:

- **BaseException** - базовое исключение, порождающее все остальные
- **SystemExit** - системное исключение, порождаемое функцией sys.exit при выходе из программы
- **KeyboardInterrupt** - системное исключение, порождаемое пользовательским выходом из программы с помощью сочетания клавиш 
- **ArithmeticError** - арифметическая ошибка
- **AssertionError** - выражение assert ложно
- **ImportError** - ошибка импорта модуля или его атрибута
- **IndexError** - индекс не входит в диапазон элементов
- **NameError** - не найдено переменных с таким именем
- **SyntaxError** - ошибка синтаксиса
- **TypeError** - операция к объекту несоответствующего типа  
и т.д.

Исключения позволяют понять какого рода ошибки возникают при выполнении программ. Иногда необходимо отловить ошибку конкретного вида или пропустить ее, не обращая внимания. Для этого существуют обработчики исключений.

### Конструкция try...except
Конструкция try ... except позволяет перехватывать исключения, полный синтаксис выглядит следующим образом:

In [None]:
try:
    try_suite
except exception_group1 as variable1:
    except_suite1
...
except exception_groupN as variableN: 
    except_suiteN
else:
    else_suite
finally:
    finally_suite

Минимально необходимая конструкция должна состоять из операторов **try** и **except**. Все остальные операторы являются необязательными.

После оператора **try** записывается вложенная инструкция того, что должна выполнить программа. В случае успешного выполнения, выполнится инструкция после оператора **else**, если такой есть в программе. Если присутствует оператор **finally**, тогда вложенная в него инструкция выполняется всегда и в последнюю очередь. Если во время выполнения инструкции **try_suite** возникает исключение, то оно проверяется на соответствие операторами **except**. **Exception_group** может быть как единственным видом исключений, так и кортежем нескольких. Приставка **as variable1** является необязательной и служит для записи исключения в переменную **variable1**, чтобы затем к нему можно было обратиться в инструкции **except_suite1**. Инструкция **except_suite1** будет выполняться, когда при выполнении **try_suite** возникнет исключение, соответствующее **exception_group1**.

При работе с исключениями необходимо помнить, что существует определенная иерархия в структуре исключений: 

<div style="width: 700px"><img src="https://cs.sberbank-school.ru/image/full/full/resize/15681190-473a-11ea-b7d8-005056011b68" alt="Фрагмент структуры исключений" /></div>

При отлове конкретных ошибок необходимо указывать их вид в первую очередь, т.е.:

In [None]:
try:
    try_suite
except IndexError:
    except_suite1
except Exception:
    except_suite2

В данном примере нам необходимо отловить ошибку индекса и выполнить соответствующее действие, а при возникновении любой другой - иное действие. В таком случае, исходя из структуры исключений, мы должны прописать конкретный вид исключения выше, чем более общий. Потому, что при возникновении **IndexError**, инструкция **except_suite2** будет также исполнена, т.к. **IndexError** является частью вида **Exception**. И, если, нам необходимо, чтобы **except_suite1** выполнился раньше **except_suite2**, то мы указываем более частный вид исключения. 

Исключения могут быть полезными, однако есть и несколько недостатков применения исключений. Например, они используются, когда природа ошибки заранее известна, а это частный случай. Гораздо важнее, если бы программа могла сигнализировать о заранее неизвестной ошибке. Помимо этого, бывает невозможно определить какая строка кода будет выполняться после перехвата исключения. В любом случае, перехват исключений не является необходимым инструментом при написании кода, каждый может применять его на свое усмотрение.

## 15. Работа с файлами

### Описание
Python позволяет работать с файлами. В качестве примера будем работать с текстовым файлом.
Прежде чем начать работать с файлом необходимо его открыть, для этого есть метод **open()**:

In [None]:
f = open('test.txt', 'r')

Мы присваиваем переменной **f** результат выполнения команды открытия файла, параметры этой команды - адрес файла, путь до места, где он расположен на компьютере с названием файла(**test**) и его расширением(.**txt**), говорящим что он текстовый. Второй параметр **'r'** означает, что файл открыт для чтения, то есть мы не сможем вносить изменения в этот файл до тех пор, пока он открыт только для чтения.

У метода open() существует много аргументов:

**'r'** - открытие на чтение(значение по умолчанию)  
**'w'** - открытие на запись, содержимое файла удаляется и перезаписывается заново, если файла не существует, создается новый  
**'x'** - открытие на запись, только если файла не существует  
**'a'** - открытие на дозапись, информация добавляется в конец файла  
**'b'** - открытие файла в двоичном виде  
**'t'** - открытие в текстовом режиме(значение по умолчанию)  
**'+'** - открытие на чтение и запись  

Возможно сочетание режимов, например **'rb'**, чтение в бинарном виде, по умолчанию установлен **'rt'**.

После открытия файла можно прочитать из него информацию, благодаря методу **read()**:

In [5]:
f = open('test.txt', 'r', encoding='utf-8')
f.read()

'Наше дело правое! \nВраг разбит! \nМы победили!'

Также можно прочитать и вывести файл построчно:

In [2]:
f = open('test.txt', 'r', encoding='utf-8') 
for line in f:
    print(line)

Наше дело правое! 

Враг разбит! 

Мы победили!


Записать информацию в файл можно, открыв файл на запись:

In [18]:
f = open('test1.txt', 'w')
for i in range(1, 4):
    f.write(str(i) + '\n')
    print(i)

1
2
3


По окончании работы с файлом его необходимо закрыть, используя метод **close()**:

In [20]:
f.close()

## 16. Подключение модулей

### Описание
Модулем в Python называется любой файл с программой с расширением **.py**. То есть любой ваш код, заключенный в файл, является модулем. Когда разрабатывается любая программа, она редко ограничивается одним файлом. Обычно это набор файлов. Для того, чтобы не писать один и тот же код в каждом файле, к каждому файлу можно подключить другой файл. Подключив другой файл (модуль), из него можно достать полезный метод, который может понадобиться.

Давайте в качестве примера подключим стандартный модуль **datetime**, чтобы достать оттуда метод **datetime.today()**:

In [1]:
import datetime
print(datetime.datetime.today()) 

2022-10-15 14:32:31.220024


Подключив стандартный модуль, мы достали метод получения текущей даты и времени, после чего вызвали его и получили вывод на экран. 

На языке Python очень много дополнительных библиотек, которые можно доустановить и затем вызвать необходимые методы для улучшения работоспособности своего кода, а зачастую и раскрывая новые возможности. Прежде чем начать работать с новой для себя библиотекой, стоит ознакомиться с ее методами, чтобы эффективно использовать в своей работе.

Также можно использовать псевдонимы для модулей, чтобы сократить их названия:

In [2]:
import datetime as m
print(m.datetime.today())

2022-10-15 14:34:04.703391


Можно сделать подключение модуля еще удобнее, использовав инструкцию **from**:

In [3]:
from datetime import datetime as m
print(m.today())

2022-10-15 14:34:44.134406


Также мы можем достать все методы сразу, использовав символ *:

In [4]:
from datetime import *

### Модуль random
Модуль **random** - дополнительный модуль из стандартной библиотеки Python. Он содержит функции для генерации случайных чисел, букв, символов и случайных элементов последовательности. Вот некоторые из них:

- **random.randrange(start, stop[, step])** - возвращает случайно выбранное число из диапазона, **start** - целое число, начало последовательности (по умолчанию 0), **stop** - конечное число в последовательности, не входящее в нее, **step** - шаг последовательности (по умолчанию 1).

In [11]:
from random import randrange
randrange(10)

6

In [12]:
from random import randrange
randrange(10, 20)

16

In [15]:
from random import randrange
randrange(10, 20, 3)

10

- **random.randint(A, B)** - случайное целое число N, A ≤ N ≤ B.

In [16]:
from random import randint
randint(0, 200)

64

- **random.choice(sequence)** - случайный элемент непустой последовательности.

In [27]:
import random
random.choice('Python is awesome!')

't'

- **random.shuffle(sequence)** - перемешивает последовательность (изменяется сама последовательность). Поэтому функция не работает для неизменяемых объектов.

In [35]:
import random
l = [1, 2, 3, 4, 5, 6, 7, 8, 9]

print(l)
random.shuffle(l)
print(l)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
[9, 4, 8, 6, 2, 5, 3, 1, 7]


- **random.random()** - случайное число от 0 до 1.

In [44]:
import random
random.random()

0.026037368177040277

# 17. Регулярные выражения. Итоговый проект

## Регулярные выражения
В качестве дополнительного материала мы расскажем про регулярные выражения, с которыми рано или поздно вы можете столкнуться.

Регулярные выражения - выражения для поиска и замены части текста в строке или файле. Для работы с ними необходимо подключить модуль **"re"** из стандартной библиотеки Python.

Наиболее часто регулярные выражения используются для поиска в строке, разбиении строк, замены части строк. Вот некоторые методы для работы с регулярными выражениями:

### **re.match**(шаблон, строка) 
- ищет заданный шаблон с самого начала строки.

In [2]:
import re
print(re.match(r'Hey', 'Hey Hey'))

print('Данные нашлись')

<re.Match object; span=(0, 3), match='Hey'>
Данные нашлись


In [3]:
import re
print(re.match('Hey', 'hey Hey'))

print('Данные не нашлись, т.к. строка отличается от шаблона с первого символа.')
print('Обратите внимание на синтаксис, перед шаблоном ставится латинская буква r')
print('Ну-ну, буква r не нужна')

None
Данные не нашлись, т.к. строка отличается от шаблона с первого символа.
Обратите внимание на синтаксис, перед шаблоном ставится латинская буква r
Ну-ну, буква r не нужна


### **re.search**(шаблон, строка) 
- ищет заданный шаблон по всей строке, возвращает результат при первом совпадении.

In [10]:
import re
print(re.search('Hey', 'hey Hey').group(0))     # Добавляем метод group(), чтобы вывести содержимое поиска

Hey


### **re.findall**(шаблон, строка)
- ищет заданный шаблон и возвращает все совпадения в виде **списка**.

In [4]:
import re
print(re.findall('Hey', 'hey Hey Hey Hey'))

['Hey', 'Hey', 'Hey']


### **re.split**(шаблон, строка) 
- разделяет строку по заданному шаблону

In [13]:
import re
a = 'hey Hey Hey Hey'
print(re.split('y', a)) 

['he', ' He', ' He', ' He', '']


### **re.sub**(шаблон, замена, строка) 
- находит шаблон в строке и производит замену

In [14]:
import re
a = 'hey Hey Hey Hey'
print(re.sub('Hey', '?', a))

hey ? ? ?


### **re.compile**(шаблон) 
- позволяет собирать регулярное выражение в отдельный объект для последующего использования

In [15]:
ex_str = re.compile('Hey')

result = ex_str.findall('hey Hey Hey')
print (result)

result2 = ex_str.findall('Hey')
print (result2)

['Hey', 'Hey']
['Hey']


Перейдем к самой интересной части - представьте, что вам необходимо произвести чтение "грязного" файла и убрать из него все лишнее, но при этом вы не можете сказать точно, что необходимо убрать. Эту задачу можно решить, используя специальные символы:

### `.`   
Один любой символ, кроме символа переноса строки `\n`

In [10]:
print(re.findall(r'h..', 'hey Hey Hey Hey'))

['hey']


## Greedy quanitiers `+`, `*`, `?`

They are **greedy** in the sense that they take as long matching string as it is possible. For instance, if the RE `<.*>` is matched against `<a> b <c>`, it will match the entire string, and not just `<a>`. Adding `?` after the quantifier makes it perform the match in non-greedy or minimal fashion; as few characters as possible will be matched. Using the RE `<.*?>` will match only `<a>`.

In [29]:
import re
a = '<a> b <c>'
y = re.findall('<.*>', a)
print(y)

['<a> b <c>']


Also be aware of the **backtrackig** behaviour of the regex, this mechanism is explained later in the text.

### `+`	  
Causes the resulting RE to match **1 or more** repetitions of the preceding RE. `ab+` will match **‘a’ followed by any non-zero number of ‘b’s**; it will not match just ‘a’.

In [13]:
print(re.findall('H.+', 'hey Hey Hey Hey'))
print(re.findall('H+', 'hey Hey Hey Hey'))

['Hey Hey Hey']
['H', 'H', 'H']


In [17]:
import re
y = re.findall('ab+', 'a')
print(y)
y = re.findall('ab+', 'abc')
print(y)
y = re.findall('ab+', 'abbbb')
print(y)
y = re.findall('ab+', 'abbbbacaab')
print(y)

[]
['ab']
['abbbb']
['abbbb', 'ab']


In [25]:
import re
y = re.findall('abc+', 'a')
print(y)
y = re.findall('abc+', 'abcccc')
print(y)
y = re.findall('abc+', 'abbcbb')
print(y)
y = re.findall('abc+', 'abcabbbacaabcc')
print(y)

[]
['abcccc']
[]
['abc', 'abcc']


### `*`  

Causes the resulting RE to match **0 or more** repetitions of the preceding RE, as many repetitions as are possible. `ab*` will match **‘a’, ‘ab’, _or_ ‘a’ followed by any number of ‘b’s**.

In [11]:
print(re.findall('H*', 'hey Hey Hey Hey'))
print('This is the example of the RE\'s backtracking beahavior')

['', '', '', '', 'H', '', '', '', 'H', '', '', '', 'H', '', '', '']
This is the example of the RE's backtracking beahavior


> **Bactracking** means the RE starts searching from the beginning (or the end) and checks all the elements in the string for matching. When the match is False regex goes back and starts checking again from the next elements, having been always backtracking until it matches, then it goes further.

In [9]:
import re
y = re.findall('ab*', 'aa')
print(y)
y = re.findall('ab*', 'abc')
print(y)
y = re.findall('ab*', 'abbbb')
print(y)
y = re.findall('ab*', 'abbbbacaababb')
print(y)
y = re.findall('ab*', 'aa abb ddc aab')
print(y)


['a', 'a']
['ab']
['abbbb']
['abbbb', 'a', 'a', 'ab', 'abb']
['a', 'a', 'abb', 'a', 'ab']
['', '', '']


In [13]:
import re
y = re.findall('b*', 'a')
print(y)
print('Bactrackinng example again')

['', '']
Bactrackinng example again


> **Backtracking** again. The string consists of only **1** elements, but the output contains **2** empty strings. This happens because after first match failing (the first `''`) regex backtracks, finds nothing (no element, the second `''`) and stops.

### `?`	 

Causes the resulting RE to match **0 or 1** repetitions of the preceding RE. `ab?` will match **_either_ ‘a’ _or_ ‘ab’**.

In [28]:
import re
y = re.findall('ab?', 'a')
print(y)
y = re.findall('ab?', 'abc')
print(y)
y = re.findall('ab?', 'abbbb')
print(y)
y = re.findall('ab?', 'abbbbacaab')
print(y)

['a']
['ab']
['ab']
['ab', 'a', 'a', 'ab']


In [15]:
y = re.findall('a?', 'bb')
print(y)
print('Bactracking!')

['', '', '']
Bactracking!


## Lazy Quantifiers `*?`, `+?`, `??`  
The `*`, `+`, and `?` quantifiers are all **greedy**; they match as much text as possible. Sometimes this behaviour isn’t desired. To prevent such behavior and make it **'lazy'**, i.e. make the regex take the shortest possible text, we need to add `?` after our greedy quantifier:

In [16]:
import re
a = '<a> b <c>'
y = re.findall('<.*>', a)
print(y)
y = re.findall('<.*?>', a)
print(y)
y = re.findall('^<.*?>', a)  # ^ sign stands for 'from the beginning of the line'
print(y)

['<a> b <c>']
['<a>', '<c>']
['<a>']


### `*+`, `++`, `?+`   
Like the `*`, `+`, and `?` quantifiers, those where `+` is appended also match as many times as possible. However, unlike the true greedy quantifiers, these do not allow back-tracking when the expression following it fails to match. These are known as **possessive quantifiers**. 

For example, `a*a` will match `'aaaa'` because the `a*` will match all 4 `'a'`s, but, when the final `'a'` is encountered, the expression is backtracked so that in the end the `a*` ends up matching 3 `'a'`s total, and the fourth `'a'` is matched by the final `'a'`. However, when `a*+a` is used to match `'aaaa'`, the `a*+` will match all 4 `'a'`, but when the final `'a'` fails to find any more characters to match, the expression cannot be backtracked and will thus fail to match. `x*+`, `x++` and `x?+` are equivalent to `(?>x*)`, `(?>x+)` and `(?>x?)` correspondingly.  
> _New in version 3.11._

Check your Python version before uncommenting the code below

In [3]:
from platform import python_version
print(python_version())

3.9.13


In [3]:
import re
y = re.findall('a*a', 'aaaa')
print(y)
# y = re.findall('a*+a', 'aaaa')
# print(y)

['aaaa']


### `$`  
Matches the end of the string or just before the newline at the end of the string, and in MULTILINE mode also matches before a newline. foo matches both ‘foo’ and ‘foobar’, while the regular expression `foo$` matches only ‘foo’. More interestingly, searching for `foo.$` in `'foo1\nfoo2\n'` matches ‘foo2’ normally, but ‘foo1’ in MULTILINE mode; searching for a single `$` in `'foo\n'` will find two (empty) matches: one just before the newline, and one at the end of the string.

In [1]:
import re
a = 'foo1\nfoo2\n'
y = re.findall('foo.$', a)
print(y)

['foo2']


In [27]:
import re
a = 'foo\n'
y = re.findall('$', a)
print(y)

['', '']


### `{m}`  
Specifies that exactly _m_ copies of the previous RE should be matched; fewer matches cause the entire RE not to match. For example, `a{6}` will match exactly six `'a'` characters, but not five.

In [20]:
print(re.findall('\w{2}', 'hey. Hey1. Hey2. Hey3'))

['he', 'He', 'y1', 'He', 'y2', 'He', 'y3']


In [24]:
import re
y = re.findall('a{5}', 'abaaaaaacaababb')  # 6 'a'
print(y)
y = re.findall('a{5}', 'abaaaacaababb')  # 4 'a'
print(y)

['aaaaa']
[]


### `{m, n}`	
От m до n вхождений (`{,n}` — от 0 до n)

Causes the resulting RE to match from _m_ to _n_ repetitions of the preceding RE, attempting to match as many repetitions as possible. For example, `a{3,5}` will match from 3 to 5 `'a'` characters. Omitting _m_ specifies a lower bound of zero, and omitting _n_ specifies an infinite upper bound. As an example, `a{4,}b` will match `'aaaab'` or a thousand `'a'` characters followed by a `'b'`, but not `'aaab'`. The comma may not be omitted or the modifier would be confused with the previously described form.

In [19]:
import re
y = re.findall('a{2,4}', 'abaaaaaabcaababb')  # 6 'a'
print(y)
y = re.findall('a{,4}', 'abaaaaaabcaababb')
print(y)
y = re.findall('a{,4}b', 'abaaaaaabcaababb')
print(y)
y = re.findall('a{2,}', 'abaaaaaabcaababb')
print(y)
y = re.findall('a{2,}b', 'abaaaaaabcaababb')
print(y)

['aaaa', 'aa', 'aa']
['a', '', 'aaaa', 'aa', '', '', 'aa', '', 'a', '', '', '']
['ab', 'aaaab', 'aab', 'ab', 'b']
['aaaaaa', 'aa']
['aaaaaab', 'aab']


### `{m,n}?`  
Causes the resulting RE to match from _m_ to _n_ repetitions of the preceding RE, attempting to match as few repetitions as possible. This is the **non-greedy** version of the previous quantifier. For example, on the 6-character string `'aaaaaa'`, `a{3,5}` will match 5 `'a'` characters, while `a{3,5}?` will only match 3 characters.

Is it equal to `{m}`? Seems like it is only in the code where there are no additional symbols after `?`.

In [41]:
import re
y = re.findall('a{3,5}', 'aaaaaa')   # 6 'a'
print(y)
y = re.findall('a{3,5}?', 'aaaaaa')  # 6 'a'
print(y)
y = re.findall('a{3}', 'aaaaaa')     # 6 'a'
print(y)

['aaaaa']
['aaa', 'aaa']
['aaa', 'aaa']


In [37]:
y = re.findall('a{3,5}b', 'abaaaaaabcaabaaabb')   # 6 'a'
print(y)
y = re.findall('a{3,5}?b', 'abaaaaaabcaabaaabb')  # 6 'a'
print(y)
y = re.findall('a{3}b', 'abaaaaaabcaabaaabb')     # 6 'a'
print(y)

['aaaaab', 'aaab']
['aaaaab', 'aaab']
['aaab', 'aaab']


### `{m,n}+`  
Causes the resulting RE to match from _m_ to n repetitions of the preceding RE, attempting to match as many repetitions as possible without establishing any backtracking points. This is the **possessive version** of the quantifier above. For example, on the 6-character string `'aaaaaa'`, `a{3,5}+aa` attempt to match 5 `'a'` characters, then, requiring 2 more `'a'`s, will need more characters than available and thus fail, while `a{3,5}aa` will match with `a{3,5}` capturing 5, then 4 `'a'`s by backtracking and then the final 2 `'a'`s are matched by the final `aa` in the pattern. `x{m,n}+` is equivalent to `(?>x{m,n})`.
_New in version 3.11._  

In [48]:
import re
# y = re.findall('a{3,5}+aa', 'aaaaaa')   # 6 'a'
# print(y)
y = re.findall('a{3,5}', 'aaaaaa')   # 6 'a'
print(y)
y = re.findall('a{3,5}aa', 'aaaaaa')   # 6 'a'
print(y)

['aaaaa']
['aaaaaa']


`\w`	Любая цифра или буква (`\W` — все, кроме буквы или цифры)

In [26]:
print(re.findall(r'\w', 'hey Hey Hey Hey'))

['h', 'e', 'y', 'H', 'e', 'y', 'H', 'e', 'y', 'H', 'e', 'y']


`\d`	Любая цифра [0-9] (`\D` — все, кроме цифры)

In [27]:
print(re.findall(r'\d', 'hey Hey1 Hey2 Hey3'))

['1', '2', '3']


`\s`	Любой пробельный символ (`\S` — любой непробельный символ)

In [28]:
print(re.findall(r'\s', 'hey Hey1 Hey2 Hey3'))

[' ', ' ', ' ']


`\b`	Граница слова

In [29]:
print(re.findall(r'\b\w', 'hey, Hey1, Hey2, Hey3'))

['h', 'H', 'H', 'H']


`[...]`	Один из символов в скобках

In [30]:
print(re.findall(r'[Hy]', 'hey, Hey1, Hey2, Hey3'))

['y', 'H', 'y', 'H', 'y', 'H', 'y']


`[^..]` — любой символ, кроме тех, что в скобках

`\`	Экранирование специальных символов (`\.` означает точку или `\+` — знак «плюс»)

In [31]:
print(re.findall(r'\.', 'hey. Hey1. Hey2. Hey3'))

['.', '.', '.']


`^` и `$`	Начало и конец строки соответственно

In [36]:
print(re.findall(r'..$', 'hey. Hey1. Hey2. Hey3'))

['y3']


`a|b`	Соответствует a или b	

In [43]:
print(re.findall('h|3', 'hey. Hey1. Hey2. Hey3'))

['h', '3']


In [49]:
a = 'iper'
b = 'epipefhe'

print(re.findall('he|ll|0+', b))

['he']


`()`	Группирует выражение и возвращает найденный текст

In [39]:
print(re.findall(r'(\w\w\w)', 'hey. Hey1. Hey2. Hey3\n'))

['hey', 'Hey', 'Hey', 'Hey']


`\t,\n,\r` Символ табуляции, новой строки и возврата каретки соответственно

In [40]:
print(re.findall(r'\n', 'hey. Hey1. Hey2. Hey3\n'))

['\n']


Рассмотрим пример. Ниже представлен фрагмент лога - файла, записывающего события при работе программы:

In [3]:
logfile = open('logfile.txt', 'r')
for string in logfile:
    string = string.rstrip()
    print(string)

Oct 16 20:10:10 legacy sshd[59955]: Did not receive identification string from 211.156.128.23
Oct 16 20:19:43 legacy sshd[59961]: Illegal user patrick from 211.156.128.23
Oct 16 20:19:53 legacy sshd[59966]: Illegal user patrick from 211.156.128.23
Oct 16 20:20:22 legacy sshd[59981]: Illegal user rolo from 211.156.128.23
Oct 16 20:20:28 legacy sshd[59983]: Illegal user iceuser from 211.156.128.23
Oct 16 20:20:34 legacy sshd[59985]: Illegal user horde from 211.156.128.23
Oct 16 20:20:38 legacy sshd[59987]: Illegal user cyrus from 211.156.128.23
Oct 16 20:20:48 legacy sshd[59991]: Illegal user wwwrun from 211.156.128.23
Oct 16 20:20:58 legacy sshd[59993]: Illegal user matt from 211.156.128.23
Oct 17 01:29:25 legacy sshd[60366]: Illegal user test from 218.237.4.57
Oct 17 01:29:28 legacy sshd[60368]: Illegal user guest from 218.237.4.57
Oct 17 01:29:32 legacy sshd[60370]: Illegal user admin from 218.237.4.57
Oct 17 01:29:35 legacy sshd[60374]: Illegal user admin from 218.237.4.57
Oct 17 01:

В нем есть характерная строка, сообщающая, что программа не получила идентификатор пользователя при подключении:

`Did not receive identification string from ip_address`

Напишем программу, которая найдет все ip адреса таких неавторизованных юзеров:

In [35]:
import re
logfile = open('logfile.txt', 'r')
for string in logfile:
    if re.search('Did', string):
        print(re.findall('\d+\.\d+\.\d+\.\d+', string))
logfile.close()

['211.156.128.23']
['147.46.76.225']
['83.64.18.219']
['67.19.240.114']


In [42]:
import re
with open('logfile.txt', 'r') as x:
    for line in x:
        y = re.findall('Did not receive identification string from (\d+\.\d+\.\d+\.\d+)', line)
        if len(y) != 1: continue
        print(y)
        
# Another way, thanks to Dr. Chuck

['211.156.128.23']
['147.46.76.225']
['83.64.18.219']
['67.19.240.114']


In [37]:
import re
ip_lst = list()
with open('logfile.txt', 'r') as x:
    for line in x:
        y = re.findall('Did not receive identification string from (\d+\.\d+\.\d+\.\d+)', line)
        if len(y) != 1: continue
        ip_lst.append(y)
print(ip_lst)

[['211.156.128.23'], ['147.46.76.225'], ['83.64.18.219'], ['67.19.240.114']]


Мы построчно читаем файл и ищем строки, в которых есть сочетание 'Did'. В каждой такой строке мы находим ip адрес. Он состоит из 4 наборов цифр, разделенных точками между собой.

Здесь приведена [ссылка](https://regexcrossword.com/) на портал, где можно сыграть в кроссворд из регулярных выражений. Шаблоны записываются по горизонтали и вертикали и вам необходимо вписать тот символ, который удовлетворяет одному или нескольким шаблонам. Задания выстроены по уровню сложности от простого к сложному. С помощью этой игры вы сможете открыть для себя интересные полезные комбинации для формирования собственных шаблонов.