## Содержание:
- Словари
- Устройство функций в Python. Написание простейших функций. Написание сложных функций.
- Распаковка
- Локальные и глобальные переменные. Области видимости
- Рекурсия
- Функции как объект
- Функции высших порядков
- Lambda-функции
- Основные оценки сложности алгоритмов
- Библиотеки и модули
- Работа с файлами
- Библиотека OpenCV

# Словари

Словари(dict) в Python - неупорядоченные коллекции произвольных объектов с доступом по ключу. Их иногда ещё называют ассоциативными массивами или хеш-таблицами.

Первый способ создать словарь:

In [None]:
# Пустой словарь
empty_dict = {}

# Словарь с двумя парами ключ-значение
value_dict = {"cat": "кошка", "dog": "собака"}

In [None]:
type(value_dict)

Второй способ создать словарь:

In [None]:
dct = dict(cat="кошка", dog="собака", hedgehog = "ежик")
print(dct)
dct["animals"] = ["кошка", "собака", "ежик"]
print(dct)

Вернуть значение ключа.

In [None]:
dct["hedgehog"]

In [None]:
dct.get("hedgehog")

In [None]:
dct.get("hedgeho", "Такого ключа нет")

Вернуть пары.

In [None]:
dct.items()

Вернуть ключи

In [None]:
dct.keys()

Вернуть значения.

In [None]:
dct.values()

In [None]:
# Если пройтись циклом по словарю, то выведутся только ключи

for k in dct:
    print(k)

In [None]:
# Так посмотрим только на значения

for v in dct.values():
    print(v)

In [None]:
for k,v in dct.items():
    print("Ключ: {} -> Значение: {}".format(k, v))

Методы:

In [None]:
# Создать словарь
df = dict(apple='яблоко', pineapple="ананас", banana="банан")

# Получить значение по ключу
print(df['apple'])

# Получить значение по ключу
print(df.get('apple'))

# Получить пары ключ-значение
print(df.items())

# Получить все ключи в словаре
print(df.keys())

# Получить все значения в словаре
print(df.values())

# Удалить занчение из словаря
del df["banana"]
print(df)

# Получить значение по ключу, после чего удалить
print(df.pop('apple'))
print(df)

# Если элемента нет
print(df.pop('lemon', "Элемента в словаре нет"))

# Добавить новое значение в словарь
df['cherry'] = 'вишня'
print(df)

# Изменение значения
df.update({"banana": "БАНАН"})
print(df)

Включения для словарей.

In [None]:
squares = {i: i * i for i in range(10)}
squares

## Пример применения словарей

Найдем пять самых часто встречающихся слова в утверждениях Zen of Python.

In [None]:
import this

Создадим переменную zen, куда считаем все утверждения:

In [None]:
zen = '''Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!'''

Разобьем данную строку на слова и очистим от знаков. Очищенные слова будем поочередно добавлять в словарь zen_map. В качестве ключей в этом словаре будут выступать слова, а значениями - частота использования слов.

In [None]:
zen_map = dict()

for word in zen.split():
    cleaned_word = word.strip('.,!-* "').lower()
    if cleaned_word not in zen_map:
        zen_map[cleaned_word] = 1  # Если слово ранее не встречалось, добавляем в словарь с ключом 1
    else: 
        zen_map[cleaned_word] += 1  # Увеличиваем счетчик слов

for k,v in zen_map.items():
    print("Слово: {} -> Встречается: {}".format(k, v))

In [None]:
# Вариант программы, которая создает словарь без "сорных" слов

zen_map = dict()
for word in zen.split():
    cleared_word = word.strip('.,!-* "').lower()
    if cleared_word not in zen_map:
        if cleared_word not in ('this', 'is','and', 'not', 'to', 'the', 'in', 'of','for', 'than', 'there', 'at', 'if', ""):
            zen_map[cleared_word]  = 1
    else:
        zen_map[cleared_word] += 1

for k,v in zen_map.items():
    print("Слово: {} -> Встречается: {}".format(k, v))

Ключи и значения не упорядочены, поэтому организуем сортировку. Для этого можно воспользоватьс методом items(). Так мы получим zen_items - список множеств. Элементами множества будут - (ключ, значение).

In [None]:
import operator

zen_items = zen_map.items() 
word_count_items = sorted(zen_items, key=operator.itemgetter(1), reverse=True)

print(word_count_items[:8])

Однако, как это часто бывает в Python, уже есть встроенный модуль, который поможет решить эту задачу проще:

In [None]:
from collections import Counter

cleaned_list = []
for word in zen.split():
    cleaned_list.append(word.strip('.,!-* "').lower())  # Очищаем строку от знаков и приводим к нижнему регистру

print(Counter(cleaned_list).most_common(5)) # Вызываем Counter и обращаемся к методу most_common

### Задача

Напишите программу для создания словаря из строки, где ключ – это значение символа сороки, а значение – количество их встречаемости.

Пример строки: ' w3resource'

Ожидаемый результат: {'w': 1, '3': 1, 'r': 2, 'e': 2, 's': 1, 'o': 1, 'u': 1, 'c': 1}

In [None]:
di = dict()
st = input()
for i in st:
    if i is not di:
        di[i] = st.count(i)
print(di)

# Устройство функций в Python. Написание простейших функций. Написание сложных функций.  

## Функция

Функцией называют именованный фрагмент программного кода, к которому можно обратиться из другого места вашей программы (но есть lambda-функции, у которых нет имени, о них будет рассказано на следующем уроке). Как правило, функции создаются для работы с данными, которые передаются ей в качестве аргументов, также функция может формировать некоторое возвращаемое значение.

**Объявляя функцию, нужно следовать определенным правилам**:

Объявление происходит с помощью ключевого слова **def**, за ним идёт имя функции и круглые скобки ().

**Аргументы**, передаваемые в функцию, должны находится в круглых скобках. Там же можно определить их значения по умолчанию, указав их после знака равно.

Перед основным содержимым желательно включить **строку документации** (docstring), которая обычно описывает назначение  и основные принципы работы функции.

**Тело функции** начинается после знака двоеточия. Важно не забыть об отступах.

Чтобы выйти из функции в Python, используют оператор **return [значение]**. Если оператор опущен, будет возвращено значение None.

In [None]:
print(1)

In [None]:
len("123")  # Пример функции

In [None]:
'asdf'.upper()  # Пример метода

Попробуем самостоятельно реализовать функцию, складывающую два числа и выводящую результат на печать:

In [None]:
def summarize(a, b):
    summ = a + b
    print(summ)

In [None]:
summarize(1, 2)

Или с return:

In [None]:
def summarize(a, b):
    summ = a + b
    return summ

In [None]:
x = summarize(1, 2)
print(x)

Теперь эту функцию можно вызвать в любом месте кода.

При описании функции в Python 3 можно задать аргументы с какими-либо начальными значениями, такие аргументы являются "необязательными". Вначале нужно описывать обязательные параметры, а после них – необязательные. При вызове функции не обязательно указывать значения "необязательных" параметров. Если мы хотим изменить значение аргумента, не меняя начальные значения других аргументов, можно обращаться к нему по ключу.

In [None]:
def example(first, second=3, third=5):
    print(first)
    print(second)
    print(third)
    
example('my string')

In [None]:
example('my string',second='dfgh')

Пример использования функции
вычислим значение n! + k! - p!

    5! = 5*4*3*2*1

In [None]:
n, k, p = 5, 6, 3
fn = 1
for i in range(2, n + 1):
    fn *= i
fk = 1
for i in range(2, k + 1):
    fk *= i
fp = 1
for i in range(2, p + 1):
    fp *= i

fn + fk - fp

In [None]:
def factorial(N):
    f = 1
    for i in range(1, N+1):
        f *= i
    return f

factorial(5) + factorial(6) - factorial(3)

## Распаковка

Если мы хотим сожержимое двух списков положить в третий список или содержимое двух словарей положить в третий словарь, на помощь нам приходит так называемый "звездочный синтаксис":

In [None]:
list1 = [1,2,3]
list2 = [4,5,6]

list3 = [*list1,*list2]  # Положили все элементы обоих списков в третий
print(list3)

In [None]:
dict1 = {'a':1,'b':2,'c':3}
dict2 = {'a':4,'e':5,'f':6}

dict3 = {**dict1,**dict2}  # Положили все элементы обоих словарей в третий
print(dict3)

Точно таким же образом можно что-то указать "в явном виде", а что-то распаковать из структуры (например, вы хотите дописать в новый список числа 3 и 4):

In [None]:
list1 = [0,1,2]
print([3,4,list1])  # Тут элементом стал сам список
print([3,4,*list1])  # А тут мы элементы списка распаковали

**В функции точно так же можно подавать несколько аргументов**

Даже если вы заранее не знаете, сколько их будет. Вспомните, например, функцию print(). Она умеет давать ответ и при одном аргументе, и при двух и при любом N.

In [None]:
print(1,2,3)

**\*args и \*\*kwargs спешат на помощь**

В Python можно передать переменное количество аргументов двумя способами:

* \*args для неименованных аргументов;
* \*\*kwargs для именованных аргументов.

Мы используем \*args и \*\*kwargs в качестве аргумента, когда заранее не известно, сколько значений мы хотим передать функции.

`*args`

args нужен, когда мы хотим передать неизвестное количество неименованных аргументов. Если поставить * перед именем, это имя будет принимать не один аргумент, а несколько. Аргументы передаются как кортеж и доступны внутри функции под тем же именем, что и имя параметра, только без *.

In [None]:
def adder(*nums):
    summ = 0
    for n in nums:
        summ += n

    print("Sum: ", summ)

adder(3, 5)
adder(4, 5, 6, 7)
adder(1, 2, 3, 5, 6)

In [None]:
def adder(*nums):
    summ = 1
    for n in nums:
        summ *= n

    print("Sum: ", summ)

adder(3, 5)
adder(4, 5)
adder(1, 2)

`**kwargs`

По аналогии с \*args мы используем \*\*kwargs для передачи переменного количества именованных аргументов. Схоже с \*args, если поставить ** перед именем, это имя будет принимать любое количество именованных аргументов. Кортеж/словарь из нескольких переданных аргументов будет доступен под этим именем. Например:

In [None]:
def dct(**data):
    print("\nData type of argument: ",type(data))

    for key, value in data.items():
        print("{} -> {}".format(key, value))

dct(cat="кошка", dog="собака", hedgehog = "ежик")
dct(animals = ["кошка", "собака", "ежик"])

В этом случае у нас есть функция **dct()** с параметром \*\*data. В функцию мы передали два словаря разной длины. Затем внутри функции мы прошлись в цикле по словарям, чтобы вывести их содержимое.

# Локальные и глобальные переменные. Области видимости

**Локальные переменные**

Для создания переменных, обладающих локальной областью видимости, необходимо всего лишь поместить их в отдельный блок кода, изолированный от остальной программы. Например, у нас таким свойством обладают все переменные, которые мы прежде использовали в функциях, например:

In [None]:
def f(x):
    output = x+1
    output2 = output + 1
    return output2

print(f(4))
print(output)

Функция у нас сработала, а вот переменную за пределами функции мы не видим. Попробуем изнутри функции использовать переменную определенную вовне.

In [None]:
x = 11

def foo(z):
    print(x)
    return None

foo(10)

Если нам все-таки нужно использовать значение переменной "изнутри" функции, можно сказать , что мы объявляем глобальную переменную. Для этого используется выражение **global**

In [None]:
def f():
    global s
    print(s)
    s = "Переменная задана внутри функции"
    print(s)

s = "Переменная задана в основном теле программы" 
f()
print(s)

Здесь мы вызвали функцию и она перезаписала нам значение в переменную s.

**Возврат нескольких значений**

Нужно упомянуть еще один факт: по команде return функция может возвращать несколько значений. Например вот функция, которая умеет выводить сумму и разность двух аргументов функции:

In [None]:
def sum_diff(a,b):
    return a+b, a-b

sum1, diff = sum_diff(4,1)
print(sum1)
print(diff)

In [None]:
def sum_diff(a):
    return a+a, a-a

sum1, diff = sum_diff(4)
print(sum1)
print(diff)

### Задача

Напишите функцию для вычисления факториала данного числа без рекурсии.

Ввод: 3

Вывод: 6

In [None]:
def factorial(N):
    f = 1
    for i in range(1, N+1):
        f *= i
    return f

factorial(3)

## Рекурсия

Рекурсия — функция вызывает сама себя. Самый известный пример — вычисление факториала n! = n * n — 1 * n -2 * … 2 *1

In [None]:
def factorial(n):
    if n != 0:
        return n * factorial(n-1)
    else:
        return 1

In [None]:
factorial(0)

А еще таким же образом можно вычислять N-ое число Фибоначчи (они как раз задаются рекурсивно).

Заодно здесь мы видим, что выражений return может быть несколько (для различных условий).

1, 1, 2, 3, 5, 8, 13, 21, ...

f(5) -> f(4) + f(3) #3 + 2 = 5

f(4) -> f(3) + f(2) #2 + 1 = 3

f(3) -> f(2) + f(1) #1 + 1 = 2

In [None]:
def fibonacci(n):
    if n in (1, 2):
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

In [None]:
fibonacci(8)

In [None]:
def fibonacci(n):
    if n in (1, 2):
        return 1
    f1 = 1
    f2 = 1
    for i in range(1, n-1):
        f3 = f1 + f2 
        f1 = f2
        f2 = f3
    return f3

In [None]:
fibonacci(8)

### Задача

Рекурсивно посчитать сумму чисел от 1 до N

Вход: N

Выход: sum(1,2,3,...,N)


Вход: 3

Выход: 6

In [None]:
def summe(n):
    if n == 0:
        return 0
    return n + summe(n - 1)

n = int(input())
print(summe(n))

### Задача

Рекурсивно проверить, является ли строка палиндромом (читается наоброт)

Вход: шалаш

Выход: True


Вход: мама

Выход: False

In [None]:
def Palindrom(s):
    if len(s) <= 1:
        return True
    else:
        return s[0] == s[-1] and Palindrom(s[1:-1])
    
st = input()
Palindrom(st)

In [None]:
# Вариант решения без применения рекурсии (просто пример)

def Palindrom(s):
    if  s = s[::-1]:
        return True
    else:
        return False
    
st = input()
Palindrom(st)

### Задача

Напишите функцию, которая принимает три числа и возвращает их произведение.

In [None]:
def multi_num(n1, n2, n3):
    return n1 * n2 * n3

num1, num2, num3 = map(float, input().split())
print(multi_num(num1, num2, num3))

### Задача

Напишите функцию для вычисления среднего арифметического числа в заданном списке.

In [None]:
def mean_lt(mas):
    len_mas = len(mas)
    sum_mas = 0
    
    for i in mas:
        sum_mas += i
    
    return sum_mas / len_mas

ls = list(map(float, input().split()))
print(mean_lt(ls))

In [None]:
# Вариант написания, без цикла for

def mean_lt(mas):
    len_mas = len(mas)
    sum_mas = sum(mas)
    
    return sum_mas / len_mas

ls = list(map(float, input().split()))
print(mean_lt(ls))

### Задача

Напишите функцию, которая принимает на вход число и выдаёт сумму цифр в числе. Реализуйте два варианта, с использованием строки без использования строки.

In [None]:
# Вариант решения через строку №1

def sum_st(num):
    num = str(num)
    sum_num = 0
    
    for i in num:
        sum_num += int(i)
    
    return sum_num

n = int(input())
print(sum_st(n))

In [None]:
# Вариант решения через строку №2

def sum_of(num):
    return sum(int(digit) for digit in str(num))

num = int(input())
print(sum_of(num))

In [None]:
# Вариант решения через цикл while

def sum_int(num):
    sum_num = 0
    
    while num > 0:
        sum_num += num % 10
        num //= 10
    
    return sum_num

n = int(input())
print(sum_int(n))

### Задача

Напишите функцию, которая будет преобразовывать десятичное число в двоичное.

In [None]:
def translator(num):
    st = ""
    while num > 0:
        st += str(num % 2)
        num //= 2
    
    return st[::-1]

n = int(input())
print(translator(n))

# Функции как объект

Функцию можно присвоить любой переменной.

In [None]:
writeline = print
x = 5
writeline(5)

In [None]:
s = "Привет мир!!!"
writeline(s[:6])

### Задача

Исполнитель калькулятор может выполнить одно из действий: сложение, умножение или возведение в степень. Опишем функции:

In [None]:
# Первое решение

def addition(x, y):  # Команда "+"
    return x + y
def multiplication(x, y):  # Команда "*"
    return x * y
def exponentiation(x, y):  # Команда "^"
    return x ** y

func = addition  # Значение по умолчанию

operation_sign = input()

if operation_sign == "*":
    func = multiplication
elif operation_sign == "^":
    func = exponentiation

x, y = 3, 4
func(x, y)

In [None]:
# Второе решение

def addition(x, y):  # Команда "+"
    return x + y
def multiplication(x, y):  # Команда "*"
    return x * y
def exponentiation(x, y):  # Команда "^"
    return x ** y

operation = {"+" : addition,
            "*" : multiplication,
            "^" : exponentiation}

operation_sign = input()
func = operation[operation_sign]

x, y = 3, 4
func(x, y)

Напишем функции для преобразования стилистики текста:
- все строчные
- ВСЕ ПРОПИСНЫЕ
- иЗМЕНИТЬ РЕГИСТР
- Начинается С Прописных
- Как в предложениях

In [None]:
st = "привет мир. hello, world."  # Тестовая строка

In [None]:
# Все строчные

def all_lower(s): 
    return s.lower()

all_lower(st)

In [None]:
# ВСЕ ПРОПИСНЫЕ

def all_upper(s):
    return s.upper()

all_upper(st)

In [None]:
# иЗМЕНИТЬ РЕГИСТР
# swapcase() - можно было использовать, но напишем сами

def change_register(s):
    str_as_list = list(s)
    for i in range(len(str_as_list)):
        if str_as_list[i].isupper():
            str_as_list[i] = all_lower(str_as_list[i])
        else:
            str_as_list[i] = all_upper(str_as_list[i])
    return "".join(str_as_list)

change_register(st)

In [None]:
# Как в предложениях

def start_with_upper(s):
    return s[0].upper() + s[1:]

# Будем предполагать, что предложение заканчивается точкой.
# capitalize()

def as_sentence(s):
    seq = s.split(sep=". ")
    for i in range(len(seq)):
        seq[i] = start_with_upper(seq[i])

    return ". ".join(seq)

as_sentence(st)

In [None]:
# Начинается С Прописных

# title
def words_with_upper(s):
    words = s.split()
    for i in range(len(words)):
        words[i] = start_with_upper(words[i])
    return " ".join(words)

words_with_upper(st)

In [None]:
# Создадим словарь для хранения функций
# Ключ - номер, значение функция

regiter = {1: all_lower, 
           2: all_upper, 
           3: change_register, 
           4: as_sentence, 
           5: words_with_upper}

number = int(input())
if number not in range(1, 6):
    print("Ошибочный ввод")
else:
    func = regiter[number]
    print(func(st))

In [None]:
# Создадим дополнительную функцию

def register_fun(n):
    register = {1: all_lower, 
       2: all_upper, 
       3: change_register, 
       4: as_sentence, 
       5: words_with_upper}
    return register[number]

number = int(input())
if number not in range(1, 6):
    print("Ошибочный ввод")
else:
    func = register_fun(number)
    print(func(st))

# Функции высших порядков

Функции, которые могут принимать в качестве аргумента другую функцию и/или возвращать функцию в качестве результата своей работы.

map, filter, sorted

In [None]:
#Как в предложениях

def start_with_upper(s):
    return s[0].upper() + s[1:]

#Будем предполагать, что предложение заканчивается точкой.
# capitalize()

def as_sentence(s):
    seq = s.split(sep=". ")
    s = map(start_with_upper, seq)

    return ". ".join(s)

as_sentence(st)

In [None]:
# Применение filter

def is_odd(x):
    return x % 2 == 1

sp = [34, 45, 22, 65, 11, 87]

sp2 = list(filter(is_odd, sp))
print(sp2)

In [None]:
# Применение sorted

fruits = ['apple', 'orange', 'banana', 'cherry', 'date', 'apricot']
print(sorted(fruits))
print(sorted(fruits, reverse=True))
print(sorted(fruits, key=len))
print(sorted(fruits, key=len, reverse=True))

# Lambda-функции

Это особый вид функций, которые объявляются с помощью ключевого слова **lambda** вместо **def**.

Лямбда-функции принимают любое количество аргументов, но не могут содержать несколько выражений и всегда возвращают только одно значение. Пишется так:

- lambda arguments: expression

arguments - аргументы, expression - выражение, возвращающее значение.

Пример (lambda функция, которая добавляет к переданному аргументу 1 и возвращает результат):

In [None]:
add_1 = lambda x: [i for i in range(x + 1)]
add_1(8)

Сложение двух числ с помощью лямбда-функции:

In [None]:
add_2 = lambda x, y: x + y
add_2(3, 4)

Выше, мы присвоили имя каждой из функций. Попробуем без имени. Аргументы передаются в скобках после скобок, содержащих определение lambda функции:

In [None]:
(lambda x, y: x * y)(3, 5)

По сути, лямбда-функции умеют все, что и обычные функции, только они обязаны возвращать всего одно значение.

- Они умеют работать с разными типами данных (Строками, например)
- Можно вызывать функцию без параметров
- Параметрам функции можно задать значения по умолчанию

In [None]:
# Со строками

(lambda x, y: x * y)("Ха-",3)

In [None]:
(lambda x, y: x + y)("Первая ","Вторая")

In [None]:
# А вот тут без аргументов

(lambda: [0,1,2,3])()

In [None]:
# Значения по умолчанию

(lambda x=3, y = 5: str(x) + str(y))(1,2)

In [None]:
# Здесь в качестве первого аргумента пришел список, а второй использовался по умолчанию
# На выходе должны получить первый элемент первого списка + 3

(lambda x,y=3: x[0] + y)([1,2,3])

In [None]:
print((lambda x, y, z: x + y + z)(1, 2, 3))  # Три аргумента

print((lambda x, y, z=3: x + y + z)(1, 2))  # Три аргумента и у одного default-значение

print((lambda x, y, z=3: x + y + z)(1, y=2))  # Три аргумента, у одного default-значение и один мы передали "по имени"

print((lambda *args: sum(args))(1,2,3))  # Передали кортеж аргументов и сложили

print((lambda **kwargs: sum(kwargs.values()))(one=1, two=2, three=3))  # Передали словарь аргументов и сложили

Лямбда-функции очень часто применяются для преобразования каких-то коллекций. Для этого lambda-функции можно подавать в функцию map. Возьмем список и возведем все его элементы в квадрат с помощью map и lambda-функции.

In [None]:
a = [1,3,4,6]
def to_str(x):
    return x*x
list(map(to_str, a))

In [None]:
a = [1,3,4,6]
list(map(lambda x: x * x,a))

In [None]:
lst = ["ежик", "Python", "книга"]
print(list(map(lambda x: x[0], lst)))

`filter` - функция для фильтрации списков. Необходимо отфильтровать все числа меньше 4 из списка. С помощью цикла:

In [None]:
numbers = [1,2,3,4,5]
numbers_under_4 = []
for number in numbers:
    if number < 4:
        numbers_under_4.append(number)
numbers_under_4

С помощью спискового включения:

In [None]:
numbers = [1,2,3,4,5]
numbers_under_4 = [number for number in numbers if number < 4]
numbers_under_4

filter + Lambda-функция:

In [None]:
numbers = [1,2,3,4,5]
numbers_under_4 = list(filter(lambda x: x < 4, numbers))
numbers_under_4

Видно, что синтаксис такой же, как и у map. Первый аргумент - функция, которую надо применять, а второй - коллекция, на которую надо применять. Но как и для map, функция возвращает итератор, поэтому, чтобы получить список, его нужно обернуть функцией list.

sorted + Lambda-функция:

In [None]:
sp = [34, 45, 22, 65, 19, 87, 21]
sorted(sp, key = lambda x: x % 10)

In [None]:
points = [(1, 1), (2, 3), (5, 4), (1, 3), (8, 0), (1, 0)]
sorted(points, key = lambda x: x[0])

In [None]:
points = [(1, 1), (2, 3), (5, 4), (1, 3), (8, 0), (1, 0)]
sorted(points, key = lambda x: (x[0], x[1]))

# Основные оценки сложности алгоритмов

Основные категории алгоритмической сложности в О-нотации:

* Постоянное время: 0(1) — время выполнения не зависит от количества элементов во входном наборе данных

* Линейное время: О(N) — время выполнения пропорционально количеству элементов в коллекции

* Логарифмическое время: О(log(N)) — время выполнения пропорционально логарифму от количества элементов в коллекции

* Квазилинейное время: О(N*log(N)) — время выполнения больше чем, линейное, но меньше квадратичного

* Полиномиальное время: О(N^2) — время выполнения пропорционально квадрату количества элементов в коллекции


## Константа $O(1)$
Самый простой в оценке вариант алгоритма — алгоритм, который не зависит от размера входных данных. 
Посчитаем сумму первых пяти натуральных чисел. Для этого сравним два алгоритма.

In [None]:
# Алгоритм 1

a = [1, 2, 3, 4, 5, 6]

summ = 0
for element in a:
    summ += element

print(summ)

Первый алгоритм будет перебирать все элементы списка и добавлять их к общей сумме. \
*Количество операций*: 1 (создание переменной) + n (проходимся по всему списку) + n (операция суммы).

In [None]:
# Алгоритм 2

a = [1, 2, 3, 4, 5, 6]

summ = (a[0] + a[len(a) - 1]) / 2 * len(a)

print(summ)

Второй алгоритм не будет проходиться по всему массиву, а сразу сложит нужные элементы. \
*Количество операций*: 3.

В этой задаче нам нужно сделать три действия, независимо от того, какое количество натуральных чисел мы передали. То есть мы говорим, что данный алгоритм имеет сложность $О(1)$.

# Линейная $О(n)$

Линейная оценка, или сложность $О(n)$, будет у алгоритма, который проходит один или несколько раз по всем переданным объектам. Например, алгоритм поиска числа в неупорядоченном списке.

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
s = 17
n = len(lst)
i = 0
while i < n and lst[i] != s:
    i += 1
if i == n:
    print("Число не найдено")
else:
    print(i)

In [None]:
def element_search(ar, element):
    for i in range(len(ar)):
        if ar[i] == element:
            return i
    return "Число не найдено"
s = 17
print(element_search(lst, s))

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
element = 30
for i in range(len(lst)):
    if lst[i] == element:
        print(i)
        break
else:
    print("Число не найдено")

В этом примере в худшем случае (а нам интересен именно худший случай) мы пройдемся по всему списку, сравнивая каждый элемент с искомым, пока не найдем подходящий. Это и есть линейная сложность алгоритма. 

## Экспоненциальное время: O(2^n)

Если сложность алгоритма описывается формулой O(2^n), значит, время его работы удваивается с каждым дополнением к набору данных. Кривая роста функции O(2^n) экспоненциальная: сначала она очень пологая, а затем стремительно поднимается вверх. Примером алгоритма с экспоненциальной сложностью может послужить рекурсивный расчет чисел Фибоначчи:

In [None]:
def fibonacci(n):
    # Первое и второе числа Фибоначчи равны 1
    if n <= 2:
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

fibonacci(10)

## Квадратичная $О(n^2)$

Оценка алгоритма в $О(n^2)$ будет у алгоритма, который для каждого элемента множества перебирает все остальные элементы множества. Таковым, например, является **пузырьковая сортировка**.

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/132/1a8/c2d/1321a8c2d653c5b4fdca906baff445a5.gif)

In [None]:
def bubble_sort(nums):

    # Устанавливаем swapped в True, чтобы цикл запустился хотя бы один раз
    swapped = True

    while swapped:
        swapped = False

        # Идем циклом по индексам наших элементов
        for i in range(len(nums) - 1):

            # Если текущий элемент слева больше своего элемента справа
            if nums[i] > nums[i + 1]:

                # Меняем элементы местами
                nums[i], nums[i + 1] = nums[i + 1], nums[i]

                # Устанавливаем swapped в True для следующей итерации
                swapped = True

                # По окончании первого прогона цикла for, самый большой элемент "всплывет" наверх

# Проверяем, что оно работает
random_list_of_nums = [9, 5, 2, 1, 8, 4, 3, 7, 6]
bubble_sort(random_list_of_nums)
print(random_list_of_nums)

Алгоритм сортировки списка вставкой

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
n = len(lst)
for i in range(1, n):
    x = lst[i]
    j = i - 1
    while j > -1 and lst[j] > x:
        lst[j + 1] = lst[j]
        j -= 1

    lst[j + 1] = x

print(lst)

## Логарифмическая $О(log(n))$

Оценку $О(log(n))$ чаще всего имеют алгоритмы, которые на каждом шаге работы с данными уменьшают размер этих данных в разы. 

Классический пример логарифмического алгоритма — **бинарный поиск**


In [None]:
lst = [1, 3, 16, 17, 24, 26, 27, 28, 30]

s = 17
i = 0
j = len(lst) - 1
while i <= j:
    k = (i + j) // 2
    if lst[k] > s:
        j = k - 1
    elif lst[k] < s:
        i = k + 1
    else:
        break
if i <= j:
    print(k)
else:
    print("Число не найдено")

Получается, что в алгоритме бинарного поиска мы каждый раз будем делить наше множество пополам, пока не останется один элемент. Значит, функция, которая будет описывать оценку нашего алгоритма, должна показывать, сколько раз число $n$, которое описывает размер наших данных, можно поделить на 2, или наоборот — в какую степень надо возвести 2, чтобы получилось наше число. Это и есть определение логарифма $log(n)$. 

## Линейно-логарифмическая $О(n * log(n))$

Яркий пример такого алгоритма — **быстрая сортировка**. В этом алгоритме мы сначала разбиваем все элементы на пары (логарифмическая часть), а затем отсортированные пары последовательно соединяем (линейная часть). 

**Алгоритм с оценкой $О(n * log(n))$ считается самым быстрым решением задачи сортировки в общем случае.**

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/0a9/afd/372/0a9afd372156de5806bd87f93c875834.gif)


In [None]:
import random
def quicksort(nums):

    if len(nums) <= 1:
        return nums
    else:

        q = random.choice(nums)  # Генерирует случайную выборку из заданного одномерного списка.
        s_nums = []
        m_nums = []
        e_nums = []

    for n in nums:
        if n < q:
            s_nums.append(n)
        elif n > q:
            m_nums.append(n)
        else:
            e_nums.append(n)

    return quicksort(s_nums) + e_nums + quicksort(m_nums)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(quicksort(lst))

Сортировка слиянием
![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/21f/1a3/ec0/21f1a3ec016004112fbb9180f76067dd.gif)

In [None]:
def merge(le, ri):
    i, j = 0, 0
    res = []
    while i < len(le) and j < len(ri):
        if le[i] <= ri[i]:
            res.append(le[i])
            i += 1
        else:
            res.append(ri[j])
            j += 1
    res += le[i:] + ri[j:]
    return res

def merge_sort(s):
    if len(s) < 2: return s
    else:
        ln = len(s) // 2
        left = merge_sort(s[:ln])
        right = merge_sort(s[ln:])
        return merge(left, right)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(merge_sort(lst))

Сложность алгоритма `сортировки подсчетом` оценивается как **O(n + k)**, где n - это количество элементов в списке, а k - это количество уникальных элементов в списке.

In [None]:
lst = [1, 3, 16, 17, 24, 24, 26, 27, 28, 30]
lst_ancillary = [0] * (max(lst) + 1)
for i in range(len(lst)):
    lst_ancillary[lst[i]] += 1

lst_new = []
for i in range(max(lst) + 1):
    for j in range(lst_ancillary[i]):
        lst_new.append(i)

print(lst_new)
print(lst_ancillary)

# Библиотеки и модули

Если несколько функций позволяют решать схожие задачи, то их объединяют в **модули**.  Например, модуль `math` объединяет в себе математические функции , модуль `string` предназначен для работы со строками, модуль `random` предлагает функции для генерации псевдослучайных чисел.  

Эти модули и многие другие объединены в **Стандартную библиотеку Python**. Эта библиотека поставляется в составе Python, ее не нужно отдельно скачивать и устанавливать. Библиотека и входящие в нее модули описана в документации: https://docs.python.org/3/library/.


Рассмотрим модули Стандартной библиотеки Python. 

## Пример использования модуля Стандартной библиотеки Python

Воспользуемся функцией `sqrt()` из модуля  `math`. Эта функция как раз вычисляет квадратный корень, попробуем ее вызвать.

In [None]:
sqrt(16)  # Вызвов функцию sqrt() из модуля math

Не получилось. Необходимо импортировать модуль

In [None]:
import math  # Импортируем модуль math

In [None]:
sqrt(16)  # Снова пытаемся вызвать функцию sqrt() из модуля math, предварительно его импортировав

 Необходимо выполнить следующее: `<модуль>.<функция()>`.

In [None]:
math.sqrt(16)  # снова пытаемся вызвать функцию sqrt(), указав, что это функция из модуля math

In [None]:
math.__dict__

# Импорт отдельных компонент модуля

Писать каждый раз название модуля, точку, название функции не всегда удобно. Можно явно указать, что именно необходимо импортировать из модуля.

In [None]:
from random import randint, uniform  # Импортируем две функции из модуля random

Чтобы узнать, что делают эти функции и какие аргументы им нужно подавать, можно посмотреть документацию или воспользоваться функцией `help()`:

In [None]:
help(randint)

In [None]:
?randint

In [None]:
help(uniform)

In [None]:
# Вызываем функции по 5 раз
for i in range(5):
    print(randint(100, 200))
    print(uniform(100, 200))

In [None]:
import random
help(random)

Получили по 5 разных псевдослучайных чисел для каждой функции в указанном диапазоне — все получилось без указания модуля через точку.


Если необходимо импортировать много функций и переменных из одного модуля, то можно импортировать всё сразу, используя звездочку. Тогда указывать модуль через точку тоже не нужно.

In [None]:
# Импортируем всё из модуля math
from math import *

In [None]:
sqrt(16)

Получили число с высокой точностью, так как в модуле `math` содержится переменная `pi` с большим количеством знаков после запятой (точки):

In [None]:
print(pi)

Допустим, потом мы проводим еще какие-то вычисления, где не нужна такая точность. Мы создаем свою переменную `pi`:

In [None]:
pi = 3.14

Переприсвоили значение переменной pi

In [None]:
print(pi)

Если бы мы импортировали `math` и записывали бы через точку, значение `math.pi` не изменилось бы:

In [None]:
import math

pi = 3.14
print(pi, math.pi)

# Импорт под псевдонимом

Чтобы избежать таких сложностей, лучше писать название модуля. Но можно воспользоваться следующим упрощением: дать модулю псевдоним. Посмотрим на примере модуля `string`, предназначенного для работы со строками. Допустим, мы решили, что целиком слово `string` писать слишком долго, и хотим писать просто `s`. Посмотрим, как это можно сделать.

In [None]:
import string as s    # Даем псевдоним модулю string
print(s.punctuation)  # Печатаем строку со знаками препинания, хранящуюся в модуле

Теперь мы вместо `string.punctuation` будем писать `s.punctuation`, а `string.punctuation` не сработает.

In [None]:
print(string.punctuation)

In [None]:
s = 10

In [None]:
s.punctuation

Наконец, если вы совсем не готовы писать название модуля и даже слово `punctuation` кажется вам тоже слишком длинным, можно и ему дать псевдоним:

In [None]:
from string import punctuation as punc

In [None]:
print(punc)

## math

In [None]:
# Наибольший общий делитель
math.gcd(34,17)

In [None]:
# Факториал
math.factorial(5)

In [None]:
# Округление вверх
math.ceil(23.013)

In [None]:
# Округление вниз
math.floor(23.013)

Интересный факт - округление "ломается", при работе с некоторыми числами, у которых много значений после запятой. Нагляднее на примерах: 

In [None]:
from math import ceil, floor

print(ceil(10.0000000000000009))
print(ceil(10.0000000000000008))

print(floor(10.9999999999999992))
print(floor(10.9999999999999991))

In [None]:
# Возведение в степень
math.pow(2,5)

## random

In [None]:
# Случайное число от 0 до 1
random.random()

In [None]:
# Случайное число из заданного диапазона
random.randint(1, 100)

In [None]:
# Случайное число с плавающей точкой
random.uniform(1, 100)

In [None]:
# Случайный элемент из непустой последовательности, например, из списка
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
random.choice(lst)

In [None]:
# Перемешать последовательность
random.shuffle(lst)
lst

In [None]:
# Список заданной длины из последовательности
random.sample(lst, 5)

## datetime

In [None]:
import datetime

In [None]:
today = datetime.date.today()  # Текущая дата
print(today)
today = datetime.datetime.now()
print(today)

In [None]:
day = datetime.date(2024, 1, 16)
print(day)

In [None]:
import time

sec = time.time()
print(sec)
print(datetime.datetime.fromtimestamp(sec))

In [None]:
# Задать время
time = datetime.time()
print(time)

In [None]:
time = datetime.time(13)
print(time)

In [None]:
time = datetime.time(13, 24)
print(time)

In [None]:
time = datetime.time(13, 24, 57)
print(time)

In [None]:
# Получение текущего времени
date_time = datetime.datetime.today()
print(date_time)

date_time = datetime.datetime.now()
print(date_time)

In [None]:
date_str = "16 February 2024"
date_format = "%d %B %Y"

print(datetime.datetime.strptime(date_str, date_format))

date_str = "16 Feb 2024"
date_format = "%d %b %Y"

print(datetime.datetime.strptime(date_str, date_format))

In [None]:
d1 = datetime.datetime.strptime("01.01.2024 13:16", "%d.%m.%Y %H:%M")
print(d1)
d2 = datetime.datetime.strptime("2024/03/03 17:18", "%Y/%m/%d %H:%M")
print(d2)

In [None]:
d2 - d1

In [None]:
(d2 - d1).days

In [None]:
(d2 - d1).seconds

In [None]:
now = datetime.datetime.now()
date_str = now.strftime("%m/%d/%y %H:%M:%S")
print(date_str)

In [None]:
datetime.datetime.now() - datetime.timedelta(days=5)

In [None]:
datetime.datetime.now() + datetime.timedelta(weeks=5)

In [None]:
# День недели
date_time = datetime.datetime.today()
date_time.weekday()

## pprint

In [None]:
import pprint
data = {
    "name": "John",
    "age": 30,
    "city": "New York",
    "hobbies": ["reading", "playing guitar", "travelling"],
}

pprint.pprint(data)
print(data)

Функция pprint предоставляет несколько параметров для настройки вывода данных. Например, можно установить ширину строки вывода и количество отступов для вложенных структур данных.

In [None]:
pprint.pprint(data, width=50, indent=4)

In [None]:
pprint.pprint(data, depth=1)  # Указать глубину

In [None]:
file = ["file_00.csv", "file_01.csv", "file_02.csv",
        "file_03.csv", "file_04.csv", "file_05.csv",
        "file_06.csv", "file_07.csv", "file_08.csv",
        "file_09.csv", "file_10.csv", "file_11.csv",
        "file_12.csv", "file_13.csv", "file_14.csv",
        "file_15.csv", "file_16.csv", "file_17.csv",]

In [None]:
file

In [None]:
print(file)

In [None]:
pprint.pprint(file)

## timeit

Этот модуль предназначен для оценки производительности небольших фрагментов кода. 

Для этого необходимо импортировать саму библиотеку `timeit` и вызвать из нее метод `.timeit()`, передав ему название нашей функции и количество необходимых повторений.

Рассмотрим следующую задачу конкатенации строк: Составить строку из чисел от 1 до 100, отделив числа друг от друга запятой.

In [None]:
import timeit

# Алгоритм 1
def concat():
    s = ""
    for i in range(100):
        s += str(i) + ","
    s += "100"

# Алгоритм 2
def join():
    s = ",".join(map(str, range(101)))

print(timeit.timeit(concat, number=1000))
print(timeit.timeit(join, number=1000))

# Работа с файлами

Рассмотрим способы открытия, чтения и записи простых файлов с использования Python. 

Открывать файлы можно двумя способами. С помощью `open/close` и с помощью конструкции `with ... as`

Синтаксис следующий:

`f = open(file_name, access_mode)`

Где, `file_name` = имя открываемого файла, а `access_mode` = режим открытия файла.

Он может быть: для чтения, записи и т. д. По умолчанию используется режим чтения (r), если другое не указано. Далее полный список режимов открытия файла:

- `r` Только для чтения.
- `w` Только для записи. Создаст новый файл, если не найдет с указанным именем.
- `rb` Только для чтения (бинарный).
- `wb` Только для записи (бинарный). Создаст новый файл, если не найдет с указанным именем.
- `r+` Для чтения и записи.
- `rb+` Для чтения и записи (бинарный).
- `w+` Для чтения и записи. Создаст новый файл для записи, если не найдет с указанным именем.
- `wb+` Для чтения и записи (бинарный). Создаст новый файл для записи, если не найдет с указанным именем.
- `a` Откроет для добавления нового содержимого. Создаст новый файл для записи, если не найдет с указанным именем.
- `a+` Откроет для добавления нового содержимого. Создаст новый файл для чтения записи, если не найдет с указанным именем.
- `ab` Откроет для добавления нового содержимого (бинарный). Создаст новый файл для записи, если не найдет с указанным именем.
- `ab+` Откроет для добавления нового содержимого (бинарный). Создаст новый файл для чтения записи, если не найдет с указанным именем.

Больше информации в статье [по ссылке](https://pythonru.com/osnovy/fajly-v-python-vvod-vyvod)

Откроем и запишем строку в файл txt с использованием `open/close`. Файла с таким именем нет, Python сам создаст его. Использовать будем относительный путь, т.е. файл txt будет создан в той же директории, где находится наш файл Python.

In [None]:
f = open("file.txt", "w")
f.write("Hey, Bim")
f.close()

In [None]:
#Узнаем в какой директории мы находимся

import os
os.getcwd()

Абсолютный путь к файлу может выглядеть следующим образом

In [None]:
f = open("C:\\Users\\User\\Python_for_beginners\\Lect_13\\file.txt", "w")
f.write("Hey, Bim")
f.close()

Запишем текст с использованием кириллицы. Для записи необходимо использовать только строковый тип, для этого явный тип int преобразуем в str

In [None]:
f = open("file.txt", "w")
f.write("Собаке Бим уже " + str(5) + " лет")
f.close()

При открытии файла file.txt в Jupyter, получаем проблемы с кодировкой. Поведение также может зависеть от операционной системы и программы, в которой открывается файл - что корректно откроется в обычном блокноте Win, может не открыться в Jupyter Notebook или, например, корректно открыться в Jupyter Notebook, но в MS Excel увидим абракадабру.

Поэтому, часто стоит указывать кодировку, особенно если в тексте есть кириллица:

In [None]:
f = open("file.txt", "w", encoding='UTF-8')
f.write("Собаке Бим уже " + str(5) + " лет")
f.close()

На самом глубоком уровне компьютер оперирует исключительно цифрами 0 и 1. Это так называемый [двоичный код](https://ru.wikipedia.org/wiki/Двоичный_код), а единички и нули называются битами, от "binary digit" — «двоичная цифра».

Обычные, привычные нам числа в десятичной системе исчисления, закодированы с помощью двоичных чисел.

Компьютер на самом деле не знает ничего о буквах, знаках пунктуации и прочих текстовых символах. Все эти символы так же закодированы числами. В этом заключается суть `кодировок`.

Во время своей работы, программы используют кодировки для преобразования чисел в символы и наоборот. Причём сама программа не имеет представления о смысле этих символов.

Подобные таблицы, в которых сопоставляются буквы и числа, называются кодировками. Кроме букв алфавита, в таблицы кодировок входят знаки препинания и другие полезные символы. Вы наверняка сталкивались с кодировками, например, [ASCII](https://ru.wikipedia.org/wiki/ASCII) или [UTF-8](https://ru.wikipedia.org/wiki/UTF-8).

Разные кодировки содержат разное количество символов. Изначально небольших таблиц вроде ASCII было достаточно для большинства задач. Но в ней только латинские буквы, несколько простых символов вроде % и ? и специальные управляющие символы типа перевода строки.

С распространением компьютеров, разным странам понадобились свои, более широкие таблицы. В том числе для кириллических букв, восточных иероглифов, арабской вязи, дополнительных математических и типографских символов, а впоследствии даже для эмодзи-смайликов.

Сегодня в большинстве случаев используется один из вариантов [юникода](https://ru.wikipedia.org/wiki/Юникод), включающий в себя знаки почти всех письменных языков мира.

В Python можно «запросить» и вывести на экран любой символ из кодировки ASCII, по его номеру. Для этого используется функция `chr()`. Например:

In [None]:
print(chr(126))
print(chr(94))
print(chr(37))

Теперь воспользуемся конструкцией `with ... as` для открытия и записи файла

In [None]:
with open("file.txt", "w", encoding='UTF-8') as f:
    f.write("Сегодня теплее чем вчера\n")
    f.write("Завтра обещают похолодание")

Попробуем записать список в файл

In [None]:
lst = ["Мама", "мыла", "раму"]
with open("file.txt", "w", encoding='UTF-8') as f:
    f.write(lst)

Получим ошибку. Для записи списка необходимо использовать writelines

In [None]:
lst = ["Мама ", " мыла ", " раму", "\n"]
with open("file.txt", "w", encoding='UTF-8') as f:
    f.writelines(lst)

Ранее мы перезаписывали файл. Для добавление данных файл нужно сменить "w" на "a"

In [None]:
lst = ["Раму ", " мыла ", " мама"]
with open("file.txt", "a", encoding='UTF-8') as f:
    f.writelines(lst)

Создадим новый файл и запишем в него несколько строк:

In [None]:
test_text = '''Этот файл
состоит
из

нескольких строчек'''

with open("file_r.txt", "w", encoding='UTF-8') as f:
    f.writelines(test_text)

Откроем файл для чтения. Сменим "a" на "r". Для наглядности, выводить будем без использования print

In [None]:
with open("file_r.txt", "r") as f:
    st = f.read()
st

Получили набор символов. Добавим при открытии encoding='UTF-8'

In [None]:
with open("file_r.txt", "r", encoding='UTF-8') as f:
    st = f.read()
st

Прочитаем первые 25 символов

In [None]:
with open("file_r.txt", "r", encoding='UTF-8') as f:
    st = f.read(25)
st

Прочитаем 1 строку

In [None]:
with open("file_r.txt", "r", encoding='UTF-8') as f:
    st = f.readline()
st

Прочитаем первые две строчки, выведем только вторую

In [None]:
with open("file_r.txt", "r", encoding='UTF-8') as f:
    st = f.readline()
    st2 = f.readline()
st2

Считаем все строки

In [None]:
with open("file_r.txt", "r", encoding='UTF-8') as f:
    st = f.readlines()
st

Еще один способ считывание всего файла в одну переменную str

In [None]:
st = ""
with open("file_r.txt", "r", encoding='UTF-8') as f:
    for s in f:
        st += s
st

Уберем перенос строк c использованием `strip()`

In [None]:
st = ""
with open("file_r.txt", "r", encoding='UTF-8') as f:
    for s in f:
        st += s.strip() + " "
st

Следующий пример работы - создадим частотный словарь сказки Аксакова Сергея Тимофеевича - Аленький цветочек.

Считываем текст из файла в одну строковую переменную, удаляя пробельные символы по краям строки.

In [None]:
text = ""
with open("_add_material_lesson_python\\Аксаков С. Т. - Аленький цветочек.txt", "r", encoding='UTF-8') as f:
    for s in f:
        text += s.strip() + " "
print(text[:100])

Чтобы создать словарь уникальных слов, сначала нужно получить список этих слов. Но при обычном разделении через split() они у нас будут с лишними символами: запятая, точка, восклицательный знак и т.д.

In [None]:
words = text.split()   

print(words[:100])

Создадим список слов без посторонних списков и приведем все к одному регистру

In [None]:
words_lst = []

for st in words:
    st_temp = st.lower().strip('.,;:!«»?—()"') 
    if st_temp != '':
        words_lst.append(st_temp)


print(words_lst[:100]) 

Напишем функцию для создания словаря слов

In [None]:
def create_dict(lst_words): 
    dic = {}
    for word in lst_words:
        if word not in dic:
            dic[word] = 1
        else:
            dic[word] += 1
    return dic     

Проверим функцию на небольшом тексте

In [None]:
small_text = 'Мама мыла раму – раму мыла мама'.split()
small_dict = create_dict(small_text)
print(small_dict)
small_text

Запустим на данных из нашей сказки

In [None]:
dict_of_words = create_dict(words_lst)
print(len(dict_of_words))
len(words_lst)

С помощью функции выведем первые 10 элементов словаря в том порядке, в котором они расположены в словаре

In [None]:
def print_dict(dictionary):
    i = 0
    for w in dictionary:
        if i == 10:
            break
        print(w, dictionary[w])
        i += 1
        
print_dict(dict_of_words)

Отсортируем небольшой словарь. Для этого воспользуемся функцией sorted для сортировки с key в виде lamda-функции.

Сортировка будет проходить по второму элементу, т.е. по встречаемости слов.

Также применим reverse=True для сортировки от наибольшего к наименьшему.

In [None]:
print(sorted(small_dict.items(), key=lambda dict: dict[1], reverse=True))

Следующий результат получается на данных из сказки

In [None]:
sorted_list = sorted(dict_of_words.items(), key=lambda dict: dict[1], reverse=True)

In [None]:
sorted_list

Список стоп-слов

In [None]:
stopwords = ['и', 'в', 'во', 'не', 'что', 'он', 'на', 'я', 'с', 'со', 'как', 'а', 'то', 
             'она', 'так', 'его', 'но', 'да', 'ты', 'к', 'у', 'же', 'вы', 'за', 'бы', 
             'по', 'только', 'ее', 'мне', 'было', 'вот', 'от', 'меня', 'еще', 'нет', 'о', 'из', 
             'ему', 'теперь', 'когда', 'даже', 'ну', 'вдруг', 'ли', 'если', 'уже', 'или', 'ни', 'быть', 
             'был', 'него', 'до', 'вас', 'нибудь', 'опять', 'уж', 'вам', 'ведь', 'там', 'потом', 'себя', 
             'ничего', 'ей', 'может', 'они', 'тут', 'где', 'есть', 'надо', 'ней', 'для', 'мы', 'тебя', 'их', 
             'чем', 'была', 'сам', 'чтоб', 'без', 'будто', 'чего', 'раз', 'тоже', 'себе', 'под', 'будет', 'ж', 
             'тогда', 'кто', 'этот', 'того', 'потому', 'этого', 'какой', 'совсем', 'ним', 'здесь', 'этом', 
             'один', 'почти', 'мой', 'тем', 'чтобы', 'нее', 'сейчас', 'были', 'куда', 'зачем', 'всех', 
             'никогда', 'можно', 'при', 'наконец', 'два', 'об', 'другой', 'хоть', 'после', 'над', 'больше', 
             'тот', 'через', 'эти', 'нас', 'про', 'всего', 'них', 'какая', 'много', 'разве', 'три', 'эту', 
             'моя', 'впрочем', 'хорошо', 'свою', 'этой', 'перед', 'иногда', 'лучше', 'чуть', 'том', 
             'такой', 'им', 'более', 'всегда', 'всю', 'между','это']

Создадим новый список слов сказки без стоп-слов

In [None]:
words_lst_new = []                 # Создаем пустой список
for word in words_lst:             # Последовательно для всех слов из списка
    if word not in stopwords:      # Если слово не находится в списке стоп-слов
        words_lst_new.append(word) # Добавляем его к новому списку
print(words_lst_new[:10])          # Смотрим фрагмент получившегося списка, где видно, что стоп-слова исключены
len(words_lst_new)

Создадим новый словарь без стоп-слов и отсортируем его

In [None]:
dict_without_stopwords = create_dict(words_lst_new)

In [None]:
print_dict(dict_without_stopwords)

In [None]:
sorted_without_stopwords = sorted(dict_without_stopwords.items(), key=lambda x: x[1], reverse=True)
sorted_without_stopwords[:15]

Запишем результат в файл

In [None]:
with open("flower.txt", "w", encoding='UTF-8') as f:
    for lst in sorted_without_stopwords:
        f.writelines(lst[0] + ", " + str(lst[1]) + "\n")

In [None]:
with open("flower.csv", "w", encoding='UTF-8') as f:
    for lst in sorted_without_stopwords:
        f.writelines(lst[0] + ", " + str(lst[1]) + "\n")

# p.s. В MS Excel потребуется открывать с указанием кодировки, иначе получим абракадабру.

**Работа с csv-файлами**

Часто для хранения табличных данных используют формат csv. В данном файле данные записаны по строкам, а разделение по столбцам происходит с помощью запятых (точек с запятой, пробелами и т.д.), отделяющих значения друг от друга. Данные файлы можно просматривать в редакторе таблиц (например, Excel и Google Sheets).

Создадим и затем откроем csv файл.

In [None]:
test_text = '''Random Number 1,Random Number 2,Random Number 3
27,7,3
23,14,24
28,27,12
16,2,9
24,18,5
21,15,10
2,20,3
11,9,26
13,24,30
21,22,9'''

with open("file_csv.csv", "w", encoding='UTF-8') as f:
    f.writelines(test_text)

In [None]:
csv_data = ""
with open("file_csv.csv", "r", encoding='UTF-8') as f:
    for s in f:
        csv_data += s
print(csv_data)

Построим график, на основании содержимого существующего файла csv.

In [None]:
csv_data = ""
with open("_add_material_lesson_python\\usd_eur_quotes.csv", "r") as f:
    for line in f:
        csv_data += line
csv_data[:100]

В данном случае, в момент считывания файла лучше сразу разбить данные на элементы списка

In [None]:
usd_eur_list = []
with open("_add_material_lesson_python\\usd_eur_quotes.csv", "r") as f:
    for line in f:
        day_list = line.split(";")
        usd_eur_list.append(day_list)
usd_eur_list

In [None]:
usd_eur_list.pop(0)

Из полученного списка с курсов валют, сохраним данные в три разных списка, первый для даты, второй для курса доллара, третий для курса евро. Но так как данные за 1 января находятся в конце csv-файла, считывать данные будем в обратном порядке 

In [None]:
dates = []
currency_usd = []
currency_eur = []

for row in reversed(usd_eur_list):
    dates.append(row[0])
    currency_usd.append(float(row[1]))
    currency_eur.append(float(row[2]))

Подключим библиотеку `matplotlib` для отрисовки графиков. Более подробнее мы будем ее изучать отдельно

In [None]:
import matplotlib.pyplot as plt


plt.figure(figsize=(10, 5))
plt.plot(dates, currency_usd, label='USD')
plt.plot(dates, currency_eur, label='EUR')
plt.xlabel('Date')
plt.ylabel('Course')
plt.title('Course of USD and EUR Over Time')
plt.legend()
plt.show()

# Библиотека OpenCV

In [None]:
!pip install opencv-python

In [None]:
!pip list

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

In [None]:
file_name = "_add_material_lesson_python\\huskies.jpeg"
img = cv2.imread(file_name)
plt.imshow(img);

In [None]:
# Для IDLE, matplotlib не нужно
# Откроем картинку с собакой в Windows

cv2.imshow('_add_material_lesson_python\\huskies.jpeg', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Почему после обработки файла OpenCV мы получили такую картинку - всё дело в том, что OpenCV по умолчанию использует формат **BGR**, а не более привычный **RGB**. Так исторически сложилось. Подробнее можно почитать [по ссылке](https://arboook.com/kompyuternoe-zrenie/operatsii-s-tsvetom-v-opencv3-i-python/). Чтобы в нашем случае, получить требуемый результат, используем `cv2.COLOR_BGR2RGB`

In [None]:
img = cv2.cvtColor(cv2.imread(file_name), cv2.COLOR_BGR2RGB)

plt.imshow(img);

In [None]:
b, g, r = cv2.split(img)
plt.imshow(b);

In [None]:
plt.imshow(g);

In [None]:
plt.imshow(r);

Перевод в оттенки серого

In [None]:
gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

In [None]:
plt.imshow(gray, cmap='gray');

Изменение размера

In [None]:
size = 50
height = int(img.shape[0] * size / 100)
width = int(img.shape[1] * size / 100)
resized_img = cv2.resize(img, (width, height))
plt.imshow(resized_img);

In [None]:
resized_img = cv2.resize(img, None, fx = 0.5, fy = 0.5)
plt.imshow(resized_img);

Кадрирование

In [None]:
cropped = img[200:1200, 200:1500]  # Координаты: [y0:y1, x0:x1]
plt.imshow(cropped);

In [None]:
cropped[0][0]

Вращение изображений

In [None]:
rotated_img = cv2.rotate(img, cv2.ROTATE_90_CLOCKWISE)
plt.imshow(rotated_img);

In [None]:
angel = 45  # В градусах
(h, w, c) = img.shape
center = (w // 2, h // 2)
M = cv2.getRotationMatrix2D(center, angel, 1.0)
rotated_img = cv2.warpAffine(img, M, (w, h))
plt.imshow(rotated_img);

Контраст и яркость 

In [None]:
lab = cv2.cvtColor(img, cv2.COLOR_RGB2LAB)  # Переведем в формат LAB
l, a , b = cv2.split(lab)  # Разбитие на каналы
# Создание адаптивной гистограммы
clahe = cv2.createCLAHE(clipLimit = 3., tileGridSize = (8,8))
# clipLimit - определяет, насколько контрастнее станет фото
# Изображенеие разбивается на блоки 8 на 8, для каждого блока гистограмма строится отдельно
l2 = clahe.apply(l)  # Применение гистограмм к L-каналу
lab = cv2.merge((l2, a, b))
img2 = cv2.cvtColor(lab, cv2.COLOR_LAB2RGB)
plt.imshow(img2); 

In [None]:
claheFilter = cv2.createCLAHE(clipLimit = 3., tileGridSize = (8,8))
gray2 = claheFilter.apply(gray)
plt.imshow(gray2, cmap='gray');

In [None]:
# Линейный метод
alpha = 1.5
beta = 10
# np.clip - ограничение значений в массиве
# Значения за пределами интервала обрезаются по краям интервала
img3 = np.uint8(np.clip((alpha * img + beta), 0, 255))
plt.imshow(img3);

Выделение контуров

In [None]:
edged_grey = cv2.Canny(gray, 10, 250)
plt.imshow(edged_grey, cmap='gray');

In [None]:
edged_grey_2 = cv2.Canny(gray2, 10, 250)
plt.imshow(edged_grey_2, cmap='gray');

Размытие изображения

In [None]:
blurred_img = cv2.GaussianBlur(img, (11, 11), 0)

plt.imshow(blurred_img);

In [None]:
blurred_img = cv2.blur(img, (11, 11))

plt.imshow(blurred_img);

In [None]:
blurred_img = cv2.bilateralFilter(img, 19, 75, 75)

plt.imshow(blurred_img);

In [None]:
plt.imshow(img);

Загрузим изображение луны на зеленом фоне для дальнейшего добавления на нашу первоначальную картинку

In [None]:
file_name_moon = "_add_material_lesson_python\\moon.jpg"
img_moon = cv2.cvtColor(cv2.imread(file_name_moon), cv2.COLOR_BGR2RGB)

plt.imshow(img_moon);

In [None]:
print(img_moon.shape)

Размер изображения луны меньше, поэтому «создадим» зеленый прямоугольник нужного нам размера

In [None]:
green = np.full((1281,1920,3),(0, 255, 0), np.uint8)
plt.imshow(green);

При помощи среза заменим в зеленом прямоугольники пиксели из изображения луны

In [None]:
green[0:0+img_moon.shape[0], 0:0+img_moon.shape[1]] = img_moon
plt.imshow(green);

Уберем зеленый цвет. Для этого переведем картинку в HSV формат (Hue – тон, Saturation – насыщенность и Value – значение).
Далее создадим маску зеленого цвета в формате HSV, более подробней можно посмотреть [по ссылке](https://stackoverflow.com/questions/47483951/how-can-i-define-a-threshold-value-to-detect-only-green-colour-objects-in-an-ima)

In [None]:
hsv = cv2.cvtColor(green, cv2.COLOR_BGR2HSV) 
mask = cv2.inRange(hsv, (36, 25, 25), (70, 255,255))
plt.imshow(mask, cmap='gray');

Сделаем копию изначального изображения.

Уберем зеленый фон с использованием нашей маски, все кроме изображения луны красится в черный цвет

In [None]:
masked_image = np.copy(green)
masked_image[mask != 0] = [0, 0, 0]
plt.imshow(masked_image);

Создадим копию первоначального изображения и на копию наложим нашу маску 

In [None]:
masked_background_image = np.copy(img)
masked_background_image[mask == 0] = [0, 0, 0]
plt.imshow(masked_background_image);

In [None]:
complete_image = masked_image + masked_background_image  # Cкладываем массивы

plt.imshow(complete_image);

Сохраняем файл, не забыв про `COLOR_BGR2RGB`

In [None]:
cv2.imwrite('_add_material_lesson_python\\huskies_moon.png', cv2.cvtColor(complete_image, cv2.COLOR_RGB2BGR))