## Содержание:
- Основные оценки сложности алгоритмов
- Работа с файлами
- Библиотека OpenCV
- Массивы NumPy

# Основные оценки сложности алгоритмов

Основные категории алгоритмической сложности в О-нотации:

* Постоянное время: 0(1) – время выполнения не зависит от количества элементов во входном наборе данных

* Линейное время: О(N) – время выполнения пропорционально количеству элементов в коллекции

* Логарифмическое время: О(log(N)) – время выполнения пропорционально логарифму от количества элементов в коллекции

* Квазилинейное время: О(N*log(N)) – время выполнения больше чем, линейное, но меньше квадратичного

* Полиномиальное время: О(N^2) – время выполнения пропорционально квадрату количества элементов в коллекции


## Константа $O(1)$
Самый простой в оценке вариант алгоритма – алгоритм, который не зависит от размера входных данных.
Посчитаем сумму первых пяти натуральных чисел. Для этого сравним два алгоритма.

In [None]:
# Алгоритм 1

a = [1, 2, 3, 4, 5, 6]

summ = 0
for element in a:
    summ += element

print(summ)

Первый алгоритм будет перебирать все элементы списка и добавлять их к общей сумме.\
*Количество операций*: 1 (создание переменной) + n (проходимся по всему списку) + n (операция суммы).

In [None]:
# Алгоритм 2

a = [1, 2, 3, 4, 5, 6]

summ = (a[0] + a[len(a) - 1]) / 2 * len(a)

print(summ)

Второй алгоритм не будет проходиться по всему массиву, а сразу сложит нужные элементы.\
*Количество операций*: 3.

В этой задаче нам нужно сделать три действия, независимо от того, какое количество натуральных чисел мы передали. То есть мы говорим, что данный алгоритм имеет сложность $О(1)$.

# Линейная $О(n)$

Линейная оценка, или сложность $О(n)$, будет у алгоритма, который проходит один или несколько раз по всем переданным объектам. Например, алгоритм поиска числа в неупорядоченном списке.

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
s = 17
n = len(lst)
i = 0
while i < n and lst[i] != s:
    i += 1
if i == n:
    print("Число не найдено")
else:
    print(i)

In [None]:
def element_search(ar, element):
    for i in range(len(ar)):
        if ar[i] == element:
            return i
    return "Число не найдено"
s = 17
print(element_search(lst, s))

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
element = 30
for i in range(len(lst)):
    if lst[i] == element:
        print(i)
        break
else:
    print("Число не найдено")

В этом примере в худшем случае (а нам интересен именно худший случай) мы пройдемся по всему списку, сравнивая каждый элемент с искомым, пока не найдем подходящий. Это и есть линейная сложность алгоритма.

## Экспоненциальное время: O(2^n)

Если сложность алгоритма описывается формулой O(2^n), значит, время его работы удваивается с каждым дополнением к набору данных. Кривая роста функции O(2^n) экспоненциальная: сначала она очень пологая, а затем стремительно поднимается вверх. Примером алгоритма с экспоненциальной сложностью может послужить рекурсивный расчет чисел Фибоначчи:

In [None]:
def fibonacci(n):
    # Первое и второе числа Фибоначчи равны 1
    if n <= 2:
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

fibonacci(10)

## Квадратичная $О(n^2)$

Оценка алгоритма в $О(n^2)$ будет у алгоритма, который для каждого элемента множества перебирает все остальные элементы множества. Таковым, например, является **пузырьковая сортировка**.

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/132/1a8/c2d/1321a8c2d653c5b4fdca906baff445a5.gif)

In [None]:
def bubble_sort(nums):

    # Устанавливаем swapped в True, чтобы цикл запустился хотя бы один раз
    swapped = True

    while swapped:
        swapped = False

        # Идем циклом по индексам наших элементов
        for i in range(len(nums) - 1):

            # Если текущий элемент слева больше своего элемента справа
            if nums[i] > nums[i + 1]:

                # Меняем элементы местами
                nums[i], nums[i + 1] = nums[i + 1], nums[i]

                # Устанавливаем swapped в True для следующей итерации
                swapped = True

                # По окончании первого прогона цикла for, самый большой элемент "всплывет" наверх

# Проверяем, что оно работает
random_list_of_nums = [9, 5, 2, 1, 8, 4, 3, 7, 6]
bubble_sort(random_list_of_nums)
print(random_list_of_nums)

Алгоритм сортировки списка вставкой

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
n = len(lst)
for i in range(1, n):
    x = lst[i]
    j = i - 1
    while j > -1 and lst[j] > x:
        lst[j + 1] = lst[j]
        j -= 1

    lst[j + 1] = x

print(lst)

## Логарифмическая $О(log(n))$

Оценку $О(log(n))$ чаще всего имеют алгоритмы, которые на каждом шаге работы с данными уменьшают размер этих данных в разы.

Классический пример логарифмического алгоритма – **бинарный поиск**


In [None]:
lst = [1, 3, 16, 17, 24, 26, 27, 28, 30]

s = 17
i = 0
j = len(lst) - 1
while i <= j:
    k = (i + j) // 2
    if lst[k] > s:
        j = k - 1
    elif lst[k] < s:
        i = k + 1
    else:
        break
if i <= j:
    print(k)
else:
    print("Число не найдено")

Получается, что в алгоритме бинарного поиска мы каждый раз будем делить наше множество пополам, пока не останется один элемент. Значит, функция, которая будет описывать оценку нашего алгоритма, должна показывать, сколько раз число $n$, которое описывает размер наших данных, можно поделить на 2, или наоборот – в какую степень надо возвести 2, чтобы получилось наше число. Это и есть определение логарифма $log(n)$.

## Линейно-логарифмическая $О(n * log(n))$

Яркий пример такого алгоритма – **быстрая сортировка**. В этом алгоритме мы сначала разбиваем все элементы на пары (логарифмическая часть), а затем отсортированные пары последовательно соединяем (линейная часть). 

**Алгоритм с оценкой $О(n * log(n))$ считается самым быстрым решением задачи сортировки в общем случае.**

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/0a9/afd/372/0a9afd372156de5806bd87f93c875834.gif)


In [None]:
import random
def quicksort(nums):

    if len(nums) <= 1:
        return nums
    else:

        q = random.choice(nums)  # Генерирует случайную выборку из заданного одномерного списка.
        s_nums = []
        m_nums = []
        e_nums = []

    for n in nums:
        if n < q:
            s_nums.append(n)
        elif n > q:
            m_nums.append(n)
        else:
            e_nums.append(n)

    return quicksort(s_nums) + e_nums + quicksort(m_nums)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(quicksort(lst))

Сортировка слиянием
![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/21f/1a3/ec0/21f1a3ec016004112fbb9180f76067dd.gif)

In [None]:
def merge(le, ri):
    i, j = 0, 0
    res = []
    while i < len(le) and j < len(ri):
        if le[i] <= ri[i]:
            res.append(le[i])
            i += 1
        else:
            res.append(ri[j])
            j += 1
    res += le[i:] + ri[j:]
    return res

def merge_sort(s):
    if len(s) < 2: return s
    else:
        ln = len(s) // 2
        left = merge_sort(s[:ln])
        right = merge_sort(s[ln:])
        return merge(left, right)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(merge_sort(lst))

Сложность алгоритма `сортировки подсчетом` оценивается как **O(n + k)**, где n – это количество элементов в списке, а k – это количество уникальных элементов в списке.

In [None]:
lst = [1, 3, 16, 17, 24, 24, 26, 27, 28, 30]
lst_ancillary = [0] * (max(lst) + 1)
for i in range(len(lst)):
    lst_ancillary[lst[i]] += 1

lst_new = []
for i in range(max(lst) + 1):
    for j in range(lst_ancillary[i]):
        lst_new.append(i)

print(lst_new)
print(lst_ancillary)

# Работа с файлами

Рассмотрим способы открытия, чтения и записи простых файлов с использования Python.

Открывать файлы можно двумя способами. С помощью `open/close` и с помощью конструкции `with ... as`

Синтаксис следующий:

`f = open(file_name, access_mode)`

Где, `file_name` = имя открываемого файла, а `access_mode` = режим открытия файла.

Он может быть: для чтения, записи и т. д. По умолчанию используется режим чтения (r), если другое не указано. Далее полный список режимов открытия файла:

- `r` Только для чтения.
- `w` Только для записи. Создаст новый файл, если не найдет с указанным именем.
- `rb` Только для чтения (бинарный).
- `wb` Только для записи (бинарный). Создаст новый файл, если не найдет с указанным именем.
- `r+` Для чтения и записи.
- `rb+` Для чтения и записи (бинарный).
- `w+` Для чтения и записи. Создаст новый файл для записи, если не найдет с указанным именем.
- `wb+` Для чтения и записи (бинарный). Создаст новый файл для записи, если не найдет с указанным именем.
- `a` Откроет для добавления нового содержимого. Создаст новый файл для записи, если не найдет с указанным именем.
- `a+` Откроет для добавления нового содержимого. Создаст новый файл для чтения записи, если не найдет с указанным именем.
- `ab` Откроет для добавления нового содержимого (бинарный). Создаст новый файл для записи, если не найдет с указанным именем.
- `ab+` Откроет для добавления нового содержимого (бинарный). Создаст новый файл для чтения записи, если не найдет с указанным именем.

Больше информации в статье [по ссылке](https://pythonru.com/osnovy/fajly-v-python-vvod-vyvod)

Откроем и запишем строку в файл txt с использованием `open/close`. Файла с таким именем нет, Python сам создаст его. Использовать будем относительный путь, т.е. файл txt будет создан в той же директории, где находится наш файл Python.

In [None]:
f = open("file.txt", "w")
f.write("Hey, Bim")
f.close()

In [None]:
#Узнаем в какой директории мы находимся

import os
os.getcwd()

Абсолютный путь к файлу может выглядеть следующим образом

In [None]:
f = open("C:\\Users\\User\\Python_for_beginners\\Lect_13\\file.txt", "w")
f.write("Hey, Bim")
f.close()

Запишем текст с использованием кириллицы. Для записи необходимо использовать только строковый тип, для этого явный тип int преобразуем в str

In [None]:
f = open("file.txt", "w")
f.write("Собаке Бим уже " + str(5) + " лет")
f.close()

При открытии файла file.txt в Jupyter, получаем проблемы с кодировкой. Поведение также может зависеть от операционной системы и программы, в которой открывается файл – что корректно откроется в обычном блокноте Win, может не открыться в Jupyter Notebook или, например, корректно открыться в Jupyter Notebook, но в MS Excel увидим абракадабру.

Поэтому, часто стоит указывать кодировку, особенно если в тексте есть кириллица:

In [None]:
f = open("file.txt", "w", encoding = 'UTF-8')
f.write("Собаке Бим уже " + str(5) + " лет")
f.close()

На самом глубоком уровне компьютер оперирует исключительно цифрами 0 и 1. Это так называемый [двоичный код](https://ru.wikipedia.org/wiki/Двоичный_код), а единички и нули называются битами, от "binary digit" – «двоичная цифра».

Обычные, привычные нам числа в десятичной системе исчисления, закодированы с помощью двоичных чисел.

Компьютер на самом деле не знает ничего о буквах, знаках пунктуации и прочих текстовых символах. Все эти символы так же закодированы числами. В этом заключается суть `кодировок`.

Во время своей работы, программы используют кодировки для преобразования чисел в символы и наоборот. Причём сама программа не имеет представления о смысле этих символов.

Подобные таблицы, в которых сопоставляются буквы и числа, называются кодировками. Кроме букв алфавита, в таблицы кодировок входят знаки препинания и другие полезные символы. Вы наверняка сталкивались с кодировками, например, [ASCII](https://ru.wikipedia.org/wiki/ASCII) или [UTF-8](https://ru.wikipedia.org/wiki/UTF-8).

Разные кодировки содержат разное количество символов. Изначально небольших таблиц вроде ASCII было достаточно для большинства задач. Но в ней только латинские буквы, несколько простых символов вроде % и ? и специальные управляющие символы типа перевода строки.

С распространением компьютеров, разным странам понадобились свои, более широкие таблицы. В том числе для кириллических букв, восточных иероглифов, арабской вязи, дополнительных математических и типографских символов, а впоследствии даже для эмодзи-смайликов.

Сегодня в большинстве случаев используется один из вариантов [юникода](https://ru.wikipedia.org/wiki/Юникод), включающий в себя знаки почти всех письменных языков мира.

В Python можно «запросить» и вывести на экран любой символ из кодировки ASCII, по его номеру. Для этого используется функция `chr()`. Например:

In [None]:
print(chr(126))
print(chr(94))
print(chr(37))

Теперь воспользуемся конструкцией `with ... as` для открытия и записи файла

In [None]:
with open("file.txt", "w", encoding = 'UTF-8') as f:
    f.write("Сегодня теплее чем вчера\n")
    f.write("Завтра обещают похолодание")

Попробуем записать список в файл

In [None]:
lst = ["Мама", "мыла", "раму"]
with open("file.txt", "w", encoding = 'UTF-8') as f:
    f.write(lst)

Получим ошибку. Для записи списка необходимо использовать writelines

In [None]:
lst = ["Мама ", " мыла ", " раму", "\n"]
with open("file.txt", "w", encoding = 'UTF-8') as f:
    f.writelines(lst)

Ранее мы перезаписывали файл. Для добавление данных файл нужно сменить "w" на "a"

In [None]:
lst = ["Раму ", " мыла ", " мама"]
with open("file.txt", "a", encoding = 'UTF-8') as f:
    f.writelines(lst)

Создадим новый файл и запишем в него несколько строк:

In [None]:
test_text = '''Этот файл
состоит
из

нескольких строчек'''

with open("file_r.txt", "w", encoding = 'UTF-8') as f:
    f.writelines(test_text)

Откроем файл для чтения. Сменим "a" на "r". Для наглядности, выводить будем без использования print

In [None]:
with open("file_r.txt", "r") as f:
    st = f.read()
st

Получили набор символов. Добавим при открытии `encoding = 'UTF-8'`

In [None]:
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    st = f.read()
st

Прочитаем первые 25 символов

In [None]:
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    st = f.read(25)
st

Прочитаем 1 строку

In [None]:
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    st = f.readline()
st

Прочитаем первые две строчки, выведем только вторую

In [None]:
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    st = f.readline()
    st2 = f.readline()
st2

Считаем все строки

In [None]:
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    st = f.readlines()
st

Еще один способ считывание всего файла в одну переменную str

In [None]:
st = ""
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    for s in f:
        st += s
st

Уберем перенос строк c использованием `strip()`

In [None]:
st = ""
with open("file_r.txt", "r", encoding = 'UTF-8') as f:
    for s in f:
        st += s.strip() + " "
st

Следующий пример работы – создадим частотный словарь сказки Аксакова Сергея Тимофеевича – Аленький цветочек.

Считываем текст из файла в одну строковую переменную, удаляя пробельные символы по краям строки.

In [None]:
text = ""
with open("_add_material_lesson_python\\Аксаков С. Т. - Аленький цветочек.txt", "r", encoding = 'UTF-8') as f:
    for s in f:
        text += s.strip() + " "
print(text[:100])

Чтобы создать словарь уникальных слов, сначала нужно получить список этих слов. Но при обычном разделении через split() они у нас будут с лишними символами: запятая, точка, восклицательный знак и т.д.

In [None]:
words = text.split()   

print(words[:100])

Создадим список слов без посторонних списков и приведем все к одному регистру

In [None]:
words_lst = []

for st in words:
    st_temp = st.lower().strip('.,;:!«»?—()"') 
    if st_temp != '':
        words_lst.append(st_temp)


print(words_lst[:100]) 

Напишем функцию для создания словаря слов

In [None]:
def create_dict(lst_words): 
    dic = {}
    for word in lst_words:
        if word not in dic:
            dic[word] = 1
        else:
            dic[word] += 1
    return dic     

Проверим функцию на небольшом тексте

In [None]:
small_text = 'Мама мыла раму – раму мыла мама'.split()
small_dict = create_dict(small_text)
print(small_dict)
small_text

Запустим на данных из нашей сказки

In [None]:
dict_of_words = create_dict(words_lst)
print(len(dict_of_words))
len(words_lst)

С помощью функции выведем первые 10 элементов словаря в том порядке, в котором они расположены в словаре

In [None]:
def print_dict(dictionary):
    i = 0
    for w in dictionary:
        if i == 10:
            break
        print(w, dictionary[w])
        i += 1
        
print_dict(dict_of_words)

Отсортируем небольшой словарь. Для этого воспользуемся функцией sorted для сортировки с key в виде lamda-функции.

Сортировка будет проходить по второму элементу, т.е. по встречаемости слов.

Также применим `reverse = True` для сортировки от наибольшего к наименьшему.

In [None]:
print(sorted(small_dict.items(), key = lambda dict: dict[1], reverse = True))

Следующий результат получается на данных из сказки

In [None]:
sorted_list = sorted(dict_of_words.items(), key = lambda dict: dict[1], reverse = True)

In [None]:
sorted_list

Список стоп-слов

In [None]:
stopwords = ['и', 'в', 'во', 'не', 'что', 'он', 'на', 'я', 'с', 'со', 'как', 'а', 'то', 
             'она', 'так', 'его', 'но', 'да', 'ты', 'к', 'у', 'же', 'вы', 'за', 'бы', 
             'по', 'только', 'ее', 'мне', 'было', 'вот', 'от', 'меня', 'еще', 'нет', 'о', 'из', 
             'ему', 'теперь', 'когда', 'даже', 'ну', 'вдруг', 'ли', 'если', 'уже', 'или', 'ни', 'быть', 
             'был', 'него', 'до', 'вас', 'нибудь', 'опять', 'уж', 'вам', 'ведь', 'там', 'потом', 'себя', 
             'ничего', 'ей', 'может', 'они', 'тут', 'где', 'есть', 'надо', 'ней', 'для', 'мы', 'тебя', 'их', 
             'чем', 'была', 'сам', 'чтоб', 'без', 'будто', 'чего', 'раз', 'тоже', 'себе', 'под', 'будет', 'ж', 
             'тогда', 'кто', 'этот', 'того', 'потому', 'этого', 'какой', 'совсем', 'ним', 'здесь', 'этом', 
             'один', 'почти', 'мой', 'тем', 'чтобы', 'нее', 'сейчас', 'были', 'куда', 'зачем', 'всех', 
             'никогда', 'можно', 'при', 'наконец', 'два', 'об', 'другой', 'хоть', 'после', 'над', 'больше', 
             'тот', 'через', 'эти', 'нас', 'про', 'всего', 'них', 'какая', 'много', 'разве', 'три', 'эту', 
             'моя', 'впрочем', 'хорошо', 'свою', 'этой', 'перед', 'иногда', 'лучше', 'чуть', 'том', 
             'такой', 'им', 'более', 'всегда', 'всю', 'между','это']

Создадим новый список слов сказки без стоп-слов

In [None]:
words_lst_new = []                 # Создаем пустой список
for word in words_lst:             # Последовательно для всех слов из списка
    if word not in stopwords:      # Если слово не находится в списке стоп-слов
        words_lst_new.append(word) # Добавляем его к новому списку
print(words_lst_new[:10])          # Смотрим фрагмент получившегося списка, где видно, что стоп-слова исключены
len(words_lst_new)

Создадим новый словарь без стоп-слов и отсортируем его

In [None]:
dict_without_stopwords = create_dict(words_lst_new)

In [None]:
print_dict(dict_without_stopwords)

In [None]:
sorted_without_stopwords = sorted(dict_without_stopwords.items(), key = lambda x: x[1], reverse = True)
sorted_without_stopwords[:15]

Запишем результат в файл

In [None]:
with open("flower.txt", "w", encoding = 'UTF-8') as f:
    for lst in sorted_without_stopwords:
        f.writelines(lst[0] + ", " + str(lst[1]) + "\n")

In [None]:
with open("flower.csv", "w", encoding = 'UTF-8') as f:
    for lst in sorted_without_stopwords:
        f.writelines(lst[0] + ", " + str(lst[1]) + "\n")

# p.s. В MS Excel потребуется открывать с указанием кодировки, иначе получим абракадабру.

**Работа с csv-файлами**

Часто для хранения табличных данных используют формат csv. В данном файле данные записаны по строкам, а разделение по столбцам происходит с помощью запятых (точек с запятой, пробелами и т.д.), отделяющих значения друг от друга. Данные файлы можно просматривать в редакторе таблиц (например, Excel и Google Sheets).

Создадим и затем откроем csv файл.

In [None]:
test_text = '''Random Number 1, Random Number 2, Random Number 3
27,7,3
23,14,24
28,27,12
16,2,9
24,18,5
21,15,10
2,20,3
11,9,26
13,24,30
21,22,9'''

with open("file_csv.csv", "w", encoding = 'UTF-8') as f:
    f.writelines(test_text)

In [None]:
csv_data = ""
with open("file_csv.csv", "r", encoding = 'UTF-8') as f:
    for s in f:
        csv_data += s
print(csv_data)

Построим график, на основании содержимого существующего файла csv.

In [None]:
csv_data = ""
with open("_add_material_lesson_python\\usd_eur_quotes.csv", "r") as f:
    for line in f:
        csv_data += line
csv_data[:100]

В данном случае, в момент считывания файла лучше сразу разбить данные на элементы списка

In [None]:
usd_eur_list = []
with open("_add_material_lesson_python\\usd_eur_quotes.csv", "r") as f:
    for line in f:
        day_list = line.split(";")
        usd_eur_list.append(day_list)
usd_eur_list

In [None]:
usd_eur_list.pop(0)

Из полученного списка с курсов валют, сохраним данные в три разных списка, первый для даты, второй для курса доллара, третий для курса евро. Но так как данные за 1 января находятся в конце csv-файла, считывать данные будем в обратном порядке 

In [None]:
dates = []
currency_usd = []
currency_eur = []

for row in reversed(usd_eur_list):
    dates.append(row[0])
    currency_usd.append(float(row[1]))
    currency_eur.append(float(row[2]))

Подключим библиотеку `matplotlib` для отрисовки графиков. Более подробнее мы будем ее изучать отдельно

In [None]:
import matplotlib.pyplot as plt


plt.figure(figsize = (10, 5))
plt.plot(dates, currency_usd, label = 'USD')
plt.plot(dates, currency_eur, label = 'EUR')
plt.xlabel('Date')
plt.ylabel('Course')
plt.title('Course of USD and EUR Over Time')
plt.legend()
plt.show()

# Библиотека OpenCV

In [None]:
!pip install opencv-python

In [None]:
!pip list

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

In [None]:
file_name = "_add_material_lesson_python\\huskies.jpeg"
img = cv2.imread(file_name)
plt.imshow(img);

In [None]:
# Для IDLE, matplotlib не нужно
# Откроем картинку с собакой в Windows

cv2.imshow('_add_material_lesson_python\\huskies.jpeg', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Почему после обработки файла OpenCV мы получили такую картинку – всё дело в том, что OpenCV по умолчанию использует формат **BGR**, а не более привычный **RGB**. Так исторически сложилось. Подробнее можно почитать [по ссылке](https://arboook.com/kompyuternoe-zrenie/operatsii-s-tsvetom-v-opencv3-i-python/). Чтобы в нашем случае, получить требуемый результат, используем `cv2.COLOR_BGR2RGB`

In [None]:
img = cv2.cvtColor(cv2.imread(file_name), cv2.COLOR_BGR2RGB)

plt.imshow(img);

In [None]:
b, g, r = cv2.split(img)
plt.imshow(b);

In [None]:
plt.imshow(g);

In [None]:
plt.imshow(r);

Перевод в оттенки серого

In [None]:
gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

In [None]:
plt.imshow(gray, cmap = 'gray');

Изменение размера

In [None]:
size = 50
height = int(img.shape[0] * size / 100)
width = int(img.shape[1] * size / 100)
resized_img = cv2.resize(img, (width, height))
plt.imshow(resized_img);

In [None]:
resized_img = cv2.resize(img, None, fx = 0.5, fy = 0.5)
plt.imshow(resized_img);

Кадрирование

In [None]:
cropped = img[200:1200, 200:1500]  # Координаты: [y0:y1, x0:x1]
plt.imshow(cropped);

In [None]:
cropped[0][0]

Вращение изображений

In [None]:
rotated_img = cv2.rotate(img, cv2.ROTATE_90_CLOCKWISE)
plt.imshow(rotated_img);

In [None]:
angel = 45  # В градусах
(h, w, c) = img.shape
center = (w // 2, h // 2)
M = cv2.getRotationMatrix2D(center, angel, 1.0)
rotated_img = cv2.warpAffine(img, M, (w, h))
plt.imshow(rotated_img);

Контраст и яркость 

In [None]:
lab = cv2.cvtColor(img, cv2.COLOR_RGB2LAB)  # Переведем в формат LAB
l, a , b = cv2.split(lab)  # Разбитие на каналы
# Создание адаптивной гистограммы
clahe = cv2.createCLAHE(clipLimit = 3., tileGridSize = (8,8))
# clipLimit – определяет, насколько контрастнее станет фото
# Изображенеие разбивается на блоки 8 на 8, для каждого блока гистограмма строится отдельно
l2 = clahe.apply(l)  # Применение гистограмм к L-каналу
lab = cv2.merge((l2, a, b))
img2 = cv2.cvtColor(lab, cv2.COLOR_LAB2RGB)
plt.imshow(img2); 

In [None]:
claheFilter = cv2.createCLAHE(clipLimit = 3., tileGridSize = (8,8))
gray2 = claheFilter.apply(gray)
plt.imshow(gray2, cmap = 'gray');

In [None]:
# Линейный метод
alpha = 1.5
beta = 10
# np.clip – ограничение значений в массиве
# Значения за пределами интервала обрезаются по краям интервала
img3 = np.uint8(np.clip((alpha * img + beta), 0, 255))
plt.imshow(img3);

Выделение контуров

In [None]:
edged_grey = cv2.Canny(gray, 10, 250)
plt.imshow(edged_grey, cmap = 'gray');

In [None]:
edged_grey_2 = cv2.Canny(gray2, 10, 250)
plt.imshow(edged_grey_2, cmap = 'gray');

Размытие изображения

In [None]:
blurred_img = cv2.GaussianBlur(img, (11, 11), 0)

plt.imshow(blurred_img);

In [None]:
blurred_img = cv2.blur(img, (11, 11))

plt.imshow(blurred_img);

In [None]:
blurred_img = cv2.bilateralFilter(img, 19, 75, 75)

plt.imshow(blurred_img);

In [None]:
plt.imshow(img);

Загрузим изображение луны на зеленом фоне для дальнейшего добавления на нашу первоначальную картинку

In [None]:
file_name_moon = "_add_material_lesson_python\\moon.jpg"
img_moon = cv2.cvtColor(cv2.imread(file_name_moon), cv2.COLOR_BGR2RGB)

plt.imshow(img_moon);

In [None]:
print(img_moon.shape)

Размер изображения луны меньше, поэтому «создадим» зеленый прямоугольник нужного нам размера

In [None]:
green = np.full((1281,1920,3),(0, 255, 0), np.uint8)
plt.imshow(green);

При помощи среза заменим в зеленом прямоугольники пиксели из изображения луны

In [None]:
green[0:0+img_moon.shape[0], 0:0+img_moon.shape[1]] = img_moon
plt.imshow(green);

Уберем зеленый цвет. Для этого переведем картинку в HSV формат (Hue – тон, Saturation – насыщенность и Value – значение).
Далее создадим маску зеленого цвета в формате HSV, более подробней можно посмотреть [по ссылке](https://stackoverflow.com/questions/47483951/how-can-i-define-a-threshold-value-to-detect-only-green-colour-objects-in-an-ima)

In [None]:
hsv = cv2.cvtColor(green, cv2.COLOR_BGR2HSV)
mask = cv2.inRange(hsv, (36, 25, 25), (70, 255,255))
plt.imshow(mask, cmap = 'gray');

Сделаем копию изначального изображения.

Уберем зеленый фон с использованием нашей маски, все кроме изображения луны красится в черный цвет

In [None]:
masked_image = np.copy(green)
masked_image[mask != 0] = [0, 0, 0]
plt.imshow(masked_image);

Создадим копию первоначального изображения и на копию наложим нашу маску

In [None]:
masked_background_image = np.copy(img)
masked_background_image[mask == 0] = [0, 0, 0]
plt.imshow(masked_background_image);

In [None]:
complete_image = masked_image + masked_background_image  # Cкладываем массивы

plt.imshow(complete_image);

Сохраняем файл, не забыв про `COLOR_BGR2RGB`

In [None]:
cv2.imwrite('_add_material_lesson_python\\huskies_moon.png', cv2.cvtColor(complete_image, cv2.COLOR_RGB2BGR))

## Массивы NumPy
### Базовые операции с массивами

Библиотека `NumPy` (сокращение от *Numeric Python*) часто используется в задачах, связанных с машинным обучением. Производить вычисления с массивами `NumPy` гораздо быстрее и эффективнее чем со списками.

Импортируем библиотеку

In [None]:
import numpy as np

Основным объектом `numpy` является Ndarray – это n-мерный массив (сокращение от *n-dimensional array*), структура данных, которая позволяет хранить набор элементов **одного типа**: либо только целые числа, либо числа с плавающей точкой, либо строки, либо булевы (логические) значения.

In [None]:
a = [1, 2, 3]
b = [4, 5, 6]

In [None]:
a + b

In [None]:
a * 2

In [None]:
# Преобразование списка в массив

a_arr = np.array(a)
b_arr = np.array(b)

In [None]:
a_arr + b_arr

In [None]:
a_arr - b_arr

In [None]:
a_arr * 2

In [None]:
a_arr / b_arr

In [None]:
a_arr ** 2

In [None]:
a_arr / 0

In [None]:
np.array([0, 2, 3, 4])  # Создание массива

Массивы могут быть многомерными (n-мерными)

In [None]:
np.array([[1, 2], 
          [1, 0]])  # Двумерный

In [None]:
x = np.array([[[6, 3],
        [6, 8]],
      [[1, 100],
        [0, 1]]])  # Трехмерный
x

In [None]:
x[0]

In [None]:
x[0][1]

In [None]:
x[0][1][1]

In [None]:
x[1][0][1]

Число элементов в списках внутри массива должно совпадать

In [None]:
lst = [[0, 0, 1],
         [0, 1]]
lst

In [None]:
np.array([[0, 0, 1],
         [0, 1]])

Объединим в массив объекты разных типов

In [None]:
np.array([[5, 8.2],
         [1.2, 1,]])

In [None]:
np.array([[5, 8.2],
         [1.2, 'help']])

Наиболее важные атрибуты объектов ndarray:
1. **`ndarray.ndim`** – число измерений (чаще их называют "оси") массива.
  
2. **`ndarray.shape`** – размеры массива, его форма. Это кортеж натуральных чисел, показывающий длину массива по каждой оси. Для матрицы из n строк и m столбов, shape будет (n,m). Число элементов кортежа shape равно ndim.
3. **`ndarray.size`** – количество элементов массива. Очевидно, равно произведению всех элементов атрибута shape.
4. **`ndarray.dtype`** – объект, описывающий тип элементов массива. Можно определить dtype, используя стандартные типы данных Python. Можно хранить и numpy типы, например: bool, int16, int32, int64, float16, float32, float64, complex64

Двумерный массив:

In [None]:
M = np.array([[2, 5],
              [6, 8],
              [1, 3]])
M

In [None]:
M.dtype

In [None]:
M.ndim  # Число измерений

In [None]:
M.shape  # 3 строки и 2 столбца, т.е. 3 списка по 2 элемента

In [None]:
M.size  # Общее число элементов в массиве, его длина

### Работа с элементами массива

In [None]:
M

In [None]:
M[0]  # Весь первый список в M

In [None]:
M[0][1]  # Второй элемент первого списка в M

Еще один способ

In [None]:
M[0, 1]

Можно выбирать сразу несколько элементов массива. Для этого воспользуемся срезами

In [None]:
M[0:2]  # С элемента с индексом 0, до элемента с индексом 1 включительно

In [None]:
M

In [None]:
M[1:]  # С элемента с индексом 1 до конца

In [None]:
M[:2]  # С начала массива, до элемента с индексом 1 включительно

Кроме того, при выборе элементов можно выставлять шаг. По умолчанию мы выбираем все элементы подряд, шаг равен 1

In [None]:
M[0:3:2]  # С нулевого по третий через 2

In [None]:
M[0::2]

При отрицательном шаге все элементы выведутся в обратном порядке

In [None]:
M

In [None]:
M[::-1]

Рассмотрим другие операции над одномерным массивом

In [None]:
marks = np.array([5, 4, 3, 5, 5, 4, 3, 4])
marks

Минимальный элемент

In [None]:
marks.min()

Максимальный элемент

In [None]:
marks.max()

Среднее значение

In [None]:
marks.mean()

Функция для медианы

In [None]:
np.median(marks)

In [None]:
M

In [None]:
np.median(M)

Индекс с максимального значения

In [None]:
marks

In [None]:
marks.max()

In [None]:
marks.argmax()

Индекс минимального значения

In [None]:
marks.min()

In [None]:
marks.argmin()

Выводится первое значение, которое встретилось

Работа с многомерным массивом, на примере двухмерного

In [None]:
grades = np.array([[3, 5, 5, 4, 3],
                   [3, 3, 4, 3, 3],
                   [5, 5, 5, 4, 5]])

In [None]:
grades.min()

In [None]:
grades.min(axis = 1)  # 1 – значит по строкам

In [None]:
grades.min(axis = 0)  # 0 – по столбцам

In [None]:
grades.max()

In [None]:
grades.argmax()

In [None]:
grades.argmax(axis = 1)

In [None]:
grades.mean(axis = 1)  # Среднее по строкам

In [None]:
grades.mean(axis = 0)  # Среднее по столбцам

### Создание массивов

**Способ 1**

Массив можно получить из готового списка, воспользовавшись функцией `array()`:

In [None]:
np.array([10.5, 45, 2.4])

**Способ 2**

Можно создать массив на основе промежутка, созданного с помощью `arange()` – функции `numpy`, похожей на стандартный `range()`, только более гибкой.

In [None]:
np.arange(2, 9)  # По умолчанию шаг равен 1, как обычный range()

In [None]:
np.arange(2, 9, 3)  # с шагом 3

In [None]:
np.arange(2, 9, 0.5)

Можно создать массив из диапазона значений [start, stop] с заданием количества точек.

In [None]:
m = np.linspace(0, 5, 5)
print(m)

**Способ 3**


Массив из нулей:

In [None]:
Z = np.zeros((3, 3, 3))  # Размеры в виде кортежа
Z

In [None]:
np.zeros((5, 2))

In [None]:
# Создание вектора из нулей

v = np.zeros(4)
print(v)

Массив из единиц

In [None]:
O = np.ones((4, 2))
O

Единичная матрица – таблица из 0 и 1, в которой число строк и столбцов одинаково, и где на главной диагонали стоят 1:

In [None]:
E = np.eye(5)
E

Создадим матрицу 5x5 со значениями строк в диапазоне от 0 до 4

In [None]:
np.arange(5)

In [None]:
m = np.zeros((5, 5))
print(m)
m += np.arange(5)
print(m)

**Способ 4**

Создание массива случайных чисел.

В `numpy` есть аналог модуля `random` – `numpy.random`.

In [None]:
np.random.rand(1,1)

In [None]:
np.random.seed(42)  # seed нужен для того, чтобы при каждом запуске алгоритм выдавал одинаковые значения
np.random.rand(5, 2)

In [None]:
import random

random.seed(42)
for i in range(10):
    #print(random.random())
    print(random.randint(10,100))

In [None]:
# Массив чисел из равномерного (uniform) распределения в диапазоне [0, 1)
# np.random.rand(d0, d1, d3, ...) d0, d1,... – pазмеры возвращаемого массива

np.random.seed(42)
print(np.random.rand(2, 2))
print(np.random.rand(2, 2).shape)

In [None]:
# Массив чисел из стандартного нормального (norm) распределения

np.random.randn(2, 3, 2)
# print(np.random.randn(2, 3, 2).shape)

### Изменение размерности списков

In [None]:
grades

In [None]:
grades.reshape(5, 3)

In [None]:
grades.reshape(5, -1)  # Не задаем явно количество столбцов

In [None]:
grades.reshape(-1, 3)  # Не задаем явно количество строк

In [None]:
grades.reshape(5, 4)

Если нам нужно просто поменять местами строки и столбцы в таблице, то есть списки в массиве, можно воспользоваться транспонированием, которое осуществляется в `NumPy` с помощью метода `.transpose()`:

In [None]:
grades

In [None]:
grades.transpose()

In [None]:
grades

In [None]:
grades.ravel()  # Из многомерного массива создать одномерный

In [None]:
grades.flatten()  # Второй способ, но создает копию

### Проверка условий на массивах

Создадим массив со значениями возраста:

In [None]:
ages = np.array([[15, 23, 32, 45, 52],
               [68, 34, 55, 78, 20],
               [25, 67, 33, 45, 14]])

In [None]:
ages >= 16  # Больше или равно

In [None]:
(ages > 18) & (ages < 60)  # & – одновременное условие

Найдем сумму

In [None]:
((ages > 18) & (ages < 60)).sum()

In [None]:
(ages < 18) | (ages > 60)  # | – или – хотя бы одно условие верно

Создадим условия, чтобы данные элемены вывести

In [None]:
ages

In [None]:
ages >= 16

In [None]:
ages[ages >= 16]

In [None]:
ages[(ages >= 16) & (ages < 60)]

Круглые скобки для каждого условия обязательны

In [None]:
ages[ages >= 16 & ages < 60]

https://numpy.org/doc/stable/reference/generated/numpy.where.html

### Запись списков в файл и чтение файлов со списками

In [None]:
import os
os.getcwd()

In [None]:
np.save("ages.npy", ages)

In [None]:
np.load("ages.npy")

In [None]:
np.savetxt("ages.txt", ages)

In [None]:
np.loadtxt("ages.txt")

Если нет необходимости работать с файлами, можем просто превратить массив в другой объект Python. Например, в обычный список:

In [None]:
ages.tolist()

In [None]:
list(ages)  # Такое преобразование не верно

In [None]:
ages

Преобразование в строку

In [None]:
np.array2string(ages)