## Прикладные комбинаторные задачи

### В жизни часто возникает необходимость повседневного решения несложных комбинаторных задач. Реализация таковых каждый раз вручную - может быть долгим и кропотливым занятием. Модуль itertools предоставляет ряд инструментов, призванных упростить их осуществление.

<img src="../../MFK_Project/sem/itertools.PNG">

In [2]:
"""
1.accumulate():

Создает итератор, который возвращает накопленную сумму или накопленный результат других бинарных функций, 
которые указаны в параметре func. 
"""

import itertools

l = [1,2,3,4,5,6,7]
for i,val in enumerate(itertools.accumulate(l)):
    print(f'{i}: {val}')

0: 1
1: 3
2: 6
3: 10
4: 15
5: 21
6: 28


In [3]:
"""
Возможно ли использовать другую функцию?
"""
import operator
from functools import reduce

for i,val in enumerate(itertools.accumulate(l, operator.mul)):
    print(f'{i}: {val}')

0: 1
1: 2
2: 6
3: 24
4: 120
5: 720
6: 5040


In [7]:
"""
reduce позволяет свести последовательность исполняемых действий к последнему из них
"""
reduce(operator.mul,l)

5040

In [4]:
"""
Определим декоратор
"""
import time
def timing_val(func):
    def wrapper(*arg, **kw):
        print(func.__name__, 'running')
        t1 = time.time()
        res = func(*arg, **kw)
        t2 = time.time()
        print(f'It took {t2-t1} seconds to run this code')
        
        return res
    return wrapper

"""
Реализуем факториал без цикла!
"""
@timing_val
def factorial(n):
    *_, last = itertools.accumulate(range(1,n+1), operator.mul)
    return last

@timing_val
def factorial_r(n):
    return reduce(operator.mul,range(1,n+1))

@timing_val
def factorial_c(n):
    x = 1
    for x_ in range(2, n+1):
        x*=x_
    return x

In [5]:
factorial(50000)
factorial_r(50000)
factorial_c(50000);

factorial running
It took 1.8272757530212402 seconds to run this code
factorial_r running
It took 0.48283886909484863 seconds to run this code
factorial_c running
It took 0.4659423828125 seconds to run this code


In [6]:
"""
Еще одно удобство reduce
"""
import pandas as pd
df1 = pd.DataFrame({'A' : list(range(100)), 'I' : list(range(100))})
df2 = pd.DataFrame({'B' : list(range(100)), 'I' : list(range(100))})
df3 = pd.DataFrame({'C' : list(range(100)), 'I' : list(range(100))})

reduce(lambda left, right: pd.merge(left, right, on = "I"), [df1, df2, df3])

Unnamed: 0,A,I,B,C
0,0,0,0,0
1,1,1,1,1
2,2,2,2,2
3,3,3,3,3
4,4,4,4,4
...,...,...,...,...
95,95,95,95,95
96,96,96,96,96
97,97,97,97,97
98,98,98,98,98


In [7]:
"""
2. chain():

Создает итератор, который возвращает элемент из итерируемого объекта до тех пор, пока он не закончится, 
а потом переходит к следующему.
Он будет рассматривать последовательности, идущие друг за другом, как одну
"""

l = [['first', 'second'], ['third'], ['fouth', 'fifth', 'sixth']]
list(itertools.chain(*l))

['first', 'second', 'third', 'fouth', 'fifth', 'sixth']

In [8]:
"""
3. dropwhile()

Создает итератор, который выбрасывает элементы из итерируемого объекта до тех пор, 
пока предикат (predicate) имеет значение True, а затем возвращает каждый элемент. 
Итератор не вернет выходных данных, пока предикат не получит значение False.
"""
list(itertools.dropwhile(lambda x:x>4,[5,6,7,8,9,1,2,3]))

[1, 2, 3]

In [9]:
it = range(10, 1, -1)
it_1 = itertools.dropwhile(lambda x:x>4, it)

In [10]:
for i in it_1:
    print(i)

4
3
2


In [11]:
"""
4. takewhile()

Создает итератор, который возвращает элементы из итерируемого объекта до тех пор, пока предикат имеет значение True.
"""
list(itertools.takewhile(lambda x:x>4,[5,6,7,8,9,1,2,3]))

[5, 6, 7, 8, 9]

In [12]:
"""
5. Groupby
На вход методу мы подаем итеррируемую последовательность и некоторую функцию keyfunc, определяющую группировку объектов (то есть их похожесть)

Метод groupby возвращает нам итеррируемый объект, в котором данные сгруппированы по группам, выделенным при помощи keyfunc

Пример: разделим четные и нечетные числа
"""
from itertools import groupby
keyfunc = lambda x: 'нечетные' if int(x%2) else 'четные'
sequence = [i for i in range(10)]

sequence = sorted(sequence, key=keyfunc)

for group, nums in groupby(sequence, keyfunc):
    print(group, list(nums))

нечетные [1, 3, 5, 7, 9]
четные [0, 2, 4, 6, 8]


In [13]:
"""
Или в целом равные по модулю n (равенство чисел а и b по модулю n означает, что при делении на n a и b дают одинаковые остатки. 
Например, все нечетные числа равны по модулю 2, числа 6 и 11 равны по модулю 5, так как оба дают остаток 1, и так далее)
"""
N = 4

keyfunc = lambda x: int(x%N)
sequence = [i for i in range(16)]

sequence = sorted(sequence, key=keyfunc)

for group, nums in groupby(sequence, keyfunc):
    print('остаток от деления на ', N, ': ', group, ' -> ', list(nums))

остаток от деления на  4 :  0  ->  [0, 4, 8, 12]
остаток от деления на  4 :  1  ->  [1, 5, 9, 13]
остаток от деления на  4 :  2  ->  [2, 6, 10, 14]
остаток от деления на  4 :  3  ->  [3, 7, 11, 15]


## Задача:
### Пусть мы имеем таблицу, в которой храним информацию о статусе населенных пунктов, которые мы хотим сгруппировать

In [14]:
table = [['Париж', 'город', 'Франция'],
         ['Абкот', 'деревня', 'Англия'],
         ['Алексеевка', 'поселок городского типа', 'Россия'],
         ['Мехико', 'город', 'Мексика'],
         ['Финистер', 'деревня', 'Франция'],
         ['Москва', 'город', 'Россия'],
         ['Бешенковичи', 'поселок городского типа', 'Белоруссия']]

table

[['Париж', 'город', 'Франция'],
 ['Абкот', 'деревня', 'Англия'],
 ['Алексеевка', 'поселок городского типа', 'Россия'],
 ['Мехико', 'город', 'Мексика'],
 ['Финистер', 'деревня', 'Франция'],
 ['Москва', 'город', 'Россия'],
 ['Бешенковичи', 'поселок городского типа', 'Белоруссия']]

In [15]:
keyfunc = lambda x:x[2]

table = sorted(table,key = keyfunc)

for TYPE, group in groupby(table, keyfunc):
    print(TYPE)
    print('------------------')
    for g in group:
        print(g[0],',',g[1])
    print('------------------')
    print('\n')

Англия
------------------
Абкот , деревня
------------------


Белоруссия
------------------
Бешенковичи , поселок городского типа
------------------


Мексика
------------------
Мехико , город
------------------


Россия
------------------
Алексеевка , поселок городского типа
Москва , город
------------------


Франция
------------------
Париж , город
Финистер , деревня
------------------




## Задача:
### Дана таблица пищевой ценности разных продуктов. Нужно отсортировать их по калорийности в три группы: диетические, средней калорийности и повышенной калорийности, используя функцию **groupby**.

Считаем, что 1г белка содержит 4 ккал, 1г жиров содержит 9 ккал, 1г углеводов также содержит 4 ккал.

Категорию продукта определяем следующим образом: 
Если продукт входит в 25% наиболее калорийных продуктов, то считаем его калорийным. Если в 25% наименее калорийных - диетическим. Иначе - считаем его продуктом средней калорийности.


In [16]:
import pandas as pd
pd.options.display.max_rows = 999
data = pd.read_csv('../../MFK_Project/Calories.csv')

meal = data['Продукт']
protein = data['Белки']
fat = data['Жиры']
carbonhydrates = data['Углеводы']

FileNotFoundError: [Errno 2] No such file or directory: '../../MFK_Project/Calories.csv'

In [27]:
data

Unnamed: 0,Продукт,Белки,Жиры,Углеводы
0,Брынза из коровьего молока,17.9,20.1,0.0
1,Йогурт нат. 1.5% жирности,5.0,1.5,3.5
2,Кефир нежирный,3.0,0.1,3.8
3,Кефир жирный,2.8,3.2,4.1
4,Молоко,2.8,3.2,4.7
5,Молоко ацидофильное,2.8,3.2,10.8
6,Молоко сухое цельное,25.6,25.0,39.4
7,Молоко сгущеное,7.0,7.9,9.5
8,Молоко сгущеное с сахаром,7.2,8.5,56.0
9,Простокваша,2.8,3.2,4.1


Создадим функцию, позволяющую нам вычислить калорийность продукта, а также двумерный массив вида


[
(...     ,  ... , ... ,   ...   ,   ...  )

**(продукт , белки, жиры, углеводы, калории)**

(...     ,  ... , ... ,   ...   ,   ...  )
]


In [28]:
data['calories'] = 4*data['Белки'] + 9*data['Жиры'] + 4*data['Углеводы']
data

Unnamed: 0,Продукт,Белки,Жиры,Углеводы,calories
0,Брынза из коровьего молока,17.9,20.1,0.0,252.5
1,Йогурт нат. 1.5% жирности,5.0,1.5,3.5,47.5
2,Кефир нежирный,3.0,0.1,3.8,28.1
3,Кефир жирный,2.8,3.2,4.1,56.4
4,Молоко,2.8,3.2,4.7,58.8
5,Молоко ацидофильное,2.8,3.2,10.8,83.2
6,Молоко сухое цельное,25.6,25.0,39.4,485.0
7,Молоко сгущеное,7.0,7.9,9.5,137.1
8,Молоко сгущеное с сахаром,7.2,8.5,56.0,329.3
9,Простокваша,2.8,3.2,4.1,56.4


In [29]:
table = data.values.tolist()
sortfunk = lambda x: x[-1]

sorted_table = sorted(table, key = sortfunk)
sorted_table

[['Сыроежи свежие', 1.7, 0.3, 1.4, 15.1],
 ['Баклажаны', 0.6, 0.1, 5.5, 25.3],
 ['Белые свежие', 3.2, 0.7, 1.6, 25.5],
 ['Кабачки', 0.6, 0.3, 5.7, 27.9],
 ['Кефир нежирный', 3.0, 0.1, 3.8, 28.1],
 ['Подосиновики свежие', 3.3, 0.5, 3.4, 31.299999999999997],
 ['Подберезовики свежие', 2.3, 0.9, 3.7, 32.099999999999994],
 ['Брюква', 1.2, 0.1, 8.1, 38.1],
 ['Йогурт нат. 1.5% жирности', 5.0, 1.5, 3.5, 47.5],
 ['Кефир жирный', 2.8, 3.2, 4.1, 56.4],
 ['Простокваша', 2.8, 3.2, 4.1, 56.4],
 ['Бобы', 6.0, 0.1, 8.3, 58.1],
 ['Молоко', 2.8, 3.2, 4.7, 58.8],
 ['Говяжьи Почки', 12.5, 1.8, 0.0, 66.2],
 ['Горошек зеленый', 5.0, 0.2, 13.3, 75.0],
 ['Баранье Сердце', 13.5, 2.5, 0.0, 76.5],
 ['Бараньи Почки', 13.6, 2.5, 0.0, 76.9],
 ['Почки свинные', 13.0, 3.1, 0.0, 79.9],
 ['Ряженка', 3.0, 6.0, 4.1, 82.4],
 ['Молоко ацидофильное', 2.8, 3.2, 10.8, 83.2],
 ['Творог нежирный', 18.0, 0.6, 1.5, 83.4],
 ['Говяжье Сердце', 15.0, 3.0, 0.0, 87.0],
 ['Сердце свинное', 15.1, 3.2, 0.0, 89.2],
 ['Телятина', 19.7, 1.2

In [30]:
bound1 = int(0.25*len(sorted_table))
bound2 = int(0.75*len(sorted_table))

max_calories1 = sorted_table[bound1][-1]
max_calories2 = sorted_table[bound2][-1]

print(
f'''
Продукты с калорийностью менее {max_calories1} считаем диестическими, 
от {max_calories1} до {max_calories2} - средней калорийности, 
а более {max_calories2} - высококалорийными
'''
)


Продукты с калорийностью менее 89.6 считаем диестическими, 
от 89.6 до 346.90000000000003 - средней калорийности, 
а более 346.90000000000003 - высококалорийными



In [32]:
keyfunc_1 = lambda x: 'среднекалорийный' if x[-1] < max_calories2 else 'высококалорийный'
keyfunc = lambda x: 'диетический' if x[-1] < max_calories1 else keyfunc_1(x)

grouped_meals = groupby(sorted_table, key = keyfunc)

In [33]:
for group, meal_info in grouped_meals:
    print('---------------')
    for meal in meal_info:
        print(f'Продукт {meal[0]} - {group}, так как его калорийность {meal[-1]}')
    
    print('---------------')

---------------
Продукт Сыроежи свежие - диетический, так как его калорийность 15.1
Продукт Баклажаны - диетический, так как его калорийность 25.3
Продукт Белые свежие - диетический, так как его калорийность 25.5
Продукт Кабачки - диетический, так как его калорийность 27.9
Продукт Кефир нежирный - диетический, так как его калорийность 28.1
Продукт Подосиновики свежие - диетический, так как его калорийность 31.299999999999997
Продукт Подберезовики свежие - диетический, так как его калорийность 32.099999999999994
Продукт Брюква - диетический, так как его калорийность 38.1
Продукт Йогурт нат. 1.5% жирности - диетический, так как его калорийность 47.5
Продукт Кефир жирный - диетический, так как его калорийность 56.4
Продукт Простокваша - диетический, так как его калорийность 56.4
Продукт Бобы - диетический, так как его калорийность 58.1
Продукт Молоко - диетический, так как его калорийность 58.8
Продукт Говяжьи Почки - диетический, так как его калорийность 66.2
Продукт Горошек зеленый - ди

## Комбинаторика
1. product()

Декартово произведение итерируемых объектов, подаваемых на вход.

In [17]:
len(list(itertools.product('ABCD',[1,2,3,4])))

16

2. permutations()

Возвращает последовательные r перестановок элементов в итерируемом объекте.

In [18]:
len(list(itertools.permutations("ABDC")))

24

3. combinations()

Возвращает подпоследовательности длины r из элементов итерируемого объекта, подаваемого на вход. '

In [19]:
print (list(itertools.combinations("ABC",2)))
print (list(itertools.combinations_with_replacement("ABC",2)))

[('A', 'B'), ('A', 'C'), ('B', 'C')]
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]
