# Декомпозиция. Встроенные функции

 Сравним код сверху и код снизу: какой более понятный? 


In [None]:
for student in students_list:
  sum_score = 0
  for score in student:
    sum_score += score
  avg_score = sum_score/len(student)
  exams_passed = []
  for score in student:
    if score > min_avg_score:
      exams_passed.append(score)
  if avg_score > min_score:
    if len(exams_passed) > min_exams_passed:
      print('Успешно окончил учебу')
  else:
    print('Не окончил учебу')


In [None]:
for student in students_list:
  avg_score = find_average_score(student)
  num_exams_passed = find_exams_passed(student)
  result = is_ready_for_graduate(avg_score, num_exams_passed)
  print(result)

Смотря на код внизу, сразу становится понятно, что для каждого студента считается его средний балл и количество сданных экзаменов. На основе этих данных решение о его успешном или неуспешном окончании университета кладётся в переменную `result` и выводится на экран. Это понятно из трёх говорящих строчек кода, которые вызывают три функции: `find_average_score`, `find_exams_passed`, `is_ready_for_graduate`.

В то время как код, который находится сверху, нужно сначала прочитать и осознать, прежде чем понять, что там происходит.

Чтобы код был более читабельным, при его написании используют *декомпозицию*. Умение декомпозировать – это одно из основных требований для специалиста, который пишет код.

***Декомпозиция*** – это разбиение сложной задачи на более мелкие части, которые более управляемы и понятны.

Например, приготовление торта – это большая сложная задача, её можно разбить на подзадачи: приготовить коржи, испечь коржи, приготовить крем, намазать коржи кремом.

Вспомним нашу функцию по поиску среднего: это тоже сложная проблема, её можно декомпозировать на 3 части: найти сумму всех элементов, найти количество элементов, поделить результат первой части на вторую. 

Давайте её тоже декомпозируем: сначала определим нахождение суммы элементов в списке через отдельную функцию `get_sum` c входным параметром `user_list`. На выходе она будет возвращать `overall_sum`. 

In [1]:
def get_sum(user_list):
    overall_sum = 0 
    for elem in user_list:
        overall_sum += elem
        
    return overall_sum

А в функции `get_average_v2` вызовем эту функцию:

In [3]:
def get_average_v2(user_list):
    overall_sum = get_sum(user_list)

    return overall_sum/len(user_list)

Проверим, что все работает верно:

In [4]:
user_1 = [1000, 1000, 1200, 1200, 1200]
get_average_v2(user_1)

1120.0

Мы декомпозировали функцию, и она стала меньше и намного понятнее, а результат при этом не изменился. 

Более того, вероятность совершить ошибку при декомпозиции снижается. Вы сначала проверяете результат работы маленьких функций, например, подсчет суммы, запускаете её на разных списках, проверяете, что она работает верно. 

In [5]:
get_sum([1,2])

3

In [6]:
get_sum([1,0])

1

После этого уже проверяете всю функцию целиком. 


In [7]:
user_2 = [1000, 1000, 1000, 1000, 1000]
get_average_v2(user_2)

1000.0

Настало время рассказать про еще одно удобство работы со списками в Python. До этого мы всегда писали функцию по нахождению суммы элементов списка самостоятельно. Так было задумано, чтобы научиться манипулировать списками с помощью циклов. Теперь, когда вы уже достаточно прокачались, можете пользоваться заранее встроенной в Python функцией `sum()`. Подайте ей на вход список, и на выходе вы получите сумму его элементов:

In [8]:
sum(user_1)

5600

Также можно найти максимум и минимум в списках.

In [9]:
max(user_1)

1200

In [10]:
min(user_1)

1000

Заменим функцию `get_sum` на предопределенную функцию `sum`. Это и будет финальным решением для `get_average`.

In [11]:
def get_average_v2(user_list):
    overall_sum = sum(user_list)

    return overall_sum/len(user_list)

В Python много различных встроенных функций. Они были заранее написаны разработчиками языка, чтобы облегчить нам жизнь и сократить время написания кода. Встроенные функции  обычно реализуют наиболее часто используемые действия, такие как нахождение максимума, суммы или длины списка. Перечень всех таких функций можно найти в документации: https://docs.python.org/3/library/functions.html

Рассмотрим ещё одну практическую задачу и декомпозируем её. Вам нужно посчитать метрику NPS (Net Promoter Score – индекс потребительской лояльности) по сервису в трёх регионах и по всем в регионам в целом. Данные по пользовательским оценкам представлены в виде списка списков. 


In [18]:
scores_list = [
                    [10, 10, 9, 10, 1, 8, 5],
                    [9, 9, 8, 5],
                    [10, 10, 10, 4, 5]
]

Пользователи оценивают готовность рекомендовать сервис по шкале от 1 до 10:
- 9 и 10 – это самые лояльные пользователи (positive), 
- 1-6 – критики (negative), 
- 7-8 – нейтральные пользователи (neutral). 

Для расчёта используется формула NPS = % (positive) - % (negative)

Давайте декомпозируем задачу. Первая функция, которую мы реализуем, это формула расчета NPS на списке значений. Объявим `nps()` с одним входным параметром: список из оценок. Также объявим две переменные для подсчета количества позитивных и негативных оценок. Для каждого элемента из списка будем проверять,является ли он позитивным или негативным. Если встретим позитивную оценку, будем увеличивать `positive_count`, если негативную – `negative_count`. После завершения цикла рассчитаем NPS по формуле и вернём значение переменной с помощью `return`:



In [13]:
def nps(scores):
    positive_count = 0
    negative_count = 0
    
    for score in scores:
        if score >= 9:
            positive_count += 1
        elif score <= 6:
            negative_count += 1
            
    nps = (positive_count - negative_count)/len(scores)
    nps = nps*100
    
    return nps

Проверим результат работы функции:

In [14]:
scores_1 = [10, 10, 10, 6, 5]
nps(scores_1)

20.0

Данная функция считает NPS на одном списке. Теперь нам нужно реализовать функцию, которая сможет посчитать NPS на списке из списков. Для этого заведем функцию `total_nps()`, на вход она принимает список списков. Внутри себя она должна список из списков преобразовать в один большой список и на нем посчитать `nps()`.


Преобразовать список из списков в один большой список – это тоже отдельное действие, которое реализует операцию над списками – вынесем его в отдельную функцию, назовем `extend_list()`. На вход она принимает список списков, а её результат запишем в `result_list`. Результатом функции `total_nps` будет являться `nps()` над списком `result_list`.




In [16]:
def total_nps(scores_list):
    result_list = extend_list(scores_list)
    return nps(result_list)

Осталось объявить функцию `extend_list()`. 

In [15]:
def extend_list(scores_list):
    result = []
    for scores in scores_list:
        result += scores
    
    return result

Теперь рассчитаем `nps()` на каждом из регионов и на всех регионах целиком.


In [19]:
for scores in scores_list:
    print(nps(scores))
    
print(total_nps(scores_list))

28.57142857142857
25.0
20.0
25.0


Получили достаточно нормальные значения NPS. В целом, значение около 30 процентов считается удовлетворительным. Все нормально, но есть куда развиваться.

