# Вложенные функции. Область видимости переменных

In [1]:
# Объявляем внешнюю функцию outer()
def outer():
    # Печатаем информацию о вызове внешней функции
    print('Called outer function')
    # Объявляем внутреннюю функцию inner()
    def inner():
        # Печатаем информацию о вызове внутренней функции
        print('Called inner function')
    # Вызываем внутреннюю функцию inner()
    inner()

In [2]:
# Вызываем внешнюю функцию outer()    
outer()    

Called outer function
Called inner function


***

In [3]:
# Задаём функцию для вычисления корня степени n из числа value
def root(value, n=2):
    # Вычисляем корень степени n из числа value
    result = value ** (1/n)
    # Возвращаем результат из функции
    return result

In [4]:
res = root(81, 4)
print(res)

3.0


In [5]:
# Задаём внешнюю функцию
def print_root(value, n=2):
    # Задаём внутреннюю функцию
    # Она будет являться вспомогательной
    def root(value, n=2):
        result = value ** (1/n)
        return result
    # Получаем результат из внутренней функции
    res = root(value, n)
    # Печатаем результат и не возвращаем его
    print(f'Root of power {n} from {value} equals {res}')

In [6]:
print_root(81, 4)

Root of power 4 from 81 equals 3.0


***

### Задание

На первом этапе напишите функцию get_count_unique_symbols(), которая:

принимает на вход строку s,

приводит её к нижнему регистру,

убирает из неё все пробелы,

возвращает количество уникальных символов в строке.

In [7]:
def get_count_unique_symbols(s):
  new_s=s.lower().replace(' ', '')
  def unique(new_s):
    new_list=list()
    for i in new_s:
      if i not in new_list:
        new_list.append(i)
    return len(new_list)
  return unique(new_s)

In [8]:
get_count_unique_symbols('Это простая строка')

9

***

### Задание

На втором этапе напишите функцию get_min_string(), которая:

принимает на вход две строки s1 и s2,

возвращает ту, в которой количество уникальных символов меньше.

Чтобы определить количество уникальных символов, воспользуйтесь функцией get_count_unique_symbols(), которую вы написали в предыдущем задании. Поместите ее определение и вызов внутрь функции get_min_string().

Функция get_min_string() должна возвращать:

строку s1, если количество уникальных символов в ней меньше, чем в s2;

строку s2, если количество уникальных символов в ней меньше, чем в s1;

кортеж из строк s1 и s2 при равенстве количества уникальных символов.

In [9]:
def get_min_string(s1, s2):
  new_s1=s1.lower().replace(' ', '')
  new_s2=s2.lower().replace(' ', '')
  def get_count_unique_symbols(new_s, new_list=None):
    if new_list==None:
      new_list=[]
    for i in new_s:
      if i not in new_list:
        new_list.append(i)
    return len(new_list)
  if get_count_unique_symbols(new_s1) < get_count_unique_symbols(new_s2):
    return s1
  elif get_count_unique_symbols(new_s1) == get_count_unique_symbols(new_s2):
    return tuple([s1, s2])
  else:
    return s2

print(get_min_string(s1='Это простая строка', s2='This is a simple string'))

Это простая строка


***

## РАЗРЕШЕНИЕ ПЕРЕМЕННЫХ. ОБЛАСТИ ВИДИМОСТИ

In [10]:
# Объявляем внешнюю функцию для регистрации сотрудников
def register_employee(name, surname):
    # Объявляем функцию для промежуточных вычислений
    def create_full_name():
        # Функция использует внешние переменные name и surname
        sep = ' ' # Разделитель между именем и фамилией
        result = name + sep + surname # Вычисляем полное имя
        return result
    # Вызываем внутреннюю функцию
    full_name = create_full_name()
    # Выводим результат на экран, используя внешнюю переменную company_name
    print('Employee {} is registered with the company {}'.format(full_name, company_name))
    
company_name = 'TheBlindMice' # Название компании
register_employee('John','Doe') # Вызов функции

Employee John Doe is registered with the company TheBlindMice


***

### Задание

Мы пишем приложение для рисования графических фигур. Пока мы можем рисовать только окружности и эллипсы.

Чтобы закрашивать фигуры, которые мы рисуем, необходимо рассчитывать площадь этих фигур. Для расчета площади воспользуемся простейшими формулами.

Площадь круга вычисляется по формуле:

S = πr², где r — радиус окружности.

Площадь эллипса вычисляется по формуле:

S = πab, где a и b — длины полуосей эллипса.

При разработке приложения мы принимаем, что π = 3,1416.

Обратите внимание! Это число является константой — его значение не меняется на всём протяжении выполнения программы.

Напишите функции calculate_area_circle() и calculate_area_ellipse().

Первая функция должна принимать один аргумент r — радиус окружности, вторая функция должна принимать два аргумента a и b — длины полуосей эллипса.

Каждая из функций должна возвращать площадь соответствующей фигуры, округленную до третьего знака после запятой.

Обе функции должны использовать внутри себя локальные переменные с одним и тем же именем area (площади фигур) и глобальную переменную pi, объявленную вне этих функций.

In [11]:
def calculate_area_circle(r):
  area=round(pi*r**2, 3)
  return area

def calculate_area_ellipse(a, b):
  area=round(pi*a*b, 3)
  return area

pi = 3.1416
print(calculate_area_circle(r=5))

78.54


***

## ИЗМЕНЕНИЕ ЗНАЧЕНИЙ ГЛОБАЛЬНЫХ ПЕРЕМЕННЫХ. ОБЪЯВЛЕНИЕ GLOBAL

In [12]:
# Создадим глобальную переменную, изначально она равна 0
global_count = 0
 
# Создадим функцию, которая прибавляет 1 к переменной global_count
def add_item():
    # Здесь мог бы быть код для добавления товара в базу данных
    
    # Укажем, что global_count является глобальной переменной
    global global_count 
    # Увеличим общее количество товаров на 1
    global_count = global_count + 1
 
# Вызовем функцию add_item()
add_item()
# Напечатаем значение переменной global_count
print(global_count)

1


***

### Задание

Вам необходимо написать программу, которая будет вычислять сумму, оставшуюся на счёте у пользователя банковской карты. Посмотрите на код ниже и внесите в него исправление так, чтобы он работал верно.

Не добавляйте аргументы в функцию cash, помимо less_money.

In [13]:
def cash(less_money):
    global money
    money -= less_money
    return money

money = 200000
print(cash(1000))

199000


***

### Задание

Вы написали программу, которая позволяет конвертировать рубли в выбранную валюту. При написании программы вы использовали global, но позже узнали, что не стоит так часто его использовать. Перепишите следующий код, не используя global.

Перепишите функцию convert() так, чтобы словарь с курсами валют и количество денег на счету были её первым и вторым аргументом, а валюта, в которую необходимо произвести конвертацию, — третьим.

In [15]:
# Словарь с курсами валют (по отношению к рублю)
currencies = {'USD': 74, 'EUR': 88, 'GBP': 98 , 'CHF': 82}
# Общее количество денег на счету, которое нужно конвертировать
money = 100000
# Функция для конвертации валюты, аргумент - наименование валюты
def convert(currencies, Money, currency):
    # Объявляем, что money - глобальная переменная
    Money
    # Производим конвертацию - делим количество денег на счету на соответствующий курс
    Money = Money / currencies[currency]
    return Money

convert_money = convert(currencies, money, 'EUR')  
print(convert_money) 

1136.3636363636363


***

# ИЗМЕНЕНИЕ ЗНАЧЕНИЙ НЕЛОКАЛЬНЫХ ПЕРЕМЕННЫХ. ОБЪЯВЛЕНИЕ NONLOCAL

In [16]:
# Внешняя функция
def outer():
    # Создадим переменную, относящуюся к внешней функции
    enclosing_count = 0
    # Внутренняя функция
    def inner():
        # Укажем, что используем нелокальную переменную enclosing_count
        nonlocal enclosing_count
        # Прибавим 1 к enclosing_count
        enclosing_count = enclosing_count + 1
        # Напечатаем значение enclosing_count
        print(enclosing_count)
    # Запустим внутреннюю функцию из внешней
    inner()
 
# Запустим внешнюю функцию
outer()

1


***

In [17]:
# Внешняя функция для вычисления итоговой стоимости
def calculate_cost(cost, sale):
    # Внутренняя функция для предобработки аргумента sale
    def preprocessing_sale():
        # Объявляем, что используем нелокальную переменную sale
        nonlocal sale
        # Если sale — строка
        if type(sale) is str:
            # Удаляем из строки '%', приводим к float и делим на 100
            sale = float(sale.replace('%', '')) / 100
        # Если sale — целое число
        elif type(sale) is int:
            # Делим его на 100 
            sale = sale / 100
    # Запускаем предобработку, прежде чем вычислить стоимость
    preprocessing_sale()
    # Считаем итоговую стоимость и возвращаем её
    # (стоимость — стоимость * скидка)     
    return cost - cost * sale


print(calculate_cost(1330, '15%'))
print(calculate_cost(1330, 15))
print(calculate_cost(1330, 0.15))

1130.5
1130.5
1130.5


***

### Задание

Мы реализуем функцию count_occurrences(), у которой есть два параметра s — строка и symbols — список из символов. Функция вычисляет, сколько раз символ symbol встречается в строке s.

Перед подсчётом количества символов строка s проходит предобработку: из неё удаляются пробелы, а символы приводятся к нижнему регистру.

Сейчас при попытке вызвать функцию: count_occurrences('This is simple string', symbol='t') вызывается исключение UnboundLocalError.

Исправьте код таким образом, чтобы он отрабатывал без ошибки.

In [18]:
def count_occurrences(s, symbol):
    # Внутренняя функция для предобработки строки s
    def preprocessing_s():
        # Удаляем пробелы из строки
        nonlocal s
        s = s.replace(' ', '')
        # Приводим строку к нижнему регистру
        s = s.lower()
    # Вызываем функцию для предобработки аргумента s
    preprocessing_s()
    # Считаем количество символов symbol в строке s и возвращаем результат
    return s.count(symbol)

count_occurrences('This is simple string', symbol='t')

2

***

# ИЗМЕНЕНИЕ ЗНАЧЕНИЙ ВСТРОЕННЫХ ПЕРЕМЕННЫХ

### Задание

Нам необходимо проанализировать, какая из рекламных кампаний оказалась наиболее успешной. Данные хранятся в словаре advertising_campaigns, где ключ — это рекламный канал, а значение — список, в котором задано суммарное количество вновь нажавших на кнопку рекламного баннера в 2021 и 2022 годах.

Для каждого рекламного канала нужно получить максимальное количество откликнувшихся за 2021 и 2022 годы.

Для этого мы создали пустой словарь advertising_campaigns_max и написали цикл for, в котором:

проходимся по ключам исходного словаря;

вычисляем максимумы в списках, соответствующих этим ключам;

добавляем эти значения в новый словарь.

Выясните, в чём дело, и исправьте код. В результате выполнения кода у вас должен получиться словарь advertising_campaigns_max следующего вида:



In [20]:
advertising_campaigns = {'ютуб': [212, 248], 'вк': [514, 342], 'радио': [339, 125]}

# Создаём новый пустой словарь  
advertising_campaigns_max = {}  
# Создаём цикл по ключам исходного словаря  
for key in advertising_campaigns:  
    # Вычисляем максимум в списке, лежащем по ключу key  
    #print(advertising_campaigns[key])
    maxx = max(advertising_campaigns[key])  
    # Добавляем максимум в новый словарь  
    advertising_campaigns_max[key] = maxx
    
advertising_campaigns_max

{'ютуб': 248, 'вк': 514, 'радио': 339}

***

### Задание

Условие задачи

Мы создаём некоторое приложение, предусматривающее регистрацию пользователей.

Пока мы реализуем небольшой функционал для регистрации. Для этого нам необходимо написать функцию register(surname, name, date, middle_name, registry). 

Она будет иметь следующие аргументы:

surname — фамилия пользователя;
name —  имя пользователя;
date —  дата рождения пользователя в виде строки формата "DD.MM.YYYY" (например, "13.01.2001");
middle_name — отчество пользователя;
registry — список, в который необходимо добавить полученные аргументы в виде кортежа. Порядок следующий: фамилия, имя, отчество, день, месяц, год рождения.
Регистрацию будем имитировать добавлением данных о пользователях в список в виде кортежа. Функция должна возвращать список, в который добавила запись.

In [22]:
# Функция для регистрации пользователей
def register(surname, name, date, middle_name=None, registry=None):
    # Вспомогательная функция для предобработки даты
    def preprocessing_date(date):
        # Разделяем строку по символу точки
        day, month, year = date.split('.')
        # Преобразуем все данные к типу данных int
        day, month, year = int(day), int(month), int(year)
        return day, month, year
    # Если список не был передан — создаём пустой список
    if registry is None:
        registry = list()
    # Разделяем дату на составляющие
    day, month, year = preprocessing_date(date)
    # Добавляем данные в список
    registry.append((surname, name, middle_name, day, month, year))
    return registry

In [23]:
# Вызываем функцию для регистрации
# Если список registry не передаётся, то он создаётся внутри функции
reg = register('Petrova', 'Maria', '13.03.2003', 'Ivanovna')
reg = register('Ivanov', 'Sergej', '24.09.1995', registry=reg)
reg = register('Smith', 'John', '13.02.2003', registry=reg)
print(reg)

[('Petrova', 'Maria', 'Ivanovna', 13, 3, 2003), ('Ivanov', 'Sergej', None, 24, 9, 1995), ('Smith', 'John', None, 13, 2, 2003)]


In [24]:
# Функция для проверки корректности даты
def check_date(day, month, year):
    # Проверяем день, месяц и год на целочисленность
    if (type(day) is not int) or (type(month) is not int) or (type(year) is not int):
        return False
    # Проверяем год на заданный диапазон
    if (year <= 1900) or (year >= 2022):
        return False
    # Проверяем месяц на заданный диапазон     
    if (month < 1) or (month > 12):
        return False
    # Проверяем день на заданный диапазон  
    if (day < 1) or (day > 31): 
        return False
    # Проверяем апрель, июнь, сентябрь и ноябрь на количество дней
    if (month in [4,6,9,11]) and (day > 30):
        return False
    # Проверяем количество дней в феврале
    if month == 2 and day > 28:
        return False
    return True

print(check_date(18, 9, 1999))
print(check_date(13, 13, 2021))

True
False


***

### Задание

Напишите функцию is_leap(year), которая принимает на вход год и возвращает True, если год високосный, иначе — False.

Как определить, является ли год високосным:

годы, номера которых кратны 400 - високосные;

остальные годы, кратные 100 - невисокосные (то есть 1700, 1800, 1900, 2100, 2200, 2300 годы — невисокосные);

остальные годы, которых кратны 4 - високосные (например, 1964, 2004, 2008);

оставшиеся годы - не високосные (например, 1789, 2013, 2014).

In [25]:
def is_leap(year):
  if year%400!=0 and year%100==0:
    return False
  if year%400==0 or year%4==0:
    return True
  else:
    return False

print(is_leap(2000))
# True
print(is_leap(1900))
# False

True
False


***

### Задание

Нам остался финальный штрих — добавить проверку даты на корректность в функцию для регистрации!

Модифицируйте функцию register() так, чтобы она выбрасывала исключение ValueError("Invalid Date!"), если введённая пользователем дата является некорректной. Для этого вам пригодится функция check_date() из предыдущего задания — вы можете добавить её в функцию register() или сделать независимой, на ваш вкус.

Главное — не забудьте добавить её объявление при отправке кода на проверку.

In [26]:
# Введите свое решение ниже
def register(surname, name, date, middle_name=None, registry=None):
    # Вспомогательная функция для предобработки даты
    def preprocessing_date(date):
        # Разделяем строку по символу точки
        day, month, year = date.split('.')
        # Преобразуем все данные к типу данных int
        day, month, year = int(day), int(month), int(year)
        return day, month, year
    # Если список не был передан — создаём пустой список
    if registry is None:
        registry = list()
    # Разделяем дату на составляющие
    day, month, year = preprocessing_date(date)
    def check_date(day, month, year):
        def is_leap(year):
          global key
          key=0
          if year%400==0 or year%4==0:
            key=1
            return True
        
        # Проверяем день, месяц и год на целочисленность
        if (type(day) is not int) or (type(month) is not int) or (type(year) is not int):
            return False
        # Проверяем год на заданный диапазон
        if (year <= 1900) or (year >= 2022):
            return False
        # Проверяем месяц на заданный диапазон     
        if (month < 1) or (month > 12):
            return False
        # Проверяем день на заданный диапазон  
        if (day < 1) or (day > 31): 
            return False
        # Проверяем апрель, июнь, сентябрь и ноябрь на количество дней
        if (month in [4,6,9,11]) and (day > 30):
            return False
        is_leap(year)
        # Проверяем количество дней в феврале
        if month == 2 and day > 28 and key==0:
            return False
        if month == 2 and day > 28 and key==1:
            return True
        
        return True
    # Добавляем данные в список
    if check_date(day, month, year)==False:
      raise ValueError("Invalid Date!")

    registry.append((surname, name, middle_name, day, month, year))
    return registry

In [27]:
reg = register('Petrova', 'Maria', '13.03.2003', 'Ivanovna')
reg = register('Ivanov', 'Sergej', '24.09.1995', registry=reg)
reg = register('Smith', 'John', '13.02.2003', registry=reg)
print(reg)

[('Petrova', 'Maria', 'Ivanovna', 13, 3, 2003), ('Ivanov', 'Sergej', None, 24, 9, 1995), ('Smith', 'John', None, 13, 2, 2003)]


***

### Задание

Условие задачи

Мы разрабатываем приложение для графических дизайнеров. Идея приложения состоит в следующем: пользователь выбирает тип фигуры и ставит на экране точки, а приложение по этим точкам рисует фигуру, а также выводит её площадь и периметр. 

Рисовать с помощью Python мы пока не умеем, однако мы можем реализовать другую часть приложения — расчёт параметров фигуры.

Одной из основополагающих геометрических фигур, используемых в дизайне, является треугольник. Каждый треугольник задаётся тремя точками, каждая из которых имеет свои координаты  и  на плоскости: ,  и .

Предположим, что в нашем приложении есть возможность отрисовки треугольника по введённым пользователем координатам трёх точек. Каждая из трёх точек представляет собой кортеж из двух чисел — координата точки по оси  и по оси  соответственно. 

Необходимо реализовать функцию triangle(), которая будет принимать на вход координаты трёх точек p1, p2 и p3 и возвращать длины сторон треугольника, его периметр и площадь в виде словаря.

In [28]:
def triangle(p1, p2, p3):
    # Функция для вычисления сторон треугольника
    # По умолчанию параметры функции берутся из объемлющей области видимости
    def sides(p1, p2, p3):
        # Распаковываем кортежи для удобства, “;” означает новую строку кода
        x1, y1 = p1; x2, y2 = p2; x3, y3 = p3
        # Вычисляем стороны по теореме Пифагора
        a = ((x2 - x1) ** 2 + (y2 - y1)** 2) ** 0.5
        b = ((x3 - x1) ** 2 + (y3 - y1)** 2) ** 0.5
        c = ((x3 - x2) ** 2 + (y3 - y2)** 2) ** 0.5
        return a, b, c

    # Функция для вычисления периметра треугольника
    def calculate_perimeter_triangle(a, b, c):
        # Периметр — сумма всех сторон треугольника
        perimeter = a + b + c
        return perimeter

    # Функция для вычисления площади треугольника
    def calculate_area_triangle(a, b, c):
        # Вычисляем полупериметр 
        # Значение perimeter берётся из объемлющей области видимости
        p = perimeter / 2
        # Вычисляем площадь по формуле Герона
        area = (p * (p - a) * (p - b) * (p - c)) ** 0.5
        return area
    a, b, c = sides(p1, p2, p3)
    perimeter = calculate_perimeter_triangle(a, b, c)
    area = calculate_area_triangle(a, b, c)
    result = {'a': a, 'b': b, 'c': c, 'perimeter': perimeter, 'area': area}
    return result

In [29]:
print(triangle(p1=(2, 2), p2=(4, 1.25), p3=(1, 4.5)))
## {'a': 2.1360009363293826, 'b': 2.692582403567252, 'c': 4.422951503238533, 'perimeter': 9.251534843135168, 'area': 2.1250000000000027}
print(triangle(p1=(1, 1), p2=(1, 4), p3=(5, 1)))
## {'a': 3.0, 'b': 4.0, 'c': 5.0, 'perimeter': 12.0, 'area': 6.0}

{'a': 2.1360009363293826, 'b': 2.692582403567252, 'c': 4.422951503238533, 'perimeter': 9.251534843135168, 'area': 2.1250000000000027}
{'a': 3.0, 'b': 4.0, 'c': 5.0, 'perimeter': 12.0, 'area': 6.0}


***

### Задание

Вы возможно удивитесь, но три точки на плоскости не всегда образуют треугольник.

Например, при координатах точек p1, p2, p2 = (2.5, 2), (4, 1), (1, 3) треугольник составить не получится, потому что все эти точки будут лежать на одной прямой:

Из математики известно, что треугольник существует только тогда, когда сумма любых двух его сторон больше третьей.

То есть треугольник будет существовать, если одновременно будут выполняться следующие условия:

a + b > c;
a + c > b;
b + c > a.
В противном случае составить треугольник не получится.

Реализуйте функцию check_exist_triangle(a, b, c), которая возвращает True, если треугольник с длинами сторон a, b и c существует, и False — в обратном случае.

In [31]:
def check_exist_triangle(a, b, c):
  if a+b>c and a+c>b and c+b>a:
    return True
  else:
    return False

print(check_exist_triangle(a=3, b=4, c=5))

True


***

### Задание 

Остался финальный штрих.

Модифицируйте функцию triangle() так, чтобы эта функция выбрасывала исключение ValueError("Треугольник не существует"), если треугольник не существует.

Для проверки существования треугольника воспользуйтесь функцией check_exist_triangle() из предыдущего задания. Добавьте её объявление и вызов внутрь функции triangle().

In [32]:
def triangle(p1, p2, p3):
    # Функция для вычисления сторон треугольника
    # По умолчанию параметры функции берутся из объемлющей области видимости
    def sides(p1, p2, p3):
        # Распаковываем кортежи для удобства, “;” означает новую строку кода
        x1, y1 = p1; x2, y2 = p2; x3, y3 = p3
        # Вычисляем стороны по теореме Пифагора
        a = ((x2 - x1) ** 2 + (y2 - y1)** 2) ** 0.5
        b = ((x3 - x1) ** 2 + (y3 - y1)** 2) ** 0.5
        c = ((x3 - x2) ** 2 + (y3 - y2)** 2) ** 0.5
        return a, b, c
    def check_exist_triangle(a, b, c):
      if a+b>c and a+c>b and c+b>a:
        pass
      else:
        raise ValueError("Треугольник не существует")
        return False
    # Функция для вычисления периметра треугольника
    def calculate_perimeter_triangle(a, b, c):
        # Периметр — сумма всех сторон треугольника
        perimeter = a + b + c
        return perimeter

    # Функция для вычисления площади треугольника
    def calculate_area_triangle(a, b, c):
        # Вычисляем полупериметр 
        # Значение perimeter берётся из объемлющей области видимости
        p = perimeter / 2
        # Вычисляем площадь по формуле Герона
        area = (p * (p - a) * (p - b) * (p - c)) ** 0.5
        return area
    a, b, c = sides(p1, p2, p3)
    check_exist_triangle(a, b, c)
    perimeter = calculate_perimeter_triangle(a, b, c)
    area = calculate_area_triangle(a, b, c)
    result = {'a': a, 'b': b, 'c': c, 'perimeter': perimeter, 'area': area}
    return result


In [33]:
print(triangle(p1=(2, 2), p2=(4, 1.25), p3=(1, 4.5)))
## {'a': 2.1360009363293826, 'b': 2.692582403567252, 'c': 4.422951503238533, 'perimeter': 9.251534843135168, 'area': 2.1250000000000027}
print(triangle(p1=(1, 1), p2=(1, 4), p3=(5, 1)))
## {'a': 3.0, 'b': 4.0, 'c': 5.0, 'perimeter': 12.0, 'area': 6.0}
print(triangle(p1=(2.5, 2), p2=(4, 1), p3=(1, 3)))
## ValueError: Треугольник не существует


{'a': 2.1360009363293826, 'b': 2.692582403567252, 'c': 4.422951503238533, 'perimeter': 9.251534843135168, 'area': 2.1250000000000027}
{'a': 3.0, 'b': 4.0, 'c': 5.0, 'perimeter': 12.0, 'area': 6.0}


ValueError: Треугольник не существует

***

### Задание

Создавая окружность в нашем графическом приложении, пользователь сначала ставит точку P₁ — центр окружности. Затем тянет мышкой эту точку, и там, где растяжение остановится, будет создана точка P₂.

Каждая точка имеет координаты x и y, которые задаются в виде кортежей: P₁=(x₁, y₁), P₂=(x₂, y₂).

Чтобы вычислить все параметры окружности, нам необходимо знать её радиус.

Напишите функцию radius(), которая принимает на вход две точки (их координаты заданы кортежами) и возвращает радиус окружности.

Для вычисления радиуса воспользуйтесь теоремой Пифагора

In [34]:
def radius(p1, p2):
    # Функция для вычисления сторон треугольника
        # Распаковываем кортежи для удобства, “;” означает новую строку кода
      x1, y1 = p1; x2, y2 = p2;
      # Вычисляем стороны по теореме Пифагора
      r = ((x2 - x1) ** 2 + (y2 - y1)** 2) ** 0.5
      return r
  
print(radius(p1=(3, 2.5), p2=(4, 4.5)))

2.23606797749979


***

### Задание

Теперь, когда у нас есть функция для расчёта радиуса по двум точкам, нам не составит труда вычислить площадь и периметр окружности. Для удобства все вычисления можно обернуть в одну объемлющую функцию.

Напишите функцию circle(), которая принимает на вход две точки, чьи координаты записаны в виде кортежей.

Внутри себя функция содержит три вложенные функции:

radius() — функция для вычисления радиуса, которую мы писали в прошлом задании.
calculate_circumference() — функция для вычисления длины окружности (по сути периметра) по формуле:
L=2πr
Радиус окружности сделайте параметром функции.
calculate_area_circle() — функция для вычисления площади окружности по формуле:
S=πr²
Радиус окружности сделайте параметром функции.
Значение числа π задаётся глобальной переменной pi в основном блоке программы.

Функция circle() должна возвращать словарь с ключами 'radius', 'circumference' и 'area'. Значениями должны быть рассчитанные радиус, длина окружности и её площадь соответственно, округленные до третьего знака после запятой. Радиус нужно округлять, когда все остальные значения посчитаны.

In [35]:
def circle(p1, p2):
  def radius(p1, p2):
      # Функция для вычисления сторон треугольника
          # Распаковываем кортежи для удобства, “;” означает новую строку кода
    x1, y1 = p1; x2, y2 = p2
        # Вычисляем стороны по теореме Пифагора
    r = ((x2 - x1) ** 2 + (y2 - y1)** 2) ** 0.5
    return r
  def calculate_circumference(r):
    L=2*pi*r
    return L
  def calculate_area_circle(r):
    area=pi*(r**2)
    return area
  r=radius(p1, p2)
  p=calculate_circumference(r)
  s=calculate_area_circle(r)
  result = {'radius': round(r, 3), 'circumference': round(p, 3), 'area': round(s, 3)}
  return result


pi = 3.1416
print(circle(p1=(3, 2.5), p2=(4, 4.5)))

{'radius': 2.236, 'circumference': 14.05, 'area': 15.708}


***

# Рекурсия


In [36]:
def sum_lst(lst):
    # Выводим текущее значение lst
    print(lst)
    # Задаём условие выхода из рекурсии
    if len(lst) == 0:
        return 0
    # Во всех других случаях возвращаем
    # сумму первого элемента списка 
    # и результат суммирования оставшихся
    return lst[0] + sum_lst(lst[1:])


my_lst = [10, 21, 24, 12]
print(sum_lst(my_lst))

[10, 21, 24, 12]
[21, 24, 12]
[24, 12]
[12]
[]
67


***

### Задание

Напишите рекурсивную функцию multiply_lst(lst), которая перемножает элементы заданного списка lst между собой. Если в функцию передаётся пустой список, она должна возвращать 1.

In [37]:
def multiply_lst(lst):
  if not lst:
    return 1
  return lst[0]* multiply_lst(lst[1:])

print(multiply_lst([1, 5, 2, 1.5]))

15.0


***

### Задание
Напишите рекурсивную функцию inv_sum_list(). На вход ей подаётся список из чисел, а она вычисляет сумму чисел, являющихся обратными к своим элементам. Обратным числу x называется число 1/x. Например, обратным числу 2 является 1/2 = 0.5.

Например, если на вход программы подается список [10, 4, 8], то функция должна вернуть сумму 0.1 + 0.25 + 0.125 = 0.475.

Если на вход функции передаётся пустой список, она должна возвращать 0.

In [38]:
def inv_sum_list(lst):
  if not lst:
    return 0
  return 1/lst[0]+ inv_sum_list(lst[1:])

print(inv_sum_list([10, 4, 8]))

0.475


***

# Факториал через рекурсию

In [39]:
def factorial(n):
    # Задаём условия выхода из рекурсии:
    if n==0: return 1
    if n==1: return 1
    # Во всех других случаях возвращаем
    # произведение текущего числа n и функции от n-1
    return factorial(n-1) * n

print(factorial(0))
print(factorial(3))
print(factorial(5))

1
6
120


***

### Задание

Напишем функцию combination(n, k), которая позволит нам автоматически вычислять значение сочетания по формуле, приведённой выше, для любых n и k.

При расчёте воспользуйтесь рекурсивной функцией factorial(), которую мы написали выше. Можете сделать её внутренней для функции combination() или независимой функцией, на ваш вкус. Главное, добавьте в свой код объявление функции factorial().

In [40]:
def combination(n, k):
  def factorial(x):
    # Задаём условия выхода из рекурсии:
    if x==0: return 1
    if x==1: return 1
    # Во всех других случаях возвращаем
    # произведение текущего числа n и функции от n-1
    return factorial(x-1)*x
  C=factorial(n)/(factorial(n-k)*factorial(k))
  return C

print(combination(n=10, k=5))

252.0


***

# ЦИКЛ VS РЕКУРСИЯ

In [41]:
from time import time
import sys
# Увеличим глубину рекурсии
sys.setrecursionlimit(1000000000)
# Объявляем рекурсивную функцию для расчёта факториала
def factorial(n):
    if n==0: return 1
    if n==1: return 1
    return factorial(n-1) * n
# Засекаем время до начала выполнения цикла
a = time()
for i in range(100):
    factorial(10000)
# Засекаем время после выполнения цикла
b = time()
# Считаем разницу: вычисляем время, потраченное на выполнение
print(b-a)

2.642653465270996


In [42]:
from time import time
# Объявляем функцию для расчёта факториала через цикл
def factorial_for(n):
    # Для расчёта произведения первый член — единица, а не ноль!
    result = 1
    # Перемножаем числа от 1 до n
    for i in range(1, n+1):
        result *= i
    return result
# Засекаем время до начала выполнения цикла
a = time()
for i in range(100):
    factorial_for(10000)
# Засекаем время после выполнения цикла
b = time()
# Считаем разницу: вычисляем время, потраченное на выполнение
print(b-a)

2.532613754272461


***

### Задание

Числа Фибоначчи — пример последовательности, которую можно получить рекурсивно. Каждое число из последовательности является суммой двух предыдущих.

Последовательность Фибоначчи активно применяется в комбинаторике и аналитике. О значении и вариантах применения чисел Фибоначчи вы можете прочитать в блоге Skillfactory.

Можно записать рекурсивное выражение для расчёта n-ого числа из последовательности Фибоначчи:

Напишите рекурсивную функцию fib(n), которая считает n-ое число Фибоначчи. Алгоритм работы функции:

Если n=1 или n=2, вернуть 1, так как первый и второй элементы ряда Фибоначчи равны единице.
Во всех остальных случаях вызвать эту же функцию с аргументами n-1 и n-2 и сложить результаты двух вызовов.

In [43]:
def fib(n):
  if n==1: return 1
  if n==2: return 1
  return fib(n-1)+fib(n-2)

print(fib(6))

8


***

### Задание

Напишите рекурсивную функцию power(val, n), которая возводит число в заданную целую натуральную степень (или в степень 0).

Использовать встроенный оператор ** для возведения в степень запрещено. Пользуйтесь только умножением *. Например, 2 ** 4 = (((2 * 2) * 2) * 2) = 16.

В качестве первого аргумента функция принимает число, в качестве второго — желаемую степень.

In [44]:
def power(val, n):
  if n == 0: return 1
  #if n == 1: return 1
  return val*power(val, n-1)

print(power(-5, 4))

625


***

### Задание

Условие задачи

Необходимо написать функцию add_brackets(), которая принимает на вход строку, содержащую только английские буквы (большие и маленькие). Функция должна добавлять в строку открывающиеся и закрывающиеся скобки по следующему образцу: "example" → "e(x(a(m)p)l)e".

До середины добавляются открывающие скобки, после середины – закрывающие. Если длина строки равна чётному числу, в скобках, расположенных в середине, должно быть два символа: "card" → "c(ar)d" (но не "c(a()r)d").

In [45]:
# Функция для создания строки со скобками
def add_brackets(s):
    # Проверяем условие остановки: строка состоит из одного или двух символов
    if len(s) == 1 or len(s) == 2:
        # Возвращаем эти символы
        return s
    # В противном случае:
    # «Отщипываем» от строки первый и последний символы,
    # добавляем к ним скобки, а также результат вызова функции, в которую
    # передаем строку без первого и последнего символов
    return s[0] + '(' + add_brackets(s[1:-1]) + ')' + s[-1]

In [46]:
print(add_brackets('example'))
print(add_brackets('carr'))
print(add_brackets('hello'))


e(x(a(m)p)l)e
c(ar)r
h(e(l)l)o


***

### Задание

Дана строка, содержащая только английские буквы (большие и маленькие).

Напишите рекурсивную функцию add_asterisk(). Она должна принимать в качестве аргумента строку и добавлять символ * (звёздочка) между буквами. Перед первой и после последней буквами символ * добавлять не нужно.

In [47]:
def add_asterisk(s):
  if len(s)==1:
    return s
  if len(s)==2:
    return s[0]+'*'+s[-1]
  return s[0]+'*'+add_asterisk(s[1:-1])+'*'+s[-1]

print(add_asterisk('LItBeoFLcSGBOFQxMHoIuDDWcqcVgkcRoAeocXO'))

L*I*t*B*e*o*F*L*c*S*G*B*O*F*Q*x*M*H*o*I*u*D*D*W*c*q*c*V*g*k*c*R*o*A*e*o*c*X*O


***

### Задание

В машинном обучении мы часто работаем с многомерными структурами, например двумерными матрицами.

Могут быть и гораздо более сложные структуры, например трёхмерные или четырёхмерные массивы, но пока остановимся на двумерных.

В глубоком обучении (Deep Learning) есть специальная операция под названием flatten. Эта операция является важной частью архитектуры свёрточных нейронных сетей: она выпрямляет любой многомерный массив в одномерный.

Например, в результате выполнения операции flatten для вложенного списка matrix мы должны получить список следующего вида:

Напишем функцию flatten(), которая принимает на вход список, состоящий из других списков, и возвращает обычный список, в котором присутствуют все элементы из вложенных списков.

In [48]:
# Функция для выпрямления списка
def flatten(lst):
    # Создаём новый пустой список
    result = []
    # Создаём цикл по элементам списка
    for elem in lst:
        # Если элемент списка является списком,
        if type(elem) is list:
            # Применяем к нему функцию выпрямления и добавляем элементы к результату
            result += flatten(elem)
        else: # Если элемент не является списоком,
            # Добавляем элемент в новый список
            result.append(elem)
    return result

In [49]:
matrix = [
    [1, 1, 0],
    [4, 2, 1],
    [0, 2, 1]
]
print(flatten(matrix))

[1, 1, 0, 4, 2, 1, 0, 2, 1]


***

### Задание

Другая важная операция в нейронных сетях — это суммирование элементов исходной матрицы.

Напишите функцию sum_list(). Она принимает на вход вложенный список, элементами которого являются числа, и возвращает сумму всех элементов.

In [50]:
def sum_list(lst):
    total = 0
    for elem in lst:
        if type(elem) is list:
            total += sum_list(elem)
        else:
            total += elem
    return total

matrix = [
    [1, 1, [1, 2, 3], 0],
    [4, 2, 1, [10, 52, 2]],
    [0, 2, 1]
]
print(sum_list(matrix))

82


***

### Задание

Условие задачи

Мы администрируем некоторый форум. Каждое сообщение на форуме имеет свой идентификатор. Сообщения на форуме могут иметь древовидную структуру, то есть существует корневое сообщение (нулевой уровень), на это сообщение могут быть ответы (первый уровень), а на каждый из этих ответов могут быть ещё ответы (второй уровень). Такая структура может быть бесконечной. То есть каждое сообщение может иметь:

родителя — сообщение, на которое мы ответили на форуме своим сообщением;

потомков — сообщения, которые являются ответом на наше сообщение.

Дан словарь forum_messages, ключами которого являются идентификаторы (id) сообщений на форуме. Значения в свою очередь также являются словарями. У этих словарей есть два ключа:

parrent_link — родительская ссылка: может быть целым числом, если сообщение является ответом на другое сообщение, или None, если сообщение является корневым на форуме;

child_link — список из идентификаторов дочерних сообщений, если таковые имеются, и пустой список, если таковых нет.

Необходимо реализовать функцию delete_message(), которая принимает на вход словарь со структурой форума и идентификатор сообщения. Функция должна удалять идентификатор сообщения из словаря, а также идентификаторы дочерних сообщений.

In [52]:
forum_messages = {
    1: {'parrent_link': None, 'child_link': [3, 4]},
    2: {'parrent_link': None, 'child_link': [5]},
    3: {'parrent_link': 1, 'child_link': [6]},
    4: {'parrent_link': 1, 'child_link': []},
    5: {'parrent_link': 2, 'child_link': []},
    6: {'parrent_link': 3, 'child_link': []}
}

# Функция для удаления сообщения на форуме и всех его потомков
def delete_message(messages, msg_id):
    # Удаляем из словаря сообщение с идентификатором msg_id
    # Метод pop() возвращает значение, лежащее по удаляемому ключу
    result = messages.pop(msg_id)
    # Получаем идентификатор родителя
    parrent_link = result['parrent_link']
    # Получаем список идентификаторов потомков
    child_link = result['child_link']
    # Если у сообщения был родитель и он ещё не был удален
    # Эта запись будет аналогична parrent_link is not None
    if parrent_link and parrent_link in messages:
        # Обращаемся к словарю messages по ключу родителя
        # Удаляем потомка из списка потомков
        messages[parrent_link]['child_link'].remove(msg_id)
    # Если у сообщения были потомки
    # Эта запись будет аналогична child_link == [<значение_1>, <значение_2>, ...]
    if child_link:
        # В цикле проходимся по всем потомкам 
        for child_id in child_link:
            # И повторяем те же самые действия для каждого из них
            # (рекурсивно вызываем функцию delete_message)
            delete_message(messages, msg_id=child_id)
    return messages

print(delete_message(forum_messages, msg_id=5))

{1: {'parrent_link': None, 'child_link': [3, 4]}, 2: {'parrent_link': None, 'child_link': []}, 3: {'parrent_link': 1, 'child_link': [6]}, 4: {'parrent_link': 1, 'child_link': []}, 6: {'parrent_link': 3, 'child_link': []}}


***

# Встроенная функция map()

### Задание

Условие задачи

В задачах обработки естественного языка (Natural Language Processing, NLP) иногда имеет значение не только само слово, но и его длина.

Перед нами стоит следующая микрозадача: вычислить длину каждого слова из набора данных, чтобы в дальнейшем использовать эту информацию для анализа теста.

Пусть задан список words_list со словами, длину которых нам надо посчитать.

words_list = ["We're", 'in', 'a', 'small', 'village', 'near', 'Chicago', 'My', "cousin's", 'getting', 'married.']

В результате работы программы мы должны получить новый список следующего вида:

[5, 2, 1, 5, 7, 4, 7, 2, 8, 7, 8]

In [62]:
words_list = ["We're", 'in', 'a', 'small', 'village', 'near', 'Chicago', 'My', "cousin's", 'getting', 'married.']

# Создаём пустой список, куда будем заносить результаты
lengths_list = []
# Создаём цикл по элементам списка names
for word in words_list:
    # Вычисляем длину текущего слова
    length = len(word)
    # Добавляем вычисленную длину слова в список
    lengths_list.append(length)
# Смотрим, что получилось
print(lengths_list)


[5, 2, 1, 5, 7, 4, 7, 2, 8, 7, 8]


In [63]:
# Применяем функцию len к каждому элементу списка
# Для этого передаём функцию len и список words_list в функцию map
# Результат преобразуем в список
lengths_list = list(map(len, words_list))
# Посмотрим, что получилось
print(lengths_list)

[5, 2, 1, 5, 7, 4, 7, 2, 8, 7, 8]


***

### Задание

Условие задачи

У нас есть данные о расходах компании за 2022 год, разделённые на кварталы (от первого до четвёртого). Данные представлены в виде списка, состоящего из кортежей, элементами которых являются три числа — расходы в первый, второй и третий месяцы квартала. Необходимо рассчитать максимальные расходы в каждом из кварталов.

expenses = [(101, 203, 167), (214, 351, 752), (255, 2537), (852, 362, 366)]

In [64]:
expenses = [(101, 203, 167), (214, 351, 752), (255, 2537), (852, 362, 366)]

# Применяем функцию max к каждому элементу списка
# Для этого передаём функцию max и список expenses в функцию map
# Результат преобразуем в список
expenses_max = list(map(max, expenses))
# Смотрим, что получилось
print(expenses_max)


[203, 752, 2537, 852]


***

### Задание
Дан список чисел old_list, где все числа имеют строковый тип данных. Чтобы работать с ними, вам нужно превратить их в целое число. Напишите код, который позволит это сделать. Новое значение списка присвойте переменной new_list. В решении используйте функцию map().

In [65]:
old_list = ['1', '2', '3', '4', '5', '6', '7']
new_list=list(map(int, old_list))

new_list

[1, 2, 3, 4, 5, 6, 7]

***

### Задание

Вам передали информацию о расходах за шесть месяцев. Данные содержатся в списке expenses. В этом списке расходы по каждому месяцу хранятся в отдельных списках. С помощью map создайте новый список expenses_sum, содержащий суммы расходов по каждому месяцу.

In [66]:
expenses = [[2356, 4537, 8678], [7395, 1298, 6500, 4791],[6341, 3408], [1105, 8374, 5914], [1024, 7333], [3500, 2008, 9375, 6144]]  

expenses_sum=list(map(sum, expenses))

expenses_sum

[15571, 19984, 9749, 15393, 8357, 21027]

***

# map() И ПОЛЬЗОВАТЕЛЬСКИЕ ФУНКЦИИ

### Задание

Условие задачи

Представим, что у нас есть список зарплат сотрудников salaries.

salaries = [1500, 2200, 3500, 1200]

Необходимо посчитать, какой налог необходимо удержать с каждой зарплаты. Допустим: у нас используется прогрессивная система налогообложения, то есть чем выше зарплата, тем выше налог. Налог на доход меньше 1000 составляет 5 %, от 1000 до 2000 — 10 %, а если доход превышает 2000, то налог составляет 15 %.

In [67]:
salaries = [1500, 2200, 3500, 1200]

# Создаём пустой список, куда будем добавлять размеры налогов
taxes = []
# В цикле перебираем все зарплаты из списка
for salary in salaries:
    if salary < 1000: # Если зарплата < 1000
        # Налог — 5 % от зарплаты
        taxes.append(salary * 0.05)
    elif salary < 2000: # Если зарплата < 2000
        # Налог — 10 % от зарплаты
        taxes.append(salary * 0.1)
    else:
        # Налог — 15 % от зарплаты
        taxes.append(salary * 0.15)
# Выводим результат
print(taxes) 

[150.0, 330.0, 525.0, 120.0]


In [68]:
def calculate_tax(salary):
    if salary < 1000: # Если зарплата < 1000
        # Налог — 5 % от зарплаты
        return salary * 0.05
    elif salary < 2000: # Если зарплата < 2000
        # Налог — 10 % от зарплаты
        return salary * 0.1
    else:
        # Налог — 15 % от зарплаты
        return salary * 0.15
    
print(calculate_tax(1500))

150.0


In [69]:
taxes = list(map(calculate_tax, salaries))
# Выведем, что получилось
print(taxes)

[150.0, 330.0, 525.0, 120.0]


***

### Задание

Условие задачи

Допустим, у нас есть словарь quotes_dict, ключами которого являются названия произведений, а значениями — цитаты из этих произведений.

В рамках решения задачи анализа естественного языка нам необходимо преобразовать тексты, а именно:

привести к нижнему регистру;
удалить знаки препинания (точки и запятые);
разделить на отдельные слова.

In [70]:
quotes_dict = {
    'Преступление и наказание': 'А знаешь ли... что низкие потолки и тесные комнаты душу и ум теснят.', 
    'Война и мир': 'И нет величия там, где нет простоты, добра и правды.', 
    'Анна Каренина': 'Если искать совершенства, то никогда не будешь доволен.', 
    'Детство': 'Правил у нас много, а правды нет.', 
    'Колесо времени': 'Ничто так на соединяет людей, как улыбка.'
}

# Функция для преобразования одного элемента списка кортежей
def preprocessing_quoutes(name_quotes_tuple):
    # Разделяем составляющие кортежа на отдельные переменные
    name, text = name_quotes_tuple
    # Приводим цитату к нижнему регистру
    text = text.lower()
    # Заменяем точки и запятые на пустые строки
    text = text.replace('.', '')
    text = text.replace(',', '')
    # Разделяем цитату на слова по пробелу
    words = text.split(' ')
    # Возвращаем кортеж из названия произведения и текста
    return (name, words)

# Применяем функцию processing_quoutes к списку кортежей
# Результат преобразовываем в словарь
processed_quotes_dict = dict(map(preprocessing_quoutes, quotes_dict.items()))

print(processed_quotes_dict)

{'Преступление и наказание': ['а', 'знаешь', 'ли', 'что', 'низкие', 'потолки', 'и', 'тесные', 'комнаты', 'душу', 'и', 'ум', 'теснят'], 'Война и мир': ['и', 'нет', 'величия', 'там', 'где', 'нет', 'простоты', 'добра', 'и', 'правды'], 'Анна Каренина': ['если', 'искать', 'совершенства', 'то', 'никогда', 'не', 'будешь', 'доволен'], 'Детство': ['правил', 'у', 'нас', 'много', 'а', 'правды', 'нет'], 'Колесо времени': ['ничто', 'так', 'на', 'соединяет', 'людей', 'как', 'улыбка']}


***

### Задание

У вас есть словарь prices, содержащий цены на литровые упаковки соков в интернет-магазине. Вам необходимо применить к этим ценам скидку 5 % и округлить полученное значение до двух знаков после запятой. Новый словарь положите в переменную new_prices. В решении используйте функцию map().

In [71]:
def n(tpl):
  key, value=tpl
  return (key, round(value*0.95, 3))

prices = {'яблоко': 99, 'апельсин': 99, 'вишня': 147, 'персик': 145, 'грейпфрут': 139}  
new_prices = dict(map(n, prices.items()))

new_prices

{'яблоко': 94.05,
 'апельсин': 94.05,
 'вишня': 139.65,
 'персик': 137.75,
 'грейпфрут': 132.05}

***

# MAP + LAMBDA = ♥

In [72]:
# Список чисел
number_list = [11, 12, 13, 14, 15, 16]
# Создаём lambda-функцию, которая возводит число в куб, и применяем её к списку
cube_number_list = list(map(lambda x: x**3, number_list))
# Выводим результирующий список
print(cube_number_list)

[1331, 1728, 2197, 2744, 3375, 4096]


***

In [74]:
# Список строк, которые надо развернуть
str_list = ['шалаш', 'казак', 'палиндром', 'рвал дед лавр']
# Создаем lambda-функцию, которая переворачивает одну строку, и применяем её к списку
reverse_str_list = list(map(lambda x: x[::-1], str_list))
# Выводим результирующий список
print(reverse_str_list)

['шалаш', 'казак', 'морднилап', 'рвал дед лавр']


***

### Задание

Условие задачи

Есть список кортежей. Один кортеж соответствует одному объекту (в Data Science его часто называется наблюдением) и состоит из трёх элементов (признаков объекта):

имени человека; его роста (в метрах); веса (в килограммах).
Необходимо создать список, состоящий из индексов массы тела для каждого человека. Индекс массы тела достаточно будет округлить до одного знака после запятой.

In [75]:
data = [('Amanda', 1.61, 51), ('Patricia', 1.65, 61), ('Marcos', 1.91, 101)]
map_func = lambda x: (*x, round(x[2]/(x[1]**2), 1))
updated_data = list(map(map_func, data))
# Выводим результат
print(updated_data)

[('Amanda', 1.61, 51, 19.7), ('Patricia', 1.65, 61, 22.4), ('Marcos', 1.91, 101, 27.7)]


***

### Задание

Представьте, что мы пытаемся выгрузить несколько новостей с сайта kommersant.ru. У вас есть список путей до интересующих вас статей.

Как вы видите, представленные ссылки на статьи — неполные: в них не хватает адреса самого сайта — "https://www.kommersant.ru".

Ваша задача составить новый список links, в котором будут храниться полные ссылки до статей на сайте «Коммерсанта». Например, полная ссылка на первую статью будет иметь вид: "https://www.kommersant.ru//doc/5041434?query=data%20science".

Для решения задачи используйте функцию map().

К каждому элементу списка docs (размер списка может быть любым) примените функцию-преобразование, которая добавляет к ссылке на начальную страницу сайта путь до статьи из списка docs.

Результат работы функции map() оберните в список и занесите в переменную links.

In [77]:
docs = ['//doc/5041434?query=data%20science','//doc/5041567?query=data%20science', '//doc/4283670?query=data%20science','//doc/3712659?query=data%20science', '//doc/4997267?query=data%20science'  
]  
links=list(map(lambda elem: "https://www.kommersant.ru" + elem, docs))

links

['https://www.kommersant.ru//doc/5041434?query=data%20science',
 'https://www.kommersant.ru//doc/5041567?query=data%20science',
 'https://www.kommersant.ru//doc/4283670?query=data%20science',
 'https://www.kommersant.ru//doc/3712659?query=data%20science',
 'https://www.kommersant.ru//doc/4997267?query=data%20science']

***

### Задание

Допустим, мы решаем задачу оценки стоимости недвижимости.

В списке data представлены усреднённые данные по домам в районах Бостона. Каждый вложенный в список кортеж описывает средние данные по одному району (для примера представлены данные о семи участках). В этом кортеже представлены следующие признаки (в порядке следования):

x₁ — уровень преступности на душу населения по городам;

x₂ — среднее количество комнат в доме;

x₃ — доля зданий, построенных до 1940 г. и занимаемых владельцами;

x₄ — полная ставка налога на имущество за каждые 10 000 долларов стоимости;

x₅ — процент населения с низким статусом.

In [78]:
data = [(0.00632, 6.575, 65.2, 296.0, 4.98),  
(0.02731, 6.421, 78.9, 242.0, 9.14),  
(0.02729, 7.185, 61.1, 242.0, 4.03),  
(0.03237, 6.998, 45.8, 222.0, 2.94),  
(0.06905, 7.147, 54.2, 222.0, 5.33),  
(0.02985, 6.43, 58.7, 222.0, 5.21),  
(0.08829, 6.012, 66.6, 311.0, 12.43)]


boston_func = lambda x:(*x, round(x[0] * x[3] * x[4], 2))
updated_data = list(map(boston_func, data))

updated_data

[(0.00632, 6.575, 65.2, 296.0, 4.98, 9.32),
 (0.02731, 6.421, 78.9, 242.0, 9.14, 60.41),
 (0.02729, 7.185, 61.1, 242.0, 4.03, 26.61),
 (0.03237, 6.998, 45.8, 222.0, 2.94, 21.13),
 (0.06905, 7.147, 54.2, 222.0, 5.33, 81.7),
 (0.02985, 6.43, 58.7, 222.0, 5.21, 34.53),
 (0.08829, 6.012, 66.6, 311.0, 12.43, 341.31)]

***

# ФУНКЦИЯ FILTER

Условие задачи

Пусть у нас задан список слов words_list:

Необходимо создать новый список even_list, содержащий только те слова из списка words_list, длина которых чётная. Например, если программа будет выполняться для списка, представленного выше, мы должны получить новый список следующего содержания:

['in', 'near', 'My', "cousin's", 'married.']

In [79]:
# Создаём пустой список, куда будем добавлять результаты
even_list = []
# Создаём цикл по элементам списка
for word in words_list:
    # Проверяем условие, что длина текущего слова чётная
    if len(word) % 2 == 0: # Если условие выполняется
        # Добавляем слово в новый список
        even_list.append(word)
print(even_list)

['in', 'near', 'My', "cousin's", 'married.']


In [82]:
def is_even(x):
    return len(x) % 2 == 0

even_list = list(filter(is_even, words_list))
# Смотрим, что получилось 
print(even_list)


['in', 'near', 'My', "cousin's", 'married.']


***

# FILTER + LAMBDA

### Задание

Пусть у нас есть кортеж из строк. Пример такого кортежа:

str_tuple = ("Москва", "15.1 см", "зацвело", "было пол 5 утра", "рассвет")
Необходимо составить новый кортеж, в котором будут только строки, состоящие только из букв. То есть для примера выше в результирующем кортеже должны быть строки "Москва", "зацвело" и "рассвет".

In [83]:
str_tuple = ("Москва", "15.1 см", "зацвело", "было пол 5 утра", "рассвет")
# Применяем lambda-функцию к каждому элементу кортежа
# Результат оборачиваем в кортеж
filtered_tuple = tuple(filter(lambda x: x.isalpha(), str_tuple))
# Смотрим, что получилось
print(filtered_tuple)

('Москва', 'зацвело', 'рассвет')


***

### Задание

Условие задачи

Школа онлайн-образования разрабатывает курс «Fullstack-разработчик» и собирает данные по каждому модулю курса.

В списке кортежей data представлена выгрузка данных из базы данных об оценках бонусных (дополнительных) модулей курса:

Данные по каждому модулю представлены в виде кортежей, состоящих из пяти элементов:

Кодовое название курса.
Название курса.
Средняя оценка модуля.
NESSA — это внутренняя метрика компании, показывающая качество модуля (измеряется от 0 до 100).
Количество оценок.
Необходимо выбрать из представленных данных только те модули, которые относятся к курсу FPW-2.0, их NESSA > 70 и количество оценок > 50.


In [86]:
data = [
    ("FPW-2.0_D", "Бонус: Тренажер по HTML", 10, 100, 10),
    ("FPW-2.0", "Бонус: Тренажер по JavaScript", 9.2, 70, 180),
    ("FPW-2.0_D", "Бонус: Тренажер по React", 8.5, 66.67, 68),
    ("FPW-2.0", "Бонусный: IT в современном мире", 8.64, 83.74, 856),
    ("FPW-2.0", "Бонусный: Введение", 8.73, 56.24, 745),
    ("FPW-2.0", "Бонус: D1. Знакомство с Django (NEW)", 9.76, 95.24, 21),
    ("FPW-2.0_D", "Бонус: D2. Модели (NEW)", 9.44, 77.78, 18)
]

In [88]:
def filter_module(module):
    # Распаковываем кортеж на пять переменных
    code, name, avg_votes, nessa, count = module
    # Создаём условия 
    cond_1 = code == "FPW-2.0"
    cond_2 = nessa >= 70
    cond_3 = count > 50
    # Условия должны выполняться одновременно
    return cond_1 and cond_2 and cond_3

print(filter_module(module=("FPW-2.0_D", "Бонус: Тренажер по HTML", 10, 100, 10)))
print(filter_module(module=("FPW-2.0", "Бонус: Тренажер по JavaScript", 9.2, 70, 180)))

False
True


In [89]:
# Применяем функцию filter_module() для фильтрации списка кортежей
filtered_data = list(filter(filter_module, data))
print(filtered_data)

[('FPW-2.0', 'Бонус: Тренажер по JavaScript', 9.2, 70, 180), ('FPW-2.0', 'Бонусный: IT в современном мире', 8.64, 83.74, 856)]


Заметим, что при желании функцию filter_module() можно переписать в виде однострочной lambda-функции:

In [90]:
# Создаём lambda-функцию, которая возвращает True, если модуль удовлетворяет условиям
lambda_filter_module = lambda x: (x[0] == "FPW-2.0") and (x[3] >= 70) and (x[4] > 50)
# Применяем эту функцию к каждому элементу списка (к каждому кортежу)
filtered_data = list(filter(lambda_filter_module, data))
# Смотрим, что получилось
print(filtered_data)

[('FPW-2.0', 'Бонус: Тренажер по JavaScript', 9.2, 70, 180), ('FPW-2.0', 'Бонусный: IT в современном мире', 8.64, 83.74, 856)]


***

### Задание

У вас есть список prices стоимости аренды помещения под магазин за месяц. Вам необходимо создать список filtered_prices из стоимости, которая не выше 30000, чтобы уложиться в бюджет. В решении примените filter() и lambda.

In [92]:
prices = [34562, 66572, 25683, 17683, 56389, 28973]
new_lambda=lambda x: x<=30000
filtered_prices=list(filter(new_lambda, prices))
filtered_prices

[25683, 17683, 28973]

***

### Задание

Допустим, вы работаете в отделе разработки в МФЦ. Центр предоставляет некоторый спектр услуг многодетным семьям. Необходимо создать функциональность, которая позволяет отфильтровать среди всех запрашиваемых пользователем услуг (их количество произвольное) только те, которые предоставляются многодетным семьям.

При решении задачи вам понадобится список услуг, предоставляемых многодетным семьям

Реализуйте функцию filter_family(): на вход подаётся список с названием услуг МФЦ, а в результате возвращается список услуг, которые могут быть оказаны только многодетной семье.

Для фильтрации входного списка аргументов используйте функцию filter()

In [93]:
family_list = [
    'certificate of a large family',
    'social card',
    'maternity capital',
    'parking permit',
    'tax benefit',
    'reimbursement of expenses',
    "compensation for the purchase of children's goods"
 ]
def filter_family(lst):
  
  return list(filter(lambda x: x in family_list, lst))  

print(filter_family(['newborn registration', 'parking permit', 'maternity capital', 'tax benefit', 'medical policy']))

['parking permit', 'maternity capital', 'tax benefit']


***

### Задание

Условие задачи

Вернёмся к нашей задаче из области анализа естественного языка о подсчёте длины слов. Нам дан список слов в предложении words_list:

words_list = ["We're", 'in', 'a', 'small', 'village', 'near', 'Chicago', 'My', "cousin's", 'getting', 'married.']

Допустим, вначале мы хотим отобрать только те слова, которые состоят из пяти и более букв, а затем посчитать, сколько раз в таких словах встречается буква "a".

Результатом работы нашей программы должен стать список кортежей, где каждый кортеж состоит из двух элементов: слово и количество букв "a". Например, для списка words_list, представленного выше, у нас должен получиться следующий результат:

[("We're", 0), ('small', 1), ('village', 1), ('Chicago', 1), ("cousin's", 0), ('getting', 0), ('married.', 1)]

In [94]:
# Создаём пустой список, в который будем добавлять результаты
count_a = []
# Создаём цикл по элементам списка words_list
for word in words_list:
    # Проверяем условие, что длина имени больше либо равна пяти
    if len(word) >= 5:
        # Создаём кортеж (слово, количество букв 'a')
        result_tuple = (word, word.lower().count('a'))
        # Добавляем в итоговый список кортеж
        count_a.append(result_tuple)
print(count_a)

[("We're", 0), ('small', 1), ('village', 1), ('Chicago', 1), ("cousin's", 0), ('getting', 0), ('married.', 1)]


In [95]:
# Отбираем слова из пяти и более букв
filtered_words = filter(lambda x: len(x) >= 5, words_list)
# Все отобранные слова переводим в нижний регистр и считаем число букв 'a' в них
# Результат выдаём в виде кортежа (слово, количество букв "a")
count_a = map(lambda x: (x, x.lower().count('a')), filtered_words)
# Переводим объект map в list и печатаем его
print(list(count_a))

[("We're", 0), ('small', 1), ('village', 1), ('Chicago', 1), ("cousin's", 0), ('getting', 0), ('married.', 1)]


***

### Задание
Вернёмся к примеру о генерации признаков (Feature Engineering).

Перед нами снова выгрузка данных о параметрах человеческого тела (только теперь она немного больше), представленная в виде списка кортежей. Один кортеж состоит из трёх элементов (признаков):

имени человека;
его роста (в метрах);
веса (в килограммах).

В таблице ниже представлены медицинские характеристики соотношения массы и роста, составленные на основе значения индекса массы тела

Нам необходимо выбрать из данных только тех пациентов, у кого соотношение массы и роста находится в пределах нормы.

Результатом работы нашей программы должен стать список кортежей, удовлетворяющих условию.


In [96]:
data = [
    ('Amanda', 1.61, 51),
    ('Patricia', 1.65, 61), 
    ('Marcos', 1.91, 101),
    ('Andrey', 1.79, 61),
    ('Nikos', 1.57, 78),
    ('Felicia', 1.63, 56),
    ('Lubov', 1.53, 34)
]

# Создаём lambda-функцию, которая считает BMI, и применяем её к каждому элементу списка
map_func = lambda x: (*x, x[2]/(x[1]**2))
updated_data = map(map_func, data)
# Создаём lambda-функцию, которая возвращает True, если 18.5 <= BMI <= 25
filter_func = lambda x: 18.5 <= x[3] <= 25
# Применяем эту функцию к результату работы map()
filtered_data = filter(filter_func, updated_data)
# Переводим объект filter в list и печатаем его
print(list(filtered_data))

[('Amanda', 1.61, 51, 19.675166853130666), ('Patricia', 1.65, 61, 22.4058769513315), ('Andrey', 1.79, 61, 19.038107424861895), ('Felicia', 1.63, 56, 21.077195227520797)]


***

### Задание

Мы снова занимаемся регистрацией пользователей. В нашем распоряжении есть список кортежей reg. В каждом кортеже хранится информация о зарегистрированном пользователе и его дате рождения в формате: Фамилия, Имя, день, месяц, год:

Выберите из списка reg только те записи, в которых год рождения пользователя больше 2000 (2001, 2002 и т. д.). Из оставшихся записей составьте новый список кортежей, в котором фамилия и имя объединены в одну строку по следующему шаблону: Фамилия И.

Обратите внимание на точку после сокращения имени!

Например, для представленного списка reg результирующий список кортежей new_reg должен иметь вид:

Для решения задачи используйте конвейер из filter() и map().

Обратите внимание: задана двумерная структура, то есть функции фильтрации и преобразования, указываемые в аргументах в filter() и map(), принимают на вход один кортеж и должны обрабатывать его.

В результате работы программы должен быть создан обновленный список кортежей с именем переменной new_reg.

In [98]:
reg = [('Ivanov', 'Sergej', 24, 9, 1995),
      ('Smith', 'John', 13, 2, 2003),
      ('Petrova', 'Maria', 13, 3, 2003)]

def update_tuple(arg):
  surname=arg[0]
  name=arg[1]
  new_surname=surname+' '+name[0]+'.'
  return (new_surname, arg[2], arg[3], arg[4])

new_f = filter(lambda x: x[4] >= 2000, reg)
new_reg=list(map(update_tuple, new_f))

new_reg

[('Smith J.', 13, 2, 2003), ('Petrova M.', 13, 3, 2003)]

***

### Задание

Вернёмся к задаче по оценке стоимости недвижимости.

В списке data представлены усреднённые данные по домам в районах Бостона. Каждый вложенный в список кортеж описывает средние данные по одному району (для примера представлены данные о семи участках). В этом кортеже представлены следующие признаки (в порядке следования):

x₁ — уровень преступности на душу населения по городам;

x₂ — среднее количество комнат в доме;

x₃ — доля зданий, построенных до 1940 г. и занимаемых владельцами;

x₄ — полная ставка налога на имущество за каждые 10 000 долларов стоимости;

x₅ — процент населения с низким статусом.

In [99]:
data = [(0.00632, 6.575, 65.2, 296.0, 4.98),
 (0.02731, 6.421, 78.9, 242.0, 9.14),
 (0.02729, 7.185, 61.1, 242.0, 4.03),
 (0.03237, 6.998, 45.8, 222.0, 2.94),
 (0.06905, 7.147, 54.2, 222.0, 5.33),
 (0.02985, 6.43, 58.7, 222.0, 5.21),
 (0.08829, 6.012, 66.6, 311.0, 12.43)]

new_reg=map(lambda x:(*x, round(x[0]*x[3]*x[4], 2)), data)
filtered_data = list(filter(lambda x: x[5] > 60, new_reg))

filtered_data

[(0.02731, 6.421, 78.9, 242.0, 9.14, 60.41),
 (0.06905, 7.147, 54.2, 222.0, 5.33, 81.7),
 (0.08829, 6.012, 66.6, 311.0, 12.43, 341.31)]