<a href="https://colab.research.google.com/github/ordevoir/Digital_Cathedra/blob/main/Python/04_functions.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Функции

Функции в программировании нужны для того, чтобы упростить и структурировать код, избежать повторения одинаковых действий и сделать программу более модульной и понятной. Функции позволяют выделить отдельные блоки кода, которые решают определенную задачу, и вызывать их по имени в любом месте программы. Функции также могут принимать и возвращать значения, которые используются для обмена данными между разными частями программы. Функции могут быть встроенными или определенными пользователем.

Встроенные функци – это функции, которые предоставляются языком программирования или его библиотеками и реализуют общие или специфические операции. Например, в Python есть встроенные функци и `print()`, `len()`, `type()` и другие, которые позволяют выводить данные на экран, получать длину объекта, получать тип объектар и т.д.

Определенные пользователем функции – это функции, которые создает сам программист для решения своих задач.

# Определение функции

Для **определения** функции используется ключевое слово `def` (сокращение от *define*). Тело функции прописывается с отступом. В данном примере функция принимает два аргумента (`a` и `b`). Значения аргументов будут использованы в теле функции при выполнении функции.

In [None]:
def some_function(a, b):
    c = a * b - 1
    return c

При объявлении функции не производится выполнения тела функции. Выполнение осуществляется только при вызове функции.

# Вызов функции

Для того, чтобы поспользоваться функцией, необходимо произвести **вызов** (*call*) функции. Для этого нужно написать имя функции, за которым будут следовать круглые скобки, в которых можно прописать аргументы.

In [None]:
x, y = 5, 6
result = some_function(x, y)
print(result)

Очевидно, что вызов такой функции является выражением, результатом которого является значение, определяемое оператором `return`. Это значение, **возвращаемое** функцией, можно присвоить некоторой переменной.

> При вызове функций всегда после имени функции идут круглые скобки `()`. Если написать имя функции без скобок, то вызова функции не произойдет: имя функции является переменной, которая ссылается на объект функции, так что если просто написать имя функции, это это будет выражение, возвращающее объект функции. Это обстоятельство позволяет передавать функции по ссылке (см. ниже)

In [None]:
some_function

После определения функции, ее можно вызывать многократно, в самых разных участках кода.

## Пример

Рассмотрим код, вычисляющий площадь цилиндра:

In [None]:
h = 100
r = 2
pi = 3.14

base_area = pi * r**2           # площадь основания
side_area = 2 * pi * r * h      # площадь боковой поверхности
area = 2*base_area + side_area  # полная площалдь

print('S =', area)

Определим функцию, которая по заданным аргументам (высота, радиус) будет вычислять площадь цилиндра и возвращать его в качестве результата выполнения:

In [None]:
def cylinder_area(h, r):
    pi = 3.14
    base_area = pi * r**2           # площадь основания
    side_area = 2 * pi * r * h      # площадь боковой поверхности
    area = 2*base_area + side_area  # возврат полной площади
    return area

Теперь произведем вызов функции для того, чтобы получить площадь. Результат выполнения функции, т.е. значение, возвращаемое функцией, присвоим переменной `s` и выведем ее на печать:

In [None]:
s = cylinder_area(100, 2)
print('S =', s)

Предположим, что мы в ходе выполнения программы получили значения высоты и радиуса цилиндра в переменных `H` и `R`. Тогда мы можем вычислить площадь цилиндра, вызвав функцию `cylinder_area()` и передав ей соответствующие аргументы:

In [None]:
H = 10
R = 3
s = cylinder_area(H, R)
print('S =', s)

> Заметим, что переменные, хранящие значения высоты и радиуса, передаются в функцию в той последовательности, которая была предусмотрена при определении функции: первым аргументом функции является высота, вторым – радиус.

# Функции без `return`

В качестве примера функции, которая не возвращает значений, напишем фукнцию, которая принимает в качестве аргумента некоторую строку, и выводит на печать отдельные слова, из которых оно состоит.

In [None]:
def print_words(text):
    word = ''
    for symbol in text:
        if symbol != ' ':
            word = word + symbol
        else:
            print(word)
            word = ''

In [None]:
some_text = "Medicine is the field of health and healing"
print_words(some_text)

Напишем теперь функцию, которая будет менять объект, передаваемый ей в качестве аргумента. В рассматриваемом примере функция `increase_elements_of_list()` изменяет список, увеличивая значения элементов на единицу:

In [None]:
def increase_elements_of_list(x):
    for i in range(len(x)):
        x[i] += 1

> Следует отметить, что для передавать в функцию необходимо не произвольный список, а список целиком состоящий из чисел. Иначе оператор арифметического присваивания не будет работать корректно.

In [None]:
a = [1, 2, 3]                   # имя "a" ссылается на список
increase_elements_of_list(a)    # вызов функции, функция меняет список "a"
print(a)

## Что возвращает функция без `return`?

Строго говоря, функции без `return` все же кое что возвращают, а именно – объект `None`:

In [None]:
result = increase_elements_of_list(a)
print(result)

## Образец плохой практики

Список `a` можно изменить в функции не передавая ее в качестве аргумента:

In [None]:
def f():
    a.append(a[-1]+1)

In [None]:
a = [1, 2, 3]           # глобальные

In [None]:
f()
print(a)

Плохо здесь то, что глядя на вызов функции `f()` вряд ли можно догадаться, что она меняет объект `a`. В более сложном коде это может привести к непредсказуемым изменениям объекта `a`, при котором будет очень трудно выяснить, почему объект меняется: мы смотрим на вызов функции `f()` и не видим никаких намеков на то, что она будет менять объект и именем `a`. Более того, функция не является универсальной: кроме как менять `a`, функция ничего больше не умеет, ведь она не сможет работать с каким либо другим списком.

Вишенкой на торте является то, что название функции совершенно не информативное. Оно ничего нам не говорит о поведении функции.

## Как сделать грамотно?

Во-первых следовало бы явно передавать список в качестве аргумента. Для этого в определении функции необходимо определить аргумент. Во-вторых стоит подобрать более информативное имя для функции `append_increased_last_elemend()`.

In [None]:
def append_increased_last_elemend(a):
    a.append(a[-1]+1)

Тогда функция будет универсальной – работать с любым числовым списком, и при этом, глядя на вызов функции всегда будет понятно, над каким объектом функция совершает манипуляции:

In [None]:
b = [100]

In [None]:
append_increased_last_elemend(b)
print(b)

In [None]:
append_increased_last_elemend(a)
print(a)

# Локальные и глобальные переменные

**Локальные переменные** (*local variables*) – это переменные, которые объявлены внутри функции и существуют только во время выполнения этой функции.

**Глобальные переменные** (*global variables*) – это те, которые объявлены вне функции и существуют во всей программе.

Локальные переменные могут иметь то же имя, что и глобальные, но они не связаны между собой.

Немного модифицируем функцию `append_increased_last_elemend()`:

In [None]:
def append_increased_last_elemend(a):
    t = 1
    a.append(a[-1]+t)

Мы используем в теле функции локальную переменную `t`. Эта перменная создается при вызове функции и вне функции мы не можем получить к ней доступ – вне функции она не существует.

In [None]:
# t

Объявим теперь вне функции глобальные перменные `a`, `b` и `t`:

In [None]:
a = [1, 2 ,3]
b = [100]
t = 10

Произведем вызов функции и передадим ей в качестве аргумента список `b`

In [None]:
append_increased_last_elemend(b)

Посмотрим, как как изменились значения глобальных переменных:

In [None]:
print(a, b, t)

Отсюда можно убедиться, что локальные переменные `a` и `t`, определенные внутри функции и глобальные переменные `a` и `t`, определенные вне функции – никак не связаны между собой.

Однако, если бы локальная переменная `t` не была бы определена внутри функции, то в инструкции `a.append(a[-1]+t)` функции обратилась бы к глобальной переменной:

In [None]:
def append_increased_last_elemend(a):
    a.append(a[-1]+t)

In [None]:
append_increased_last_elemend(a)
print(a)

Заметим, что несмотря на то, что функция `append_increased_last_elemend()` обращается к глобальной переменной `t`, она не пытается изменить ее значение. Поэтому значение `t` не будет неожиданно меняться:

In [None]:
print(t)

## Гуанин-цитозиновый состав (*GC-content*)

In [None]:
sequence_1 = 'ATTGCTTAAGACATTAAGACATAATTACCAAGTAGCAGATGAAATTAGC'
sequence_2 = 'AGTGCGTACGACAGCGCAGGGACATGCACGACCAAGTAGCAGCCGCGGCTAGC'

In [None]:
def get_gc_content(seq):
    pass

# Композиция функций

Самый простой вариант композиции функций – вызов функции внутри аргумента:

In [None]:
print(type(10))

В общем случае можно неограниченно вкладывать вызовы функций друг в друга:

In [None]:
print(len(str(type(10))))

Другой распространенный способ композиции функций – использование фукнкций, определенных ранее, в *теле* другой функции. Мы уже такую композицию, когда вызвали, к примеру, встроенную функцию `print()` в теле функции `print_words()`.

## Температура плавления ДНК

Напишем функцию, которая будет использовать определенную нами ранее функцию `get_gc_content()` для вычисления температуры плавления двуцепочечной молекулы ДНК по [формуле](http://iairas.ru/mag/2020/full2/Art2.pdf)
$$
T_m = 69.3 + 0.41 [G + C]
$$
где $[G + C]$ представляет собой содержание нуклеотидов $G$ и $C$ в цепи.

In [None]:
def melting_t(A):
    gc = get_gc_content(A)      # доля gc в цепи
    T = 69.3 + 0.41 * (gc*100)
    return T

In [None]:
melting_t(sequence_1)

In [None]:
melting_t(sequence_2)

# Встроенные функции

## `help()`

`help()` – это встроенная функция в Python, которая позволяет получить справку по любому объекту языка, такому как модуль, класс, функция, переменная и т.д. Функция `help()` вызывает интерактивную справочную систему, которая показывает документацию по объекту, его атрибутам, методам и примерам использования.

In [1]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [6]:
print(4, 5, 6, 7, sep=' - ', end=' ')
print(8, 9)

4 - 5 - 6 - 7 8 9


## `abs()`

`abs()` возвращает абсолютную величину числа:

In [9]:
a = 11 / 3
print(a)

3.6666666666666665


In [10]:
b = abs(a)
print(b)

3.6666666666666665


## `round()`

`round()` округляет число до ближайшего целого, либо до $n$ знаков после запятой:

In [11]:
round(b)

4

In [12]:
round(b, 2)

3.67

## `max()` & `min()`

`max()` и `min()` возвращают максимальный и минимальный эелемент последовательности

In [13]:
L_1 = [1, -2, 3, 2, 5, 2, -3, 4, 5, 0]
L_2 = [2, 3, -3, 5, 3, -4, 5, 0, 9, 3]

In [14]:
print(max(L_1))
print(max(L_2))

5
9


In [15]:
print(min(L_1))
print(min(L_2))

-3
-4


## `sum()`

In [16]:
print(sum(L_1), sum(L_2))

17 23


In [18]:
s = 0

for value in L_2:
    s += value

print(s)

23


## `zip()`

Функция `zip()` позволяет пройтись в цикле параллельно по двум или нескольким последовательностям.

Получим список, содержащий поэлементные разности двух списков:

In [22]:
L_1 = [1, -2, 3, 2, 5, 2, -3, 4, 5, 0]
L_2 = [2, 3, -3, 5, 3, -4, 5, 0, 9, 3, 9, 21]

In [24]:
print(L_1)
print(L_2)

[1, -2, 3, 2, 5, 2, -3, 4, 5, 0]
[2, 3, -3, 5, 3, -4, 5, 0, 9, 3, 9, 21]


In [20]:
differences = []
lenght = len(L_1)

for index in range(lenght):
    diff = L_2[index] - L_1[index]
    differences.append(diff)

print(differences)

[1, 5, -6, 3, -2, -6, 8, -4, 4, 3]


In [23]:
differences = []

for v1, v2 in zip(L_1, L_2):
    diff = v2 - v1
    differences.append(diff)

print(differences)

[1, 5, -6, 3, -2, -6, 8, -4, 4, 3]


Напишем в виде функции:

In [25]:
def get_differences(a, b):

    differences = []
    for v1, v2 in zip(a, b):
        diff = v2 - v1
        differences.append(diff)

    return differences

In [26]:
d = get_differences(L_1, L_2)
print(d)

[1, 5, -6, 3, -2, -6, 8, -4, 4, 3]


# Аргументы функций

## Позиционные аргументы

In [27]:
def difference(x, y):
    diff = x - y
    return diff

In [28]:
a = 3
b = 5

In [29]:
difference(a, b)

-2

In [30]:
difference(b, a)

2

## Именованные аргументы

In [31]:
difference(x=a, y=b)

-2

In [33]:
difference(y=b, x=a)

-2

In [34]:
difference(a)

TypeError: ignored

## Дефолтные значения аргументов

In [38]:
def difference(x, y=1):
    diff = x - y
    return diff

In [35]:
difference(a, b)

-2

In [36]:
difference(y=a, x=b)

2

In [39]:
difference(b)

4

In [40]:
b = difference(b)
print(b)

4


## Предостережение!

>Не стоит задавать изменяемый объект в качестве значение аргумента функции по умолчанию!

Значения по умлочанию аргументов функций задаются один раз при определении функции, а не отдельно во время вызова. Поэтому при каждом вызове функции его локальная перменная, соответствующая дефолтному аргументу, ссылается на тот объект, который создан при определении функции. Для неизменяемых значений это не проблема, но для изменяемых объектов это может привести к неприятностям: первый вызов функции может изменить дефолтный объект, и тогда следующий вызов функции будет иметь дело с измененным объектом.

In [41]:
def f(a, b=[]):
    b.append(a)
    return b
# дефолтный объект [] создан

В данном коде для функции `f` определяется один дефолтный объект – пустой список. Далее, при вызове функции локальная переменная `b` будет ссылаться на тот самый объект и изменит его при выполнении функции.

In [42]:
c = f(10)   # в объект [] записывается значение 10
print(c)    # функция возвращает этот список и на него теперь ссылается c
d = f(11)   # в объект [10] записыается значение 11
print(d)    # теперь и d ссылается на список, значение которого теперь [10, 11]

[10]
[10, 11]


Переменным `c` и `d` был присвоен один и тот же объект: список, созданный при определении функции, поэтому:

In [43]:
c is d

True

Если все же значением по умолчанию должен быть изменяемый объект, но уникальный при для каждого вызова функции, можно действовать так:

In [44]:
def f(a, b=None):
    if b is None:
        b = []
    b.append(a)
    return b

c = f(10)
print(c)
d = f(11)
print(d)
print(c is d)

[10]
[11]
False


В этом случае при определении функции создается объект `None`, а список создаются отдельно создается каждый раз при вызове функции.

# Функции как методы

Методы представляют собой функции, которые предназначены для работы с объектами данного типа. Возьмем, к примеру, списки (объекти типа `list`). Списки обладают некоторым набором методов, при помощи которых можно менять списки, либо получать данные на основе значений элементов. Полный список методов списка приводится в [документации](https://docs.python.org/3/tutorial/datastructures.html).

>Основные методы списков, строк и словарей приводятся в файле list_string_dict.ipynb.

## Методы списков

Создадим список и попробуем вызвать некоторые его методы.

In [57]:
L = [1, -2, 3, 2, 5, 2, -3, 4, 5, 0]

Методы могут вызываться при помощи точечной нотации:

In [None]:
L.append(9)

Метод `append()` добавляет объект, переданный в качестве аргумента, в конец списка:

In [None]:
print(L)

Метод `pop()` удаляет и возвращает последний элемент списка:

In [56]:
value = L.pop()
print(value)
print(L)

IndexError: ignored

Также можно передать индекс в качестве аргумента, тогда будет удален и возвращен объект, находящийся под заданным индексом:

In [65]:
L

[-3, 4, 5, 0]

In [64]:
value = L.pop(0)
print(value)
print(L)

2
[-3, 4, 5, 0]


# Воссоздание комплементарной последовательности

In [85]:
sequence = 'ATTGCTTAAGACATTAAGACATAATTACCAAGTAGCAGATGAAATTAGC'

In [86]:
def get_compl_seq(seq):
    sequence_list = []
    for nucleotide in seq:
        if nucleotide == "A":
            sequence_list.append("T")
        elif nucleotide == "T":
            sequence_list.append("A")
        elif nucleotide == "C":
            sequence_list.append("G")
        elif nucleotide == "G":
            sequence_list.append("C")
    sequence = "".join(sequence_list)
    return sequence

In [87]:
get_compl_seq(sequence)

'TAACGAATTCTGTAATTCTGTATTAATGGTTCATCGTCTACTTTAATCG'

# Разбиение на триплеты

In [88]:
sequence

'ATTGCTTAAGACATTAAGACATAATTACCAAGTAGCAGATGAAATTAGC'

In [89]:
i = 0
triplet_list = []
while (i+3) < len(sequence):
    triplet = sequence[i] + sequence[i+1] + sequence[i+2]
    triplet_list.append(triplet)
    i += 3

print(sequence)
print(triplet_list)

ATTGCTTAAGACATTAAGACATAATTACCAAGTAGCAGATGAAATTAGC
['ATT', 'GCT', 'TAA', 'GAC', 'ATT', 'AAG', 'ACA', 'TAA', 'TTA', 'CCA', 'AGT', 'AGC', 'AGA', 'TGA', 'AAT', 'TAG']


# Вложенные циклы и списки

Дается список, состоящий из списков, в каждом из которых по два числовых значения (вложенные списки). Нeобходимо найти средннее арифметическое от квадратов разностей чисел во вложенных списках.

In [90]:
L = [[2, 3], [3, 6], [12, 4], [4, 3], [22, 25], [1, 2]]

total = 0

for pair in L:
    difference = pair[0] - pair[1]
    squared = difference ** 2
    total += squared

mean = total / len(L)
print(mean)

14.166666666666666


## Список всевозможных триплетов

In [91]:
nucleotides = 'ATGC'

triplets = []

for n1 in nucleotides:
    for n2 in nucleotides:
        for n3 in nucleotides:
            t = n1 + n2 + n3
            triplets.append(t)

In [93]:
len(triplets)

64

## Транскрипция

In [108]:
def transcriptor(dna_sequence):
    sequence_list = []
    for nucleotide in dna_sequence:
        if nucleotide == "A":
            sequence_list.append("U")
        elif nucleotide == "T":
            sequence_list.append("A")
        elif nucleotide == "C":
            sequence_list.append("G")
        elif nucleotide == "G":
            sequence_list.append("C")
    rna_sequence = "".join(sequence_list)
    return rna_sequence

In [109]:
transcriptor(sequence)

'UAACGAAUUCUGUAAUUCUGUAUUAAUGGUUCAUCGUCUACUUUAAUCG'

In [126]:
def get_triplets(seq):
    i = 0
    triplet_list = []
    while (i+3) < len(seq):
        triplet = seq[i] + seq[i+1] + seq[i+2]
        triplet_list.append(triplet)
        i += 3
    return triplet_list

In [127]:
def translator(seq, codons):
    rna_sequence = transcriptor(seq)
    print(seq)
    print(rna_sequence)
    triplets = get_triplets(rna_sequence)
    print(rna_sequence)
    aa_list = []
    print(triplets)
    for t in triplets:
        print(t)
        aminoacid = codons[t]
        aa_list.append(aminoacid)
    return aa_list

In [128]:
translator(sequence, codons)

ATTGCTTAAGACATTAAGACATAATTACCAAGTAGCAGATGAAATTAGC
UAACGAAUUCUGUAAUUCUGUAUUAAUGGUUCAUCGUCUACUUUAAUCG
UAACGAAUUCUGUAAUUCUGUAUUAAUGGUUCAUCGUCUACUUUAAUCG
['UAA', 'CGA', 'AUU', 'CUG', 'UAA', 'UUC', 'UGU', 'AUU', 'AAU', 'GGU', 'UCA', 'UCG', 'UCU', 'ACU', 'UUA', 'AUC']
UAA
CGA
AUU
CUG
UAA
UUC
UGU
AUU
AAU
GGU
UCA
UCG
UCU
ACU
UUA
AUC


['STOP',
 'Arg',
 'Ile',
 'Leu',
 'STOP',
 'Phe',
 'Cys',
 'Ile',
 'Asn',
 'Gly',
 'Ser',
 'Ser',
 'Ser',
 'Thr',
 'Leu',
 'Ile']

## Трасляция

In [99]:
codons = {  'UUU': 'Phe',
            'UUC': 'Phe',
            'UUA': 'Leu',
            'UUG': 'Leu',
            'UCU': 'Ser',
            'UCC': 'Ser',
            'UCA': 'Ser',
            'UCG': 'Ser',
            'UAU': 'Tyr',
            'UAC': 'Tyr',
            'UAA': 'STOP',
            'UAG': 'STOP',
            'UGU': 'Cys',
            'UGC': 'Cys',
            'UGA': 'STOP',
            'UGG': 'Trp',
            'CUU': 'Leu',
            'CUC': 'Leu',
            'CUA': 'Leu',
            'CUG': 'Leu',
            'CCU': 'Pro',
            'CCC': 'Pro',
            'CCA': 'Pro',
            'CCG': 'Pro',
            'CAU': 'His',
            'CAC': 'His',
            'CAA': 'Gln',
            'CAG': 'Gln',
            'CGU': 'Arg',
            'CGC': 'Arg',
            'CGA': 'Arg',
            'CGG': 'Arg',
            'AUU': 'Ile',
            'AUC': 'Ile',
            'AUA': 'Ile',
            'AUG': 'Met',
            'ACU': 'Thr',
            'ACC': 'Thr',
            'ACA': 'Thr',
            'ACG': 'Thr',
            'AAU': 'Asn',
            'AAC': 'Asn',
            'AAA': 'Lys',
            'AAG': 'Lys',
            'AGU': 'Ser',
            'AGC': 'Ser',
            'AGA': 'Arg',
            'AGG': 'Arg',
            'GUU': 'Val',
            'GUC': 'Val',
            'GUA': 'Val',
            'GUG': 'Val',
            'GCU': 'Ala',
            'GCC': 'Ala',
            'GCA': 'Ala',
            'GCG': 'Ala',
            'GAU': 'Asp',
            'GAC': 'Asp',
            'GAA': 'Glu',
            'GAG': 'Glu',
            'GGU': 'Gly',
            'GGC': 'Gly',
            'GGA': 'Gly',
            'GGG': 'Gly',
            }

In [100]:
codons["UUU"]

'Phe'