# Вспомним былое...

<details>
<summary>Назовите три неизменяемых типа данных в python</summary>

    string (строки), integer (целые числа), bool, float ...
</details>

<details>
<summary>Назовите три изменяемых типа данных в python?</summary>

    list (списки), set (множества), dictionary (словари)
</details>

<details>
    
<summary>Как получить каждый второй элемент списка или строки?</summary>

    При помощи среза: my_var[::2]
</details>

<details>
<summary>Что произойдёт в результате такой операции: "ABCD"[2] = "c"?</summary>

    Ошибка! Строки неизменяемый тип данных
</details>

<details>
<summary>Что должно быть написано после ключевого слова if чтобы программа работала корректно?</summary>

    Выражение, результат которого будет логическим значением. Или результат, который может быть превращён в логическое значение
</details>

# Кортежи (tuples)

Программирование можно рассматривать как процесс преобразования данных. А данные бывают разных типов, в том числе таких типов, которые представляют собой контейнеры для хранения более простых данных. И конечно, вы уже догадались, что списки (lists) как раз являются примером таких контейнеров. Списки позволяют нам хранить набор данных, получать доступ к одному элементу через индекс, брать срезы (slices) из подряд идущих элементов. В python также поддерживается очень похожий на списки тип данных - **кортежи (tuples)**. Кортежи очень похожи на списки, отличие заключается только в том, что кортежи нельзя изменять.

In [None]:
num_list = [1, 2, 3, 5]  # list example
num_tup = (1, 2, 3)  # tuple example
print(num_list[2])  # third element in list
print(num_tup[1])  # second element in tuple

In [None]:
num_list[0] = 10
print(num_list)

In [None]:
# списки можно изменять
print(num_list)
num_list.append(10)  # какое значение возвращает метод 'append'?
print(num_list)
num_list[3] = 20
print(num_list)

In [None]:
num_tup.append(10)  # нет метода 'append' (неизменяемый тип)

In [None]:
num_tup[1] = 10  # нельзя присваивать (неизменяемый тип)

In [None]:
num_tup

In [None]:
# также можно перебирать при помощи цикла
for num in num_tup:
    print(num)

In [None]:
some_list = ["a", 'b', "c"]
some_tup = tuple(some_list)
print(type(some_tup))

Кортежи таким образом применяются в тех случаях, когда вам нужно использовать неизменяемый набор данных, например, когда вы хотите "защитить" данные от случайного изменения. Также (на масштабе больших данных) кортежи работают быстрее и занимают меньше памяти.

Также, если функция возвращает несколько значений, она возвращает именно кортеж, состоящий из этих значений:

In [None]:
random_tuple = (1, 2.5, "abd", [1,2,3], (True, False))


In [None]:
def func():
    return 1, 2, 3

print(func())
print(type(func()))

Значения из кортежей и списков можно "распаковать" в несколько переменных (количество переменных должно совадать с длиной кортежа/списка):

In [None]:
some_list = [1,2,3]
a, b, c = some_list
print(a,b,c)

In [None]:
seq1, seq2, seq3 = ('AA', 'CC', 'GG')
s_1, s_2, s_3, s_4 = ['ava', 'ttq', 'gtg', 'jk']
print(seq1)
print(s_2)

In [None]:
def gc(seq):
    ln = len(seq)
    a_count = seq.count('A')
    c_count = seq.count('C')
    g_count = seq.count('G')
    t_count = seq.count('T')
    
    at = (a_count + t_count) / ln
    gc = (g_count + c_count) / ln
    return gc, at  # возвращаем два значения

In [None]:
gc_aaa, at_aaa = gc('AAA')
print(gc_aaa)
print(at_aaa)
gc_at = gc('AAA')
print(gc_at[0])
print(gc_at)

In [None]:
gc_c, _ = gc('AAA')
print(gc_c)
print(_)

In [None]:
a = 'XYZ'
x, y, z = a

print(x)
print(y)
print(z)
print(a)

# Словари (dictionaries)

И если новые для вас кортежи были очень похожи по своему функционалу на известные уже списки, чуть более интересный способ хранить набор значений предоставляют **словари**. Фишка словарей состоит в том, что индексация хранимых значений происходит не при помощи порядковых номеров элементов, а при помощи _"ключей"_. Таким образом, словари из себя представляют набор пар "ключ-значение":

Простейший способ создать словарь, описать его при помощи фигурных скобок `{ }`. Ключ и его значение обозначаются через `:`, а несколько таких пар, как водится перечисляются при помощи запятой:

`dict_name = { key1 : value1, key2 : value2, ...}`

In [None]:
nernst_potentials = {'K': -88, 'Na': +60, 'Cl': -61}  # словарь их трёх пар

В примере выше мы создали словарь, который для трёх ионов (калий, натрий и хлор) содержит соответствующие им равновесные мембранные потенциалы (то есть, какой вклад каждый из ионов вносит в элетрический потенциал на мембране нейрона в условии покоя).
Теперь, для того, чтобы узнать, какой равновесный потенциал соответствует иону, мы можем просто вызвать его по "ключу":


In [None]:
# для калия:
K_pot = nernst_potentials['K']  # индексация не по порядку, а по ключу
print('Равновесный потенциал для калия равен', K_pot)

print('Для натрия', nernst_potentials['Na'])

Cl_key = 'Cl'
print('А для хлора', nernst_potentials[Cl_key])

In [None]:
ions = ['Na', 'Na', "Cl", 'K', 'Na']
for ion in ions:
    print(nernst_potentials[ion])

Создавать словари можно не обязательно сразу описывая все пары ключ-значение, их можно также добавлять и по ходу:

In [None]:
grades = {'Физика': 5, 'Биология': 5}
phys = grades["Физика"]
biol = grades["Биология"]
# После следующего экзамена
math = grades['Математика']  # несуществующий ключ

In [None]:
grades['Математика'] = 3  # присваиваем новое значение к новому ключу
print('Оценка за математику:', grades['Математика'])

In [None]:
grades

In [None]:
grades['Математика'] = 4
grades

Также можно создавать словари при помощи встроенной функции `dict`. Она работает несколькими способами, первый - когда вы передаёте последовательность пар ключ-значение:

In [None]:
one_pair = ('Arginine', 'NMDA')
all_pairs = [one_pair, ('Glutamate', 'NMDA'), ('Serotonin', '5-HT_3'), ('Acetylcholine', 'Nicotinic ACh r.')]
some_receptors = dict(all_pairs)

In [None]:
print(some_receptors)

print(some_receptors['Glutamate'])

print(type(some_receptors))
print(len(some_receptors))

In [None]:
print(type(one_pair))
print(len(one_pair))


In [None]:
print(type(all_pairs))
print(len(all_pairs))

Ещё один способ исползовать `dict`:

In [None]:
def some_func(a, b, c):
    return a + b + c

some_func(b=3, a=4, c=0)

In [None]:
some_func(**{"b": 3, "a": 4, "c": 0})

In [None]:
some_func(1,2,3)

In [None]:
some_dict = dict(ghjfhfgh=100_000, key2=5e-2)
print(some_dict)

Конечно, можно не только одиночные объекты (типа числа или строки) использовать в качестве значения словаря, также ключи и значения могут быть разного типа:

In [None]:
trash_dict = {10: 'some string',
              'text': [1, 3, 4],
              10.01: ('a', 'b', 'c'),
              (5e-6, 's', True): ['', {}]}

In [None]:
print(trash_dict[1])
print(trash_dict[10.01])

**Важно!**

Ключами словаря могут быть только значения *неизменяемых* типов данных.

Вернёмся к словарю рецепторов:

In [None]:
some_receptors

Глутамат (Glu) действует не только на NMDA рецепторы, но и на AMPA, давайте заменим это значение словаря на список:

In [None]:
glu = 'Glutamate'
some_receptors[glu] = [some_receptors[glu], 'AMPA']  # присваиваем новое значение элементу под ключом "Glutamate"
print(some_receptors)

Как выдумаете, словари являются изменяемым или неизменяемым типом?

**Вопрос:** \
Какие из операций ниже можно выполнить?

In [None]:
a = 10
a = 15
a = a - 10

b = [12, "a", None, 50]
b[1] = "b"
b[0] = b[0] + 2

c = "ABCD"
c[3] = "G"
c[3] = c[3] + "dd"

d = "ABCD"
d[3] = 5

e = {"a": 1, "bb": 3.0, "C": (55, 44)}
e["bb"] = 10
e["C"][0] = 66
e["C"] = (1,2,3)
e["a"] = e["a"] + e["bb"] + e["C"][1]

## Вложенные словари (словари как элементы словарей):

In [None]:
elements = {'Metal': None,
            'Non-metal': None,
            'Halogen': None}

In [None]:
print(elements)

In [None]:
hydrogen = {'name': 'hydrogen', 'symbol': 'H', 'mass': 1.008, 'q num': (0, 0, 1)}  # отдельный словарь только для водорода

In [None]:
elements['Halogen'] = {}
print('before:',elements)


elements['Halogen'][1] = hydrogen  # обращаемся к пустому словарю с новым ключом
print('after:', elements)

In [None]:
elements['Halogen'][1]['mass']

In [None]:
elements['Halogen'][1]['q num'][2]

In [None]:
elements['Metal'] = {}
elements['Metal'][11] = {'name': 'sodium', 'symbol': 'Na', 'mass': 22.98, 'q num': (0, 0, 3)}
elements

In [None]:
# что делать, если я хочу добавить метал в таком виде?
fe = {26: {'name': 'ferrum', 'symbol': 'Fe', 'mass': 55.845, 'q num': (2, -2, 3)}}
elements['Metal'] = fe  # перезапишет то, что там сейчас, проблема
elements

## У словарей есть методы

### .get()

In [1]:
passwords = {'admin':'admin',
             'john228': 'qwerty',
             'super_boy95': '12345',
             'Иван Васильевич': 'password1234'}

In [3]:
passwords['admin']

'admin'

In [5]:
passwords.get('admin')

'admin'

In [7]:
passwords.get("john228")

'qwerty'

In [9]:
passwords['user1']

KeyError: 'user1'

In [11]:
print(passwords.get('user1'))

None


### .items()

In [13]:
passwords

{'admin': 'admin',
 'john228': 'qwerty',
 'super_boy95': '12345',
 'Иван Васильевич': 'password1234'}

In [15]:
list(passwords.items())  # где-то такое уже видели

[('admin', 'admin'),
 ('john228', 'qwerty'),
 ('super_boy95', '12345'),
 ('Иван Васильевич', 'password1234')]

In [17]:
passwords2 = dict(passwords.items())
passwords2

{'admin': 'admin',
 'john228': 'qwerty',
 'super_boy95': '12345',
 'Иван Васильевич': 'password1234'}

In [19]:
a = {1: '1', 2: '2'}
b = dict(a.items())
print(b)

{1: '1', 2: '2'}


### .values() и .keys()

In [None]:
passwords

In [None]:
list(passwords.values())

In [None]:
list(passwords.keys())

### .update()

In [None]:
passwords

In [None]:
passwords['admin'] = 'admin3'
passwords

In [None]:
passwords.update({'admin': 'admin2'})
passwords

In [None]:
passwords.update({'new_user1337': '!@#$!@#$', '113': '001'})
passwords

In [None]:
passwords.update([('vasya', '0000'), ('kolyaN', '09051999')])  # можно сразу несколько пар
passwords

### Как решить проблему?

In [None]:
fe

In [None]:
elements

In [None]:
elements['Metal']

In [None]:
elements['Metal'].update(fe)
elements

### Циклы и словари

In [None]:
simple_dict = {'a': 0, 'b': 1, 'c': 2, 'd': 3}
for var in simple_dict:
    print(var)
    print(simple_dict[var])

In [None]:
sd_keys = simple_dict.keys()
for key in sd_keys:
    print(key)
    print(simple_dict[key])

In [None]:
for value in simple_dict.values():
    print(value)

In [None]:
print(simple_dict.items())

In [None]:
print(simple_dict.items())
print('-.'*10)
for key, value in simple_dict.items():
    print('Ключ:', key)
    print('Значение:', value)

# Упражнения

Измените `pass` на свой код так, чтобы на печать выводилось `True`.

In [None]:
my_dict = {'a': 1, 'b': 2, 'c': 3}
key_to_check = 'b'

dict_contains_key = pass

print(dict_contains_key)

In [None]:
my_dict = {'name': 'Alice', 'age': 25}
my_dict pass = "New York"

is_city_key = 'city' in my_dict

print(is_city_key)

In [None]:
my_dict = {'p': 5, 'q': 20}
my_dict.update(pass)

print(my_dict['q'] == 25)

In [None]:
dict1 = {'a': 1, 'b': 2}
dict2 = {'b': 3, 'c': 4}

pass

print(dict1['b'] == 3 and dict1['c'] == 4)

Измените `pass` на свой код так, чтобы на печать выводились ключи и значения

In [None]:
my_dict = {'k1': 'v1', 'k2': 'v2'}

for key, value in pass:
    print(key, value)

#  Домашнее задание

### 1. Трансляция
Напишите и протестируйте функцию, которая преобразует мРНК в виде строки в строку, содержащую соответствующую последовательность аминокислот. Для сопоставления коднов и аминокислот используйте словарь приведённый ниже.

In [34]:
def rna2amino(rna):
    rna = rna.upper()
    # проверка количества стоп-кодонов
    stop_count = rna.count('UAA') + rna.count('UAG') + rna.count('UGA')
    print(stop_count)
    if stop_count == 0:
        return 'нет стоп-кодона'
    elif stop_count > 1:
        return 'больше одного стоп-кодона'
    # поиск стоп-кодона
    if 'UAA' in rna:
        stop_i = rna.index('UAA')
    elif 'UAG' in rna:
        stop_i = rna.index('UAG')
    else:
        stop_i = rna.index('UGA')
    # в переменной stop_i положение стоп-кодона в последовательности, всё после стоп-кодона отпрасываем
    # теперь возьмём только целые триплеты до стоп-кодона: найдём остаток от деления длины последовательности (индекса стоп-кодона) на 3
    start_i = stop_i % 3
    seq = rna[start_i:stop_i]

    amino = ''
    for i in range(0, stop_i - start_i, 3):
        index = seq[i:i+3]
        print(index)
        amino += STANDARD_GENETIC_CODE[index]
    return amino


by_rna = "AGCUGGUCGAUCGAUCGAGCUGGCCUAAUGGUGG"
my_amino = rna2amino(by_rna)
print(my_amino)

# my_rna = 'ACGUGUCGUACGUCGU'
# my_amino = rna2amino(my_rna)

1
GCU
GGU
CGA
UCG
AUC
GAG
CUG
GCC
AlaGlyArgSerIleGluLeuAla


In [None]:
my_amino = 'PhePheSerCysLeu'

In [22]:
STANDARD_GENETIC_CODE = {
                            'UUU':'Phe', 'UUC':'Phe', 'UCU':'Ser', 'UCC':'Ser',
                            'UAU':'Tyr', 'UAC':'Tyr', 'UGU':'Cys', 'UGC':'Cys',
                            'UUA':'Leu', 'UCA':'Ser', 'UAA':None, 'UGA':None,
                            'UUG':'Leu', 'UCG':'Ser', 'UAG':None, 'UGG':'Trp',
                            'CUU':'Leu', 'CUC':'Leu', 'CCU':'Pro', 'CCC':'Pro',
                            'CAU':'His', 'CAC':'His', 'CGU':'Arg', 'CGC':'Arg',
                            'CUA':'Leu', 'CUG':'Leu', 'CCA':'Pro', 'CCG':'Pro',
                            'CAA':'Gln', 'CAG':'Gln', 'CGA':'Arg', 'CGG':'Arg',
                            'AUU':'Ile', 'AUC':'Ile', 'ACU':'Thr', 'ACC':'Thr',
                            'AAU':'Asn', 'AAC':'Asn', 'AGU':'Ser', 'AGC':'Ser',
                            'AUA':'Ile', 'ACA':'Thr', 'AAA':'Lys', 'AGA':'Arg',
                            'AUG':'Met', 'ACG':'Thr', 'AAG':'Lys', 'AGG':'Arg',
                            'GUU':'Val', 'GUC':'Val', 'GCU':'Ala', 'GCC':'Ala',
                            'GAU':'Asp', 'GAC':'Asp', 'GGU':'Gly', 'GGC':'Gly',
                            'GUA':'Val', 'GUG':'Val', 'GCA':'Ala', 'GCG':'Ala',
                            'GAA':'Glu', 'GAG':'Glu', 'GGA':'Gly', 'GGG':'Gly'
                            }

### 2. Примерная оценка массы
Напишите и протестируйте функцию для примерного расчёта массы молекулы (протестируйте для всех типов молекул). Для значений испльзуйте словарь ниже:

In [36]:
residue_masses = {
    "DNA": {"G": 329.21, "C": 289.18, "A": 323.21, "T": 304.19},
    "RNA": {"G": 345.21, "C": 305.18, "A": 329.21, "U": 302.16},
    "protein": {"A": 71.07, "R": 156.18, "N": 114.08, "D": 115.08,
                "C": 103.10, "Q": 128.13, "E": 129.11, "G": 57.05,
                "H": 137.14, "I": 113.15, "L": 113.15, "K":128.17,
                "M": 131.19, "F": 147.17, "P": 97.11, "S": 87.07,
                "T": 101.10, "W": 186.20, "Y": 163.17, "V": 99.13}
}

In [44]:
'''
def mass_func(residue, r_type=False):
    if not r_type:
        # определяем тип
        if any([(x in residue) for x in "RNDQEHILKMFPSWYV"]):
            r_type = "protein"
        elif "T" in residue:
            r_type = "DNA"
        else:
            r_type = "RNA"
    masses = residue_masses[r_type]
    mass = 0.0
    for codon in residue:
        mass += masses[codon]
    return(mass)
'''
def mass_func(residue, r_type):
    masses = residue_masses[r_type]
    mass = 0.0
    for codon in residue:
        mass += masses[codon]
    return(mass)


print()
dna = 'AT'
print(mass_func(dna, 'DNA') == 627.4)
print(mass_func('ACGIQEKL', "protein"))
print(mass_func('ACGCCGCAAUAG', "RNA"))
print(mass_func('ATCGATCGATCAGGCCT', "DNA"))



True
842.93
3875.35
5272.34


### 3. Нуклеотидный состав

Напишите функцию `nucleotide_frequency(sequences)`, которая принимает список ДНК-последовательностей и возвращает словарь с частотой появления каждого нуклеотида (A, T, C, G) в этих последовательностях.

Пример:
```
sequences = [  
    "ATGCGATTC",
    "GCTAGCTA",
    "ATGCGC"
]

freqs = nucleotide_frequency(sequences)
print(freqs)
# Ожидаемый результат: {'A': 5, 'T': 3, 'G': 5, 'C': 4}
```

In [50]:
def amino_percentage(sequence, residue):
    sequence = sequence.lower()
    residue = residue.lower()
    percent = sequence.count(residue)/len(sequence)*100
    return percent

def nucleotide_frequency(sequences):
    total = ''.join(sequences).lower()
    freqs = {}
    freqs['A'], freqs['T'], freqs['G'], freqs['C'] = [total.count(x) for x in 'atgc']
    return freqs


sequences = [  
    "ATGCGATTC",
    "GCTAGCTA",
    "ATGCGC"
]

freqs = nucleotide_frequency(sequences)
print(freqs)
# Ожидаемый результат: {'A': 5, 'T': 3, 'G': 5, 'C': 4}
    
    

{'A': 5, 'T': 6, 'G': 6, 'C': 6}


### 4. Профиль микробиома

Создайте функцию `microbiome_profile(samples)`, которая принимает список названий микроорганизмов и возвращает словарь, где ключами являются названия микроорганизмов, а значениями — их общее количество (например, если название встречается несколько раз).
Пример:

```
exp_data = [
    "Lactobacillus",
    "Escherichia",
    "Bifidobacterium",
    "Lactobacillus",
    "Escherichia"
]

profile = microbiome_profile(exp_data)
print(profile)
# Ожидаемый результат: {'Lactobacillus': 2, 'Escherichia': 2, 'Bifidobacterium': 1}
```

In [56]:
def microbiome_profile(samples):
    keys = set(samples)
    biome_dict = {}
    for name in samples:
        counter = samples.count(name)
        biome_dict.update({name: counter})
    return biome_dict


exp_data = [
    "Lactobacillus",
    "Escherichia",
    "Bifidobacterium",
    "Lactobacillus",
    "Escherichia"
]

profile = microbiome_profile(exp_data)
print(profile)
# Ожидаемый результат: {'Lactobacillus': 2, 'Escherichia': 2, 'Bifidobacterium': 1}

{'Lactobacillus': 2, 'Escherichia': 2, 'Bifidobacterium': 1}


### 5. Вместимость капилляров

В исследовании капиллярной активности у растений были собраны данные о капиллярах (например, радиус и длина) и их вместимости. Нужно рассчитать вместимость каждого из капилляров и сохранить результаты в словаре.

Напишите функцию `calculate_capacity(cylinders)`, которая принимает словарь, где ключи — это имена капилляров, а значения — кортежи (радиус, длина), и возвращает словарь, в котором для каждого капилляра записана рассчитанная вместимость (используйте формулу $V = \pi r^2 h$.

Пример:
```
cylinders_data = {
    "Capillary A": (0.01, 0.5),
    "Capillary B": (0.005, 0.3)
}

cylinders_volume = calculate_capacity(cylinders_data)
print(cylinders_volume)

# Ожидаемый результат: {'Capillary A': 0.00015707963267948946, 'Capillary B': 0.00023561944901923448}
```

In [24]:
from math import pi


def calculate_capacity(cylinders):
    answer = {}
    for cylinder in list(cylinders.items()):
        name, sizes = cylinder
        r, h = sizes
        volume = pi * h * r ** 2
        answer[name] = volume
    return answer


In [26]:
cylinders_data = {
    "Capillary A": (0.01, 0.5),
    "Capillary B": (0.005, 0.3)
}

cylinders_volume = calculate_capacity(cylinders_data)
print(cylinders_volume)


{'Capillary A': 0.00015707963267948965, 'Capillary B': 2.356194490192345e-05}


# Вопросы для самопроверки


<details>
<summary>Как создать объект типа кортеж (tuple)?</summary>

    Внутри круглых скобок перечислить через запятую значения: tup = (1, "a", True)
</details> 

<details>
<summary>Кортеж является изменяемым или неизменяемым типом данных?</summary>

    Неизменяемый
</details>

<details>
<summary>Есть ли у кортежей метод .append()?</summary>

    Может быть, но скорее всего нет, ведь кортежи – неизменяемый тип
</details>

<details>
<summary>Что будет результатом выражения: tup[2]?</summary>

    True. Потому что (1, "a", True)[2] -- True
</details>

<details>
<summary>А что будет результатом выражения tup[0] = 10 ?</summary>

    Ошибка! Нельзя менять значения элементов кортежа
</details>

<details>
<summary>Попробуйте создать словарь из двух пар ключ-значение?</summary>

    Например, my_dict = {1: "a", "b": 2}
</details>

<details>
<summary>Можно ли сделать цикл for по словарю?</summary>

    Да. В переменной цикла будут перебираться ключи словаря.
</details>

<details>
<summary>Можно ли в словаре изменить значение под существующим ключом?</summary>

    Да, просто обращаемся по ключу и присваиваем значение. my_dict[key] = new_value
</details>

<details>
    
<summary>Как сделать цикл только по значениям словаря?</summary>

    for val in my_dict.values():
</details>

<details>
<summary>Как получить список всех ключей словаря?</summary>
    
    keys = list(my_dict.keys())
</details>