# Циклы, Функции и Классы

Этот notebook познакомит вас с основными конструкциями Python через примеры из биологии.

## 1. Циклы

Циклы позволяют выполнять одни и те же действия много раз.

### 1.1 Цикл for - перебор последовательностей

Используется когда нужно пройтись по элементам списка, строки или другой последовательности.

In [None]:
# Пример: анализ ДНК последовательности
dna_sequence = "ATGCGATCGTAGC"

# Подсчет каждого нуклеотида
for nucleotide in dna_sequence:
    print(f"Нуклеотид: {nucleotide}")

In [None]:
# Подсчет количества каждого нуклеотида
dna = "ATGCGATCGTAGCATGC"

count_A = 0
count_T = 0
count_G = 0
count_C = 0

for base in dna:
    if base == 'A':
        count_A += 1
    elif base == 'T':
        count_T += 1
    elif base == 'G':
        count_G += 1
    elif base == 'C':
        count_C += 1

print(f"A: {count_A}, T: {count_T}, G: {count_G}, C: {count_C}")

In [None]:
# Работа со списком генов
genes = ["BRCA1", "TP53", "EGFR", "MYC", "KRAS"]

print("Анализируем гены:")
for gene in genes:
    print(f"- Ген {gene} имеет длину названия {len(gene)} символов")

In [None]:
# Цикл с range() - для повторения действий n раз
# Симуляция деления клеток
initial_cells = 1
generations = 5

print(f"Начальное количество клеток: {initial_cells}")
cells = initial_cells

for generation in range(generations):
    cells = cells * 2  # Каждая клетка делится на 2
    print(f"Поколение {generation + 1}: {cells} клеток")

### 1.2 Цикл while - выполнение пока условие истинно

In [None]:
# Пример: рост бактериальной культуры до определенного размера
bacterial_count = 100
target_population = 10000
hours = 0

print(f"Начальная популяция: {bacterial_count} бактерий")

while bacterial_count < target_population:
    bacterial_count = bacterial_count * 1.5  # Рост на 50% в час
    hours += 1
    print(f"Час {hours}: {bacterial_count:.0f} бактерий")

print(f"\nЦелевая популяция достигнута за {hours} часов!")

### 1.3 Вложенные циклы

In [None]:
# Анализ микропланшета 96-луночного (8 рядов x 12 колонок)
rows = ['A', 'B', 'C', 'D']
columns = [1, 2, 3, 4]

print("Координаты лунок:")
for row in rows:
    for col in columns:
        print(f"{row}{col}", end="  ")
    print()  # Новая строка после каждого ряда

## 2. Функции

Функции - это переиспользуемые блоки кода, которые выполняют определенную задачу.

### 2.1 Простые функции

In [None]:
# Функция для подсчета GC-содержания
def calculate_gc_content(dna_sequence):
    """Вычисляет процент GC-содержания в ДНК последовательности"""
    g_count = dna_sequence.count('G')
    c_count = dna_sequence.count('C')
    total = len(dna_sequence)
    
    gc_content = (g_count + c_count) / total * 100
    return gc_content

# Использование функции
sequence1 = "ATGCGATCGTAGC"
sequence2 = "AAATTTGGGCCC"

print(f"GC-содержание последовательности 1: {calculate_gc_content(sequence1):.2f}%")
print(f"GC-содержание последовательности 2: {calculate_gc_content(sequence2):.2f}%")

In [None]:
# Функция для транскрипции ДНК в РНК
def transcribe(dna_sequence):
    """Транскрибирует ДНК в РНК (заменяет T на U)"""
    rna_sequence = dna_sequence.replace('T', 'U')
    return rna_sequence

dna = "ATGCGATCG"
rna = transcribe(dna)
print(f"ДНК: {dna}")
print(f"РНК: {rna}")

### 2.2 Функции с несколькими параметрами

In [None]:
# Функция для расчета концентрации после разведения
def calculate_dilution(initial_concentration, initial_volume, final_volume):
    """Рассчитывает финальную концентрацию после разведения"""
    final_concentration = (initial_concentration * initial_volume) / final_volume
    return final_concentration

# Пример: разведение 10 мкл раствора с концентрацией 100 мкМ до 100 мкл
final_conc = calculate_dilution(100, 10, 100)
print(f"Финальная концентрация: {final_conc} мкМ")

### 2.3 Функции с параметрами по умолчанию

In [None]:
# Функция для расчета роста популяции
def population_growth(initial_pop, growth_rate=0.1, time_periods=10):
    """Рассчитывает размер популяции через заданное время"""
    final_pop = initial_pop * (1 + growth_rate) ** time_periods
    return final_pop

# Использование с параметрами по умолчанию
print(f"Популяция через 10 периодов: {population_growth(1000):.0f}")

# Изменение параметров
print(f"Популяция через 20 периодов: {population_growth(1000, time_periods=20):.0f}")
print(f"Популяция с ростом 20%: {population_growth(1000, growth_rate=0.2):.0f}")

### 2.4 Функции, возвращающие несколько значений

In [None]:
# Функция для анализа ДНК последовательности
def analyze_dna(sequence):
    """Возвращает длину, GC-содержание и комплементарную последовательность"""
    length = len(sequence)
    gc_content = calculate_gc_content(sequence)
    
    # Создание комплементарной последовательности
    complement_map = {'A': 'T', 'T': 'A', 'G': 'C', 'C': 'G'}
    complement = ''.join([complement_map[base] for base in sequence])
    
    return length, gc_content, complement

# Использование
seq = "ATGCGATCG"
length, gc, comp = analyze_dna(seq)

print(f"Последовательность: {seq}")
print(f"Длина: {length} нуклеотидов")
print(f"GC-содержание: {gc:.2f}%")
print(f"Комплемент: {comp}")

## 3. Классы

Классы позволяют создавать собственные типы данных с их свойствами и методами.

### 3.1 Простой класс

In [None]:
# Класс для представления гена
class Gene:
    def __init__(self, name, sequence):
        """Инициализация гена"""
        self.name = name
        self.sequence = sequence
    
    def get_length(self):
        """Возвращает длину последовательности"""
        return len(self.sequence)
    
    def get_gc_content(self):
        """Возвращает GC-содержание"""
        return calculate_gc_content(self.sequence)
    
    def transcribe(self):
        """Возвращает РНК последовательность"""
        return self.sequence.replace('T', 'U')

# Создание объекта гена
brca1 = Gene("BRCA1", "ATGCGATCGTAGCATGC")

print(f"Ген: {brca1.name}")
print(f"Последовательность: {brca1.sequence}")
print(f"Длина: {brca1.get_length()} нуклеотидов")
print(f"GC-содержание: {brca1.get_gc_content():.2f}%")
print(f"РНК: {brca1.transcribe()}")

### 3.2 Класс с более сложной логикой

In [None]:
# Класс для моделирования клеточной культуры
class CellCulture:
    def __init__(self, name, initial_cells, growth_rate):
        """Инициализация клеточной культуры"""
        self.name = name
        self.cell_count = initial_cells
        self.growth_rate = growth_rate  # Скорость роста за период
        self.passages = 0
    
    def grow(self, time_periods):
        """Моделирует рост культуры"""
        for period in range(time_periods):
            self.cell_count *= (1 + self.growth_rate)
        print(f"{self.name}: {self.cell_count:.0f} клеток после {time_periods} периодов")
    
    def passage(self, split_ratio):
        """Пассаж культуры (перенос части клеток)"""
        self.cell_count = self.cell_count / split_ratio
        self.passages += 1
        print(f"{self.name}: Пассаж {self.passages}, осталось {self.cell_count:.0f} клеток")
    
    def status(self):
        """Выводит текущий статус культуры"""
        print(f"\n=== {self.name} ===")
        print(f"Количество клеток: {self.cell_count:.0f}")
        print(f"Скорость роста: {self.growth_rate*100:.1f}%")
        print(f"Число пассажей: {self.passages}")

# Создание и работа с культурой
hela = CellCulture("HeLa", initial_cells=10000, growth_rate=0.2)
hela.status()

hela.grow(5)
hela.passage(split_ratio=4)
hela.grow(3)
hela.status()

### 3.3 Класс для белка

In [None]:
# Класс для работы с белками
class Protein:
    def __init__(self, name, sequence):
        """Инициализация белка (sequence - последовательность аминокислот)"""
        self.name = name
        self.sequence = sequence
        
        # Молекулярные массы аминокислот (Да)
        self.aa_weights = {
            'A': 89, 'R': 174, 'N': 132, 'D': 133, 'C': 121,
            'E': 147, 'Q': 146, 'G': 75, 'H': 155, 'I': 131,
            'L': 131, 'K': 146, 'M': 149, 'F': 165, 'P': 115,
            'S': 105, 'T': 119, 'W': 204, 'Y': 181, 'V': 117
        }
    
    def get_length(self):
        """Возвращает длину белка в аминокислотах"""
        return len(self.sequence)
    
    def calculate_molecular_weight(self):
        """Вычисляет молекулярную массу белка"""
        weight = sum(self.aa_weights.get(aa, 0) for aa in self.sequence)
        return weight
    
    def count_amino_acid(self, amino_acid):
        """Подсчитывает количество определенной аминокислоты"""
        return self.sequence.count(amino_acid)
    
    def get_composition(self):
        """Возвращает аминокислотный состав"""
        composition = {}
        for aa in set(self.sequence):
            composition[aa] = self.sequence.count(aa)
        return composition

# Пример использования
insulin = Protein("Insulin", "MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKA")

print(f"Белок: {insulin.name}")
print(f"Длина: {insulin.get_length()} аминокислот")
print(f"Молекулярная масса: {insulin.calculate_molecular_weight()} Да")
print(f"Количество лейцина (L): {insulin.count_amino_acid('L')}")
print(f"\nАминокислотный состав:")
for aa, count in sorted(insulin.get_composition().items()):
    print(f"  {aa}: {count}")

### 3.4 Наследование классов

In [None]:
# Базовый класс для организма
class Organism:
    def __init__(self, species, age):
        self.species = species
        self.age = age
    
    def get_info(self):
        return f"{self.species}, возраст: {self.age} лет"

# Класс для бактерии (наследуется от Organism)
class Bacteria(Organism):
    def __init__(self, species, age, gram_positive):
        super().__init__(species, age)
        self.gram_positive = gram_positive
    
    def get_info(self):
        gram_type = "грамположительная" if self.gram_positive else "грамотрицательная"
        return f"{super().get_info()}, {gram_type}"

# Класс для растения (наследуется от Organism)
class Plant(Organism):
    def __init__(self, species, age, photosynthetic):
        super().__init__(species, age)
        self.photosynthetic = photosynthetic
    
    def get_info(self):
        photo = "фотосинтезирующее" if self.photosynthetic else "не фотосинтезирующее"
        return f"{super().get_info()}, {photo}"

# Создание объектов
ecoli = Bacteria("E. coli", 0.001, gram_positive=False)
arabidopsis = Plant("Arabidopsis thaliana", 0.5, photosynthetic=True)

print(ecoli.get_info())
print(arabidopsis.get_info())

## 4. Практические задания

Попробуйте решить эти задачи самостоятельно!

### Задание 1: Найти все старт-кодоны (ATG) в последовательности

In [None]:
# Напишите функцию, которая находит все позиции старт-кодона ATG в последовательности
def find_start_codons(sequence):
    # Ваш код здесь
    pass

# Тест
test_seq = "ATGCGATCGATGATGAAATGATC"
# Должно вернуть [0, 11, 17]

### Задание 2: Создайте класс для ПЦР реакции

In [None]:
# Создайте класс PCR с параметрами:
# - начальное количество копий ДНК
# - количество циклов
# - эффективность амплификации (по умолчанию 0.95)
# Метод amplify() должен рассчитывать финальное количество копий

class PCR:
    # Ваш код здесь
    pass

# Тест
# pcr = PCR(initial_copies=100, cycles=30)
# pcr.amplify()

### Задание 3: Калькулятор разведений

In [None]:
# Напишите функцию для расчета серийных разведений
# Входные параметры: начальная концентрация, коэффициент разведения, количество разведений
# Возвращает список всех концентраций

def serial_dilution(initial_conc, dilution_factor, num_dilutions):
    # Ваш код здесь
    pass

# Тест
# serial_dilution(1000, 10, 5)
# Должно вернуть [1000, 100, 10, 1, 0.1]