# <center>  Python for biologists

## Notes 2, F-strings


> Nikita Vaulin, vaulin@ro.ru, tg: @nvaulin
    

***Notion 0***. Feel free to start using shortcuts when working with Jupyter Notebook:
- To run the cell `Ctrl`+`Enter`
- To run the cell and step to the next one `Shift` + `Enter`
- To run the cell and create the new one `Alt` + `Enter`

There are two modes of action: cell-editing (the line on the left is green) and cell-selecting (the line on the left is blue). 

- cell-editing mode &#8594; `Esc` &#8594; cell-selecting mode
- cell-selecting mode &#8594; `Enter` &#8594; cell-editing mode

In cell-selecting mode you can:

- Delete  a cell - `DD`
- Undo deleting - `Z`


### <center> Let's move on!

---

>## Содержание
> - F-строки
> - Несколько фактов про f-строки
> - Применения f-строк в биоинформатике

## F-строки

`F` - от слова *format*. Они нужны, когда мы хотим каким либо образом модифицировать (форматировать) строки в нашем коде. 

Например, я получаю имя человека и хочу с ним поздороваться. Это можно сделать и через сложение строк:

In [143]:
greeting = 'Hello, my name is '
name = 'nikita'
greeting + name

'Hello, my name is nikita'

Но то же самое можно сделать с помощью форматирования строк. Для этого в начале строки ставится символ `f` и нужные нам объекты передаются внутри `{` фигурных `}` скобок.

In [145]:
f'Hello, my name is {name}'

'Hello, my name is nikita'

### Несколько фактов про f-строки.

- **Внутри фигурных скобок можно делать какие-то операции.**

Например, было бы логично сделать имя с заглавной буквы

- **F-строки удобно использовать во всяких таких историях шаблон + конкретный объект**

In [156]:
names = ('nikita', 'sasha', 'lena')
for name in names:
    print(f"Hello, my name is {name}!")

Hello, my name is nikita!
Hello, my name is sasha!
Hello, my name is lena!


In [153]:
f"Hello, my name is {name.capitalize()}!"

'Hello, my name is Lena!'

Можно математические операции делать

In [149]:
my_num = 2
f"Your number is {my_num + 1} (that's a lie)"

"Your number is 3 (that's a lie)"

Но будьте аккуратнее! Какую-то одну штучку сделать ок. Если же вы там какую-то обработку будете делать, это уже будет плохо читаться. Сперва делайте обработку, потом подставляйте в шаблон, чтобы не было все вперемешку.

- **Внутри фигурных скобок можно информативно отобразить переменную:**

Здесь знак `=` - специальный символ, который позволяет подставить само значение.

In [155]:
age = 22
print(f' My {age}')
print(f' My {age = }') 

 My 22
 My age = 22


- **Внутри фигурных скобок форматировать числа с помощью `:`:**

In [170]:
pi = 3.141592653589793846
print(f"Pi is {pi}!")
print(f"Pi is {pi:.2f}!") # float-point, 2 знака после запятой
print(f"Pi is {pi:.3e}!") # exponential, 3 знака после запятой

Pi is 3.141592653589794!
Pi is 3.14!
Pi is 3.142e+00!


In [171]:
print(f"Pi is {pi = :.2f}!") # кстати можно комбинировать:)

Pi is pi = 3.14!


- **Текст внутри  можно дополнительно оформлять для печати:**

Мы тут:
  - Ставим `:` чтобы задать правила оформления
  - Ставим число чтобы задать ширину блока в символах (штуках)
  - Между `:` и числом можно поставить любой символ из `<` `^` `>` чтобы выровнять текст (влево, по-центру и вправо). По-умолчанию выравнивание вправо.
  - Между `:` и символом выравнивания можно добавить символ, которых будет заполнять пустоту

In [194]:
pi = 3
print(f"Pi is {pi}!")
print(f"Pi is {pi:10}! (ширина 10, вправо (дефолт))")
print(f"Pi is {pi:<10}! (ширина 10, влево)")
print(f"Pi is {pi:^10}! (ширина 10, по-центру)")
print(f"Pi is {pi:>10}! (ширина 10, вправо)")
print(f"Pi is {pi:-^10}! (ширина 10, по-центру, заполнили пустоту)")
print(f"Pi is {pi:=^10}! (ширина 10, по-центру, заполнили пустоту)")

Pi is 3!
Pi is          3! (ширина 10, вправо (дефолт))
Pi is 3         ! (ширина 10, влево)
Pi is     3     ! (ширина 10, по-центру)
Pi is          3! (ширина 10, вправо)
Pi is ----3-----! (ширина 10, по-центру, заполнили пустоту)
Pi is ====3=====! (ширина 10, по-центру, заполнили пустоту)


- **Можно форматировать не только текст и числа, но и целые даты!:**

Здесь используются символы через `%`. Посмотреть значение каждого можно в [табличке тут](https://docs.python.org/3/library/datetime.html#datetime.timezone). Между ними можно писать что угодно


In [203]:
import datetime
today = datetime.datetime.today()
print(f"{today:%Y-%m-%d}") # год месяц день
print(f"{today:Year %Y, month %m, day %d}") # год месяц день
print(f"{today:%H:%M (%I:%M%p)}") # часы:минуты (часы:минуты в 12-часовом формате)

2023-10-10
Year 2023, month 10, day 10
22:30 (10:30PM)


- **Можно делать f-строки вложенными, если менять типы кавычек:**

*только зачем...*


In [204]:
x = 'F-string'
print(f'''-{f"""*{f"+{f'.{x}.'}+"}*"""}-''')

-*+.F-string.+*-


### Применения f-строк в биоинформатике

Тут чисто примеры, самих применений немеренное множество

- **Писать сообщение пользователю**

    Например, если он ввел вам неправильную операцию 

In [206]:
operation = 'multiply'
operations = ['add', 'divide']

if operation not in operations:
    print( f"Unknown operation {operation}!")

Unknown operation multiply!


- **Простейшее логгирование - уведомлять какой образец был обработан**

In [215]:
# Набор образцов
samples = [
    'A1', 'A2', 
    'B1', 'B2'
]

# Функция которую нам нужно с ними сделать (очень полезная, но долгая)
def some_doings(data):
    for i in range(1, 10000):
        nothing = 0
    return data

# перебираем образцы
for sample in samples:
    print(f'{sample:-^32}') # взяли образец
    print('Start doings') # оповестили что начали работу
    sample = some_doings(sample)
    print(f'Sample {sample} succesefully processed') # оповестили о завершении

---------------A1---------------
Start doings
Sample A1 succesefully processed
---------------A2---------------
Start doings
Sample A2 succesefully processed
---------------B1---------------
Start doings
Sample B1 succesefully processed
---------------B2---------------
Start doings
Sample B2 succesefully processed


- **Читать и записывать файлы с сложными названиями, формировать названия образцов и т.п.**

In [218]:
import os

# Набор образцов
samples = [
    'A1', 'A2', 
    'B1', 'B2'
]

def read_file(path):
    return 666

# перебираем образцы
for sample in samples:
    filename = f'ChIPSeq_{sample}_filtered.fastq.gz'
    path = os.path.join('data', filename)
    print(f'Reading file `{path}`' )

Reading file `data/ChIPSeq_A1_filtered.fastq.gz`
Reading file `data/ChIPSeq_A2_filtered.fastq.gz`
Reading file `data/ChIPSeq_B1_filtered.fastq.gz`
Reading file `data/ChIPSeq_B2_filtered.fastq.gz`


Тут понятно можно выдумывать что-то совсем жуткое))

```python
for qval in (0.01, 0.05):
    for res in (50000, 100000):
        for bl in (0.01, 0.1, 0.5):
            filename = f"HiC_{res//1000}kb_bl{bl}_merged_all_q{qval}.pkl"
            path = os.path.join('data', filename)
            df = pd.read_pickle(path)
```

- **И многое многое другое...**

In [166]:
samples = [1, 2, 3, 4]
for sample in samples:
    filename = f'ChIPseq_sample{sample}.fastq'
    print(filename)

ChIPseq_sample1.fastq
ChIPseq_sample2.fastq
ChIPseq_sample3.fastq
ChIPseq_sample4.fastq


In [141]:
samples = [1, 2, 3, 4]
for sample in samples:
    print(f'{sample:=10}')
    filename = f'ChIPseq_run{sample}.fastq'
    print(filename)

         1
ChIPseq_run1.fastq
         2
ChIPseq_run2.fastq
         3
ChIPseq_run3.fastq
         4
ChIPseq_run4.fastq
