I. Зображення як багатовимірні масиви та підготовка зображень до подальшого аналізу
===================================================================================

_Image Analysis with Python and Napari, Bioinformatics for Ukraine course, 6-24 October 2025, Kyiv, Ukraine._

_© Borys Olifirov, 2025_

__План:__
- Основні властивості та відмінності списків _python_ та масивів _numpy_
- Багатовимірні масиви _numpy_, індексація та операції з багатовимірними масивами
- Зчитування та відображення зображень, кольорові мапи
- Попередня обробка зображень, компенсація фонової інтенсивності

---

In [None]:
import numpy as np
import tifffile as tiff
import matplotlib.pyplot as plt

# Списки vs. масиви
---

### Основні властивості

Списки python

In [None]:
demo_list = [0, 1, 4, 6, 2]
demo_list

In [None]:
try:
    demo_list > 1
except TypeError:
    print('Imposible operation!')

In [None]:
demo_list * 2  # подвоєння списку

In [None]:
demo_list = [1, False, 3, 'a']  # список може містити різні типи даних
print(demo_list)

print(type(demo_list[0]))
print(type(demo_list[1]))
print(type(demo_list[-1]))

Масиви numpy

In [None]:
demo_arr = np.array([0, 1, 4, 6, 2])
print(demo_arr)
print(demo_arr.dtype)  # всі елементи масиву відносяться до одного типу даних

In [None]:
demo_arr_mixed = np.array([0, 1, 4, 'a', 2])
print(demo_arr_mixed)
print(demo_arr_mixed.dtype)  # Unicode, символьний тип дних

In [None]:
demo_arr > 1

In [None]:
try:
    demo_arr > 1
except TypeError:
    print('Imposible operation')

In [None]:
demo_arr * 2  # застосування операції до кожного елементу масиву

In [None]:
try:
    demo_arr_mixed * 2
except TypeError:
    print('Imposible operation')

### Багатовимірність та індексація

Двовимірний список

In [None]:
list_2d = [[1,2],[3,4],[5,6]]
list_2d

Двовимірний масив та їх індексація

In [None]:
arr_2d = np.array([[1,1,1],[2,2,2],[3,3,3]])  # "зображення" розміром 3x3 пікседі

print(arr_2d.shape)
arr_2d

In [None]:
arr_2d[0,0]

In [None]:
arr_2d[:2,0]

In [None]:
arr_2d[-1,-1]

In [None]:
arr_2d[0:2]  # другий індекс не включається в зріз

In [None]:
arr_2d[1:]  # перший індекс включається в зріз

Векторизовані операції з масивами

In [None]:
arr_2d * 2

In [None]:
arr_2d[:2] >= 3

In [None]:
arr_2d + np.array([1,1])  # векторизовані операції із двома масивами можливі, якщо співпадають розмірності

In [None]:
arr_2d + np.array([1,1,1])

Тривимірні масиви та їх індексація

In [None]:
arr_3d = np.array([[[0,0],  # 3 "кадри" розміром 2x2 пікселі
                    [0,0]],
                   [[1,1],
                    [1,1]],
                   [[2,2],
                    [2,2]]])

print(arr_3d.shape)
arr_3d

In [None]:
arr_3d[0,0,0]

In [None]:
for frame in arr_3d:  # ітерація відбувається по першому виміру масиву
    print(frame.shape)
    print(frame)
    print('---')

# Зображення як масиви NumPy
---

### Зчитування та відображення зображень

In [None]:
# demo_image = skimage.data.human_mitosis()
image = tiff.imread('demo_data/2D_grey_matter_neurofilaments.tif')
print(image.dtype)
print(image.shape)

In [None]:
plt.figure(figsize=(5,5))
plt.imshow(image, cmap='Greys_r')

In [None]:
crop_image = image[1100:1500,350:750]
print(crop_image.shape)

plt.figure(figsize=(5,5))
plt.imshow(crop_image, cmap='Greys_r')

### Кольорові мапи

In [None]:
from matplotlib.colors import LinearSegmentedColormap

def plot_linearmap(cdict):
    ''' Функція для візуалізації кольорової мапи.
    Не питайте, як це працює, це matplotlib-магія з глибин stack-overflow.
    
    '''
    newcmp = LinearSegmentedColormap('testCmap', segmentdata=cdict, N=256)
    rgba = newcmp(np.linspace(0, 1, 256))
    fig, ax = plt.subplots(figsize=(4, 3), constrained_layout=True)
    col = ['r', 'g', 'b']
    for i in range(3):
        ax.plot(np.arange(256)/256, rgba[:, i], color=col[i])
    ax.set_xlabel('itensity')
    ax.set_ylabel('RGB')
    plt.show()

Однокольорові мапи

In [None]:
# створення та відображення кольорової мапи
dict_red = {'red':(
            (0.0, 0.0, 0.0),
            # (0.25, 0.1, 0.1),  # збільшення контрасту шляхом заниження яскравості пікселів низької інтенсивності
            (1.0, 1.0, 1.0)),
            'blue':(
            (0.0, 0.0, 0.0),
            (1.0, 0.0, 0.0)),
            'green':(
            (0.0, 0.0, 0.0),
            (1.0, 0.0, 0.0))}
cmap_red = LinearSegmentedColormap('Red_cmap', dict_red)

plt.figure(figsize=(5,5))
plt.imshow(crop_image, cmap=cmap_red)


plot_linearmap(dict_red)

Багатоколірні мапи

In [None]:
dict_blue_red = {'red':(
                 (0.0, 0.0, 0.0),
                 (0.6, 0.25, 0.25),
                 (1.0, 1.0, 1.0)),
                 'blue':(
                 (0.0, 1.0, 1.0),
                 (0.4, 0.25, 0.25),
                 (1.0, 0.0, 0.0)),
                 'green':(
                 (0.0, 0.0, 0.0),
                 (0.2, 0.0, 0.0),
                 (0.5, 0.75, 0.75),
                 (0.8, 0.0, 0.0),
                 (1.0, 0.0, 0.0))}
cmap_blue_red = LinearSegmentedColormap('BR_cmap', dict_blue_red)

plt.figure(figsize=(5,5))
plt.imshow(crop_image, cmap=cmap_blue_red)

plot_linearmap(dict_blue_red)

# Корекція фонової інтенсивності
---

### Гістограма зображення

In [None]:
print(crop_image.min())
print(crop_image.max())

plt.figure(figsize=(15,5))
plt.hist(crop_image.ravel(), bins=256)
plt.show()

Візьмемо більш драматичний випадок для ілюстративності

In [None]:
bad_image = tiff.imread('demo_data/4D_live_HEK_spectral_time_series.tiff')[1,4]
print(bad_image.shape)
print(bad_image.dtype)
print(bad_image.min())
print(bad_image.max())

plt.figure(figsize=(5,5))
plt.imshow(bad_image, cmap='jet')

In [None]:
plt.figure(figsize=(15,5))
plt.hist(bad_image.ravel(), bins=256)
plt.show()

In [None]:
plt.figure(figsize=(15,5))
plt.hist(bad_image.ravel(), bins=256)
plt.yscale('log')
plt.show()

### Оцінка фонової інтенсивності за фрагментом зображення

In [None]:
roi_background_int = np.mean(bad_image[0:50, 270:], dtype=np.uint32)
print(roi_background_int)

import matplotlib.patches as patches
crop_rect = patches.Rectangle((0, 270), 50, 50,
                              linewidth=1.5, edgecolor='white', facecolor='none')

fig, ax = plt.subplots(figsize=(5,5))
ax.imshow(bad_image, cmap='jet')
ax.add_patch(crop_rect)
plt.show()

In [None]:
bad_image_corrected = bad_image - roi_background_int

fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10,5))

ax0.hist(bad_image.ravel(), bins=256)
# ax0.set_yscale('log')
ax0.set_title('Raw')

ax1.hist(bad_image_corrected.ravel(), bins=256)
# ax1.set_yscale('log')
ax1.set_title('Without background')

plt.show()

In [None]:
plt.subplots(figsize=(5,5))
plt.imshow(bad_image_corrected, cmap='jet')
plt.show()

In [None]:
# у випадку використання цілих чисел відбувається переповнення
a = np.uint16(150)
b = np.uint16(160)
c = a - b
print(c)

In [None]:
# а використання чисел із плаваючою комою розмір зображення збільшиться вдвічі
a = np.float32(150)
b = np.uint16(160)
c = a - b
print(c)
print(c.dtype)

### Оцінка фонової інтенсивності за гістограмою

In [None]:
# перший перцентіль значень інтенсивності як оцінка фону
perc_background_int = np.percentile(bad_image, 1)
perc_background_int

In [None]:
# віднімання фону і перевірка на наявність від'ємних значень
bad_image_pre_corrected = bad_image - perc_background_int
bad_image_pre_corrected.min()

In [None]:
# корекція від'ємних значень
bad_image_corrected = bad_image_pre_corrected.clip(min=0)
bad_image_corrected.min()

In [None]:
# конвертація відкорегованого зображення
print(f'Data type after correction: {bad_image_corrected.dtype}, image size {bad_image_corrected.nbytes/1000} kB')

bad_image_preprocessed = bad_image_corrected.astype(np.uint16)

print(f'Final data type: {bad_image_preprocessed.dtype}, image size {bad_image_preprocessed.nbytes/1000} kB')

plt.subplots(figsize=(5,5))
plt.imshow(bad_image_preprocessed, cmap='jet')
plt.show()

### Оформлення кроків корекції фонової інтенсивності у функції

Оформлення всіх кроків корекції фонової інтенсивності у функцію

In [None]:
def background_correction(input_img:np.ndarray, background_percentile:float=1):
    back_int = np.percentile(input_img, background_percentile)
    corr_img = input_img - back_int
    corr_img = corr_img.clip(min=0)
    return corr_img.astype(input_img.dtype)

Альтернативний варіант оформлення функції з використанням __list comprehension__ та __lambda-функції__

In [None]:
bc = lambda img, p=1.0:np.array(img - np.percentile(img, p)).clip(min=0).astype(dtype=img.dtype)

### Збереження зображення після попередньої обробки

In [None]:
tiff.imwrite('data/preproc_img.tiff', bc(bad_image))

<!-- # Завдання
---

- __Якщо не маєете власни даних:__ обрати демонстраційні дані для роботи і ознайомитись з їх описом та завданнями до них.
- __Якщо маєте власні дані:__ сформулювати завдання до власних даних, які хотілось би отримати кількісні параметри із зображень і які кроки на шляху до цього Ви вбачаєте. 
- Стоворити робочий jupyther ноутбуку і завантажити обрані для роботи зображення.
- _Опціонально:_ кропнути обрані зображення, щоб в подальшій роботі використовувати менші за розміром і максимально показові фрагменти.
- _Опціонально:_ створити функцію, що проводила би корекцію фонової інтенсивності приймаючи на всіх початкове зображення і список із координат регіону, за середньою інтенсивністю якого відбувається оцінка фону (в форматі `[x_start, x_end, y_start, y_end]`). -->

---

# Завдання

- __За відсутності власних зображень:__ обрати із демонстраційних зображення для подальшої роботи та ознайомитись із завданнями щодо його аналізу.
- __За наявності власних зображень:__ сформувати перелік завдань щодо аналізу власних даних, спробувати сформулювати характеристики чи величини, що необхідно оцінити і які кроки передують отриманню значень цих характеристик/величин.
- Провести попередню обробку обраних для подальшої роботи даних, за необхідності провести кроп зображення щоб лишити лише значущі регіони і провести корекцію фонової інтенсивності.
- _Опціонально_ адапувати одну з наведених вище функції для корекції фонової інтенсивності для використання із 3D-зображеннями та часовими серіями зображень.
- _Опіціонально_ створити функцію для корекції фонової інтенсивності, що приймала би на всіх початкове зображення та координати регіону, ща середньою інтенсивністю якого відбувається оцінка фонової інтенсивності (координати можна передавати функції у вигляді списку виду `[x_start, x_end, y_start, y_end]`).