# Przetwarzanie Grafiki i Muzyki - laboratorium nr 2

In [1]:
import math

import cv2
import numpy as np
import matplotlib.pyplot as plt

# face recognition: https://opencv-tutorial.readthedocs.io/en/latest/face/face.html

%matplotlib inline

## Zadanie 1 (1 punkt)
Proszę zmienić kolor 100 wybranym pikselom na obrazie LENA_512.

In [6]:
lena = cv2.imread("./img/LENA_512.jpg", cv2.IMREAD_COLOR)
height, width, channels = lena.shape

# lena[300:400,300:400] = (0,0,0)

for i in range(100):
    lena[100, i, 0] = 0
    lena[100, i, 1] = 0
    lena[100, i, 2] = 0
    
cv2.imshow("lena", lena)

cv2.waitKey(50)
cv2.destroyAllWindows()

## Zadanie 2 (1 punkt)
Proszę wyświetlić obraz LENA_512 w odcieniach szarości.

In [7]:
lena = cv2.imread("./img/LENA_512.jpg", cv2.IMREAD_GRAYSCALE)
cv2.imshow("lena", lena)

cv2.waitKey(50)
cv2.destroyAllWindows()

## Zadanie 3 (1 punkt)
Proszę wyświetlić obraz LENA_512 w odcianiach szarości, uśredniając kolory bez użycia funkcji cv2.COLOR_GRAY2RGB.

Aby wykonać to zadanie, można policzyć zwykłą średnią arytmetyczną po wartościach pikseli per kanał. Ale aby uzyskać obraz w odcieniach szarości, który będzie lepiej odpowiadał ludzkiej percepcji, można użyć średniej ważonej:

$$
Y = 0.299 \cdot R + 0.587 \cdot G + 0.114 \cdot B,
$$
gdzie:
* Y - luminancja,
* R - "czerwona" składowa danego piksela,
* G - "zielona" składowa danego piksela,
* B - "niebieska" składowa danego piksela.

In [33]:
lena = cv2.imread("./img/LENA_512.jpg")
height, width, channels = lena.shape

# https://docs.opencv.org/3.4/de/d25/imgproc_color_conversions.html

# order of colors is BGR, not RGB
# https://note.nkmk.me/en/python-opencv-imread-imwrite/
# to check that, change 13th line to:
# lena[i, j, (0, 1)] = 0  # changes blue and green channel to 0, leaves image red

for i in range(height):
    for j in range(width):
        lena[i, j] = lena[i, j, 2] * 0.299 + lena[i, j, 1] * 0.587 + lena[i, j, 0] * 0.114

cv2.imshow("lena", lena)

cv2.waitKey(50)
cv2.destroyAllWindows()

## Zadanie 4 (1 punkt)
Proszę wyświetlić obrazek: LENA_512 oraz Statek_640_505	jako negatyw (chodzi o model kolorów CMY).

Załóżmy, że dla każdego kanału wartości pikseli to liczby całkowite z przedziału $0-255$. Wówczas negatyw możemy otrzymać poprzez następujące przekształcenia:

* $B' = 255 - B,$
* $G' = 255 - G,$
* $R' = 255 - R,$

gdzie
* R, G, B - wartości składowych danego piksela w modelu RGB,
* R', G', B' - wartości składowych danego piksela w modelu CMY.

In [28]:
def into_negative(image_path: str, name: str):
    image = cv2.imread(image_path)
    image = 255 - image
    cv2.imshow(name, image)
    cv2.waitKey(50)

into_negative("./img/LENA_512.jpg", "lena")
into_negative("./img/statek_640_505.jpg", "statek")

cv2.destroyAllWindows()

## Zadanie 5 (1 punkt)

Proszę wyświetlić obrazy: LENA_512 oraz Statek_640_505 jako sepię, stosując następujące przekształcenia:

 * $B' = \min(255, (R \cdot 0.272) + (G \cdot 0.534) + (G \cdot 0.131)),$
 * $G' = \min(255, (R \cdot 0.349) + (G \cdot 0.686) + (B \cdot 0.168)),$
 * $R' = \min(255, (R \cdot 0.393) + (G \cdot 0.769) + (G \cdot 0.189)),$

 gdzie $R,B,G$ to wartości składowych danego piksela w modelu RGB.

In [8]:
# problem description wrong, should be R, G, B in multiplications always, not R, G, G

def into_sepia(image_path: str, name: str):
    image = cv2.imread(image_path)
    sepia_filter = np.array([[0.272, 0.534, 0.131],
                             [0.349, 0.686, 0.168],
                             [0.393, 0.769, 0.189]])
    image = cv2.transform(image, sepia_filter)
    cv2.imshow(name, image)
    cv2.waitKey(50)

into_sepia("./img/LENA_512.jpg", "lena")
into_sepia("./img/statek_640_505.jpg", "statek")

cv2.destroyAllWindows()

## Zadanie 6 (3 punkty)
Proszę wyświetlić obraz LENA_512 obrócony o kąt $30$, $45$, $90$ stopni zgodnie ze wzorem:
$$
x' = x \cos(\theta) -y \sin(\theta)
$$
$$
y'= x sin(\theta) + y cos(\theta)
$$

In [25]:
# https://pyimagesearch.com/2021/02/03/opencv-image-translation/
# https://pyimagesearch.com/2021/01/20/opencv-rotate-image/
# https://docs.opencv.org/4.x/da/d6e/tutorial_py_geometric_transformations.html

def angled_image(angle: float):
    image = cv2.imread("./img/LENA_512.jpg")
    # makes more sense to return (height, width, _) as a logical representation of a multidimensional array 
    height, width, _ = image.shape
    # width, height as a point (x, y), not (y, x)
    center = (width // 2, height // 2)
    rotation_matrix = cv2.getRotationMatrix2D(center, angle, 1)
    
    # why (width, height) suddenly, when img.shape returns (height, width, _)?
    # i guess (x, y)
    # the third parameter is for the output image size
    # so if the image's bounds are outside the original, you need to specify bigger (width, height) arguments
    rotated_image = cv2.warpAffine(image, rotation_matrix, (width, height))
    
    cv2.imshow(f"lena_angle_{angle}", rotated_image)
    cv2.waitKey(50)

    
angled_image(30)
angled_image(45)
angled_image(90)

cv2.destroyAllWindows()

## Zadanie 7 (2 punkty)
Proszę wyświetlić przesunięty obraz LENA_512.

In [29]:
# https://subscription.packtpub.com/book/data/9781785283932/1/ch01lvl1sec11/image-translation
# more in-depth: https://datahacker.rs/003-how-to-resize-translate-flip-and-rotate-an-image-with-opencv/
# general transformations: https://analyticsindiamag.com/complete-tutorial-on-image-transformations-with-opencv/

def shift_image(x_pixels: int, y_pixels: int):
    # uses this - https://stackoverflow.com/questions/58107625/opencv-translate-image-wrap-pixels-around-edges-c
    image = cv2.imread("./img/LENA_512.jpg")
    shifted_image = np.roll(image, (x_pixels, y_pixels), (1, 0))
    cv2.imshow(f"lena_shifted_x-{x_pixels}_y-{y_pixels}", shifted_image)
    cv2.waitKey(50)
    
shift_image(200, 0)

cv2.destroyAllWindows()