# Image manipulations & Processing

## Transformations


### تبدیل‌ها (Transformations)

تبدیل‌ها در پردازش تصویر به معنای اعمال تغییرات بر روی تصاویر برای بهبود، تغییر شکل، یا استخراج ویژگی‌های خاص از آن‌ها است. این تغییرات می‌توانند شامل چرخش، تغییر اندازه، برش، وارونگی، تغییر شدت روشنایی و کنتراست، و یا اعمال فیلترهای مختلف باشند. هدف اصلی تبدیل‌ها آماده‌سازی تصاویر برای تحلیل‌های بعدی یا بهبود کیفیت نمایش آن‌ها است.

**:مدل های مختلف تبدیل ها**
- وابسته (Affine)
- غیر وابسته (Non-affine)

**تبدیل‌های وابسته (Affine):**  
تبدیل‌های وابسته نوعی از تبدیل‌ها هستند که در آن‌ها خطوط مستقیم به خطوط مستقیم تبدیل می‌شوند و نسبت‌های بین نقاط حفظ می‌شود. این تبدیل‌ها شامل انتقال (Translation)، چرخش (Rotation)، مقیاس‌بندی (Scaling)، و برش (Shearing) هستند. در این نوع تبدیل‌ها، موازی بودن خطوط نیز حفظ می‌شود.

**تبدیل‌های غیر وابسته (Non-affine):**  
تبدیل‌های غیر وابسته شامل تغییراتی هستند که در آن‌ها خطوط مستقیم ممکن است به خطوط منحنی تبدیل شوند و نسبت‌های بین نقاط لزوماً حفظ نمی‌شود. این تبدیل‌ها معمولاً برای تغییر شکل‌های پیچیده‌تر مانند اعوجاج (Distortion) یا تغییرات غیرخطی استفاده می‌شوند. این نوع تبدیل‌ها برای کاربردهایی مانند مدل‌سازی تغییرات پیچیده در تصاویر یا تطبیق تصاویر با سطوح منحنی استفاده می‌شوند.

## Moving up,down,left and right

### ماتریس تبدیل

ماتریس تبدیل برای جابه‌جایی تصویر به صورت افقی و عمودی به کار می‌رود. این ماتریس به شکل زیر تعریف می‌شود:

**T = [[1 0 Tx]**  
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**[0 1 Ty]]**

- **Tx**: مقدار جابه‌جایی در جهت افقی (چپ و راست)  
- **Ty**: مقدار جابه‌جایی در جهت عمودی (بالا و پایین)  

این مقادیر تعیین می‌کنند که تصویر به چه میزان و در چه جهتی جابه‌جا شود.

In [3]:
import cv2
import numpy as np

image = cv2.imread('image.jpg')

# Store height and width of the image
height , width = image.shape[:2]

quarter_height , quarter_width = height // 4, width // 4

#       | 1   0   Tx |
# T  =  | 0   1   Ty |

# T is our translation matrix
T = np.float32([[1, 0, quarter_width], [0, 1, quarter_height]])

#We use warpAffine to apply the translation matrix to the image
translated_image = cv2.warpAffine(image, T, (width, height))
cv2.imshow('Translated Image', translated_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Rotation

### ماتریس چرخش

ماتریس چرخش برای چرخاندن تصویر حول یک نقطه مشخص (معمولاً مرکز تصویر) به کار می‌رود. این ماتریس به شکل زیر تعریف می‌شود:

**R = [[cos(θ) -sin(θ) 0]**  
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**[sin(θ)  cos(θ) 0]]**

- **θ**: زاویه چرخش (بر حسب درجه یا رادیان)  
- **cos(θ)** و **sin(θ)**: مقادیر کسینوس و سینوس زاویه چرخش  

این مقادیر تعیین می‌کنند که تصویر به چه میزان و در چه جهتی (ساعت‌گرد یا پادساعت‌گرد) چرخانده شود.

In [4]:
import cv2
import numpy as np

image = cv2.imread('image.jpg')
height , width = image.shape[:2]

# Divide by two to rotate the image around its center
rotation_matrix = cv2.getRotationMatrix2D((width / 2, height / 2), 90, 1)
rotated_image = cv2.warpAffine(image, rotation_matrix, (width, height))


cv2.imshow('Rotated Image', rotated_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

### از بین بردن قسمت های سیاه تصویر

In [5]:
rotated_image = cv2.transpose(image)

cv2.imshow('Transposed Image', rotated_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Re-sizing, Scaling & Interpolation

**تغییر اندازه (Re-sizing):**  
تغییر اندازه به معنای تغییر ابعاد تصویر (عرض و ارتفاع) است. این فرآیند می‌تواند برای کوچک‌تر یا بزرگ‌تر کردن تصویر استفاده شود. تغییر اندازه معمولاً برای تطبیق تصویر با ابعاد خاص یا کاهش حجم داده‌ها به کار می‌رود.

**مقیاس‌بندی (Scaling):**  
مقیاس‌بندی به معنای تغییر اندازه تصویر با حفظ نسبت ابعاد اصلی آن است. در این فرآیند، تصویر به صورت یکنواخت بزرگ‌تر یا کوچک‌تر می‌شود تا از تغییر شکل غیرطبیعی جلوگیری شود.

**درون‌یابی (Interpolation):**  
درون‌یابی فرآیندی است که برای تعیین مقادیر پیکسل‌های جدید در هنگام تغییر اندازه یا مقیاس‌بندی تصویر استفاده می‌شود. این فرآیند شامل روش‌هایی مانند نزدیک‌ترین همسایه (Nearest Neighbor)، دوخطی (Bilinear) و دوکعبی (Bicubic) است. انتخاب روش مناسب درون‌یابی می‌تواند بر کیفیت تصویر نهایی تأثیر بگذارد. از مدل‌های مختلف درون‌یابی می‌توان به:

- **cv2.INTER_AREA** - مناسب برای کوچک کردن تصویر  
- **cv2.INTER_NEAREST** - سریع‌ترین روش، اما با کیفیت پایین‌تر  
- **cv2.INTER_LINEAR** - پیش‌فرض برای بزرگ کردن تصویر  
- **cv2.INTER_CUBIC** - کیفیت بالاتر برای بزرگ کردن تصویر، اما کندتر(از قبلی بهتره)  
- **cv2.INTER_LANCZOS4** - کیفیت بالا برای تغییر اندازه، اما بسیار کند(از همه بهتره)  

In [7]:
import cv2
import numpy as np

image = cv2.imread('image.jpg')

# let's make our image 3/4 of its original size
image_scaled = cv2.resize(image, None, fx=0.75,fy=0.75)
cv2.imshow('Scaled Image - Linear Interpolation', image_scaled)
cv2.waitKey()

# let's double the size of our image
image_scaled = cv2.resize(image, None, fx=2,fy=2, interpolation=cv2.INTER_CUBIC)
cv2.imshow('Scaled Image - Cubic Interpolation', image_scaled)
cv2.waitKey()

# let's skew the re-sizing by setting exact dimensions
image_scaled = cv2.resize(image, (900, 400), interpolation=cv2.INTER_AREA)
cv2.imshow('Scaled Image - Area Interpolation', image_scaled)
cv2.waitKey()

cv2.destroyAllWindows()

## Image Pyramids
در این روش، مقیاس (Scale) تصویر را بزرگ‌تر یا کوچک‌تر می‌کنیم. این کار به شما امکان می‌دهد تا از یک تصویر، نسخه‌های مختلفی با مقیاس‌های متفاوت ایجاد کنید. این تکنیک معمولاً برای پردازش چندمقیاسی (Multi-Scale Processing) و تحلیل تصاویر در سطوح مختلف جزئیات استفاده می‌شود.

In [1]:
import cv2

# Load the image
image = cv2.imread('image.jpg')

# smaller & bigger versions of the image
smaller = cv2.pyrDown(image)
bigger = cv2.pyrUp(image)

# Display the images
cv2.imshow('Original Image', image)
cv2.imshow('Smaller Image', smaller)
cv2.imshow('Bigger Image', bigger)
cv2.waitKey(0)
cv2.destroyAllWindows()

این کد برای تغییر مقیاس تصویر با استفاده از تکنیک‌های "هرم تصویر" (Image Pyramids) در OpenCV استفاده می‌شود. در ادامه توضیح هر بخش آورده شده است:

1. **بارگذاری تصویر اصلی**  
    ```python
    image = cv2.imread('image.jpg')
    ```
    در این خط، تصویر اصلی با استفاده از تابع `cv2.imread` از فایل خوانده می‌شود و در متغیر `image` ذخیره می‌شود.

2. **ایجاد نسخه کوچک‌تر تصویر**  
    ```python
    smaller = cv2.pyrDown(image)
    ```
    این خط از تابع `cv2.pyrDown` برای کوچک‌تر کردن تصویر استفاده می‌کند. این تابع ابعاد تصویر را به نصف کاهش می‌دهد و نسخه کوچک‌تر تصویر را در متغیر `smaller` ذخیره می‌کند.

3. **ایجاد نسخه بزرگ‌تر تصویر**  
    ```python
    bigger = cv2.pyrUp(image)
    ```
    این خط از تابع `cv2.pyrUp` برای بزرگ‌تر کردن تصویر استفاده می‌کند. این تابع ابعاد تصویر را دو برابر می‌کند و نسخه بزرگ‌تر تصویر را در متغیر `bigger` ذخیره می‌کند.

4. **نمایش تصاویر**  
    ```python
    cv2.imshow('Original Image', image)
    cv2.imshow('Smaller Image', smaller)
    cv2.imshow('Bigger Image', bigger)
    ```
    این خطوط از تابع `cv2.imshow` برای نمایش تصاویر استفاده می‌کنند. تصویر اصلی، نسخه کوچک‌تر و نسخه بزرگ‌تر به ترتیب در پنجره‌های جداگانه نمایش داده می‌شوند.

5. **منتظر ماندن برای فشردن کلید توسط کاربر**  
    ```python
    cv2.waitKey(0)
    ```
    این خط برنامه را متوقف می‌کند تا زمانی که کاربر یک کلید را فشار دهد.

6. **بستن تمام پنجره‌ها**  
    ```python
    cv2.destroyAllWindows()
    ```
    این خط تمام پنجره‌های باز شده توسط OpenCV را می‌بندد.


## Cropping Images

برای زمانی که می خواهیم قسمت خاصی از عکس را برش دهیم


In [3]:
import cv2
import numpy as np

image = cv2.imread('image.jpg')
height , width = image.shape[:2]

# Let's get the starting pixel cordinates (top left cropping rectangle)
start_row, start_col = int(height * 0.25), int(width * 0.25)

# Let's get the ending pixel cordinates (bottom right cropping rectangle)
ending_row , ending_col = int(height * 0.75), int(width * 0.75)

# Simply use indexing to crop the image
cropped_image = image[start_row:ending_row, start_col:ending_col]
cv2.imshow('Original Image', image)
cv2.waitKey(0)
cv2.imshow('Cropped Image', cropped_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Arithmetic Operations

عملیات حسابی شامل اعمالی هستند که با اضافه کردن یا کم کردن ماتریس به تصویر، شدت روشنایی یا تاریکی تصویر را تغییر می‌دهند. این عملیات می‌توانند برای بهبود کیفیت تصویر یا ایجاد جلوه‌های خاص استفاده شوند.

In [None]:
import cv2
import numpy as np

# Load the image from the file 'image.jpg'
image = cv2.imread('image.jpg')  

# Create a matrix of ones with the same shape as the image, scaled by 75
M = np.ones(image.shape, dtype="uint8") * 75  

# Add the matrix M to the image to increase brightness
added = cv2.add(image, M) 
cv2.imshow('Added Image', added)  
cv2.waitKey(0)

# Subtract the matrix M from the image to decrease brightness 
subtracted = cv2.subtract(image, M)  
cv2.imshow('Added Image', subtracted) 
cv2.waitKey(0)
cv2.destroyAllWindows()   

## Bitwise Operations & Masking

عملیات بیتی در پردازش تصویر برای ترکیب، مقایسه یا تغییر بخش‌هایی از تصویر استفاده می‌شوند. این عملیات شامل AND، OR، XOR و NOT هستند که به صورت بیتی بر روی مقادیر پیکسل‌ها اعمال می‌شوند. از این عملیات می‌توان برای ایجاد ماسک‌ها یا ترکیب تصاویر استفاده کرد.

### Masking
ماسک‌گذاری فرآیندی است که در آن بخشی از تصویر با استفاده از یک ماسک (تصویر باینری) انتخاب یا حذف می‌شود. ماسک معمولاً یک تصویر سیاه و سفید است که در آن نواحی سفید نشان‌دهنده بخش‌هایی از تصویر اصلی هستند که باید حفظ شوند و نواحی سیاه نشان‌دهنده بخش‌هایی هستند که باید حذف شوند.

In [8]:
import cv2
import numpy as np

# Making a square
square = np.zeros((300, 300), dtype="uint8")
cv2.rectangle(square, (50, 50), (250, 250), 255, -2)
cv2.imshow('Square', square)
cv2.waitKey(0)

# Making a ellipse
ellipse = np.zeros((300, 300), dtype="uint8")
cv2.ellipse(ellipse, (150, 150), (150, 150), 30, 0, 180, 255, -1)
cv2.imshow('ellipes', ellipse)
cv2.waitKey(0)

cv2.destroyAllWindows()

### امتحان کردن با عملیات بیتی

In [None]:
# show only where interesect
And = cv2.bitwise_and(square, ellipse)
cv2.imshow('And',And)
cv2.waitKey(0)

# show where either one is present
Or = cv2.bitwise_or(square, ellipse)
cv2.imshow('Or',Or)
cv2.waitKey(0)

# show where one is present but not the other
Xor = cv2.bitwise_xor(square, ellipse)
cv2.imshow('Xor',Xor)
cv2.waitKey(0)

# show where the first shape is not present
Not = cv2.bitwise_not(square)
cv2.imshow('Not',Not)
cv2.waitKey(0)

cv2.destroyAllWindows()