# Praktikum Visi Komputer
## Modul ke-4

## Fourier transform, Filter, dan Edge detection

Saat kita bekerja dengan gambar/image/citra, bisa saja kita perlu memproses citra seperti mempertajam citra, menggabungkan citra, menggunakan filter. Pemprosesan citra tersebut akan berguna pada proses selanjutnya. Salah satunya seperti pada proses deteksi tepi. 

### Fourier transform

Sebagian besar pemrosesan yang akan kita terapkan pada citra dan video di OpenCV melibatkan konsep transformasi Fourier / Fourier Transform (FT). Joseph Fourier adalah seorang matematikawan berkebangsaan Prancis yang menemukan dan mempopulerkan banyak konsep matematika abad ke-18. Dia mempelajari bentuk fisika dari panas dan memodelkan secara matematika semua hal yang dapat diwakili oleh gelombang fungsi (waveform). Secara khusus, ia mengamati bahwa semua bentuk gelombang hanyalah jumlah dari sinusoida sederhana dari frekuensi yang berbeda.

Dengan kata lain, bentuk gelombang yang kita amati di sekitar kita adalah jumlah dari bentuk gelombang yang lain. Konsep ini sangat berguna saat memanipulasi citra karena memungkinkan kita untuk mengidentifikasi wilayah dalam citra di mana terjadi perubahan sinyal (seperti nilai piksel citra) yang banyak, ataupun perubahannya yang tidak terlalu dramatis. Kita kemudian dapat menandai ini sebagai noise atau bisa sebagai region of interest (ROI), bisa sebagai backgroud atau bisa sebagai foreground, dan lainnya. 

OpenCV mengimplementasikan sejumlah algoritma yang memungkinkan kita untuk memproses citra dan memahami data yang terkandung di dalamnya. Hal tersebut juga diimplementasikan kembali pada NumPy sehingga dapat memudahkan kita dalam memproses citra/image. NumPy memiliki modul/package Fast Fourier Transform (FFT), yang berisi method fft2. Method ini memungkinkan kita untuk menghitung transformasi Fourier diskrit/ Discrete Fourier Transform (DFT) dari suatu citra/image.

Transformasi Fourier (FT) adalah dasar dari banyak algoritma yang digunakan untuk pemprosesan citra, seperti deteksi tepi (edge detection) atau deteksi garis dan bentuk. Sebelumnya, mari kita lihat dua konsep yang berhubungan dengan transformasi Fourier dalam membentuk dasar dari operasi pemrosesan citra, yaitu HPF dan LPF.

#### HPF dan LPF

HPF (High-Pass Filter) adalah filter yang memeriksa kawasan citra dan meningkatkan intensitas piksel tertentu berdasarkan perbedaan intensitas piksel di sekitarnya. High-Pass Filter (HPF) digunakan untuk mempertahankan titik yang berbeda dengan titik-titik tetangganya (proses deteksi tepi). HPF merupakan suatu bentuk filter yang mengambil data pada frekuensi tinggi dan membuang data pada frekuensi rendah.

Contohnya pada kernel berikut:

[![QJZJ1z.png](https://i.im.ge/2021/09/09/QJZJ1z.png)](https://im.ge/i/QJZJ1z)

*Kernel adalah sekumpulan bobot yang diterapkan ke suatu kawasan dari sumber citra untuk menghasilkan satu piksel dalam gambar tujuan. Misalnya, jika kita memanggil fungsi OpenCV dengan parameter untuk menentukan ukuran kernel atau ksize dari 7, ini berarti bahwa 49 (7 x 7) piksel sumber dipertimbangkan saat menghasilkan setiap piksel tujuan. Kita dapat menganggap kernel sebagai sepotong kaca buram bergerak di atas sumber citra dan membiarkan campuran cahaya tersebar melewatinya.*

Kernel sebelumnya memberi kita perbedaan rata-rata dalam intensitas antara piksel pusat dan semua tetangga horizontal terdekatnya. Jika sebuah piksel menonjol dari piksel sekitarnya, nilai yang dihasilkan akan tinggi. Jenis kernel ini disebut filter high-boost, yang merupakan jenis HPF, dan sangat efektif dalam deteksi tepi (edge detection).

Ciri-ciri kernel dari HPF adalah nilai-nilainya terdiri dari positif, nol dan negatif, dan jumlah dari semua nilainya sama dengan nol.

Low-Pass Filter (LPF) adalah suatu bentuk filter yang mengambil frekuensi rendah dan membuang frekuensi tinggi. LPF digunakan untuk melakukan proses efek blur dan reduksi noise. Ciri-ciri kernel dari LPF adalah semua nilainya positif dan jumlah dari semua nilainya sama dengan satu.

In [1]:
import numpy as np
import cv2

In [3]:
from scipy import ndimage

kernel_3x3 = np.array([[-1, -1, -1],
                        [-1, 8, -1],
                        [-1, -1, -1]])

kernel_5x5 = np.array([[-1, -1, -1, -1, -1],
                        [-1, 1, 2, 1, -1],
                        [-1, 2, 4, 2, -1],
                        [-1, 1, 2, 1, -1],
                        [-1, -1, -1, -1, -1]])

#download gambar di: https://i.im.ge/2021/09/09/QpEGLF.jpg
img = cv2.imread("gambar/statue_small.jpg", 0)

#konvolusi adalah operasi matematika pada dua fungsi yang menghasilkan fungsi ketiga 
#yang menyatakan bagaimana bentuk yang satu diubah oleh yang lain.
#NumPy juga memiliki method convolve tapi untuk one-dimensional array
#method convolve pada ndimage dari SciPy dapat digunakan pada multidimensional array
k3 = ndimage.convolve(img, kernel_3x3)
k5 = ndimage.convolve(img, kernel_5x5)

#Gaussian blur (juga dikenal sebagai Gaussian smoothing) adalah hasil dari pengaburan gambar 
#oleh fungsi Gaussian. Ini adalah efek yang banyak digunakan dalam software grafis, 
#biasanya untuk mengurangi noise gambar dan mengurangi detail.
#Gaussian blur merupakan salah satu jenis dari LPF
blurred = cv2.GaussianBlur(img, (17,17), 0)
g_hpf = img - blurred

cv2.imshow("3x3", k3)
cv2.imshow("5x5", k5)
cv2.imshow("blurred", blurred)
cv2.imshow("g_hpf", g_hpf)
cv2.waitKey()
cv2.destroyAllWindows()

### Smoothing and Blurring

*Blurring* atau citra kabur terjadi saat kita biasanya mengambil foto menggunakan kamera namun hasilnya tidak fokus atau jelas. Pada citra yang blur biasanya bagian yang tajam tidak muncul disebabkan citra bercampur dengan intensitas piksel di sekitarnya. Walau citra yang kurang jelas atau tidak fokus ini tidak diinginkan pada hasil fotografi, namun ternyata citra tersebut sangat berguna dalam pemprosesan citra.
Bahkan sebenarnya, beberapa fungsi pada pemprosesan citra dan visi komputer seperti thresholding dan deteksi tepi, dapat berfungsi dengan lebih baik pada citra yang sebelumnya telah di-smooth atau di-blur.

#### Averaging
Proses 'averaging' aan menggunakan jendela geser k x k di atas citra, di mana k selalu bernilai ganjil (agar ada piksel titik tengahnya). Jendela ini akan bergeser dari kiri-ke-kanan dan dari atas-ke-bawah. Piksel pada bagian tengah matrik ini akan ditetapkan sebagai rata-rata (*average*) dari semua piksel yang mengelilinginya. Jendela geser ini disebut "convolution kernel" atau "kernel". 

Contoh kernel 3x 3 untuk *averaging* adalah:
[![averaging](https://i.im.ge/2022/09/11/O4fsZf.averaging.png)](https://im.ge/i/O4fsZf)

Nanti anda dapat memperhatikan saat melakukan percobaan, saat ukuran dari kernel bertambah besar, maka citra akan semakin *blurred*.


In [2]:
import numpy as np
import cv2

In [4]:
img = cv2.imread("gambar/flower1.png", cv2.IMREAD_COLOR)

blurred = np.hstack([
    cv2.blur(img, (3, 3)),
    cv2.blur(img, (5, 5)),
    cv2.blur(img, (7, 7))])

cv2.imshow("Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

In [5]:
#Latihan 1
#Silakan bereksperimen dengan citra lain seperti
img = cv2.imread("gambar/orange.png", cv2.IMREAD_COLOR)

blurred = np.hstack([
    cv2.blur(img, (4, 4)),
    cv2.blur(img, (6, 6)),
    cv2.blur(img, (8, 8))])

cv2.imshow("Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

#### Gaussian

*Gaussian blurring* sebenarnya mirip dengan *average blurring*. Jika pada *average blurring* menggunakan rata-rata (*mean*) sederhana, namun pada *gaussian blurring* menggunakan rata-rata berpemberat (*weighted mean*) di mana piksel sekelilingnya (*neighborhood*) yang lebih dekat ke titik tengah piksel berkontribusi pemberat (*weight*) lebih banyak kepada nilai rata-ratanya.

Contoh kernel 3 x 3 untuk *gaussian blurring* adalah
[![gaussian3x3](https://i.im.ge/2022/09/11/O4fglh.gaussian3x3.png)](https://im.ge/i/O4fglh)

Citra hasilnya menjadi kurang *blurred* namun lebih natural *blurred*nya, dibandingkan dengan hasil citra blur menggunakan metode average sebelumnya.


In [6]:
image = cv2.imread("gambar/flower1.png", cv2.IMREAD_COLOR)

blurred = np.hstack([
    cv2.GaussianBlur(image, (3, 3), 0),
    cv2.GaussianBlur(image, (5, 5), 0),
    cv2.GaussianBlur(image, (7, 7), 0)])

cv2.imshow("Gaussian Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

In [7]:
#Latihan 2
#Silakan bereksperimen dengan citra lainnya
image = cv2.imread("gambar/orange.png", cv2.IMREAD_COLOR)

blurred = np.hstack([
    cv2.GaussianBlur(image, (3, 3), 0),
    cv2.GaussianBlur(image, (5, 5), 0),
    cv2.GaussianBlur(image, (7, 7), 0)])

cv2.imshow("Gaussian Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

#### Median

*Median blurring* merupakan metode blur yang sering digunakan untuk menghilangkan *salt-and-pepper noise*. *Salt-and-pepper noise* ini seperti anda tidak sengaja memercikkan garam dan merica ke atas suatu foto. Jadi metode *median blur* ini dapat menghilangkan noda garam dan merica dari atas foto tersebut.

Sama seperti metode blur lainnya, untuk menggunakan median blur kita perlu definisikan kernel dengan ukuran k. Jika pada metode *average* kita mengganti titik tengah piksel dengan rata-rata sekelilingnya, maka pada *median blur* kita mengganti titik tengah piksel dengan nilai median dari sekelilingnya. Sehingga *median blurring* efektif untuk menghilangkan *salt-and-pepper noise* dari citra karena setiap titik tengah piksel akan digantikan dengan intensitas piksel lainnya yang wujud pada citra.

Apabila anda melihat hasil dari median blur, semakin besar kernel maka noise dan detail semakin lama semakin hilang.

In [8]:
#Download image di https://i.im.ge/2022/09/11/O4HTZx.noise.jpg
image = cv2.imread("gambar/noise.jpg", cv2.IMREAD_COLOR)

blurred = np.hstack([
    image,
    cv2.medianBlur(image, 3),
    cv2.medianBlur(image, 5),
    cv2.medianBlur(image, 7)])

cv2.imshow("Median Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
#Latihan 3
#Silakan bereksperimen dengan citra lainnya seperti
#https://i.im.ge/2022/09/11/O4zVOp.median.png
#https://i.im.ge/2022/09/11/O4HXXa.noise1.jpg
#https://i.im.ge/2022/09/11/O4Hrby.noise1.jpg

In [9]:
image = cv2.imread("gambar/taj.jpg", cv2.IMREAD_COLOR)

blurred = np.hstack([
    image,
    cv2.medianBlur(image, 3),
    cv2.medianBlur(image, 5),
    cv2.medianBlur(image, 7)])

cv2.imshow("Median Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

In [10]:
image = cv2.imread("gambar/pantai.jpg", cv2.IMREAD_COLOR)

blurred = np.hstack([
    image,
    cv2.medianBlur(image, 3),
    cv2.medianBlur(image, 5),
    cv2.medianBlur(image, 7)])

cv2.imshow("Median Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

In [11]:
image = cv2.imread("gambar/buah.jpg", cv2.IMREAD_COLOR)

blurred = np.hstack([
    image,
    cv2.medianBlur(image, 3),
    cv2.medianBlur(image, 5),
    cv2.medianBlur(image, 7)])

cv2.imshow("Median Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

#### Bilateral

Metode blurring yang telah dijelaskan sebelum ini memang dapat membuat kabur dan menghilangkan noise serta detil pada citra, namun dalam prosesnya juga dapat menghilangkan tepi daripada suatu citra. Oleh karena itu, untuk mengurangi noise namun tepi tetap ada, maka kita dapat menggunakan *bilateral blurring*. 

*Bilateral blurring* menyelesaikan masalah ini dengan memperkenalkan dua distribusi Gaussian. Fungsi distribusi Gaussian pertama hanya mempertimbangkan tetangga sekelilingnya (*spatial neighbors*) atau dengan kata lain piksel yang muncul dekat dan bersama-sama pada koordinat (x, y) dari citra. Fungsi distribusi Gaussian kedua akan memodelkan intensitas piksel dari sekelilingnya, untuk memastikan hanya piksel dengan intensitas mirip yang akan dimasukkan ke proses komputasi blur nantinya.

Secara umum, hasil *bilateral blurring* dapat mengurangi noise dengan tetap mempertahankan tepi. Namun sayangnya metode ini bekerja lebih lambat dibandingkan dengan metode average, gaussian dan median.

In [12]:
#Download image di https://i.im.ge/2022/09/11/O4HTZx.noise.jpg
image = cv2.imread("gambar/noise.jpg", cv2.IMREAD_COLOR)

blurred = np.hstack([
    image,
    cv2.bilateralFilter(image, 5, 21, 21),
    cv2.bilateralFilter(image, 7, 31, 31),
    cv2.bilateralFilter(image, 9, 41, 41)])

cv2.imshow("Bilateral Blurred images", blurred)
cv2.waitKey()
cv2.destroyAllWindows()

## Edge detection

Tepi memainkan peran utama dalam penglihatan manusia dan komputer. Kita sebagai manusia dapat dengan mudah mengenali banyak jenis objek dan posenya hanya dengan melihat siluet backlit atau sketsa kasar. Tepi membantu kita dalam mengekstrak informasi, mengenali objek, dan memulihkan geometri dan sudut pandang. Tepi biasanya muncul karena diskontinuitas dalam permukaan normal, kedalaman, warna permukaan, dan iluminasi.

Tujuan dari deteksi tepi adalah untuk mengidentifikasi perubahan mendadak (diskontinuitas) pada suatu citra. Secara intuitif, sebagian besar informasi semantik dan bentuk dari citra dapat dikodekan pada tepinya.

[![edge](https://i.im.ge/2022/09/10/OnPxSK.edge.png)](https://im.ge/i/OnPxSK)

OpenCV menyediakan banyak filter pencarian tepi, seperti `Laplacian`, `Sobel`, dan `Scharr`. Filter ini seharusnya mengubah daerah non-tepi menjadi hitam dan mengubah daerah tepi menjadi warna putih atau warna jenuh. Namun, filter tersebut cenderung salah dalam mengidentifikasi kebisingan (noise) sebagai tepi. Cacat ini dapat dikurangi dengan mengaburkan gambar sebelum mencoba menemukan tepinya. OpenCV juga menyediakan banyak filter blur, termasuk `blur` (simple average), `medianBlur`, dan `GaussianBlur`. Argumen untuk filter pencarian tepi dan pengaburan/blur bervariasi tetapi selalu menyertakan ksize, yaitu bilangan bulat ganjil yang mewakili lebar dan tinggi (dalam piksel) dari kernel filter.

Untuk pengaburan/blur, kita akan menggunakan `medianBlur`, yang efektif menghilangkan noise pada video digital, terutama pada gambar berwarna. Untuk pencarian tepi, mari gunakan `Laplacian`, yang menghasilkan garis tepi tebal, terutama pada gambar skala abu-abu. Setelah menerapkan `medianBlur`, tetapi sebelum menerapkan `Laplacian`, kita harus mengubah gambar dari BGR menjadi grayscale.

Setelah kita mendapatkan hasil `Laplacian`, kita dapat membalikkannya untuk mendapatkan tepi hitam pada latar belakang putih. Kemudian, kita dapat menormalkannya (sehingga nilainya berkisar dari 0 hingga 1) dan kemudian mengalikannya dengan gambar sumber untuk menggelapkan tepinya.

In [13]:
import cv2

In [14]:
img = cv2.imread("gambar/statue_small.jpg", cv2.IMREAD_COLOR)

blurredSrc = cv2.medianBlur(img, 7) 
graySrc = cv2.cvtColor(blurredSrc, cv2.COLOR_BGR2GRAY)

cv2.Laplacian(graySrc, cv2.CV_8U, graySrc, ksize = 5)

normalizedInverseAlpha = (1.0 / 255) * (255 - graySrc)
channels = cv2.split(img)
for channel in channels:
    channel[:] = channel * normalizedInverseAlpha

    cv2.merge(channels, img)

cv2.imshow("Median dan Laplacia", graySrc)
cv2.waitKey()
cv2.destroyAllWindows()

### Deteksi tepi dengan Canny

Deteksi tepi dengan menggunakan Laplacian masih menimbulkan banyak noise. Untuk mengatasi masalah tersebut, kita dapat menggunakan Canny edge detector. Fungsi Canny ini sangat popular tidak hanya karena efektif, namun juga sangat sederhana penggunaannya pada OpenCV yaitu hanya satu baris saja.


In [50]:
img = cv2.imread("gambar/statue_small.jpg", 0)
cv2.imwrite("canny.jpg", cv2.Canny(img, 200, 300)) # Canny in one line!
cv2.imshow("canny", cv2.imread("canny.jpg"))
cv2.waitKey()
cv2.destroyAllWindows()

error: OpenCV(4.6.0) :-1: error: (-5:Bad argument) in function 'imshow'
> Overload resolution failed:
>  - imshow() missing required argument 'mat' (pos 2)
>  - imshow() missing required argument 'mat' (pos 2)
>  - imshow() missing required argument 'mat' (pos 2)


Hasilnya menampilkan edge/tepi yang sangat jelas sekali. Walaupun penggunaanya hanya 1 baris saja, namun sebenarnya algoritma Canny edge detection ini kompleks. Terdapat 5 langkah proses pada Canny edge detection:
1. Denoise citra dengan filter Gaussian
2. Hitung gradientnya
3. Terapkan non-maximum suppression (NMS) pada tepinya. Ini bermakna, algoritma Canny memilih tepi terbaik dari suatu set tepi yang tumpang tindih. 
4. Terapkan ambang ganda (double threshold) ke semua tepi yang terdeteksi untuk menghilangkan False Positive.
5. Analisis semua tepi dan hubungannya satu sama lain untuk menjaga tepi yang sebenarnya dan membuang tepi yang lemah.

In [21]:
#Latihan 4
#Silakan bereksperimen dengan gambar lainnya (bebas) untuk melakukan deteksi tepi menggunakan Canny
img = cv2.imread("gambar/orange.jpg", 0)
cv2.imwrite("canny1.jpg", cv2.Canny(img, 200, 300)) # Canny in one line!
cv2.imshow("canny1", cv2.imread("canny1.jpg"))
cv2.waitKey()
cv2.destroyAllWindows()

error: OpenCV(4.6.0) D:\a\opencv-python\opencv-python\opencv\modules\imgcodecs\src\loadsave.cpp:801: error: (-215:Assertion failed) !_img.empty() in function 'cv::imwrite'


### Deteksi Kontur (contour detection)

Tugas penting lainnya dalam visi komputer adalah deteksi kontur. Kita ingin mendeteksi kontur atau garis luar subjek yang terdapat dalam bingkai gambar atau video. Dan hasil dari deteksi kontur juga digunakan pada operasi lainnya. Operasi-operasi ini diantaranya menghitung bounding polygon, perkiraan bentuk, dan menghitung region of interest (ROI). ROI dapat menyederhanakan interaksi dengan data citra sebab wilayah persegi panjang pada NumPy mudah ditentukan dengan menggunakan irisan array (array slicing). Kita akan banyak menggunakan deteksi kontur dan ROI pada bahasan mengenai deteksi objek (termasuk deteksi wajah) dan pelacakan objek.

Berikut contoh sederhana dari kontur.

In [23]:
import cv2
import numpy as np

img = np.zeros((200, 200), dtype=np.uint8)
img[50:150, 50:150] = 255

ret, thresh = cv2.threshold(img, 127, 255, 0)
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

color = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
img = cv2.drawContours(color, contours, -1, (0,255,0), 2)
cv2.imshow("contours", color)
cv2.waitKey()
cv2.destroyAllWindows()

Menentukan kontur pada persegi sangat mudah (sesuai contoh di atas). Namun menentukan kontur pada bentuk irregular, miring dan berotasi adalah challenging. 

#### Bounding box, minimum area rectangle, dan minimum enclosing circle
Dalam aplikasi kehidupan nyata, kita akan sering membuat *the bounding box of the subject*, *its minimum enclosing rectangle*, dan *its enclosing circle*. Fungsi cv2.findContours, bersama dengan beberapa utilitas OpenCV lainnya, membuat pekerjaan ini menjadi sangat mudah untuk dilakukan. 

Seperti pada contoh program di bawah. Pertama, kode berikut membaca gambar dari file, mengubahnya menjadi citra abu-abu, menerapkan ambang batas (threshold) ke citra skala abu-abu, dan menemukan kontur pada gambar threshold.

In [24]:
#Download gambar di https://i.im.ge/2021/09/10/QJJMsp.jpg
img = cv2.pyrDown(cv2.imread("gambar/hammer.jpg", cv2.IMREAD_UNCHANGED))

ret, thresh = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY), 127, 255, cv2.THRESH_BINARY)
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

#Lalu untuk setiap kontur, kita dapat menemukan bounding box, minimum enclosing rectangle, 
#dan minimum enclosing circle
for c in contours:
    # find bounding box coordinates
    x,y,w,h = cv2.boundingRect(c)
    cv2.rectangle(img, (x,y), (x+w, y+h), (0, 255, 255), 2)
    
    # find minimum area
    rect = cv2.minAreaRect(c)
    # calculate coordinates of the minimum area rectangle
    box = cv2.boxPoints(rect)
    # normalize coordinates to integers
    box = np.int0(box)
    # draw contours
    cv2.drawContours(img, [box], 0, (0,0, 255), 3)
    
    # calculate center and radius of minimum enclosing circle
    (x, y), radius = cv2.minEnclosingCircle(c)
    # cast to integers
    center = (int(x), int(y))
    radius = int(radius)
    # draw the circle
    img = cv2.circle(img, center, radius, (0, 255, 0), 2)
    
cv2.drawContours(img, contours, -1, (255, 0, 0), 1)
cv2.imshow("contours", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [26]:
#Latihan 5
#Gunakan code di atas dan lakukan eksperimen pada gambar sederhana lainnya
#Download gambar di https://i.im.ge/2021/09/10/QJJMsp.jpg
img = cv2.pyrDown(cv2.imread("gambar/taj.jpg", cv2.IMREAD_UNCHANGED))

ret, thresh = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY), 127, 255, cv2.THRESH_BINARY)
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

#Lalu untuk setiap kontur, kita dapat menemukan bounding box, minimum enclosing rectangle, 
#dan minimum enclosing circle
for c in contours:
    # find bounding box coordinates
    x,y,w,h = cv2.boundingRect(c)
    cv2.rectangle(img, (x,y), (x+w, y+h), (0, 255, 255), 2)
    
    # find minimum area
    rect = cv2.minAreaRect(c)
    # calculate coordinates of the minimum area rectangle
    box = cv2.boxPoints(rect)
    # normalize coordinates to integers
    box = np.int0(box)
    # draw contours
    cv2.drawContours(img, [box], 0, (0,0, 255), 3)
    
    # calculate center and radius of minimum enclosing circle
    (x, y), radius = cv2.minEnclosingCircle(c)
    # cast to integers
    center = (int(x), int(y))
    radius = int(radius)
    # draw the circle
    img = cv2.circle(img, center, radius, (0, 255, 0), 2)
    
cv2.drawContours(img, contours, -1, (255, 0, 0), 1)
cv2.imshow("contours", img)
cv2.waitKey()
cv2.destroyAllWindows()

#### Convex contours dan algoritma Douglas-Peucker algorithm

Saat bekerja dengan kontur, kita mungkin menemukan subjek dengan beragam bentuk, termasuk bentuk cembung/convex. Bentuk convex adalah bentuk di mana tidak ada dua titik dalam bentuk ini yang garis penghubungnya keluar dari keliling bentuk itu sendiri.

Salah satu fasilitas yang ditawarkan OpenCV untuk menghitung perkiraan batas poligon suatu bentuk adalah `cv2.approxPolyDP`. Fungsi ini membutuhkan tiga parameter:
- Sebuah kontur.
- Nilai epsilon yang mewakili perbedaan maksimum antara kontur asli dan poligon yang didekati (semakin rendah nilainya, semakin dekat nilai perkiraan dengan kontur asli).
- Boolean flag. Jika bernilai True, itu menandakan bahwa poligon tertutup.

Anda mungkin bertanya-tanya, mengapa kita masih memerlukan approximate polygon, padahal sebelumnya kita sudah memiliki kontur. Jawabannya terkait dengan bentuk poligon yang merupakan kumpulan garis lurus. Banyak tugas computer vision menjadi lebih sederhana jika kita dapat mendefinisikan poligon sehingga poligon membatasi wilayah untuk manipulasi dan pemrosesan lebih lanjut.

Mari kita gabungkan kontur asli, kontur approximate poligon, dan convex hull menjadi satu gambar untuk mengamati perbedaan di antara mereka. Untuk mempermudah, kita akan menggambar kontur di atas latar belakang hitam sehingga subjek aslinya tidak terlihat tetapi konturnya tampak.

In [27]:
img = cv2.pyrDown(cv2.imread("gambar/hammer.jpg", cv2.IMREAD_UNCHANGED))

ret, thresh = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY), 127, 255, cv2.THRESH_BINARY)

contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

black = np.zeros_like(img)

for cnt in contours:
    epsilon = 0.01 * cv2.arcLength(cnt,True)
    approx = cv2.approxPolyDP(cnt,epsilon,True)
    hull = cv2.convexHull(cnt)
    cv2.drawContours(black, [cnt], -1, (0, 255, 0), 2)
    cv2.drawContours(black, [approx], -1, (255, 255, 0), 2)
    cv2.drawContours(black, [hull], -1, (0, 0, 255), 2)
    
cv2.imshow("hull", black)
cv2.waitKey()
cv2.destroyAllWindows()

### Deteksi garis, lingkaran, dan bentuk lainnya 

Selain dari deteksi tepi dan deteksi kontur, deteksi garis dan bentuk juga berjalan beriringan. Teori di balik deteksi garis dan bentuk memiliki landasan dalam teknik yang disebut transformasi Hough, ditemukan oleh Richard Duda dan Peter Hart, yang memperluas pekerjaan yang dilakukan oleh Paul Hough pada awal 1960-an.

Suatu garis dapat direpresentasikan dalam persamaan y = mx + c ataupun dalam bentuk parameter seperti persamaan r = xcosθ + ysinθ di mana r merupakan jarak tegak lurus dari titik asal ke garis, dan θ merupakan sudut yang terbentuk dari garis tegak lurus tersebut dengan sumbu x (horizontal) dihitung secara berlawanan arah jarum jam.
[![houghline](https://i.im.ge/2022/09/10/OnNBpK.houghline.png)](https://im.ge/i/OnNBpK)

Pertama-tama, kita coba lakukan deteksi garis. Kita dapat melakukan ini dengan fungsi `HoughLines` atau fungsi `HoughLinesP`. Yang pertama menggunakan transformasi Hough yang standar, sedangkan yang kedua menggunakan transformasi Hough probabilistik. Versi probabilistik disebut demikian karena hanya menganalisis subset dari titik-titik gambar dan memperkirakan probabilitas bahwa semua titik ini termasuk dalam garis yang sama. Implementasi ini merupakan versi optimal dari transformasi Hough standar. HoughLinesP diimplementasikan sehingga mengembalikan dua titik akhir dari setiap segmen garis yang terdeteksi, sedangkan HoughLines diimplementasikan sehingga mengembalikan representasi setiap garis sebagai satu titik dan sudut, tanpa informasi tentang titik akhir.


In [28]:
# Python program to illustrate HoughLine
# Download gambar di https://i.im.ge/2022/09/10/OnU3nh.img7.png
img = cv2.imread('gambar/img7.png')

# Convert the img to grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

#Canny bukanlah kewajiban, tetapi gambar yang telah di-denoise dan hanya memiliki tepi adalah 
#sumber ideal untuk transformasi Hough, jadi hal ini akan sering dijumpai.
# Apply edge detection method on the image
edges = cv2.Canny(gray, 50, 150, apertureSize=3)

# This returns an array of r and theta values
minLineLength = 100  #panjang garis minimal yang akan terdeteksi, silakan bereksperimen
lines = cv2.HoughLines(edges, 1, np.pi/180, minLineLength)

# The below for loop runs till r and theta values
# are in the range of the 2d array
for r_theta in lines:
    arr = np.array(r_theta[0], dtype=np.float64)
    r, theta = arr
    # Stores the value of cos(theta) in a
    a = np.cos(theta)

    # Stores the value of sin(theta) in b
    b = np.sin(theta)

    # x0 stores the value rcos(theta)
    x0 = a*r

    # y0 stores the value rsin(theta)
    y0 = b*r

    # x1 stores the rounded off value of (rcos(theta)-1000sin(theta))
    x1 = int(x0 + 1000*(-b))

    # y1 stores the rounded off value of (rsin(theta)+1000cos(theta))
    y1 = int(y0 + 1000*(a))

    # x2 stores the rounded off value of (rcos(theta)+1000sin(theta))
    x2 = int(x0 - 1000*(-b))

    # y2 stores the rounded off value of (rsin(theta)-1000cos(theta))
    y2 = int(y0 - 1000*(a))

    # cv2.line draws a line in img from the point(x1,y1) to (x2,y2).
    # (0,0,255) denotes the colour of the line to be
    # drawn. In this case, it is red.
    cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)

# All the changes made in the input image are finally
# written on a new image or can be shown directly
#cv2.imwrite('gambar/linesDetected.jpg', img)
cv2.imshow("Lines detected HoughLine", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [40]:
#Latihan 6
#Silakan bereksperimen dengan gambar lainnya (bebas) untuk melakukan deteksi line
# Python program to illustrate HoughLine
# Download gambar di https://i.im.ge/2022/09/10/OnU3nh.img7.png
img = cv2.imread('gambar/img8.png')

# Convert the img to grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

#Canny bukanlah kewajiban, tetapi gambar yang telah di-denoise dan hanya memiliki tepi adalah 
#sumber ideal untuk transformasi Hough, jadi hal ini akan sering dijumpai.
# Apply edge detection method on the image
edges = cv2.Canny(gray, 50, 150, apertureSize=3)

# This returns an array of r and theta values
minLineLength = 100  #panjang garis minimal yang akan terdeteksi, silakan bereksperimen
lines = cv2.HoughLines(edges, 1, np.pi/180, minLineLength)

# The below for loop runs till r and theta values
# are in the range of the 2d array
for r_theta in lines:
    arr = np.array(r_theta[0], dtype=np.float64)
    r, theta = arr
    # Stores the value of cos(theta) in a
    a = np.cos(theta)

    # Stores the value of sin(theta) in b
    b = np.sin(theta)

    # x0 stores the value rcos(theta)
    x0 = a*r

    # y0 stores the value rsin(theta)
    y0 = b*r

    # x1 stores the rounded off value of (rcos(theta)-1000sin(theta))
    x1 = int(x0 + 1000*(-b))

    # y1 stores the rounded off value of (rsin(theta)+1000cos(theta))
    y1 = int(y0 + 1000*(a))

    # x2 stores the rounded off value of (rcos(theta)+1000sin(theta))
    x2 = int(x0 - 1000*(-b))

    # y2 stores the rounded off value of (rsin(theta)-1000cos(theta))
    y2 = int(y0 - 1000*(a))

    # cv2.line draws a line in img from the point(x1,y1) to (x2,y2).
    # (0,0,255) denotes the colour of the line to be
    # drawn. In this case, it is red.
    cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)

# All the changes made in the input image are finally
# written on a new image or can be shown directly
#cv2.imwrite('gambar/linesDetected.jpg', img)
cv2.imshow("Lines detected HoughLine", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [36]:
# Python program to illustrate HoughLineP
# Download gambar di https://i.im.ge/2022/09/10/OnU3nh.img7.png
img = cv2.imread('gambar/img7.png')

# Convert the img to grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Use canny edge detection
edges = cv2.Canny(gray,50,150,apertureSize=3)
 
# Apply HoughLinesP method to
# to directly obtain line end points
lines_list =[]
lines = cv2.HoughLinesP(
            edges, # Input edge image
            1, # Distance resolution in pixels
            np.pi/180, # Angle resolution in radians
            threshold=100, # Min number of votes for valid line
            minLineLength=100, # Min allowed length of line
            maxLineGap=10 # Max allowed gap between line for joining them
            )
 
# Iterate over points
for points in lines:
      # Extracted points nested in the list
    x1,y1,x2,y2=points[0]
    # Draw the lines joing the points
    # On the original image
    cv2.line(img,(x1,y1),(x2,y2),(0,255,0),2)
    # Maintain a simples lookup list for points
    lines_list.append([(x1,y1),(x2,y2)])

# All the changes made in the input image are finally
# written on a new image or can be shown directly
#cv2.imwrite('gambar/linesDetected1.jpg', img)
cv2.imshow("Lines detected using HoughLineP", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [41]:
#Latihan 7
#Silakan bereksperimen dengan gambar lainnya (bebas) untuk melakukan deteksi line
# Python program to illustrate HoughLineP
# Download gambar di https://i.im.ge/2022/09/10/OnU3nh.img7.png
img = cv2.imread('gambar/img8.png')

# Convert the img to grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Use canny edge detection
edges = cv2.Canny(gray,50,150,apertureSize=3)
 
# Apply HoughLinesP method to
# to directly obtain line end points
lines_list =[]
lines = cv2.HoughLinesP(
            edges, # Input edge image
            1, # Distance resolution in pixels
            np.pi/180, # Angle resolution in radians
            threshold=100, # Min number of votes for valid line
            minLineLength=100, # Min allowed length of line
            maxLineGap=10 # Max allowed gap between line for joining them
            )
 
# Iterate over points
for points in lines:
      # Extracted points nested in the list
    x1,y1,x2,y2=points[0]
    # Draw the lines joing the points
    # On the original image
    cv2.line(img,(x1,y1),(x2,y2),(0,255,0),2)
    # Maintain a simples lookup list for points
    lines_list.append([(x1,y1),(x2,y2)])

# All the changes made in the input image are finally
# written on a new image or can be shown directly
#cv2.imwrite('gambar/linesDetected1.jpg', img)
cv2.imshow("Lines detected using HoughLineP", img)
cv2.waitKey()
cv2.destroyAllWindows()

OpenCV juga memiliki fungsi untuk mendeteksi lingkaran yang bernama `HoughCircles`. Cara kerjanya mirip dengan HoughLines, bedanya pada circle ada tambahan parameter lainnya. 

In [42]:
#Download gambar di https://i.im.ge/2021/09/10/QJJlmm.jpg
planets = cv2.imread('gambar/planet_glow.jpg')
gray_img = cv2.cvtColor(planets, cv2.COLOR_BGR2GRAY)
gray_img = cv2.medianBlur(gray_img, 5)

circles = cv2.HoughCircles(gray_img,cv2.HOUGH_GRADIENT,1,120, param1=100,param2=30,minRadius=0,maxRadius=0)

circles = np.uint16(np.around(circles))

for i in circles[0,:]:
    # draw the outer circle
    cv2.circle(planets,(i[0],i[1]),i[2],(0,255,0),2)
    # draw the center of the circle
    cv2.circle(planets,(i[0],i[1]),2,(0,0,255),3)
    
cv2.imwrite("gambar/planets_circles.jpg", planets)
cv2.imshow("HoughCircles", planets)
cv2.waitKey()
cv2.destroyAllWindows()

In [43]:
#Latihan 8
#Silakan bereksperimen dengan gambar lainnya (bebas) untuk melakukan deteksi circle
#Download gambar di https://i.im.ge/2021/09/10/QJJlmm.jpg
planets = cv2.imread('gambar/planet_glow1.jpg')
gray_img = cv2.cvtColor(planets, cv2.COLOR_BGR2GRAY)
gray_img = cv2.medianBlur(gray_img, 5)

circles = cv2.HoughCircles(gray_img,cv2.HOUGH_GRADIENT,1,120, param1=100,param2=30,minRadius=0,maxRadius=0)

circles = np.uint16(np.around(circles))

for i in circles[0,:]:
    # draw the outer circle
    cv2.circle(planets,(i[0],i[1]),i[2],(0,255,0),2)
    # draw the center of the circle
    cv2.circle(planets,(i[0],i[1]),2,(0,0,255),3)
    
cv2.imwrite("gambar/planets_circles1.jpg", planets)
cv2.imshow("HoughCircles1", planets)
cv2.waitKey()
cv2.destroyAllWindows()

Implementasi OpenCV dari transformasi Hough terbatas pada deteksi garis dan lingkaran. Namun, kita sebenarnya dapat melakukan deteksi bentuk secara umum dengan `approxPolyDP`. Fungsi ini memungkinkan pendekatan poligon, jadi jika gambar Anda berisi poligon, mereka akan dideteksi secara akurat melalui penggunaan gabungan `cv2.findContours` dan `cv2.approxPolyDP`.

In [47]:
import imutils

# Python program to illustrate approxPolyDP
# Download gambar di https://i.im.ge/2022/09/10/Onm1mM.box.png
img = cv2.imread('gambar/box.png')

# convert the image to grayscale and threshold it
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)[1]

# find the largest contour in the threshold image
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
c = max(cnts, key=cv2.contourArea)

# draw the shape of the contour on the output image, compute the
# bounding box, and display the number of points in the contour
output = img.copy()
cv2.drawContours(output, [c], -1, (0, 255, 0), 3)
(x, y, w, h) = cv2.boundingRect(c)
text = "original, num_pts={}".format(len(c))
cv2.putText(output, text, (x, y - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)

# show the original contour image
print("[INFO] {}".format(text))
cv2.imshow("Original Contour", output)
cv2.waitKey()
cv2.destroyAllWindows()

[INFO] original, num_pts=951


In [45]:
pip install imutils

In [48]:
#Latihan 9
#Silakan bereksperimen dengan gambar lainnya (bebas) untuk melakukan deteksi poligon
import imutils

# Python program to illustrate approxPolyDP
# Download gambar di https://i.im.ge/2022/09/10/Onm1mM.box.png
img = cv2.imread('gambar/box1.png')

# convert the image to grayscale and threshold it
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)[1]

# find the largest contour in the threshold image
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
c = max(cnts, key=cv2.contourArea)

# draw the shape of the contour on the output image, compute the
# bounding box, and display the number of points in the contour
output = img.copy()
cv2.drawContours(output, [c], -1, (0, 255, 0), 3)
(x, y, w, h) = cv2.boundingRect(c)
text = "original, num_pts={}".format(len(c))
cv2.putText(output, text, (x, y - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)

# show the original contour image
print("[INFO] {}".format(text))
cv2.imshow("Original Contour", output)
cv2.waitKey()
cv2.destroyAllWindows()

[INFO] original, num_pts=256
