<h1 style="text-align: center">Getting Started into Computer Vision</h1>

Visi komputer / Computer vision adalah jenis AI yang memungkinkan komputer dan sistem bertindak berdasarkan informasi yang diperoleh dari gambar dan video. Computer Vision menggabungkan komputasi edge, komputasi cloud, perangkat lunak, dan model deep learning AI untuk mengenali, mengklasifikasikan, menganalisis, dan mengambil tindakan berdasarkan data visual yang dikumpulkan

### Preparing Dependencies
Install opencv Python <br> Jalankan perintah berikut di Command Line : <br></br>
`pip install opencv-python` <br>
`sudo apt install ros-noetic-cv-bridge ros-noetic-image-transport`

check installation
script python
```python
import cv2
print(cv2.__version__)
```
or 
from shell 
```bash
pip list | grep cv
sudo apt search ros-noetic | grep -E "cv-bridge|image-transport"
```


Pada Sesi kali ini menggunakan library OpenCV (Open Source Computer Vision Library) yang mana sebuah library open source yang dikembangkan oleh intel yang fokus untuk menyederhanakan programing terkait citra digital.

OpenCV sudah mempunyai banyak fitur, antara lain : pengenalan wajah, pelacakan wajah, deteksi wajah, Kalman filtering, dan berbagai jenis metode AI (Artificial Intellegence).[1]

In [2]:
!pip list | grep cv

opencv-python             4.12.0.88


OpenCV udah punya toolbox lengkap:
- Filtering, thresholding, dan transformasi (blur, edge, morphology)
- Face/object detection (Haar, DNN)
- Optical flow, feature matching, contour detection
- Camera calibration, stereo vision, dll

OpenCV dapat di integrasikan dengan berbagai hal contoh:
- Numpy
- ROS
- TensorFlow / Torch
- OpenGL
- etc

### Read Image

In [None]:
import cv2 

img = cv2.imread('source/full.jpg') 
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

pada code tersebut dilakukan untuk membaca suatu gambar. Dimana fungsi `cv2.imread(img)` untuk read gambar yang mana img merupakan path menuju ke gambar.  Gambar haruslah berada dalam satu directory folder atau directory yang lengkap. Kalau gambarnya nggak bisa dibaca entah karena filenya hilang, izin aksesnya nggak ada, atau formatnya aneh/tidak didukung maka hasilnya bakal kosong (cuma matriks kosong doang). 

untuk menampilkan menggunakan fungsi `cv2.imshow('nama window', variable_img)` berfungsi untuk menampilkan gambar pada window baru.

penggunaan `cv2.waitKey(0)` di gunakan untuk mengambil / menunggu tombol apapun yang ter tekan akan mengeksekusi

untuk menutup window dari `imshow()` disarankan menggunakan `cv2.destroyAllWindows()`


### Read Video

- via file

In [None]:
import cv2

cap = cv2.VideoCapture("source/cat.mp4")

while True:
    ret, frame = cap.read()
    if not ret:
        break
    cv2.imshow("Video", frame)
    if cv2.waitKey(30) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

Objek VideoCapture akan memberi kita frame satu per satu setiap kali kita memanggil .read().

VideoCapture akan menampilkan video hingga durasi video habis (pada contoh modul 10 detik)

- via capture camera

In [None]:
import cv2

cap = cv2.VideoCapture(0)  # 0 = kamera default

if not cap.isOpened():
    print("Error: Tidak dapat membuka kamera.")
    exit()

while True:
    ret, frame = cap.read()
    if not ret:
        print("Gagal membaca frame dari kamera.")
        break

    cv2.imshow("Webcam Live", frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        print("Dihentikan oleh pengguna.")
        break

cap.release()
cv2.destroyAllWindows()

Input dari Video capture sendiri bisa berupa path-file, index camera, path index(/dev/<camera index>),maupun stream IP Contoh:
```python
cv2.VideoCapture(0)
cv2.VideoCapture(1) untuk kamera USB
cv2.VideoCapture("http://192.168.0.10:8080/video")
```

kita juga dapat mengatur resolusi output dari video maupun gambar yang dibaca. Contoh:
```python 
cap.set(cv2.CAP_PROP_FRAME_WIDTH,  1280)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)
# check parameter 
print("Resolusi :", cap.get(cv2.CAP_PROP_FRAME_WIDTH), "x", cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
print("FPS :", cap.get(cv2.CAP_PROP_FPS))
```

### Manipulasi hasil pembacaan gambar
Pada OpenCV, terdapat berbagai fungsi yang dapat digunakan untuk memanipulasi gambar yang diperoleh melalui proses pemrosesan citra

Untuk melakukan resize dengan fungsi 
```python 
cv.resize()
```
inputnya harus berupa integer bukan floating number. itulah kenapa int() atau fungsi round() dapat di gunakan.

In [None]:
img = cv2.imread("source/full.jpg")
original_height, original_width, channels = img.shape

scale = 0.25

new_height = int(original_height * scale)
new_width = int(original_width * scale)

resized = cv2.resize(img, (new_width, new_height))

nah fungsi terdapat fitur ROI (Region of Interest) sama kayak penggunaan zoom dengan data yang hanya inginkan saja

In [None]:
img = cv2.imread("source/full.jpg")

# Ambil ROI (y: 50–250, x: 100–400) → tinggi 200, lebar 300
roi = img[50:250, 100:400]

# Tempel ROI ke posisi lain
img_copy = img.copy()
img_copy[0:200, 0:300] = roi

cv2.imshow("ROI", roi)
cv2.imshow("Pasted ROI", img_copy)

OpenCV bisa merotasi gambar karena dia pakai transformasi geometrik, tepatnya Affine Transformation.
Rotasi itu cuma salah satu bentuk affine transform/dia ngubah posisi tiap piksel berdasarkan rumus matematis rotasi.

more explanation for rotation: https://www.geeksforgeeks.org/computer-vision/python-opencv-getrotationmatrix2d-function/

In [None]:
center = (img.shape[1] // 2, img.shape[0] // 2)
angle = 45
scale = 1.0
rotation_matrix = cv2.getRotationMatrix2D(center, angle, scale)
maniped = cv2.warpAffine(img, rotation_matrix, (img.shape[1], img.shape[0]))

jadi output dari getRotationMatrix2D isinya rumus matematis buat muter + nge-scale + mindahin posisi gambar.

Melakukan penggambaran geometri pada openCV dapat di lakukan dengan fungsi-fungsi di bawah ini

In [None]:
cv2.line(img,(0,0),(511,511), (255,0,0), 5) 
cv2.circle(img, (250,250), 63, (50,50,0), -1)
cv2.rectangle(img,(384,0),(510,128),(0,255,0),3) 
cv2.putText(img, 'OpenCV', (10,500), cv2.FONT_HERSHEY_SIMPLEX, 4, (255,255,255), 2)

### Manipulasi warna & bitwise

Ruang warna itu cara menggambarkan dan menyimpan warna dalam gambar digital setiap “ruang” punya struktur berbeda (misalnya RGB, HSV, Grayscale)

secara default OpenCV akan menggunakan BGR bukan RGB

In [None]:
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
hsv  = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
rgb  = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

@Funfact 
kalau di coba
```python
print(img.shape)
```

outputnya = y, x, channel

pewarnaan gray hanya mengeluarkan height dan width saja channelnya tidak ada. 
sedangkan channel itu apa?

Channel = lapisan data yang menyimpan intensitas untuk satu komponen warna. 
Setiap piksel di gambar punya beberapa channel tergantung ruang warnanya.

Bayangin gambar warna itu kayak tumpukan tiga kertas transparan:
- satu kertas buat warna biru (B),
- satu buat hijau (G),
- satu buat merah (R).

Kalau ditumpuk bareng, jadilah gambar berwarna penuh.
Itu sebabnya gambar warna punya 3 channel.

##### Bitwise
Operasi “bitwise” artinya operasi logika tingkat bit antara dua gambar (atau gambar + mask) yang mempunyai dimensi dan tipe data sama.
Digunakan buat misalnya “masking” objek, ekstraksi bagian penting dari gambar, atau kombinasi dua citra

In [None]:
import cv2 

img1 = cv2.imread('input1.png')  
img2 = cv2.imread('input2.png') 

dest_and = cv2.bitwise_and(img2, img1, mask = None)
dest_or = cv2.bitwise_or(img2, img1, mask = None)
dest_xor = cv2.bitwise_xor(img2, img1, mask = None)
dest_not = cv2.bitwise_not(img2, mask = None)

### Challenge

- Challenge-1 buat script webcam:
    - Size = 640x480
    - mirror
    - tampilkan FPS
    - simpan frame tombol (s)
- Challenge-2 Shape detection:
    - jenis bentuk yang di deteksi: segitiga, lingkaran dan persegi
    - hasil deteksi buat bounding box + label bentuk apa yang terdeteksi
- Challenge-3 Color Tracker:
    - input webcam
    - warna orange & putih
    - deteksi kontur dari mask dan tampilakan output konturnya


@HINT: Step-step untuk melakukan contour:
- Baca gambar -> ubah ke grayscale -> blur untuk kurangi noise.
- Threshold / binarisasi supaya objek jelas kontra background.
- Temukan kontur dengan cv2.findContours()

#### ROS Integration

ROS Setup
```bash
mkdir ROS/src -p
cd src
catkin_create_pkg opencv rospy sensor_msgs cv_bridge image_transport
cd ..
catkin_make
```

In [None]:
# scripts/publisher.py
import rospy
from sensor_msgs.msg import Image
from cv_bridge import CvBridge
import cv2

def main():
    rospy.init_node('camera_publisher', anonymous=True)
    pub = rospy.Publisher('/camera/image_raw', Image, queue_size=10)
    bridge = CvBridge()
    rate = rospy.Rate(30)

    cap = cv2.VideoCapture(0)
    if not cap.isOpened():
        rospy.logerr("Camera not detected.")
        return

    while not rospy.is_shutdown():
        ret, frame = cap.read()
        if not ret:
            rospy.logwarn("Failed to grab frame.")
            continue

        msg = bridge.cv2_to_imgmsg(frame, encoding='bgr8')
        pub.publish(msg)
        rospy.loginfo("Published frame.")
        rate.sleep()

    cap.release()

if __name__ == '__main__':
    try:
        main()
    except rospy.ROSInterruptException:
        pass


In [None]:
# scripts/subscriber.py
import rospy
from sensor_msgs.msg import Image
from cv_bridge import CvBridge, CvBridgeError
import cv2

def callback(msg):
    bridge = CvaBridge()
    try:
        frame = bridge.imgmsg_to_cv2(msg, "bgr8")
    except CvBridgeError as e:
        rospy.logerr(f"CV Bridge error: {e}")
        return

    cv2.imshow("Camera Feed", frame)
    key = cv2.waitKey(1)
    if key == 27:  # ESC key
        rospy.signal_shutdown("ESC pressed.")

def main():
    rospy.init_node('image_subscriber', anonymous=True)
    rospy.Subscriber('/camera/image_raw', Image, callback)
    rospy.loginfo("Image subscriber started.")
    rospy.spin()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    main()


jangan lupa untuk membenahi bagian CMakeList.txt untuk python depedenciesnya seperti 
```cmake
catkin_install_python(PROGRAMS
 scripts/publisher.py
 scripts/subscriber.py
 DESTINATION ${CATKIN_PACKAGE_BIN_DESTINATION}
)
```

### Credit

[1]. Introduction to Opencv
https://binus.ac.id/malang/2017/10/introduction-to-open-cv/#:~:text=By%20%3A%20Hanugra%20Aulia%20Sidharta%2C%20S.T.,menyederhanakan%20programing%20terkait%20citra%20digital.

[2]. OpenCV Tutorial by Geeksforgeeks
https://www.geeksforgeeks.org/python/opencv-python-tutorial/

[3]. ROS Modul 1