# Short Introduction with Dataset Rock-Paper-Scissors

Dataset yang akan digunakan pada ekskeprimen kali ini adalah dataset gambar yang terdiri dari 3 label: Rock-Paper-Scissors. Ketiga label tersebut juga sangat dikenal sebagai permainan tradisional sederhana yaitu Batu-Gunting-Kertas. Menurut author dataset ini, seluruh data yang ada diambil sebagai bagian dari projek hobi di mana author mengembangkan permainan Batu-Gunting-Kertas menggunakan Computer Vision dan Machine Learning di Raspberry PI.

Dataset Rock-Paper-Scissors ini memiliki jumlah total keseluruhan yaitu 2.188 gambar dimana gambar dengan label/kelas Batu memiliki jumlah data sebanyak 726 gambar. Label Kertas memiliki jumlah data sebanyak 712 gambar sedangkan label Gunting memiliki jumlah data sebanyak 750 gambar. Semua gambar dari ketiga label tersebut diambil dengan latar belakang hijau dengan pencahayaan dan white balance yang relatif konsisten.

Selain itu, semua gambar dari masing-masing tiga label tersebut adalah gambar RGB atau gambar berwarna dengan format gambar yaitu lebar 300 piksel dan tinggi 200 piksel dalam eksistensi file yaitu .PNG

## 1. Import Library and Read Dataset

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import tensorflow as tf
from tensorflow import keras
from PIL import Image
import cv2
from glob import *

In [2]:
"""
Memanggil seluruh data gambar dari setiap label gambar masing-masing yaitu label batu yang mewakili gambar batu,
label gunting mewakili gambar gunting dan label kertas mewakili gambar kertas
"""
rock_label_images = "../Rock_Paper_Scissors_Dataset/rock"
paper_label_images = "../Rock_Paper_Scissors_Dataset/paper"
scissors_label_images = "../Rock_Paper_Scissors_Dataset/scissors"

Jika pada saat ingin melakukan proses load/upload Dataset eksperimen dilakukan dengan cara "df = pd.read_csv() atau df = pd.read_excel()", maka jika Dataset yang digunakan adalah berformat gambar maka cara memproses/membaca Dataset tentu saja berbeda. Pada script diatas dapat diketahui bahwasanya pertama-tama saya melakukan proses definisi variabel terlebih dahulu untuk menyimpan lokasi/path dari masing-masing label dimana masing-masing label tersebut menyimpan seluruh gambar dengan gerakan tangan yang dilakukan (apakah gerakan tangan menunjukkan gambar Batu/Kertas/Gunting).

Ketiga label tersebut ditandai dengan nama folder yaitu "rock", "paper" dan "scissors" yang disimpan di dalam folder utama yaitu "Rock_Paper_Scissors_Dataset". Lalu arti dari "../" adalah karena lokasi dari file Notebook ini berada di dalam folder utama lainnya yang bernama "Skenario Eksperimen", maka agar dapat membaca seluruh data gambar berdasarkan labelnya saya harus keluar 1 folder dan masuk ke dalam folder "Rock_Paper_Scissors_Dataset".

In [3]:
"""
Memanggil seluruh data gambar yang lokasinya berada di masing-masing label/kelas gambar
yang dimana path/lokasi penyimpanan seluruh data dari masing-masing ketiga label telah disimpan
di dalam variabel yaitu "rock_label_images", "paper_label_images" dan "scissors_label_images" menggunakan module Glob
"""
# Data-data gerakan tangan yang menunjukkan gambar/foto Batu
rock_image_data = glob(rock_label_images + "/*.png")

# Data-data gerakan tangan manusia yang menunjukkan gambar/foto Kertas
paper_image_data = glob(paper_label_images + "/*.png")

# Data-data gerakan tangan manusia yang menunjukkan gambar/foto Gunting
scissors_image_data = glob(scissors_label_images + "/*.png")

Module Glob pada kasus Image Processing menggunakan Python kali ini bertujuan untuk mengambil/membaca/memuat banyak data gambar sekaligus berdasarkan lokasi file dari data gambar tersebut disimpan. Karena pada kasus sebelumnya saya telah mendefinisikan lokasi dari masing-masing file data gambar dari ketiga label, maka saya hanya tinggal memanggil ketiga variabel yang menyimpan lokasi file dari setiap masing-masing label yaitu "rock_label_images", "paper_label_images" dan "scissors_label_images". Ketiga variabel tersebut di-input di dalam module glob yang kemudian dikombinasikan dengan simbol "/*"

Simbol "/*" berfungsi untuk mencocokan segala jenis eksistensi file yang ada di dalam sub-folder tersebut untuk dipanggil ke dalam code. Sebagai contoh jika kita ingin hanya memanggil file dengan eksistensi .txt maka bisa gunakan script "/*.txt". Maka secara otomatis file yang akan terbaca hanyalah file yang memiliki eksistensi/format file sebagai .txt saja sedangkan jika terdapat format file lainnya seperti .docx tidak terbaca karena tidak termasuk ke dalam format .txt. Selain itu, jika ingin memanggil file yang hanya bereksistensi .jpg saja (karena pada eksperimen kali ini menggunakan data images) maka kita bisa menggunakan script "/*.jpg".

Lalu bagaimana jika kita ingin memanggil/membaca seluruh file data gambar tanpa memperdulikan format file? Maka kita dapat menggunakan "/*" yang itu berarti kita akan memuat/memanggil seluruh file yang dimiliki oleh sub-folder di dalamnya tanpa memperdulikan format dari suatu file.

In [4]:
"""
Menampilkan kelima nama file paling awal dari ketiga label (Rock, Paper, Scissors)
serta menampilkan jumlah total keseluruhan data terhadap masing-masing label/kelas gambar yaitu Rock, Paper dan Scissors
"""
print("Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Rock: ", rock_image_data[0:5], "\n")
print("Jumlah Total Data pada Label Gambar Gerakan Tangan Rock: ", len(rock_image_data), "\n")

print("Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Paper: ", paper_image_data[0:5], "\n")
print("Jumlah Total Data pada Label Gambar Gerakan Tangan Paper: ", len(paper_image_data), "\n")

print("Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Scissors: ", scissors_image_data[0:5], "\n")
print("Jumlah Total Data pada Label Gambar Gerakan Tangan Scissors: ", len(scissors_image_data), "\n")

Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Rock:  ['../Rock_Paper_Scissors_Dataset/rock\\00nKV8oHuTGi20gq.png', '../Rock_Paper_Scissors_Dataset/rock\\01dM3ewPIsnBICu1.png', '../Rock_Paper_Scissors_Dataset/rock\\02vG75hQW9Vp4oTl.png', '../Rock_Paper_Scissors_Dataset/rock\\0bioBZYFCXqJIulm.png', '../Rock_Paper_Scissors_Dataset/rock\\0NDYNEoDui7o64gU.png'] 

Jumlah Total Data pada Label Gambar Gerakan Tangan Rock:  726 

Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Paper:  ['../Rock_Paper_Scissors_Dataset/paper\\04l5I8TqdzF9WDMJ.png', '../Rock_Paper_Scissors_Dataset/paper\\0a3UtNzl5Ll3sq8K.png', '../Rock_Paper_Scissors_Dataset/paper\\0cb6cVL8pkfi4wF6.png', '../Rock_Paper_Scissors_Dataset/paper\\0eqArS2GgsBeqgSn.png', '../Rock_Paper_Scissors_Dataset/paper\\0Og76sl5CJhbxWWx.png'] 

Jumlah Total Data pada Label Gambar Gerakan Tangan Paper:  712 

Lima Nama File Paling Awal dari Label Gambar Gerakan Tangan Scissors:  ['../Rock_Paper_Scissors_Dataset/scissors\\0