In [1]:
# inline for plots to show up in jupyter notebook
%matplotlib inline

# Some dependencies
# Make sure you run the command "pip install -r requirements.txt before"
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
import PIL
from tqdm import tqdm
import os

In [2]:
DATASET = os.path.join(os.getcwd(),"YALE") 
DATA_DIR = os.path.join(os.getcwd(),"data")
POS_DIR = os.path.join(DATA_DIR,"pos")
FACE_DIR = os.path.join(os.getcwd(),"faces")
print("Dataset is ",DATASET)
print("Data Dir is ",DATA_DIR)
print("Pos Dir is ",POS_DIR)
print("Face Dir is ",FACE_DIR) 

Dataset is  C:\Users\SilC\A hybrid EigenFace and Viola Jones algorithm\EigenFaces-master\YALE
Data Dir is  C:\Users\SilC\A hybrid EigenFace and Viola Jones algorithm\EigenFaces-master\data
Pos Dir is  C:\Users\SilC\A hybrid EigenFace and Viola Jones algorithm\EigenFaces-master\data\pos
Face Dir is  C:\Users\SilC\A hybrid EigenFace and Viola Jones algorithm\EigenFaces-master\faces


In [3]:
# We define some functions that we will use a lot later on

# Below function is used to download the default haarcascade in opencv
# !wget https://raw.githubusercontent.com/opencv/opencv/master/data/haarcascades/haarcascade_frontalface_default.xml
face_cascade = cv.CascadeClassifier('haarcascade_frontalface_default.xml')

# This function reads image from the given image path 
def read_im(path):
    image = PIL.Image.open(path)
    return np.array(image)

# As working with images, this function plots any binnary image
def show_im(image):
    plt.imshow(image,cmap="gray")
    plt.show()

# This function uses the frontal haarcascade defined above to detect faces in given images
def find_faces(gray):
  faces = face_cascade.detectMultiScale(gray, 1.3, 2)
  return faces

In [4]:
# For preparing pos images 
SUB = 15        # Total Subjects
IPS = 22        # Total Images (11*2 as flipped too)

count = 0
for dirpath, dirnames, filenames in os.walk(FACE_DIR):
    for file in filenames:
        i = count // IPS + 1
        j = count % IPS + 1
        count+= 1

        im = PIL.Image.open(os.path.join(dirpath,file)) 
        new_file = "data/pos/" + str(i).zfill(2) + str(j).zfill(2) + '.jpg'
        print(new_file)
        im.save(new_file)

data/pos/0101.jpg
data/pos/0102.jpg
data/pos/0103.jpg
data/pos/0104.jpg
data/pos/0105.jpg
data/pos/0106.jpg
data/pos/0107.jpg
data/pos/0108.jpg
data/pos/0109.jpg
data/pos/0110.jpg
data/pos/0111.jpg
data/pos/0112.jpg
data/pos/0113.jpg
data/pos/0114.jpg
data/pos/0115.jpg
data/pos/0116.jpg
data/pos/0117.jpg
data/pos/0118.jpg
data/pos/0119.jpg
data/pos/0120.jpg
data/pos/0121.jpg
data/pos/0122.jpg
data/pos/0201.jpg
data/pos/0202.jpg
data/pos/0203.jpg
data/pos/0204.jpg
data/pos/0205.jpg
data/pos/0206.jpg
data/pos/0207.jpg
data/pos/0208.jpg
data/pos/0209.jpg
data/pos/0210.jpg
data/pos/0211.jpg
data/pos/0212.jpg
data/pos/0213.jpg
data/pos/0214.jpg
data/pos/0215.jpg
data/pos/0216.jpg
data/pos/0217.jpg
data/pos/0218.jpg
data/pos/0219.jpg
data/pos/0220.jpg
data/pos/0221.jpg
data/pos/0222.jpg
data/pos/0301.jpg
data/pos/0302.jpg
data/pos/0303.jpg
data/pos/0304.jpg
data/pos/0305.jpg
data/pos/0306.jpg
data/pos/0307.jpg
data/pos/0308.jpg
data/pos/0309.jpg
data/pos/0310.jpg
data/pos/0311.jpg
data/pos/0

In [5]:
# Making the info file for the pos data

if os.path.exists(os.path.join(DATA_DIR,"info.dat")):
    os.remove(os.path.join(DATA_DIR,"info.dat"))

for dirpath, dirnames, filenames in os.walk(POS_DIR):
    for file in filenames:
        img = read_im(os.path.join(dirpath,file))
        line = "pos" + "/" + file + " 1 {} {} {} {}\n".format(0,0,img.shape[0],img.shape[1])
        with open(os.path.join(DATA_DIR,"info.dat"),'a') as f:
            f.write(line)


In [6]:
# Preparing the negative data

NEG_DATASET = os.path.join(DATA_DIR,'gitneg')
NEG_DIR = os.path.join(DATA_DIR,'neg')
max = 600                                       # Max Neg Images
count = 0

im = np.array(im)
for dirpath, dirnames, filenames in os.walk(NEG_DATASET):
    for file in filenames:
        count += 1
        if count > max:
            break
        img = read_im(os.path.join(dirpath,file))
        img = cv.resize(img,im.T.shape,cv.INTER_AREA)
        line = "neg/{}\n".format(file)
        cv.imwrite(os.path.join(NEG_DIR,file),img)
        print(line, end="")  
        with open(os.path.join(NEG_DIR,"bg.txt"),'a') as f:
            f.write(line)


neg/neg-0002.jpg
neg/neg-0003.jpg
neg/neg-0004.jpg
neg/neg-0005.jpg
neg/neg-0006.jpg
neg/neg-0007.jpg
neg/neg-0009.jpg
neg/neg-0010.jpg
neg/neg-0011.jpg
neg/neg-0012.jpg
neg/neg-0013.jpg
neg/neg-0015.jpg
neg/neg-0016.jpg
neg/neg-0019.jpg
neg/neg-0020.jpg
neg/neg-0022.jpg
neg/neg-0023.jpg
neg/neg-0024.jpg
neg/neg-0025.jpg
neg/neg-0026.jpg
neg/neg-0027.jpg
neg/neg-0028.jpg
neg/neg-0029.jpg
neg/neg-0030.jpg
neg/neg-0031.jpg
neg/neg-0034.jpg
neg/neg-0035.jpg
neg/neg-0036.jpg
neg/neg-0037.jpg
neg/neg-0038.jpg
neg/neg-0039.jpg
neg/neg-0040.jpg
neg/neg-0041.jpg
neg/neg-0042.jpg
neg/neg-0044.jpg
neg/neg-0045.jpg
neg/neg-0046.jpg
neg/neg-0047.jpg
neg/neg-0048.jpg
neg/neg-0049.jpg
neg/neg-0050.jpg
neg/neg-0051.jpg
neg/neg-0052.jpg
neg/neg-0053.jpg
neg/neg-0054.jpg
neg/neg-0055.jpg
neg/neg-0056.jpg
neg/neg-0057.jpg
neg/neg-0058.jpg
neg/neg-0059.jpg
neg/neg-0060.jpg
neg/neg-0061.jpg
neg/neg-0062.jpg
neg/neg-0063.jpg
neg/neg-0064.jpg
neg/neg-0065.jpg
neg/neg-0066.jpg
neg/neg-0067.jpg
neg/neg-0068.j

neg/neg-0549.jpg
neg/neg-0550.jpg
neg/neg-0551.jpg
neg/neg-0552.jpg
neg/neg-0553.jpg
neg/neg-0554.jpg
neg/neg-0555.jpg
neg/neg-0556.jpg
neg/neg-0557.jpg
neg/neg-0559.jpg
neg/neg-0561.jpg
neg/neg-0562.jpg
neg/neg-0563.jpg
neg/neg-0564.jpg
neg/neg-0565.jpg
neg/neg-0566.jpg
neg/neg-0567.jpg
neg/neg-0569.jpg
neg/neg-0572.jpg
neg/neg-0573.jpg
neg/neg-0574.jpg
neg/neg-0575.jpg
neg/neg-0576.jpg
neg/neg-0577.jpg
neg/neg-0578.jpg
neg/neg-0579.jpg
neg/neg-0580.jpg
neg/neg-0581.jpg
neg/neg-0582.jpg
neg/neg-0584.jpg
neg/neg-0586.jpg
neg/neg-0588.jpg
neg/neg-0589.jpg
neg/neg-0590.jpg
neg/neg-0591.jpg
neg/neg-0592.jpg
neg/neg-0593.jpg
neg/neg-0594.jpg
neg/neg-0595.jpg
neg/neg-0596.jpg
neg/neg-0597.jpg
neg/neg-0598.jpg
neg/neg-0599.jpg
neg/neg-0600.jpg
neg/neg-0601.jpg
neg/neg-0602.jpg
neg/neg-0603.jpg
neg/neg-0604.jpg
neg/neg-0605.jpg
neg/neg-0606.jpg
neg/neg-0607.jpg
neg/neg-0608.jpg
neg/neg-0609.jpg
neg/neg-0610.jpg
neg/neg-0611.jpg
neg/neg-0612.jpg
neg/neg-0613.jpg
neg/neg-0614.jpg
neg/neg-0615.j