**Recuperação de Informação com base no Conteúdo Visual**

**Descrição de imagens**

Descritor representa a propriedade de uma imagem. O descritor deve ser invariante a rotação, escala, etc.

Exemplo de uma forma (muito simples) de se obter uma representação númerica sobre a imagem por meio de histograma de cor.

In [None]:
import numpy as np
import cv2
from google.colab.patches import cv2_imshow

In [None]:
%%time
img_lena = cv2.imread('lena.png',0)

cv2_imshow(img_lena)
# cv2.imshow(img)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

hist, bins = np.histogram(img_lena.ravel(),256,[0,256])

print(bins)
print(hist)

**Plotting Histograms**

In [None]:
from matplotlib import pyplot as plt

In [None]:
plt.hist(img_lena.ravel(),256,[0,256]); plt.show()

Histograma de cor da imagem nos três canais RGB

In [None]:
img_lena_bgr = cv2.imread('lena.png')

cv2_imshow(img_lena_bgr)

color = ('b','g','r')
for i,col in enumerate(color):
    histr = cv2.calcHist([img_lena_bgr],[i],None,[256],[0,256])
    plt.plot(histr,color = col)
    plt.xlim([0,256])

plt.show()

**Feature Detection and Description**

**Features Locais**

Features locais: Padrão que se difere da vizinhança local. 
Pontos de interesse: cantos (corners), regiões, etc..

**BRIEF (Binary Robust Independent Elementary Features)**

In [None]:
# para imprimir a matriz completa, descomentar as duas linhas abaixo
# import sys
# np.set_printoptions(threshold=sys.maxsize)

In [None]:
# BRIEF não possui detector de pontos de interesse
# Initiate STAR detector
star = cv2.xfeatures2d.StarDetector_create()

# Initiate BRIEF extractor
brief = cv2.xfeatures2d.BriefDescriptorExtractor_create()

In [None]:
img_baggage = cv2.imread('baggage_claim.jpg', 0)

In [None]:
# find the keypoints with STAR
kp = star.detect(img_baggage,None)

# compute the descriptors with BRIEF
kp, feat = brief.compute(img_baggage, kp)

print(len(kp))
print(feat.shape)
print(feat)

**ORB (Oriented FAST and Rotated BRIEF)**

In [None]:
# Initiate ORB detector
orb = cv2.ORB_create()

# find the keypoints and descriptors with SIFT
kp1, des1 = orb.detectAndCompute(img_baggage,None)

print(np.shape(des1))
print(des1)

Matching de features locais entre duas imagens

In [None]:
import imutils

In [None]:
# create BFMatcher object
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)

In [None]:
img1 = cv2.imread('baggage_claim.jpg',0)             
img2 = cv2.imread('baggage_claim.jpg',0)  

# rotate image 180° 
rotated = imutils.rotate(img2, 180)
img2 = rotated

In [None]:
# find the keypoints and descriptors with SIFT
kp1, desc1 = orb.detectAndCompute(img1,None)
kp2, desc2 = orb.detectAndCompute(img2,None)

# Match descriptors.
matches = bf.match(desc1,desc2)

# Sort them in the order of their distance.
matches = sorted(matches, key = lambda x:x.distance)

# Draw first 10 matches.
img3 = cv2.drawMatches(img1,kp1,img2,kp2,matches[:10],None,flags=2)

plt.imshow(img3),plt.show()

In [None]:
# rotate image 180° 
rotated = imutils.rotate(img_lena, 180)
img_lena_rotated = rotated

# find the keypoints and descriptors with SIFT
kp1, desc1 = orb.detectAndCompute(img_lena,None)
kp2, desc2 = orb.detectAndCompute(img_lena_rotated,None)

# Match descriptors.
matches = bf.match(desc1,desc2)

# Sort them in the order of their distance.
matches = sorted(matches, key = lambda x:x.distance)

# Draw first 10 matches.
img_lena_matches = cv2.drawMatches(img_lena,kp1,img_lena_rotated,kp2,matches[:10],None,flags=2)

plt.imshow(img_lena_matches),plt.show()

**Busca de vídeo com base em conteúdo visual**

**Lendo um vídeo em OpenCV**

Abre e extrai keyframes do vídeo salvando em disco

In [None]:
from os import listdir
from os.path import isfile, join
import os
import os.path
import sys
import pickle

In [None]:
frames_dir = "frames/"

features_dir = "features/"

cluster_dir = "cluster/"

bow_dir = "bow/"

videos = "videos/"

search = "search/"

if not os.path.exists(frames_dir):
    os.makedirs(frames_dir)  

if not os.path.exists(features_dir):
    os.makedirs(features_dir)  
  
if not os.path.exists(cluster_dir):
    os.makedirs(cluster_dir)  

if not os.path.exists(bow_dir):
    os.makedirs(bow_dir)

if not os.path.exists(videos):
    os.makedirs(videos)

if not os.path.exists(search):
    os.makedirs(search)

In [None]:
# video path
video_dir = "videos/"

# video file
video = "videos/airport.mp4"

# create VideoCapture object and read from video file
cap = cv2.VideoCapture(video)

# frames per second
video_frames = 30

# frame id
id_frame = 0

ret = True
while ret:
    # capture frame by frame
    ret, frame = cap.read()

    # video length
    length = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))

    if (id_frame % video_frames) == 0 and ret:

        print("Proccessing frame " + str(id_frame) + " of " + str(length))

        frame_path = os.path.join(frames_dir, str(id_frame) + ".png")

        # salva a imagem (frame) no disco
        cv2.imwrite(frame_path, frame)
    
    id_frame += 1
  
print("Done")

In [None]:
frame = cv2.imread('frames/450.png')
cv2_imshow(frame)

Extraindo descritores do frames do vídeo usando BRIEF Descriptor

In [None]:
# leitura das imagens do diretório
onlyfiles = []
if os.path.exists(frames_dir):
    onlyfiles = [f for f in listdir(frames_dir) if isfile(join(frames_dir, f))]
    
    # processa cada arquivo de imagem de um diretório
    for file in onlyfiles:

        print(file)
    
        img_path = join(frames_dir, file)

        img = cv2.imread(img_path)

        # opcional: redimensiona a imagem
        # img = cv2.resize(
        #  img, (160, 160), interpolation=cv2.INTER_CUBIC)
        
        # Initiate STAR detector
        star = cv2.xfeatures2d.StarDetector_create()

        # Initiate BRIEF extractor
        brief = cv2.xfeatures2d.BriefDescriptorExtractor_create()

        # find the keypoints with STAR
        kp = star.detect(img,None)

        # compute the descriptors with BRIEF
        kp, feat = brief.compute(img, kp)        

        print(len(kp))
        print(np.shape(feat))
        # print(feat)

        feat_path = join(features_dir, file)

        # store the data as binary data stream
        with open(feat_path + ".brief", "wb") as f:            
            pickle.dump(feat.tolist(), f)        

        # f = open(feat_path + ".brief.txt", "w")
        # f.write(str(feat.tolist()))
        # f.close()

**Criação do vocabulário visual**

**1. Clusterização**

In [None]:
from sklearn.cluster import KMeans
import time

In [None]:
cluster_file = cluster_dir + "cluster.cluster"

In [None]:
# número de clusters
k = 64

# núimeros de dimensões das features
dim = 32

In [None]:
# salva o vocabulário criado (centroids) em disco
def saveCentroids (kmeans, output_file, dim):
    i = 0
    desc = ""

    for k in np.nditer(kmeans.cluster_centers_):        
        a = np.array(k).round(2)
        desc += str(a) + " "
        i += 1        

        if (i % dim) == 0:
            desc += "\n" 

    output_file.write(desc)

In [None]:
listOfFeat = []

# leitura das imagens do diretório
onlyfiles = []
if os.path.exists(features_dir):
    onlyfiles = [f for f in listdir(features_dir) if isfile(join(features_dir, f))]
    
    # processa cada arquivo de imagem de um diretório
    for file in onlyfiles:
        # print(file)
    
        feat_path = join(features_dir, file)

        with open(feat_path, 'rb') as f:
            # read the data as binary data stream
            feat = pickle.load(f)

        # print(feat)

        for item in feat:
            listOfFeat.append(item)

output_file = open(cluster_file, 'w')

# print( np.asarray(listOfFeat) )
print( np.asarray(listOfFeat).shape )
# output_file.write(np.asarray(listOfFeat[0]))
    
t1 = time.time()  
kmeans = KMeans(n_clusters=k, random_state=0).fit(np.asarray(listOfFeat))
t2 = time.time()
tf = t2 - t1

print(tf)

saveCentroids (kmeans, output_file, dim)  
output_file.close()

In [None]:
!cat cluster/cluster.cluster

**2. Bag of Visual Word**

In [None]:
%%time
# leitura dos centroids do arquivo
centroids = np.loadtxt(cluster_file)

# obtem o número de centroids (palavras visuais)
clusters = centroids.shape[0]

# leitura das imagens do diretório
onlyfiles = []
if os.path.exists(features_dir):
    onlyfiles = [f for f in listdir(features_dir) if isfile(join(features_dir, f))]

    bowOfImages = []    
    
    # processa cada arquivo de imagem de um diretório
    for file in onlyfiles:
    
        feat_path = join(features_dir, file)

        with open(feat_path, 'rb') as f:
            # read the data as binary data stream
            feat = pickle.load(f)        

        # inicializa o BoW da imagem com zero para cada dimensão
        bow = [0] * clusters

        # procedimento força bruta para cálculo de distância (euclidean distance)
        for item in feat:
            result = sys.float_info.max
            centroid_id = 0

            for id, c in enumerate(centroids):
               # Euclidean Distance 
               dist = np.sqrt(np.sum(np.square(np.subtract(item, c))))
               if dist < result:
                  result = dist
                  centroid_id = id

            bow[centroid_id] += 1                     
        
        bow_path = join(bow_dir, file)

        with open(bow_path + ".bow", 'w') as f:
            for item in bow:
                f.write("%s " % item)

print("Done")

In [None]:
!cat bow/450.png.brief.bow

**Busca**

Utilizando um arquivo de BoW de uma imagem do próprio vídeo

In [None]:
%%time
# leitura das imagens do diretório

q = np.loadtxt(bow_dir + "450.png.brief.bow")

onlyfiles = []
if os.path.exists(bow_dir):
    onlyfiles = [f for f in listdir(bow_dir) if isfile(join(bow_dir, f))]

    # processa cada arquivo de imagem de um diretório
    for file in onlyfiles:

        feat_path = join(bow_dir, file)

        item = np.loadtxt(feat_path)

        # print(item)
        # print(item.shape)

        dist = np.sqrt(np.sum(np.square(np.subtract(item, q))))

        print(str(file) + ": " + str(dist))

Altere a quantidade de clsuter para k = 64 e repita o procedimento acima, compare os resultados de cálculo de distância. O que mudou em relação às distâncias calculadas?

**Utilizando uma nova imagem qualquer**

Calculando features locais da imagem de consulta

In [None]:
frame = cv2.imread('search/beluga.jpg')
cv2_imshow(frame)

In [None]:
search_dir = "search/"
q = search_dir + "beluga.jpg"
q_feature = q + ".brief"
q_bow = q_feature + ".bow"

In [None]:
img_search = cv2.imread(q)

# Initiate STAR detector
star = cv2.xfeatures2d.StarDetector_create()

# Initiate BRIEF extractor
brief = cv2.xfeatures2d.BriefDescriptorExtractor_create()

# find the keypoints with STAR
kp = star.detect(img_search,None)

# compute the descriptors with BRIEF
kp, feat = brief.compute(img_search, kp)        

print(len(kp))
print(np.shape(feat))
# print(feat)

# store the data as binary data stream
with open(q_feature, "wb") as f:            
  pickle.dump(feat.tolist(), f)        

Calculando BoW da imagem de consulta (observe que o mesmo vocabulário visual calculado anteriormente é utilizado)

In [None]:
# leitura dos centroids do arquivo
centroids = np.loadtxt(cluster_file)

# obtem o número de centroids (palavras visuais)
clusters = centroids.shape[0]

with open(q_feature, 'rb') as f:
    # read the data as binary data stream
    feat = pickle.load(f)        

    # inicializa o BoW da imagem com zero para cada dimensão
    bow = [0] * clusters

    # procedimento força bruta para cálculo de distância (euclidean distance)
    for item in feat:
        result = sys.float_info.max
        centroid_id = 0

        for id, c in enumerate(centroids):
            dist = np.sqrt(np.sum(np.square(np.subtract(item, c))))
            if dist < result:
              result = dist
              centroid_id = id

        bow[centroid_id] += 1                     

    with open(q_bow, 'w') as f:
        for item in bow:
            f.write("%s " % item)

print("Done")

In [None]:
!cat search/beluga.jpg.brief.bow

Realizando a consulta

In [None]:
# leitura das imagens do diretório

q = np.loadtxt(q_bow)

onlyfiles = []
if os.path.exists(bow_dir):
    onlyfiles = [f for f in listdir(bow_dir) if isfile(join(bow_dir, f))]

    # processa cada arquivo de imagem de um diretório
    for file in onlyfiles:

        feat_path = join(bow_dir, file)

        item = np.loadtxt(feat_path)

        # print(item)
        # print(item.shape)

        dist = np.sqrt(np.sum(np.square(np.subtract(item, q))))

        print(str(file) + ": " + str(dist))

In [None]:
frame = cv2.imread('frames/480.png')
cv2_imshow(frame)