# Instalação de pacotes

In [12]:
!powershell pip install \
            face_recognition \
            git+https://github.com/ageitgey/face_recognition_models \
            opencv-python \
            pillow \
            numpy \
            tqdm \
            qdrant-client \
            setuptools \
            ipywidgets \
            matplotlib \
            scikit-learn \
            scikit-image

Collecting git+https://github.com/ageitgey/face_recognition_models
  Cloning https://github.com/ageitgey/face_recognition_models to c:\users\despinxz\appdata\local\temp\pip-req-build-ht9vz2if
  Resolved https://github.com/ageitgey/face_recognition_models to commit e67de717267507d1e9246de95692eb8be736ab61
  Installing build dependencies: started
  Installing build dependencies: finished with status 'done'
  Getting requirements to build wheel: started
  Getting requirements to build wheel: finished with status 'done'
  Preparing metadata (pyproject.toml): started
  Preparing metadata (pyproject.toml): finished with status 'done'
Collecting scikit-image
  Downloading scikit_image-0.25.2-cp312-cp312-win_amd64.whl.metadata (14 kB)
Collecting networkx>=3.0 (from scikit-image)
  Downloading networkx-3.5-py3-none-any.whl.metadata (6.3 kB)
Collecting imageio!=2.35.0,>=2.33 (from scikit-image)
  Downloading imageio-2.37.0-py3-none-any.whl.metadata (5.2 kB)
Collecting tifffile>=2022.8.12 (from s

  Running command git clone --filter=blob:none --quiet https://github.com/ageitgey/face_recognition_models 'C:\Users\despinxz\AppData\Local\Temp\pip-req-build-ht9vz2if'


# Rodar QDrant

In [None]:
!powershell docker run -p 6333:6333 -p 6334:6334 qdrant/qdrant

# Imports

In [13]:
import os
import uuid
import numpy as np
from tqdm import tqdm
import tkinter as tk
from tkinter import filedialog
import face_recognition
import face_recognition_models
from qdrant_client import QdrantClient
from qdrant_client.http.models import Distance, VectorParams, PointStruct
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, VectorParams
from qdrant_client.models import Filter, SearchRequest
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import sklearn
import skimage

# Configurações

In [10]:
def cria_cliente():
    # Conectando ao Qdrant local
    client = QdrantClient("http://localhost:6333")
    return client

def cria_colecao(client, nome_colecao, tamanho_vetor):
    # Cria a coleção se não existir
    if nome_colecao not in [c.name for c in client.get_collections().collections]:
        client.recreate_collection(
            collection_name=nome_colecao,
            vectors_config=VectorParams(size=tamanho_vetor, distance=Distance.COSINE),
        )

# Códigos para processar imagens

### Gerar vetor de características por Local Binary Patterns

In [41]:
import cv2
import numpy as np
from skimage.feature import local_binary_pattern

def extrai_caracteristicas_lbp(caminho_imagem):
    imagem = cv2.imread(caminho_imagem)
    # Converte imagem para tons de cinza
    imagem_cinza = cv2.cvtColor(imagem, cv2.COLOR_BGR2GRAY)

    metodo = 'uniform'
    vetor_final = []

    # Para radius 1, 2 e 3
    for raio in [1, 2, 3]:
        n_pontos = 8 * raio

        # Aplica o LBP
        lbp = local_binary_pattern(imagem_cinza, n_pontos, raio, metodo)

        # Número de bins: n_pontos + 2 para o método 'uniform'
        n_bins = n_pontos + 2
        hist, _ = np.histogram(lbp.ravel(), bins=n_bins, range=(0, n_bins), density=True)

        # Adiciona o histograma ao vetor final
        vetor_final.extend(hist)

    id_ponto = str(uuid.uuid4())    # ID único 

    nome_pessoa = caminho_imagem.split("\\")[-1].split(".")[0]

    # Cria estrutura de ponto para inserir na coleção
    ponto = PointStruct(
            id=id_ponto,
            vector=vetor_final,
            payload={"nome": nome_pessoa, "arquivo": caminho_imagem})

    return ponto


### Gerar vetor de características por descritores faciais

In [42]:
import face_recognition
import numpy as np
import cv2

def extrai_caracteristicas_landmarks(caminho_imagem):
    imagem = cv2.imread(caminho_imagem)
    # Converte para RGB (face_recognition usa RGB)
    imagem_rgb = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

    # Detecta landmarks faciais
    face_landmarks_list = face_recognition.face_landmarks(imagem_rgb)

    # Se não encontrou rosto, retorna vetor vazio
    if not face_landmarks_list:
        return np.zeros(136)  # 68 pontos * 2 coordenadas (x, y)

    # Pegamos os landmarks da primeira face detectada
    landmarks = face_landmarks_list[0]

    # Reorganiza os pontos na ordem correta (68 pontos padrão)
    pontos = []
    for key in ['chin', 'left_eyebrow', 'right_eyebrow', 'nose_bridge', 'nose_tip',
                'left_eye', 'right_eye', 'top_lip', 'bottom_lip']:
        for ponto in landmarks[key]:
            pontos.append(ponto)

    # Garante que temos sempre 68 pontos
    if len(pontos) < 68:
        pontos += [(0, 0)] * (68 - len(pontos))

    # Normaliza por largura e altura da imagem
    h, w = imagem.shape[:2]
    vetor = []
    for (x, y) in pontos[:68]:
        vetor.append(x / w)
        vetor.append(y / h)

    id_ponto = str(uuid.uuid4())    # ID único 

    nome_pessoa = caminho_imagem.split("\\")[-1].split(".")[0]

    # Cria estrutura de ponto para inserir na coleção
    ponto = PointStruct(
            id=id_ponto,
            vector=vetor,
            payload={"nome": nome_pessoa, "arquivo": caminho_imagem})

    return ponto


### Gerar vetor de características por CNN

In [None]:
def extrai_caracteristicas_cnn(caminho_imagem):
    print(caminho_imagem)
    imagem = face_recognition.load_image_file(caminho_imagem)
    embeddings = face_recognition.face_encodings(imagem)
    if not embeddings:
        return None  # Nenhum rosto detectado
    vetor = embeddings[0]

    id_ponto = str(uuid.uuid4())    # ID único 

    nome_pessoa = caminho_imagem.split("\\")[-1].split(".")[0]

    # Cria estrutura de ponto para inserir na coleção
    ponto = PointStruct(
            id=id_ponto,
            vector=vetor,
            payload={"nome": nome_pessoa, "arquivo": caminho_imagem})

    return ponto

# Código para selecionar diretórios e separar conjuntos de treino e validação

In [None]:
import os
import random
from sklearn.model_selection import train_test_split

def separa_treino_validacao_lfw(base_dir, proporcao_treino=0.8):
    caminhos_treino = []
    caminhos_validacao = []

    for nome_pessoa in os.listdir(base_dir):
        caminho_pessoa = os.path.join(base_dir, nome_pessoa)

        if not os.path.isdir(caminho_pessoa):
            continue

        imagens = [os.path.join(caminho_pessoa, img) for img in os.listdir(caminho_pessoa)
                   if img.lower().endswith(('.jpg', '.png', '.jpeg'))]

        total_imagens = len(imagens)

        if total_imagens not in [8, 10, 12]:
            continue

        imagens.sort()  # garantir consistência
        random.seed(42)  # garantir que o shuffle será o mesmo em todas as execuções do código
        random.shuffle(imagens)

        treino, validacao = train_test_split(imagens, train_size=proporcao_treino, shuffle=False)

        caminhos_treino.extend(treino)
        caminhos_validacao.extend(validacao)

    return caminhos_treino, caminhos_validacao


# Código para inserir imagem numa coleção 

In [45]:
def inserir_imagem(nome_colecao, caminho_imagem, vetor_caracteristicas):
    id_ponto = str(uuid.uuid4())    # ID único 

    nome_pessoa = caminho_imagem.split("\\")[-1].split(".")[0]

    # Cria estrutura de ponto para inserir na coleção
    ponto = PointStruct(
            id=id_ponto,
            vector=vetor_caracteristicas,
            payload={"nome": nome_pessoa, "arquivo": caminho_imagem})
    
    client.upsert(collection_name=nome_colecao, points=[ponto])

# Cria coleções

In [46]:
def popular_colecoes():
    imagens_treino, imagens_validacao = separa_treino_validacao_lfw("lfw_funneled")

    caracteristicas_lbp_treino = []
    caracteristicas_landmark_treino = []
    caracteristicas_cnn_treino = []

    for imagem in tqdm(imagens_treino, desc="Processando imagens de treinamento..."):
        caracteristicas_lbp_treino.append(extrai_caracteristicas_lbp(imagem))
        caracteristicas_landmark_treino.append(extrai_caracteristicas_landmarks(imagem))
        caracteristicas_cnn_treino.append(extrai_caracteristicas_cnn(imagem))

    caracteristicas_lbp_validacao = []
    caracteristicas_landmark_validacao = []
    caracteristicas_cnn_validacao = []

    for imagem in tqdm(imagens_validacao, desc="Processando imagens de validação..."):
        caracteristicas_lbp_validacao.append(extrai_caracteristicas_lbp(imagem))
        caracteristicas_landmark_validacao.append(extrai_caracteristicas_landmarks(imagem))
        caracteristicas_cnn_validacao.append(extrai_caracteristicas_cnn(imagem))
    
    client.upsert(collection_name=lbp_treinamento, points=caracteristicas_lbp_treino)
    client.upsert(collection_name=lbp_validacao, points=caracteristicas_lbp_validacao)
    client.upsert(collection_name=landmarks_treinamento, points=caracteristicas_landmark_treino)
    client.upsert(collection_name=landmarks_validacao, points=caracteristicas_landmark_validacao)
    client.upsert(collection_name=cnn_treinamento, points=caracteristicas_cnn_treino)
    client.upsert(collection_name=cnn_validacao, points=caracteristicas_cnn_validacao)

# Main

In [49]:
client = cria_cliente()

# Cria coleções para cada método de avaliação
cria_colecao(client, "lbp_treinamento", 54)
cria_colecao(client, "lbp_validacao", 54)
cria_colecao(client, "landmarks_treinamento", 68)
cria_colecao(client, "landmarks_validacao", 68)
cria_colecao(client, "cnn_treinamento", 128)
cria_colecao(client, "cnn_validacao", 128)

In [50]:
popular_colecoes()

Processando imagens de treinamento...:   0%|          | 0/408 [00:00<?, ?it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0008.jpg


Processando imagens de treinamento...:   0%|          | 1/408 [00:00<03:46,  1.80it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0006.jpg


Processando imagens de treinamento...:   0%|          | 2/408 [00:01<03:45,  1.80it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0003.jpg


Processando imagens de treinamento...:   1%|          | 3/408 [00:01<03:47,  1.78it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0009.jpg


Processando imagens de treinamento...:   1%|          | 4/408 [00:02<03:47,  1.78it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0010.jpg


Processando imagens de treinamento...:   1%|          | 5/408 [00:02<03:53,  1.73it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0007.jpg


Processando imagens de treinamento...:   1%|▏         | 6/408 [00:03<03:48,  1.76it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0012.jpg


Processando imagens de treinamento...:   2%|▏         | 7/408 [00:03<03:45,  1.78it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0004.jpg


Processando imagens de treinamento...:   2%|▏         | 8/408 [00:04<03:42,  1.80it/s]

lfw_funneled\Adrien_Brody\Adrien_Brody_0005.jpg


Processando imagens de treinamento...:   2%|▏         | 9/408 [00:05<03:41,  1.80it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0004.jpg


Processando imagens de treinamento...:   2%|▏         | 10/408 [00:05<03:39,  1.82it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0005.jpg


Processando imagens de treinamento...:   3%|▎         | 11/408 [00:06<03:35,  1.84it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0007.jpg


Processando imagens de treinamento...:   3%|▎         | 12/408 [00:06<03:34,  1.84it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0008.jpg


Processando imagens de treinamento...:   3%|▎         | 13/408 [00:07<04:17,  1.53it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0003.jpg


Processando imagens de treinamento...:   3%|▎         | 14/408 [00:08<04:03,  1.62it/s]

lfw_funneled\Ali_Naimi\Ali_Naimi_0006.jpg


Processando imagens de treinamento...:   4%|▎         | 15/408 [00:08<03:56,  1.66it/s]

lfw_funneled\Al_Gore\Al_Gore_0004.jpg


Processando imagens de treinamento...:   4%|▍         | 16/408 [00:09<03:56,  1.66it/s]

lfw_funneled\Al_Gore\Al_Gore_0005.jpg


Processando imagens de treinamento...:   4%|▍         | 17/408 [00:09<03:47,  1.72it/s]

lfw_funneled\Al_Gore\Al_Gore_0007.jpg


Processando imagens de treinamento...:   4%|▍         | 18/408 [00:10<03:41,  1.76it/s]

lfw_funneled\Al_Gore\Al_Gore_0008.jpg


Processando imagens de treinamento...:   5%|▍         | 19/408 [00:10<03:37,  1.79it/s]

lfw_funneled\Al_Gore\Al_Gore_0003.jpg


Processando imagens de treinamento...:   5%|▍         | 20/408 [00:11<03:33,  1.82it/s]

lfw_funneled\Al_Gore\Al_Gore_0006.jpg


Processando imagens de treinamento...:   5%|▌         | 21/408 [00:11<03:32,  1.82it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0004.jpg


Processando imagens de treinamento...:   5%|▌         | 22/408 [00:12<03:31,  1.83it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0005.jpg


Processando imagens de treinamento...:   6%|▌         | 23/408 [00:13<03:28,  1.84it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0007.jpg


Processando imagens de treinamento...:   6%|▌         | 24/408 [00:13<04:11,  1.53it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0008.jpg


Processando imagens de treinamento...:   6%|▌         | 25/408 [00:14<03:57,  1.61it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0003.jpg


Processando imagens de treinamento...:   6%|▋         | 26/408 [00:15<03:51,  1.65it/s]

lfw_funneled\Ana_Palacio\Ana_Palacio_0006.jpg


Processando imagens de treinamento...:   7%|▋         | 27/408 [00:15<03:43,  1.70it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0008.jpg


Processando imagens de treinamento...:   7%|▋         | 28/408 [00:16<03:44,  1.69it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0006.jpg


Processando imagens de treinamento...:   7%|▋         | 29/408 [00:16<03:37,  1.74it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0003.jpg


Processando imagens de treinamento...:   7%|▋         | 30/408 [00:17<03:33,  1.77it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0009.jpg


Processando imagens de treinamento...:   8%|▊         | 31/408 [00:17<03:29,  1.80it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0010.jpg


Processando imagens de treinamento...:   8%|▊         | 32/408 [00:18<03:26,  1.83it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0007.jpg


Processando imagens de treinamento...:   8%|▊         | 33/408 [00:18<03:23,  1.85it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0012.jpg


Processando imagens de treinamento...:   8%|▊         | 34/408 [00:19<03:24,  1.83it/s]

lfw_funneled\Anna_Kournikova\Anna_Kournikova_0004.jpg


Processando imagens de treinamento...:   9%|▊         | 35/408 [00:20<03:34,  1.74it/s]


lfw_funneled\Anna_Kournikova\Anna_Kournikova_0005.jpg


IndexError: list index out of range