# Análise de Comunicação por Gestos com Python



## Descrição

Este projeto propõe uma solução para a análise e compreensão da comunicação por gestos, priorizando eficiência e simplicidade. 

Ao examinar os gestos através de vetores e áreas de bounding box, a solução calcula de forma rápida a área média, mínima e máxima das bounding boxes, identificando gestos de maneira eficaz. 

A capacidade de processar matrizes em arquivos JSON, sem depender de bibliotecas complexas, destaca-se, proporcionando reconhecimento eficiente de gestos.

A solução gerencia dados de entrada, realiza cálculos usando funções nativas do Python (map, filter, reduce) e salva estatísticas em um arquivo CSV, tornando o projeto versátil e acessível.

### Apresentação

A apresentação do projeto foi realizada no formato de pitch.

Você pode visualizar a apresentação [aqui](https://github.com/felipeoliveirafranco/vem-ser-tech-dados/blob/main/modulo02/projeto/Apresenta%C3%A7%C3%A3o%20do%20Projeto.pdf).

In [None]:
# importações
import json
import timeit
from functools import reduce
import csv

O arquivo JSON que deve ser carregado está disponível [aqui](https://github.com/felipeoliveirafranco/vem-ser-tech-dados/blob/main/modulo02/projeto/gestures.json).

In [None]:
def carrega_dados(path:str = 'gestures.json') -> list[dict]:
    try:
        with open(path, 'r') as arquivo:
            dados = arquivo.read()
            return json.loads(dados)
    except FileNotFoundError:
        return []

In [None]:
gestures = carrega_dados()

In [None]:
# formata cada item
def formata_dados(frame: dict) -> str:
    return '\n'.join([f'{key.title()}: {value}' for key, value in frame.items()])

In [None]:
# formata todos os items da lista
def formata_dados_todos(frames: list[dict]) -> str:
    return '\n\n'.join(list(map(formata_dados, frames)))

In [None]:
# visualizar dados
print(formata_dados_todos(gestures))

Frame: 1
Bbox1: [167, 423, 53, 52]
Bbox2: [105, 429, 36, 48]
Gesture: Thumb_Up

Frame: 2
Bbox1: [137, 355, 48, 56]
Bbox2: [72, 347, 40, 62]
Gesture: Thumb_Up

Frame: 3
Bbox1: [0, 0, 0, 0]
Bbox2: [0, 0, 0, 0]
Gesture: None

Frame: 4
Bbox1: [411, 280, 72, 95]
Bbox2: [539, 275, 62, 86]
Gesture: Thumb_Down

Frame: 5
Bbox1: [516, 271, 74, 56]
Bbox2: [410, 280, 64, 85]
Gesture: None

Frame: 6
Bbox1: [65, 213, 75, 65]
Bbox2: [160, 250, 66, 49]
Gesture: Pointing_Up

Frame: 7
Bbox1: [0, 0, 0, 0]
Bbox2: [0, 0, 0, 0]
Gesture: None

Frame: 8
Bbox1: [0, 0, 0, 0]
Bbox2: [0, 0, 0, 0]
Gesture: None

Frame: 9
Bbox1: [0, 0, 0, 0]
Bbox2: [0, 0, 0, 0]
Gesture: None

Frame: 10
Bbox1: [380, 283, 53, 102]
Bbox2: [0, 0, 0, 0]
Gesture: Pointing_Up

Frame: 11
Bbox1: [0, 0, 0, 0]
Bbox2: [0, 0, 0, 0]
Gesture: None

Frame: 12
Bbox1: [153, 263, 42, 58]
Bbox2: [0, 0, 0, 0]
Gesture: None


In [None]:
novo_dado = {
    "frame": 13,
    "bbox1": [
      0,
      0,
      0,
      0
    ],
    "bbox2": [
      0,
      0,
      0,
      0
    ],
    "gesture": "None"
  }

def inserir_dado(novo_dado: dict, path:str = 'gestures.json'):
    try:
# Carrega os dados existentes do arquivo
        with open(path, 'r') as arquivo:
            dados = json.load(arquivo)
    except FileNotFoundError:
# Se o arquivo não existe, comece com uma lista vazia
        dados = []

# Adiciona o novo dado à lista
    dados.append(novo_dado)

# Escreve os dados atualizados de volta no arquivo JSON
    with open(path, 'w') as arquivo:
        json.dump(dados, arquivo, indent=2)

# Exemplo:
inserir_dado(novo_dado, 'gestures.json')
print (gestures)

[{'frame': 1, 'bbox1': [167, 423, 53, 52], 'bbox2': [105, 429, 36, 48], 'gesture': 'Thumb_Up'}, {'frame': 2, 'bbox1': [137, 355, 48, 56], 'bbox2': [72, 347, 40, 62], 'gesture': 'Thumb_Up'}, {'frame': 3, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 4, 'bbox1': [411, 280, 72, 95], 'bbox2': [539, 275, 62, 86], 'gesture': 'Thumb_Down'}, {'frame': 5, 'bbox1': [516, 271, 74, 56], 'bbox2': [410, 280, 64, 85], 'gesture': 'None'}, {'frame': 6, 'bbox1': [65, 213, 75, 65], 'bbox2': [160, 250, 66, 49], 'gesture': 'Pointing_Up'}, {'frame': 7, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 8, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 9, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 10, 'bbox1': [380, 283, 53, 102], 'bbox2': [0, 0, 0, 0], 'gesture': 'Pointing_Up'}, {'frame': 11, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 12, 'bbox1': [153, 263, 4

In [None]:
def deletar_dado(objeto: str, path: str = 'gestures.json'):
    dados = carrega_dados(path)

    # Filtra os dados para manter apenas aqueles com "objeto" diferente do especificado
    dados_filtrados = [dado for dado in dados if dado["frame"] != objeto]

    # Escreve os dados filtrados de volta no arquivo JSON
    with open(path, 'w') as arquivo:
        json.dump(dados_filtrados, arquivo, indent=2)

# Exemplo:
objeto_a_deletar = 13
deletar_dado(objeto_a_deletar, 'gestures.json')
print (gestures)

[{'frame': 1, 'bbox1': [167, 423, 53, 52], 'bbox2': [105, 429, 36, 48], 'gesture': 'Thumb_Up'}, {'frame': 2, 'bbox1': [137, 355, 48, 56], 'bbox2': [72, 347, 40, 62], 'gesture': 'Thumb_Up'}, {'frame': 3, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 4, 'bbox1': [411, 280, 72, 95], 'bbox2': [539, 275, 62, 86], 'gesture': 'Thumb_Down'}, {'frame': 5, 'bbox1': [516, 271, 74, 56], 'bbox2': [410, 280, 64, 85], 'gesture': 'None'}, {'frame': 6, 'bbox1': [65, 213, 75, 65], 'bbox2': [160, 250, 66, 49], 'gesture': 'Pointing_Up'}, {'frame': 7, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 8, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 9, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 10, 'bbox1': [380, 283, 53, 102], 'bbox2': [0, 0, 0, 0], 'gesture': 'Pointing_Up'}, {'frame': 11, 'bbox1': [0, 0, 0, 0], 'bbox2': [0, 0, 0, 0], 'gesture': 'None'}, {'frame': 12, 'bbox1': [153, 263, 4

In [None]:
# replica os itens e ajusta o frame
def replica_itens(entrada, numero_de_replicas=100) -> list:
    replicado = []

    for i in range(numero_de_replicas):
        for j in range(len(entrada)):
            item_replicado = entrada[j].copy()
            item_replicado['frame'] = len(replicado) + 1
            replicado.append(item_replicado)

    return replicado

In [None]:
# cria variavel com 100 replicas
gestures_cem = replica_itens(gestures)

# cria variavel com 10 000 replicas
gestures_dez_mil = replica_itens(gestures)

In [None]:
# total de pixels da imagem
total_de_pixels = 640*480

In [None]:
# funcao para calcular a area de uma bbox - porcentagem da area total da imagem
def bbox_area(bbox) -> list:
  # bbox [xmin, ymin, width, height]
  _, _, width, height = bbox
  return ((width * height)/total_de_pixels)*100

In [None]:
# apenas um teste para vizualizar o resultado do calculo de area
bbox_area(gestures[5]["bbox1"])

1.5869140625

In [None]:
# funcao para somar as areas por frame
def soma_area(frame) -> list:
  return bbox_area(frame["bbox1"]) + bbox_area(frame["bbox2"])

In [None]:
# funcao para calcular area por frame
def area_por_frame(gestures) -> list:
  return list(map(soma_area, gestures))

In [None]:
### testando até aqui
area_por_frame(gestures)

[1.4596354166666667,
 1.682291666666667,
 0.0,
 3.962239583333333,
 3.1197916666666665,
 2.6396484375,
 0.0,
 0.0,
 0.0,
 1.759765625,
 0.0,
 0.7929687499999999]

In [None]:
# segundo a regra de negocio, frames sem deteccao de mao devem ser desconsiderados
# funcao para filtrar os frames que nao tiveram deteccao de nenhuma mao, ou seja, valor = 0.
def remover_area_zero(gestures) -> tuple:
  return tuple(filter(lambda x: x > 0, area_por_frame(gestures)))

In [None]:
# armazena lista de áreas - lembrando que frames sem deteccao foram eliminados
remover_area_zero(gestures)

(1.4596354166666667,
 1.682291666666667,
 3.962239583333333,
 3.1197916666666665,
 2.6396484375,
 1.759765625,
 0.7929687499999999)

In [None]:
# funcao para calcular a media das areas
def media_area(lista_areas):
    soma = reduce(lambda x, y : x + y, lista_areas)
    return round(soma/len(lista_areas), 2)

# funcao para calcular a area maxima ou minima
def extremos_area(lista_areas, estatistica = 'min'):

    valor_extremo = max(lista_areas) if estatistica == 'max' else min(lista_areas)
    indice = [i for i, valor in enumerate(lista_areas) if valor == valor_extremo]

    return valor_extremo, indice[0]

# solicita a operacao desejada ao usuario
estatistica = input("Qual operação que deseja realizar? Digite 'min' para calcular a menor área, e 'max' para calcular a maior área: ")

# chama a funcao extremos_area com a estatistica escolhida pelo usuario
resultados = extremos_area(remover_area_zero(gestures), estatistica)

# imprimir os resultados
print(f'A média das áreas é de {media_area(remover_area_zero(gestures))}')
print(f'O valor extremo é {round(resultados[0],2)}% da área da imagem e o índice é {resultados[1]}.')

Qual operação que deseja realizar? Digite 'min' para calcular a menor área, e 'max' para calcular a maior área: max
A média das áreas é de 2.2
O valor extremo é 3.96% da área da imagem e o índice é 2.


In [None]:
def salvar_dados_json(dados:list[dict], path:str = 'gestures.json') -> bool:
    try:
        with open(path, 'w') as arquivo:
            arquivo.write(json.dumps(dados))
            return True
    except Exception:
        return False

In [None]:
dados_para_csv = [['Mean', 'Min','Max'],
                 [media_area(remover_area_zero(gestures)),
                 extremos_area(remover_area_zero(gestures))[0],
                 extremos_area(remover_area_zero(gestures), "max")[0]]]

In [None]:
# funcao para salvar as metricas extraidas em um arquivo csv
def salvar_csv(dados_para_csv, path='metricas.csv'):
    # abrir o arquivo CSV com o encoding UTF-8
    with open(path, 'w', encoding='utf-8') as arquivo:
        # especificar regras
        escritor = csv.writer(arquivo, delimiter=';', lineterminator='\n')

        # escrever uma lista de listas em formato CSV:
        escritor.writerows(dados_para_csv)

In [None]:
# salvar arquivo
salvar_csv(dados_para_csv)

In [None]:
# comparativo de tempo de processamento
# 12 itens
%timeit -n 1000 -r 100 %timeit
media_um = media_area(remover_area_zero(gestures))

4.58 µs ± 748 ns per loop (mean ± std. dev. of 100 runs, 1000 loops each)


In [None]:
# comparativo de tempo de processamento
# 1200 itens
%timeit -n 1000 -r 100 %timeit
media_cem = media_area(remover_area_zero(gestures_cem))

6.86 µs ± 1.58 µs per loop (mean ± std. dev. of 100 runs, 1000 loops each)


In [None]:
# comparativo de tempo de processamento
# 120000 itens
%timeit -n 1000 -r 100 %timeit
media_dez_mil = media_area(remover_area_zero(gestures_dez_mil))

7.44 µs ± 798 ns per loop (mean ± std. dev. of 100 runs, 1000 loops each)
