# Compondo com inteligência
Mateus Augusto Viotto - PC3008967

## Bibliotecas

In [1]:
import numpy as np
from skimage import io, transform, util
import cv2
import tensorflow.compat.v1 as tf
#from google.colab.patches import cv2_imshow

### Altere para os diretórios correspondentes.

In [2]:
diretorio_vocabulario = 'vocabulary_semantic.txt' #ALTERE PARA O DIRETÓRIO DO VOCABULARIO DISPONÍVEL EM https://github.com/OMR-Research/tf-end-to-end/blob/master/Data/vocabulary_semantic.txt
diretorio_modelo = '/content/models/semantic_model.meta' #ALTERE PARA O DIRETÓRIO DO MODELO DISPONÍVEL EM https://grfia.dlsi.ua.es/primus/models/PrIMuS/Semantic-Model.zip

## Funções ler e salvar

Salva a imagem em formato *jpg* no diretório atual.

In [3]:
def salvar_imagem(imagem, nome):
  io.imsave(nome+'.jpg', imagem)

Lê o vocabulário armazenado no arquito *txt* e armazena em um dicionário.

In [4]:
def ler_vocabulario(diretorio):
  # Abra o arquivo para leitura
  with open(diretorio, 'r') as arquivo:
      # Leia as linhas e armazene em uma lista
      linhas = arquivo.readlines()

  # Cada elemento da lista representa uma linha do arquivo

  dicionario = dict()
  i = 0
  for palavra in linhas:

      dicionario[i] = palavra.replace("\n", "")
      i += 1
  return dicionario


Importa o modelo armazenado na pasta *Model*.

In [5]:
def ler_modelo(diretorio):
    # Desabilitar a execução ansiosa
    tf.compat.v1.disable_eager_execution()
    # Cria um novo grafo padrão do TensorFlow
    tf.reset_default_graph()
    sess = tf.InteractiveSession()
    # Cria um objeto Saver para importar o modelo
    saver = tf.train.import_meta_graph(diretorio)

    # Restaura os parâmetros do modelo a partir do arquivo
    saver.restore(sess, diretorio[:-5])  # Remove a extensão ".meta" do diretório


## Funções Pré-processamento

Converte uma imagem colorida para escala de cinza.

In [6]:
def deixar_cinza(imagem):
  return cv2.cvtColor(imagem, cv2.COLOR_BGR2GRAY)

Binariza a imagem utilizando o método *threshold_sauvola*.

In [7]:
def binarizar(image):
  from skimage.filters import threshold_sauvola

  # tamanho da janela de cálculo local do limiar
  window_size = 101

  # fator de sensibilidade
  k = 0.2

  # Calcule o limiar de Sauvola
  threshold = threshold_sauvola(image, window_size=window_size, k=k)

  # Aplique o limiar à imagem para binarizá-la
  binary_image = image > threshold

  return binary_image


Plota um gráfico horizontal da projeção horizontal para visualização da linha de pauta.

In [None]:
def linhadepauta(projection_data):
  import matplotlib.pyplot as plt

  # Combina os arrays em um único array
  combined_data = [item for sublist in projection_data for item in sublist]

  # Define o intervalo de exibição no eixo X
  x_values = range(1, len(combined_data) + 1)  # De 1 a N

  # Define o passo para os rótulos do eixo X (exibe a cada 300 valores)
  x_ticks = list(range(1, len(combined_data) + 1, 50))  # Exibe a cada 300 valores

  # Cria um gráfico de barras horizontais
  plt.barh(x_values, combined_data, color='black')

  # Inverte o eixo Y para que os valores mais altos fiquem no topo
  plt.gca().invert_yaxis()

  # Configura os rótulos do eixo X
  plt.yticks(x_ticks, x_ticks)

  plt.show()




Calcula a projeção horizontal.

In [None]:
def calcular_projecao(img_data, col_row=1):
    # Cria uma máscara onde os valores 0 na imagem original são mapeados para 1, e outros para 0
    mask = np.uint8(np.where(img_data == 0, 1, 0))

    # Calcula a projeção somando os valores na máscara ao longo de uma coluna (col_row=1) ou linha (col_row=0)
    # REDUCE_SUM realiza a soma
    # dtype=cv2.CV_32SC1 define o tipo de dados do resultado como 32 bits com sinal
    count = cv2.reduce(mask, col_row, cv2.REDUCE_SUM, dtype=cv2.CV_32SC1)

    return count

Rotaciona a imagem.

In [None]:
def girar_imagem(img_data, angle):

  # Rotacionar a imagem
  new_image = util.img_as_ubyte(transform.rotate(img_data, angle, mode='wrap'))

  return new_image

Endireita a imagem, rotacionando-a caso esteja inclinada.

In [None]:
def alinhar_linhas(img_data):
    best_image = None  # Variável para armazenar a melhor imagem alinhada
    maximum = 0  # Variável para armazenar o valor máximo de projeção

    # Loop através de diferentes ângulos de rotação
    for i in range(-40, 40):
        angle = 0.25 * i  # Calcula o ângulo de rotação correspondente

        # Gira a imagem original pelo ângulo calculado
        new_image = girar_imagem(img_data, angle)

        # Binariza a nova imagem (converte para imagem binária)
        binary_image = binarizar(new_image)

        # Calcula a projeção horizontal da imagem binária
        horizontal_projection = calcular_projecao(binary_image)

        # Encontra o valor máximo na projeção horizontal
        max_projection = max(horizontal_projection)

        # Verifica se o valor máximo encontrado é maior que o máximo atual
        if max_projection > maximum:
            best_image = new_image  # Se for maior, atualiza a melhor imagem
            maximum = max_projection  # Atualiza o valor máximo

    return best_image  # Retorna a melhor imagem alinhada

## Funções Identificar Símbolos

## Pré-processamento

### Imagem alinhada e binarizada

In [None]:
imagem = cv2.imread('p3.jpg')
imagem_cinza = deixar_cinza(imagem)
imagem_binarizada = binarizar(imagem_cinza)

salvar_imagem(imagem_binarizada, 'binarizada')

In [None]:
imagem_alinhada = alinhar_linhas(imagem_binarizada)
salvar_imagem(imagem_alinhada, 'alinhada')

### Linha de pauta

In [None]:
projecao = calcular_projecao(imagem_alinhada)
linhadepauta(projecao)

## Identificar símbolos


In [None]:
vocabulario = ler_vocabulario(diretorio_vocabulario)
print(vocabulario)

In [None]:
ler_modelo(diretorio_modelo)