In [9]:
import numpy as np
import cv2
from tensorflow.keras.models import load_model
from tensorflow.keras.preprocessing.sequence import pad_sequences
import matplotlib.pyplot as plt
import pickle

# Функция для предобработки изображения
def preprocess_image(image_path, width, height):
    img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    if img is not None:
        # Сглаживание изображения
        img = cv2.GaussianBlur(img, (5, 5), 0)
        # Адаптивное пороговое значение
        img = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
        # Изменение размера изображения
        img = cv2.resize(img, (width, height))
        # Нормализация изображения
        img = img.astype('float32') / 255.0
    return img

# Функция для загрузки модели
def load_trained_model(model_path):
    model = load_model(model_path)
    model.summary()  # Вывод структуры модели для определения ожидаемых входов
    return model

# Функция для получения предсказаний модели
def predict_sequence(model, image, max_seq_len, second_input_shape):
    # Создание второго входа с нужной формой
    second_input = np.zeros((1, second_input_shape[1]))  # Изменить здесь на правильную форму

    # Предсказание с двумя входами
    pred = model.predict([np.expand_dims(image, axis=0), second_input])
    
    pred_classes = np.argmax(pred, axis=-1)
    pred_classes_padded = pad_sequences(pred_classes, maxlen=max_seq_len, padding='post')
    return pred_classes_padded.flatten()

def tokens_to_latex(tokens, tokenizer):
    # Обратное отображение токенов в слова
    index_to_word = {index: word for word, index in tokenizer.word_index.items()}
    
    # Формирование LaTeX кода из предсказанных токенов
    latex_code = ''.join([index_to_word[token] for token in tokens if token != 0 and token in index_to_word])
    
    return latex_code

# Путь к обученной модели, токенайзеру и тестовому изображению
model_path = './best_model.keras'
tokenizer_path = './tokenizer.pkl'
image_path = './data_2019/3_images_test/ISICal19_1201_em_751.png'

# Загрузка модели
model = load_trained_model(model_path)

# Загрузка токенайзера
with open(tokenizer_path, 'rb') as handle:
    tokenizer = pickle.load(handle)

# Параметры изображения и максимальная длина последовательности
desired_width = 256
desired_height = 256
max_seq_len = 100  # максимальная длина последовательности, изменить при необходимости

# Загрузка и предобработка изображения
image = preprocess_image(image_path, desired_width, desired_height)

# Определение формы второго входа
second_input_shape = model.input[1].shape

# Получение предсказаний
pred_tokens = predict_sequence(model, image, max_seq_len, second_input_shape)

# Преобразование предсказанных токенов в LaTeX код
latex_code = tokens_to_latex(pred_tokens, tokenizer)

print(latex_code)



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 3s/step

