surrogate_model.py

import random
import h5py
import copy
import numpy as np
import tensorflow as tf
from tensorflow import keras
from abc import ABC, abstractmethod
from tensorflow.keras.models import load_model

from lume_model.models import SurrogateModel
from lume_model.utils import load_variables
from lume_model.variables import (
    ScalarInputVariable,
    ScalarOutputVariable,
    ImageInputVariable,
    ImageOutputVariable,
)

 
class BaseKerasModel(SurrogateModel, ABC):
    def __init__(self, *, model_file, input_variables, output_variables):

        # Save init
        self.model_file = model_file
        self.input_variables = input_variables
        self.output_variables = output_variables

        # Load attributes from file
        with h5py.File(self.model_file, "r") as h5:
            self.attrs = dict(h5.attrs)

        # Load model etc.
        self.json_string = self.attrs["JSON"]

        # load model in thread safe manner
        self.thread_graph = tf.Graph()
        with self.thread_graph.as_default():
            self.model = tf.keras.models.model_from_json(
                self.json_string.decode("utf-8")
            )
            self.model.load_weights(model_file)

    # SUBCLASSING THE SURROGATE MODEL SUBCLASS ENFORCES THAT THIS IS DEFINED
    def evaluate(self, input_variables):
        input_dictionary = {} # maps variable_name -> value

        # convert list of input variables to dictionary
        input_variables = {input_variable.name: input_variable for input_variable in input_variables}

        # prepare input dictionary, accounting for any missing values using defaults
        for variable_name in self.input_ordering:
            if variable_name in input_variables:
                if input_variables[variable_name].value is not None:
                    input_dictionary[variable_name] = input_variables[variable_name].value

                else:
                    input_dictionary[variable_name] = input_variables[variable_name].default

            else:
                input_dictionary[variable_name] = self.input_variables[variable_name].default
        

        # MUST IMPLEMENT A format_input METHOD TO CONVERT FROM DICT -> MODEL INPUT
        formatted_input = self.format_input(input_dictionary)

        # call prediction in threadsafe manner
        with self.thread_graph.as_default():
            model_output = self.model.predict(formatted_input)

        # MUST IMPLEMENT AN OUTPUT -> DICT METHOD
        output = self.parse_output(model_output)

        # PREPARE OUTPUTS WILL FORMAT RETURN VARIABLES (DICT-> VARIABLES)
        return self.prepare_outputs(output)


    def random_evaluate(self):
        random_input = copy.deepcopy(self.input_variables)
        for variable in self.input_ordering:
            if self.input_variables[variable].variable_type == "scalar":
                random_input[variable].value = np.random.uniform(
                    self.input_variables[variable].value_range[0],
                    self.input_variables[variable].value_range[1],
                )

            else:
                random_input[variable].value = self.input_variables[variable].default

        pred = self.evaluate(list(random_input.values()))

        return pred
    
    def prepare_outputs(self, predicted_output):
        """
        Prepares the model outputs to be served so no additional
        manipulation happens in the OnlineSurrogateModel class

        Args:
            model_outputs (dict): Dictionary of output variables to np.ndarrays of outputs

        Returns:
            dict: Dictionary of output variables to respective scalars

        """
        for variable in self.output_variables.values():
            if variable.variable_type == "scalar":
                self.output_variables[variable.name].value = predicted_output[
                    variable.name
                ]

            elif variable.variable_type == "image":
                self.output_variables[variable.name].value = predicted_output[
                    variable.name
                ].reshape(variable.shape)

                # update limits
                if self.output_variables[variable.name].x_min_variable:
                    self.output_variables[variable.name].x_min = predicted_output[
                        self.output_variables[variable.name].x_min_variable
                    ]

                if self.output_variables[variable.name].x_max_variable:
                    self.output_variables[variable.name].x_max = predicted_output[
                        self.output_variables[variable.name].x_max_variable
                    ]

                if self.output_variables[variable.name].y_min_variable:
                    self.output_variables[variable.name].y_min = predicted_output[
                        self.output_variables[variable.name].y_min_variable
                    ]

                if self.output_variables[variable.name].y_max_variable:
                    self.output_variables[variable.name].y_max = predicted_output[
                        self.output_variables[variable.name].y_max_variable
                    ]

        return list(self.output_variables.values())

    @abstractmethod
    def format_input(self, input_dictionary):
        # MUST IMPLEMENT A METHOD TO CONVERT INPUT DICTIONARY TO MODEL INPUT
        pass

    @abstractmethod
    def parse_output(self, model_output):
        # MUST IMPLEMENT A METHOD TO CONVERT MODEL OUTPUT TO A DICTIONARY OF VARIABLE NAME -> VALUE
        pass


class ScaledModel(BaseKerasModel):
    """
    Example Usage:
    Load model and use a dictionary of inputs to evaluate the NN.
    """

    def __init__(self, *, model_file=None, input_variables=None, output_variables=None):
        super().__init__(model_file=model_file, input_variables=input_variables, output_variables=output_variables)

        # Collect attributes
        self.input_ordering = self.attrs["input_ordering"]
        self.output_ordering = self.attrs["output_ordering"]

        self.input_scales = {
            self.input_ordering[i]: self.attrs["input_scales"][i]
            for i in range(len(self.input_ordering))
        }
        self.output_scales = {
            self.output_ordering[i]: self.attrs["output_scales"][i]
            for i in range(len(self.output_ordering))
        }
        self.input_offsets = {
            self.input_ordering[i]: self.attrs["input_offsets"][i]
            for i in range(len(self.input_ordering))
        }
        self.output_offsets = {
            self.output_ordering[i]: self.attrs["output_offsets"][i]
            for i in range(len(self.output_ordering))
        }

        ## Set basic values needed for input and output scaling
        self.model_value_max = self.attrs["upper"]
        self.model_value_min = self.attrs["lower"]

    def scale_inputs(self, input_values):
        data_scaled = {}

        for i, input_variable in enumerate(self.input_ordering):

            if self.input_variables[input_variable].variable_type == "scalar":
                data_scaled[input_variable] = self.model_value_min + (
                    (input_values[input_variable] - self.input_offsets[input_variable])
                    * (self.model_value_max - self.model_value_min)
                    / self.input_scales[input_variable]
                )

            elif self.input_variables[input_variable].variable_type == "image":
                data_scaled[input_variable] = (self.model_value_max - self.model_value_min) * (
                    (input_values[input_variable] / self.input_scales[input_variable])
                    - self.input_offsets[input_variable]
                )

                data_scaled[input_variable] = data_scaled[input_variable].reshape(
                    self.input_variables[input_variable].shape
                )


        return data_scaled

    def unscale_outputs(self, output_values):
        unscaled_outputs = {}
        for output_variable in output_values:

            # Scale scalar variable
            if self.output_variables[output_variable].variable_type == "scalar":
                unscaled_outputs[output_variable] = (
                    output_values[output_variable]
                    * self.output_scales[output_variable]
                    / (self.model_value_max - self.model_value_min)
                    + self.output_offsets[output_variable]
                )

            # Scale image variable
            elif self.output_variables[output_variable].variable_type == "image":
                unscaled_image = (
                    output_values[output_variable]
                    + self.output_offsets[output_variable]
                ) * self.output_scales[output_variable]

                # Reshape image
                unscaled_outputs[output_variable] = unscaled_image.reshape(
                    self.output_variables[output_variable].shape
                )

        return unscaled_outputs


class Model(ScaledModel):
    def format_input(self, input_dictionary):
        # scale inputs
        input_dictionary = self.scale_inputs(input_dictionary)

        #image = input_dictionary["input_image"].reshape(1, 50, 50, 1)
        scalar_inputs = np.array([
            input_dictionary['distgen:r_dist:sigma_xy:value'],
            input_dictionary['distgen:t_dist:length:value'],
            input_dictionary['distgen:total_charge:value'],
            input_dictionary['SOL1:solenoid_field_scale'],
            input_dictionary['CQ01:b1_gradient'],
            input_dictionary['SQ01:b1_gradient'],
            input_dictionary['L0A_phase:dtheta0_deg'],
            input_dictionary['L0A_scale:voltage'],
            input_dictionary['end_mean_z']
            ]).reshape((1,9))


        model_input = [scalar_inputs]
        return  model_input


    def parse_output(self, model_output):
        parsed_output = {}
        image_output = model_output[0][0]

        parsed_output["out_xmin"] = image_output[0]
        parsed_output["out_xmax"] = image_output[1]
        parsed_output["out_ymin"] = image_output[2]
        parsed_output["out_ymax"] = image_output[3]

        parsed_output["x:y"] = image_output[4:].reshape((50,50))

        parsed_output.update(dict(zip(self.output_variables.keys(), model_output[1][0].T)))

        # unscale
        parsed_output = self.unscale_outputs(parsed_output)
        
        return parsed_output


# to lume-keras
class ScaleLayer(keras.layers.Layer):
    
    trainable = False
    
    def __init__(self, offset, scale, lower,upper, **kwargs): 
        super(ScaleLayer, self).__init__(**kwargs) 
        self.scale = scale
        self.offset = offset
        self.lower = lower
        self.upper = upper
        
    def call(self, inputs):
        return self.lower+((inputs-self.offset)*(self.upper-self.lower)/self.scale)
    
    
    # MUST OVERRIDE IN ORDER TO SAVE + LOAD W/KERAS
    # STORE SALE, etc.
    def get_config(self):
        return {'scale': self.scale,'offset': self.offset,'lower': self.lower,'upper': self.upper}

# to lume-keras
class UnScaleLayer(keras.layers.Layer):
    
    trainable = False
    
    def __init__(self, offset, scale, lower,upper, **kwargs): 
        super(UnScaleLayer, self).__init__(**kwargs) 
        self.scale = scale
        self.offset = offset
        self.lower = lower
        self.upper = upper
        
    def call(self, inputs):
        return (((inputs-self.lower)*self.scale)/(self.upper-self.lower)) + self.offset
    
    
    # MUST OVERRIDE IN ORDER TO SAVE + LOAD W/KERAS
    # STORE SALE, etc.
    def get_config(self):
        return {'scale': self.scale,'offset': self.offset,'lower': self.lower,'upper': self.upper}

# To lume-keras
class UnScaleImg(keras.layers.Layer):
    
    trainable = False
    
    def __init__(self, img_offset, img_scale, **kwargs): 
        super(UnScaleImg, self).__init__(**kwargs) 
        self.img_scale = img_scale
        self.img_offset = img_offset
        
    def call(self, inputs):
        return (inputs+self.img_offset)*self.img_scale  
    
    
    # MUST OVERRIDE IN ORDER TO SAVE + LOAD W/KERAS
    # STORE SALE, etc.
    def get_config(self):
        return {'img_scale': self.img_scale,'img_offset': self.img_offset}


class CustomBaseKerasModel(SurrogateModel, ABC):
    def __init__(self, *, model_file, input_variables, output_variables):

        # Save init
        self.model_file = model_file
        self.input_variables = input_variables
        self.output_variables = output_variables

        # Load attributes from file
        with h5py.File(self.model_file, "r") as h5:
            self.attrs = dict(h5.attrs)

        # load model in thread safe manner
        self.thread_graph = tf.Graph()
        with self.thread_graph.as_default():
            self.model = load_model(model_file ,custom_objects={'ScaleLayer': ScaleLayer,'UnScaleLayer': UnScaleLayer,'UnScaleImg': UnScaleImg})


    # SUBCLASSING THE SURROGATE MODEL SUBCLASS ENFORCES THAT THIS IS DEFINED
    def evaluate(self, input_variables):
        # convert list of input variables to dictionary
        input_dictionary = {input_variable.name: input_variable.value for input_variable in input_variables}

        # MUST IMPLEMENT A format_input METHOD TO CONVERT FROM DICT -> MODEL INPUT
        formatted_input = self.format_input(input_dictionary)

        # call prediction in threadsafe manner
        with self.thread_graph.as_default():
            model_output = self.model.predict(formatted_input)

        # MUST IMPLEMENT AN OUTPUT -> DICT METHOD
        output = self.parse_output(model_output)

        # PREPARE OUTPUTS WILL FORMAT RETURN VARIABLES (DICT-> VARIABLES)
        return self.prepare_outputs(output)


    def random_evaluate(self):
        random_input = copy.deepcopy(self.input_variables)
        for variable in self.input_variables:
            if self.input_variables[variable].variable_type == "scalar":
                random_input[variable].value = np.random.uniform(
                    self.input_variables[variable].value_range[0],
                    self.input_variables[variable].value_range[1],
                )

            else:
                random_input[variable].value = self.input_variables[variable].default

        pred = self.evaluate(list(random_input.values()))

        return pred
    
    def prepare_outputs(self, predicted_output):
        """
        Prepares the model outputs to be served so no additional
        manipulation happens in the OnlineSurrogateModel class

        Args:
            model_outputs (dict): Dictionary of output variables to np.ndarrays of outputs

        Returns:
            dict: Dictionary of output variables to respective scalars

        """
        for variable in self.output_variables.values():
            if variable.variable_type == "scalar":
                self.output_variables[variable.name].value = predicted_output[
                    variable.name
                ]

            elif variable.variable_type == "image":
                self.output_variables[variable.name].value = predicted_output[
                    variable.name
                ].reshape(variable.shape)

                # update limits
                if self.output_variables[variable.name].x_min_variable:
                    self.output_variables[variable.name].x_min = predicted_output[
                        self.output_variables[variable.name].x_min_variable
                    ]

                if self.output_variables[variable.name].x_max_variable:
                    self.output_variables[variable.name].x_max = predicted_output[
                        self.output_variables[variable.name].x_max_variable
                    ]

                if self.output_variables[variable.name].y_min_variable:
                    self.output_variables[variable.name].y_min = predicted_output[
                        self.output_variables[variable.name].y_min_variable
                    ]

                if self.output_variables[variable.name].y_max_variable:
                    self.output_variables[variable.name].y_max = predicted_output[
                        self.output_variables[variable.name].y_max_variable
                    ]


        return list(self.output_variables.values())

    @abstractmethod
    def format_input(self, input_dictionary):
        # MUST IMPLEMENT A METHOD TO CONVERT INPUT DICTIONARY TO MODEL INPUT
        pass

    @abstractmethod
    def parse_output(self, model_output):
        # MUST IMPLEMENT A METHOD TO CONVERT MODEL OUTPUT TO A DICTIONARY OF VARIABLE NAME -> VALUE
        pass


class AutoScaledModel(CustomBaseKerasModel):
    def format_input(self, input_dictionary):
        scalar_inputs = np.array([
            input_dictionary['distgen:r_dist:sigma_xy:value'],
            input_dictionary['distgen:t_dist:length:value'],
            input_dictionary['distgen:total_charge:value'],
            input_dictionary['SOL1:solenoid_field_scale'],
            input_dictionary['CQ01:b1_gradient'],
            input_dictionary['SQ01:b1_gradient'],
            input_dictionary['L0A_phase:dtheta0_deg'],
            input_dictionary['L0A_scale:voltage'],
            input_dictionary['end_mean_z']
            ]).reshape((1,9))


        model_input = [scalar_inputs]
        return  model_input


    def parse_output(self, model_output):        
        parsed_output = {}
        parsed_output["x:y"] = model_output[0][0].reshape((50,50))

        # NTND array attributes MUST BE FLOAT 64!!!! np.float() should be moved to lume-epics
        parsed_output["out_xmin"] = np.float64(model_output[1][0][0])
        parsed_output["out_xmax"] = np.float64(model_output[1][0][1])
        parsed_output["out_ymin"] = np.float64(model_output[1][0][2])
        parsed_output["out_ymax"] = np.float64(model_output[1][0][3])

        parsed_output.update(dict(zip(self.output_variables.keys(), model_output[2][0].T)))

        return parsed_output