instruction_tuning/emo_llama.py

import torch
from transformers import LlamaForCausalLM
from typing import Optional, List
from torch.nn import CrossEntropyLoss
from transformers import LlamaModel


class EMOLlamaForCausalLM(LlamaForCausalLM):
    def __init__(self, config):
        super().__init__(config)
        self.model = LlamaModel(config)

        self.lm_head = torch.nn.Linear(config.hidden_size, config.vocab_size, bias=False)

        # Initialize weights and apply final processing
        self.post_init()

    def forward(
        self,
        input_ids: torch.LongTensor = None,
        attention_mask: Optional[torch.Tensor] = None,
        position_ids: Optional[torch.LongTensor] = None,
        past_key_values: Optional[List[torch.FloatTensor]] = None,
        inputs_embeds: Optional[torch.FloatTensor] = None,
        labels: Optional[torch.LongTensor] = None,
        use_cache: Optional[bool] = None,
        output_attentions: Optional[bool] = None,
        output_hidden_states: Optional[bool] = None,
        return_dict: Optional[bool] = None,
    ):

        output_attentions = output_attentions if output_attentions is not None else self.config.output_attentions
        output_hidden_states = (
            output_hidden_states if output_hidden_states is not None else self.config.output_hidden_states
        )
        return_dict = return_dict if return_dict is not None else self.config.use_return_dict

        outputs = self.model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            position_ids=position_ids,
            past_key_values=past_key_values,
            inputs_embeds=inputs_embeds,
            use_cache=use_cache,
            output_attentions=output_attentions,
            output_hidden_states=output_hidden_states,
            return_dict=return_dict,
        )

        # ======================================================================== #
        #                   Compute the MLE loss
        # ======================================================================== #
        hidden_states = outputs[0]
        logits = self.lm_head(hidden_states)
        mask = labels[:, 1:].contiguous().view(-1)
        mask = (mask!=-100).to(logits.dtype)
        loss_fct = torch.nn.CrossEntropyLoss(reduction='none')
        logits = logits[:, :-1, :].contiguous().view(-1, logits.shape[-1])
        labels = labels[:, 1:].contiguous().view(-1)
        mle_loss = loss_fct(logits, labels)

        # ======================================================================== #
        #                   Compute the EMO loss
        # ======================================================================== #
        labels_tmp = labels.clone()
        labels_tmp[labels_tmp==(-100)] = 0
        one_hot = torch.nn.functional.one_hot(labels_tmp, num_classes=self.config.vocab_size).to(logits.dtype)
        stable_onehot = (one_hot+1e-15) / torch.linalg.vector_norm((one_hot+1e-15), ord=1, dim=-1, keepdim=True) # (bsz*seq_len, vocab_size)
        embedding_matrix = self.cost_embedding # (vocab_size, hidden_size)
        embedding_matrix = embedding_matrix / torch.linalg.vector_norm(embedding_matrix, ord=2, dim=1, keepdim=True)
        p_contextual_repr = stable_onehot @ embedding_matrix # (bsz*seq_len, hidden_size)
        q_grad = torch.log_softmax(logits, dim=-1).exp() # (bsz*seq_len, vocab_size)
        gt_q = (q_grad * one_hot).detach()
        q_final = q_grad - gt_q
        q_contextual_repr = q_final @ embedding_matrix # (bsz*seq_len, hidden_size)
        emo_loss = (1 - torch.sum(p_contextual_repr*q_contextual_repr, dim=-1)) # (bsz*seq_len,)
        emo_loss = emo_loss * mask

        # ======================================================================== #
        #                   Compose the final loss
        # ======================================================================== #
        loss = ((mle_loss / (emo_loss+1e-10)).detach()  * emo_loss + mle_loss) * 0.5
        loss = (loss * mask).sum() / (1e-15 + mask.sum())

        output = (logits,) + outputs[1:]
        return (loss,) + output if loss is not None else output