lite/ort/cv/female_photo2cartoon.cpp

//
// Created by DefTruth on 2022/6/3.
//

#include "female_photo2cartoon.h"
#include "lite/ort/core/ort_utils.h"

using ortcv::FemalePhoto2Cartoon;

Ort::Value FemalePhoto2Cartoon::transform(const cv::Mat &mat_merged_rs)
{
  cv::Mat canvas;
  cv::cvtColor(mat_merged_rs, canvas, cv::COLOR_BGR2RGB);
  // normalize -> (-1.f ~ +1.f)
  canvas.convertTo(canvas, CV_32FC3, 1.f / 127.5f, -1.f); // y=x*alpha+beta
  // NCHW (1,3,256,256)
  return ortcv::utils::transform::create_tensor(
      canvas, input_node_dims, memory_info_handler,
      input_values_handler, ortcv::utils::transform::CHW); // deepcopy inside
}

void FemalePhoto2Cartoon::detect(
    const cv::Mat &mat, const cv::Mat &mask,
    types::FemalePhoto2CartoonContent &content)
{
  if (mat.empty() || mask.empty()) return;
  const unsigned int channels = mat.channels();
  if (channels != 3) return;
  const unsigned int mask_channels = mask.channels();
  if (mask_channels != 1 && mask_channels != 3) return;
  // model input size
  const unsigned int input_h = input_node_dims.at(2); // 256
  const unsigned int input_w = input_node_dims.at(3); // 256

  // resize before merging mat and mask
  cv::Mat mat_rs, mask_rs;
  cv::resize(mat, mat_rs, cv::Size(input_w, input_h));
  cv::resize(mask, mask_rs, cv::Size(input_w, input_h)); // CV_32FC1
  if (mask_channels != 3) cv::cvtColor(mask_rs, mask_rs, cv::COLOR_GRAY2BGR); // CV_32FC3
  mat_rs.convertTo(mat_rs, CV_32FC3, 1.f, 0.f); // CV_32FC3
  // merge mat_rs and mask_rs
  cv::Mat mat_merged_rs = mat_rs.mul(mask_rs) + (1.f - mask_rs) * 255.f;
  // 1. make input tensor
  Ort::Value input_tensor = this->transform(mat_merged_rs);
  // 2. inference cartoon (1,3,256,256)
  auto output_tensors = ort_session->Run(
      Ort::RunOptions{nullptr}, input_node_names.data(),
      &input_tensor, 1, output_node_names.data(),
      num_outputs
  );
  // 3. generate cartoon
  this->generate_cartoon(output_tensors, mask_rs, content);
}

void FemalePhoto2Cartoon::generate_cartoon(
    std::vector<Ort::Value> &output_tensors, const cv::Mat &mask_rs,
    types::FemalePhoto2CartoonContent &content)
{
  Ort::Value &cartoon_pred = output_tensors.at(0); // (1,3,256,256)
  auto cartoon_dims = cartoon_pred.GetTensorTypeAndShapeInfo().GetShape();
  const unsigned int out_h = cartoon_dims.at(2);
  const unsigned int out_w = cartoon_dims.at(3);
  const unsigned int channel_step = out_h * out_w;
  const unsigned int mask_h = mask_rs.rows;
  const unsigned int mask_w = mask_rs.cols;
  // fast assign & channel transpose(CHW->HWC).
  float *cartoon_ptr = cartoon_pred.GetTensorMutableData<float>();
  std::vector<cv::Mat> cartoon_channel_mats;
  cv::Mat rmat(out_h, out_w, CV_32FC1, cartoon_ptr); // R
  cv::Mat gmat(out_h, out_w, CV_32FC1, cartoon_ptr + channel_step); // G
  cv::Mat bmat(out_h, out_w, CV_32FC1, cartoon_ptr + 2 * channel_step); // B
  rmat = (rmat + 1.f) * 127.5f;
  gmat = (gmat + 1.f) * 127.5f;
  bmat = (bmat + 1.f) * 127.5f;
  cartoon_channel_mats.push_back(rmat);
  cartoon_channel_mats.push_back(gmat);
  cartoon_channel_mats.push_back(bmat);
  cv::Mat cartoon;
  cv::merge(cartoon_channel_mats, cartoon); // CV_32FC3 allocated
  if (out_h != mask_h || out_w != mask_w)
    cv::resize(cartoon, cartoon, cv::Size(mask_w, mask_h));
  // combine & RGB -> BGR -> uint8
  cartoon = cartoon.mul(mask_rs) + (1.f - mask_rs) * 255.f;
  cv::cvtColor(cartoon, cartoon, cv::COLOR_RGB2BGR);
  cartoon.convertTo(cartoon, CV_8UC3);

  content.cartoon = cartoon;
  content.flag = true;
}