upgrade to opencv 090 (#33)

* opencv 090 * clippy fix
jimexist · Apr 18, 2024 · e4657d0 · e4657d0
1 parent 47408d5
commit e4657d0
Show file tree

Hide file tree

Showing 5 changed files with 18 additions and 17 deletions.
diff --git a/Cargo.toml b/Cargo.toml
@@ -16,7 +16,7 @@ clap = { version = "4.4.18", features = ["derive"], optional = true }
 env_logger = { version = "0.11.0" }
 hf-hub = { version = "0.3.2" }
 log = { version = "0.4.20" }
-opencv = { version = "0.88.8", default-features = false, features = [
+opencv = { version = "0.90.0", default-features = false, features = [
   'imgproc',
   'imgcodecs',
 ] }

diff --git a/src/bbox.rs b/src/bbox.rs
@@ -118,7 +118,7 @@ fn get_dilation_matrix(segmap: &mut Mat, stats_row: &[i32]) -> crate::Result<Mat
         let ey = (y + h + niter + 1).min(segmap.rows());
         Rect::new(sx, sy, ex - sx, ey - sy)
     };
-    let mut roi = Mat::roi(segmap, roi)?;
+    let mut roi = Mat::roi(segmap, roi)?.clone_pointee();
     let kernel = imgproc::get_structuring_element(
         imgproc::MORPH_RECT,
         Size::new(1 + niter, 1 + niter),

diff --git a/src/postprocess.rs b/src/postprocess.rs
@@ -43,7 +43,8 @@ impl ImageChunks {
         let result = Mat::roi(
             &resized_image,
             core::Rect::new(0, 0, self.original_size.width, self.original_size.height),
-        )?;
+        )?
+        .clone_pointee();
         Ok(result)
     }
 }

diff --git a/src/preprocess.rs b/src/preprocess.rs
@@ -59,7 +59,7 @@ pub fn read_chunked_resized_image<P: AsRef<Path>>(image_path: P) -> crate::Resul
         .map(|i| {
             let start = (i as i32) * IMAGE_CHUNK_HEIGHT;
             let roi: core::Rect_<i32> = core::Rect::new(0, start, image.cols(), IMAGE_CHUNK_HEIGHT);
-            let chunk = Mat::roi(&image, roi)?;
+            let chunk = Mat::roi(&image, roi)?.clone_pointee();
             let size = core::Size::new(INPUT_IMAGE_SIZE, INPUT_IMAGE_SIZE);
             resize(chunk, size)
         })

diff --git a/src/recognition/swin_transformer.rs b/src/recognition/swin_transformer.rs
@@ -80,9 +80,9 @@ struct SwinPatchEmbeddings {
 
 impl SwinPatchEmbeddings {
     fn new(config: &SwinConfig, vb: VarBuilder) -> Result<Self> {
-        let num_channels = config.num_channels as usize;
-        let patch_size = config.patch_size as usize;
-        let hidden_size = config.embed_dim as usize;
+        let num_channels = config.num_channels;
+        let patch_size = config.patch_size;
+        let hidden_size = config.embed_dim;
         let projection = conv2d(
             num_channels,
             hidden_size,
@@ -209,7 +209,7 @@ impl SwinIntermediate {
 
 impl Module for SwinIntermediate {
     fn forward(&self, x: &Tensor) -> Result<Tensor> {
-        let x = self.dense.forward(&x)?;
+        let x = self.dense.forward(x)?;
         let x = self.intermediate_act_fn.forward(&x)?;
         Ok(x)
     }
@@ -229,7 +229,7 @@ impl SwinSelfOutput {
 
 impl Module for SwinSelfOutput {
     fn forward(&self, x: &Tensor) -> Result<Tensor> {
-        let x = self.dense.forward(&x)?;
+        let x = self.dense.forward(x)?;
         Ok(x)
     }
 }
@@ -248,7 +248,7 @@ impl SwinOutput {
 
 impl Module for SwinOutput {
     fn forward(&self, x: &Tensor) -> Result<Tensor> {
-        let x = self.dense.forward(&x)?;
+        let x = self.dense.forward(x)?;
         Ok(x)
     }
 }
@@ -373,11 +373,11 @@ impl SwinSelfAttention {
             (left - right)?
         };
         let relative_grid = {
-            let bias = Tensor::full(window_size - 1, &grid.shape().clone(), device)?;
+            let bias = Tensor::full(window_size - 1, grid.shape().clone(), device)?;
             let relative_grid = (grid + bias)?;
             let m1 = relative_grid.i(0)?;
             let m2 = relative_grid.i(1)?;
-            let scalar = Tensor::full(2 * window_size - 1, &m1.shape().clone(), device)?;
+            let scalar = Tensor::full(2 * window_size - 1, m1.shape().clone(), device)?;
             let m1 = (m1 * scalar)?;
             Tensor::stack(&[m1, m2], 2)?
         };
@@ -395,9 +395,9 @@ impl SwinSelfAttention {
 impl Module for SwinSelfAttention {
     fn forward(&self, x: &Tensor) -> Result<Tensor> {
         debug_assert_eq!(3, x.dims().len(), "Input tensor must have 3 dimensions");
-        let key_layer = self.transpose_for_scores(&self.key.forward(&x)?)?;
-        let query_layer = self.transpose_for_scores(&self.query.forward(&x)?)?;
-        let value_layer = self.transpose_for_scores(&self.value.forward(&x)?)?;
+        let key_layer = self.transpose_for_scores(&self.key.forward(x)?)?;
+        let query_layer = self.transpose_for_scores(&self.query.forward(x)?)?;
+        let value_layer = self.transpose_for_scores(&self.value.forward(x)?)?;
         let attention_scores = (query_layer.matmul(&key_layer.t()?))?;
         let attention_scores = (attention_scores / (self.attention_head_size as f64).sqrt())?;
         let attention_scores = attention_scores.broadcast_add(&self.relative_position_bias)?;
@@ -722,7 +722,7 @@ impl SwinEncoder {
                 let downsample = i < config.depths.len() - 1;
                 SwinStage::new(
                     config,
-                    dim as usize,
+                    dim,
                     depth,
                     num_heads,
                     downsample,
@@ -943,7 +943,7 @@ mod test {
             let y = embedding.patch_embeddings.forward(&x)?;
             let y_sum: f32 = y.to_dtype(DType::F32)?.sum_all()?.to_scalar()?;
             // assert_eq!(y_sum, -112499.0938);
-            assert!(approx_eq!(f32, y_sum, -112499.0938, epsilon = 20.));
+            assert!(approx_eq!(f32, y_sum, -112_499.09, epsilon = 20.));
         }
         {
             let y = embedding.forward(&x)?;