Draft: Resnet support added #246

I8dNLo · 2024-05-21T23:02:17Z

Added support of resnet-50, classical CNN

joein · 2024-05-22T10:43:50Z

fastembed/image/onnx_embedding.py

+    },
+    {
+        "model": "AndrewOgn/resnet_onnx",
+        "dim": 2048,


just as a reminder: we might want to inspect other resnet models to have lower dimensionality

fastembed/image/transform/operators.py

Shapes matching for Resnet50-onnx Example of Resnet50 to onnx conversion (basic)

review-notebook-app · 2024-05-23T10:43:40Z

Check out this pull request on

See visual diffs & provide feedback on Jupyter Notebooks.

Powered by ReviewNB

…de default Fixed test accordingly

fastembed/image/transform/operators.py

joein · 2024-05-23T11:38:01Z

fastembed/image/transform/operators.py

@@ -59,6 +59,9 @@ def __init__(self, scale: float = 1 / 255):
    def __call__(self, images: List[np.ndarray]) -> List[np.ndarray]:
        return [rescale(image, scale=self.scale) for image in images]

+class PILtoNDarray:
+    def __call__(self, images: List[Union[Image.Image, np.ndarray]]) -> List[np.ndarray]:
+        return [np.asarray(image).swapaxes(2, 0) if isinstance(image, Image.Image) else image for image in images]


it seems to be

(H, W, C) -> (C, W, H)

but should be (H, W, C) -> (C, H, W)

so we need to use transpose((2, 0, 1)) instead of swapaxes, should not we?

But it's literally the same thing, isn't it?

a = np.random.random((3,4,5)) b = a.swapaxes(2, 0) c = a.transpose((2, 0, 1)) print(a.shape, b.shape, c.shape) >>> ((3, 4, 5), (5, 4, 3), (5, 3, 4))

tests/test_image_onnx_embeddings.py

Resize logic

# Conflicts: # fastembed/image/onnx_image_model.py # fastembed/image/transform/operators.py

fastembed/image/transform/operators.py

joein · 2024-05-31T10:03:27Z

fastembed/image/transform/operators.py

+        transforms = []
+        cls._get_convert_to_rgb(transforms, config)
+        cls._get_resize(transforms, config)
+        cls._get_center_crop(transforms, config)
+        cls._get_pil2ndarray(transforms, config)
+        cls._get_rescale(transforms, config)
+        cls._get_normalize(transforms, config)
+        return cls(transforms=transforms)
+
+    @staticmethod
+    def _get_convert_to_rgb(transforms: List['Transform'], config: Dict[str, Any]):
+        transforms.append(ConvertToRGB())
+
+    @staticmethod
+    def _get_resize(transforms: List['Transform'], config: Dict[str, Any]):
+        mode = config.get('image_processor_type', 'CLIPImageProcessor')
+        if mode == 'CLIPImageProcessor':
+            if config.get("do_resize", False):
+                size = config["size"]
+                if "shortest_edge" in size:
+                    size = size["shortest_edge"]
+                elif "height" in size and "width" in size:
+                    size = (size["height"], size["width"])
+                else:
+                    raise ValueError("Size must contain either 'shortest_edge' or 'height' and 'width'.")
+                transforms.append(ClipResize(size=size, resample=config.get("resample", Image.Resampling.BICUBIC)))
+        elif mode == 'ConvNextFeatureExtractor':
+            if 'size' in config and "shortest_edge" not in config['size']:
+                raise ValueError(f"Size dictionary must contain 'shortest_edge' key. Got {config['size'].keys()}")
+            shortest_edge = config['size']["shortest_edge"]
+            crop_pct = config.get("crop_pct", 0.875)
+            if shortest_edge < 384:
+                # maintain same ratio, resizing shortest edge to shortest_edge/crop_pct
+                resize_shortest_edge = int(shortest_edge / crop_pct)
+                transforms.append(ClipResize(size=resize_shortest_edge, resample=config.get("resample", Image.Resampling.BICUBIC)))
+                transforms.append(CenterCrop(size=(shortest_edge, shortest_edge)))


it's a temporary design, we would need to come up with something better, but since it is hidden from the users, it's okay to have it this way for now

joein · 2024-05-31T11:42:50Z

The last thing to do at the moment is to push the model to Qdrant's HF hub and change the corresponding name in image/onnx_embedding.py

Resnet support added

52fd9a2

joein reviewed May 22, 2024

View reviewed changes

Tests fixed

86b39c5

Shapes matching for Resnet50-onnx Example of Resnet50 to onnx conversion (basic)

Removed optional conversion from PIL to np.ndarray and now it it's ma…

48ba325

…de default Fixed test accordingly

I8dNLo requested a review from joein May 23, 2024 11:12

joein reviewed May 23, 2024

View reviewed changes

fastembed/image/transform/operators.py Outdated Show resolved Hide resolved

joein reviewed May 23, 2024

View reviewed changes

tests/test_image_onnx_embeddings.py Outdated Show resolved Hide resolved

d.rudenko added 3 commits May 23, 2024 15:10

Refactoring of pil2ndarray

8a469d8

Partial support of convnext preprocessing

d99180c

Resize logic

Merge remote-tracking branch 'origin/main' into resnet-support

cfb57cc

# Conflicts: # fastembed/image/onnx_image_model.py # fastembed/image/transform/operators.py

I8dNLo changed the title ~~Resnet support added~~ Draft: Resnet support added May 28, 2024

normalize canonical value

f750de1

joein reviewed May 31, 2024

View reviewed changes

fastembed/image/transform/operators.py Outdated Show resolved Hide resolved

joein reviewed May 31, 2024

View reviewed changes

fastembed/image/transform/operators.py Outdated Show resolved Hide resolved

joein reviewed May 31, 2024

View reviewed changes

fastembed/image/transform/operators.py Outdated Show resolved Hide resolved

joein reviewed May 31, 2024

View reviewed changes

Style changes for review

0ce042d

new: update resnet repo

c9d328b

joein self-requested a review May 31, 2024 14:48

joein approved these changes May 31, 2024

View reviewed changes

joein merged commit 85aaae4 into qdrant:main May 31, 2024
15 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Draft: Resnet support added #246

Draft: Resnet support added #246

I8dNLo commented May 21, 2024

joein May 22, 2024

review-notebook-app bot commented May 23, 2024

joein May 23, 2024

I8dNLo May 23, 2024 •

edited

Loading

joein May 23, 2024

joein May 31, 2024

joein commented May 31, 2024

Draft: Resnet support added #246

Draft: Resnet support added #246

Conversation

I8dNLo commented May 21, 2024

joein May 22, 2024

Choose a reason for hiding this comment

review-notebook-app bot commented May 23, 2024

joein May 23, 2024

Choose a reason for hiding this comment

I8dNLo May 23, 2024 • edited Loading

Choose a reason for hiding this comment

joein May 23, 2024

Choose a reason for hiding this comment

joein May 31, 2024

Choose a reason for hiding this comment

joein commented May 31, 2024

I8dNLo May 23, 2024 •

edited

Loading