feat: Adding support for AudioStorageEngine #623

jarulraj · 2023-03-28T05:06:43Z

Branch based on feat: Add support for AudioStorageEngine #620

eva/readers/decord_reader.py

gaurav274 · 2023-03-30T21:56:42Z

eva/catalog/catalog_type.py

@@ -98,3 +98,20 @@ class IndexType(EVAEnum):
    @classmethod
    def is_faiss_index_type(cls, t):
        return t in [cls.HNSW]
+
+
+class ColumnName(EVAEnum):


Like this! Maybe make the name more descriptive and add similar logic for images

How about we call them VideoColumnNames?

eva/catalog/catalog_utils.py

eva/binder/statement_binder.py

gaurav274

Do we need mp4 file?

…io-engine

Review comments fixes

gaurav274

Overall looks good apart from minor comments.

gaurav274 · 2023-03-31T04:18:52Z

eva/readers/decord_reader.py

+                av_reader = decord.AVReader(self.file_url, mono=True, sample_rate=16000)
+            except decord._ffi.base.DECORDError as error_msg:
+                if "Can't find audio stream" in str(error_msg):
+                    print("No audio stream in video")


We should assert here

And we should rather return the error message from decord.

Btw, we should check for AudioReader or VideoReader or AVReader?

gaurav274 · 2023-03-31T04:22:22Z

eva/readers/decord_reader.py

@@ -108,12 +121,34 @@ def _read(self) -> Iterator[Dict]:
                if begin % self._sampling_rate:
                    begin += self._sampling_rate - (begin % self._sampling_rate)
                for frame_id in range(begin, end + 1, self._sampling_rate):
-                    frame = video[frame_id].asnumpy()
+                    frame = self.__get_frame(frame_id, av_reader, v_reader)


We can yield directly from the function rather than checking for None again.

gaurav274 · 2023-03-31T04:26:53Z

test/readers/test_decord_reader.py

+        # gave a big enough batch_mem_size so that all frames fit in one batch
+        self.assertEqual(len(batches[0]), 996)
+        # verify that the 100th frame is read correctly and hope that all the other frames were too!
+        assert np.sum(batches[0].frames.loc[100]["audio"]) == pytest.approx(2.7592432)


How about also pushing a small numpy of decoded data and comparing against it?

gaurav274 · 2023-03-31T04:27:02Z

test/readers/test_decord_reader.py

+        # gave a big enough batch_mem_size so that all frames fit in one batch
+        self.assertEqual(len(batches[0]), 996)
+        # verify that the 100th frame is read correctly and hope that all the other frames were too!
+        assert np.sum(batches[0].frames.loc[100]["audio"]) == pytest.approx(2.7592432)


Same as above.

gaurav274 · 2023-03-31T04:28:13Z

eva/catalog/catalog_type.py

@@ -98,3 +98,20 @@ class IndexType(EVAEnum):
    @classmethod
    def is_faiss_index_type(cls, t):
        return t in [cls.HNSW]
+
+
+class ColumnName(EVAEnum):


How about we call them VideoColumnNames?

gaurav274 · 2023-03-31T04:32:25Z

eva/readers/decord_reader.py

+                av_reader = decord.AVReader(self.file_url, mono=True, sample_rate=16000)
+            except decord._ffi.base.DECORDError as error_msg:
+                if "Can't find audio stream" in str(error_msg):
+                    print("No audio stream in video")


Btw, we should check for AudioReader or VideoReader or AVReader?

gaurav274 · 2023-03-31T04:36:24Z

eva/readers/decord_reader.py

                    else:
                        break
+
+    def __get_frame(self, frame_id, av_reader, v_reader):


We shouldn't hit these decisions for every frame. How about we have 3 functions and use logic upfront to decide the correct callable and then just invoke it?

suryatejreddy · 2023-03-31T15:28:09Z

Just FYI, decord can't be installed via pypi on recent macos with pyhton3.9. Reference

eva/binder/statement_binder.py

gaurav274 · 2023-04-02T16:29:09Z

eva/readers/decord_reader.py

        super().__init__(*args, **kwargs)

    def _read(self) -> Iterator[Dict]:
        decord = _lazy_import_decord()
-        video = decord.VideoReader(self.file_url)
-        num_frames = int(len(video))
+        if self._read_audio:


nit: we can move this logic (reader selection) to a separate function. Just want to clean the code as much as possible.

gaurav274 · 2023-04-02T16:30:37Z

eva/readers/decord_reader.py

+        }
+
+    def __get_audio_frame(self, frame_id, reader):
+        frame_audio, _ = reader[frame_id]


So, we are going with audio per frame design. Will this work for whisper? If yes, we are good. We can worry about the sampling rate in the next PR when we add whisper.

Yes, I verified that it works with whisper

gaurav274

Minor comments. Fix and merge. Thanks for the effort!

aryan-rajoria and others added 30 commits February 9, 2023 19:21

adding delete operation

c9afc12

Adding Insert Statement

34dfbf7

checkpoint

9fa9857

supporting multiple entries

ebe26d3

implemented for structured data error

bc722dd

adding parser visitor for delete

0e29858

delete executor

c1a7864

delete plan and rules

5ac631a

adding delete to plan executor

3238e95

change position of LogicalDelete

02a1d28

logical delimeter

01181b5

delete test case

562a7ca

adding test case

9887732

adding test case

d2a1a3d

adding delete testcase

f09c613

adding predicate to delete executor

79a6168

adding delete to Image storage

5ce1991

bug fix in delete

91d7b06

fixing testcase

0aac934

adding test case for insert statement

ee48803

remove order_by from statement_binder.py

fc2f243

better variable names, using Batch

343a4a2

error message for insert

121451f

removing order_by and limit from delete

5b47c15

remove order_by and limit

8c75a5e

use f-string

6772cd0

adding to changelog

7a10d67

removing commit messages

1a4204f

formatting

e96d3a4

fixing comments

640e7ed

gaurav274 added 6 commits March 30, 2023 03:06

bug: fix readers

3f4266e

fix reader testcases

b6e0898

fix csv reader

6efb528

Merge branch 'master' of github.com:georgia-tech-db/eva

2cbc817

Merge branch 'master' into reader-fixes

3a19571

bug fixes

ff0615f