OpenTTD · TrueBrain · Apr 27, 2020 · Apr 27, 2020
diff --git a/bananas_server/application/bananas_server.py b/bananas_server/application/bananas_server.py
@@ -123,6 +123,8 @@ def receive_PACKET_CONTENT_CLIENT_CONTENT(self, source, content_infos):
             )
 
     def reload_md5sum_mapping(self):
+        self.storage.clear_cache()
+
         for content_type in ContentType:
             if content_type == ContentType.CONTENT_TYPE_END:
                 continue

diff --git a/bananas_server/storage/local.py b/bananas_server/storage/local.py
@@ -32,6 +32,9 @@ def _get_filename(self, content_entry):
 
         return f"{self.folder}/{content_type_folder_name}/{unique_id}/{md5sum}.tar.gz"
 
+    def clear_cache(self):
+        pass
+
     def list_folder(self, content_type, unique_id=None):
         content_type_folder_name = get_folder_name_from_content_type(content_type)
 

diff --git a/bananas_server/storage/s3.py b/bananas_server/storage/s3.py
@@ -27,6 +27,7 @@ def __init__(self):
             raise Exception("--storage-s3-bucket has to be given if storage is s3")
 
         self._s3 = boto3.client("s3")
+        self._folder_cache = None
 
     def _get_filename(self, content_entry):
         content_type_folder_name = get_folder_name_from_content_type(content_entry.content_type)
@@ -35,7 +36,7 @@ def _get_filename(self, content_entry):
 
         return f"{content_type_folder_name}/{unique_id}/{md5sum}.tar.gz"
 
-    def _get_folder_list(self, folder, continuation_token=None):
+    def _get_full_folder_list(self, folder, continuation_token=None):
         kwargs = {}
         if continuation_token:
             kwargs["ContinuationToken"] = continuation_token
@@ -49,19 +50,36 @@ def _get_folder_list(self, folder, continuation_token=None):
             objects.add(obj["Key"])
 
         if response.get("NextContinuationToken"):
-            objects.update(self._get_folder_list(folder, continuation_token=response["NextContinuationToken"]))
+            objects.update(self._get_full_folder_list(folder, continuation_token=response["NextContinuationToken"]))
 
         return objects
 
+    def _get_folder_list(self, folder_search):
+        # List all files on the S3, and cache it. Otherwise we will be doing
+        # a lot of API calls, and that is very slow.
+        if self._folder_cache is None:
+            self._folder_cache = self._get_full_folder_list("")
+
+        # Filter out the request based on the cache. We are a generator to
+        # not create yet-an-other-list in memory.
+        for folder in self._folder_cache:
+            if folder.startswith(folder_search):
+                yield folder
+
+    def clear_cache(self):
+        self._folder_cache = None
+
     def list_folder(self, content_type, unique_id=None):
         content_type_folder_name = get_folder_name_from_content_type(content_type)
 
         if unique_id is None:
             folders = self._get_folder_list(content_type_folder_name)
-            return [folder.split("/")[1] for folder in folders]
-
-        folders = self._get_folder_list(f"{content_type_folder_name}/{unique_id}")
-        return [folder.split("/")[2] for folder in folders]
+            for folder in folders:
+                yield folder.split("/")[1]
+        else:
+            folders = self._get_folder_list(f"{content_type_folder_name}/{unique_id}")
+            for folder in folders:
+                yield folder.split("/")[2]
 
     def get_stream(self, content_entry):
         filename = self._get_filename(content_entry)