feat(server): lower library scan memory usage #7939

mertalev · 2024-03-14T02:44:59Z

This PR drastically lowers RAM consumption for scans on large libraries with four optimizations:

Batched queueing for asset scanning
Trie data structure instead of set
Conditionally delete from trie instead of keeping a separate list for full refresh
Streamed glob

Successfully imported a library with 1.5 million assets and observed much lower RAM usage than described in #7373

Fixes #7373

cloudflare-pages · 2024-03-14T04:07:15Z

Deploying with Cloudflare Pages

Latest commit:	`b6fe574`
Status:	✅ Deploy successful!
Preview URL:	https://163afa61.immich.pages.dev
Branch Preview URL:	https://feat-crawl-trie.immich.pages.dev

server/src/infra/repositories/filesystem.provider.ts

server/src/domain/library/library.service.ts

server/src/domain/repositories/storage.repository.ts

mertalev added the 🗄️server label Mar 14, 2024

jrasm91 reviewed Mar 14, 2024

View reviewed changes

mertalev added 4 commits March 14, 2024 00:38

use trie

9f4298c

update tests

609aea0

formatting

3aa8ac4

pr feedback

cc3e57c

mertalev force-pushed the feat/crawl-trie branch from 392a264 to cc3e57c Compare March 14, 2024 04:38

jrasm91 approved these changes Mar 14, 2024

View reviewed changes

linting

b6fe574

mertalev merged commit d67cc00 into main Mar 14, 2024
24 checks passed

mertalev deleted the feat/crawl-trie branch March 14, 2024 05:52