diff --git a/docker/pyproject.deps.toml b/docker/pyproject.deps.toml
index eab9102..2b0ca1f 100644
--- a/docker/pyproject.deps.toml
+++ b/docker/pyproject.deps.toml
@@ -1,6 +1,6 @@
 [project]
 name = "mcp-plex"
-version = "2.0.2"
+version = "2.0.3"
 requires-python = ">=3.11,<3.13"
 dependencies = [
   "fastmcp>=2.11.2",
diff --git a/mcp_plex/loader/__init__.py b/mcp_plex/loader/__init__.py
index 2111624..7c60cd7 100644
--- a/mcp_plex/loader/__init__.py
+++ b/mcp_plex/loader/__init__.py
@@ -9,7 +9,7 @@
 import warnings
 from dataclasses import dataclass, field
 from pathlib import Path
-from typing import TYPE_CHECKING, Sequence, TypedDict, TypeVar
+from typing import TYPE_CHECKING, Sequence
 
 import httpx
 from qdrant_client import models
@@ -32,13 +32,24 @@
 from ..common.types import (
     AggregatedItem,
     IMDbTitle,
-    JSONValue,
     PlexGuid,
     PlexItem,
     PlexPerson,
     TMDBMovie,
     TMDBShow,
 )
+from . import qdrant as _qdrant
+
+_DENSE_MODEL_PARAMS = _qdrant._DENSE_MODEL_PARAMS
+_resolve_dense_model_params = _qdrant._resolve_dense_model_params
+_is_local_qdrant = _qdrant._is_local_qdrant
+_ensure_collection = _qdrant._ensure_collection
+_build_point_text = _qdrant._build_point_text
+_build_point_payload = _qdrant._build_point_payload
+QdrantPayload = _qdrant.QdrantPayload
+build_point = _qdrant.build_point
+_upsert_in_batches = _qdrant._upsert_in_batches
+_process_qdrant_retry_queue = _qdrant._process_qdrant_retry_queue
 
 PlexPartialObject = _PlexPartialObject
 
@@ -53,9 +64,6 @@
 if TYPE_CHECKING:  # pragma: no cover - import for typing only
     from .pipeline.enrichment import _RequestThrottler
 
-
-T = TypeVar("T")
-
 IMDB_BATCH_LIMIT: int = 5
 DEFAULT_QDRANT_BATCH_SIZE: int = 1000
 DEFAULT_QDRANT_UPSERT_BUFFER_SIZE: int = 200
@@ -100,38 +108,6 @@ class QdrantRuntimeConfig:
     retry_backoff: float = DEFAULT_QDRANT_RETRY_BACKOFF
 
 
-def _is_local_qdrant(client: AsyncQdrantClient) -> bool:
-    """Return ``True`` if *client* targets an in-process Qdrant instance."""
-
-    inner = getattr(client, "_client", None)
-    return bool(inner) and inner.__class__.__module__.startswith(
-        "qdrant_client.local"
-    )
-
-
-# Known Qdrant-managed dense embedding models with their dimensionality and
-# similarity metric. To support a new server-side embedding model, add an entry
-# here with the appropriate vector size and `models.Distance` value.
-_DENSE_MODEL_PARAMS: dict[str, tuple[int, models.Distance]] = {
-    "BAAI/bge-small-en-v1.5": (384, models.Distance.COSINE),
-    "BAAI/bge-base-en-v1.5": (768, models.Distance.COSINE),
-    "BAAI/bge-large-en-v1.5": (1024, models.Distance.COSINE),
-    "text-embedding-3-small": (1536, models.Distance.COSINE),
-    "text-embedding-3-large": (3072, models.Distance.COSINE),
-}
-
-
-def _resolve_dense_model_params(model_name: str) -> tuple[int, models.Distance]:
-    """Look up Qdrant vector parameters for a known dense embedding model."""
-
-    try:
-        return _DENSE_MODEL_PARAMS[model_name]
-    except KeyError as exc:
-        raise ValueError(
-            f"Unknown dense embedding model '{model_name}'. Update _DENSE_MODEL_PARAMS with the model's size and distance."
-        ) from exc
-
-
 async def _fetch_imdb(
     client: httpx.AsyncClient,
     imdb_id: str,
@@ -193,312 +169,6 @@ def _persist_imdb_retry_queue(path: Path, queue: IMDbRetryQueue) -> None:
     path.write_text(json.dumps(queue.snapshot()))
 
 
-async def _upsert_in_batches(
-    client: AsyncQdrantClient,
-    collection_name: str,
-    points: Sequence[models.PointStruct],
-    *,
-    batch_size: int,
-    retry_queue: asyncio.Queue[list[models.PointStruct]] | None = None,
-) -> None:
-    """Upsert points into Qdrant in batches, logging HTTP errors."""
-
-    total = len(points)
-    for i in range(0, total, batch_size):
-        batch = points[i : i + batch_size]
-        try:
-            await client.upsert(collection_name=collection_name, points=batch)
-        except Exception:
-            logger.exception(
-                "Failed to upsert batch %d-%d", i, i + len(batch)
-            )
-            if retry_queue is not None:
-                await retry_queue.put(list(batch))
-        else:
-            logger.info(
-                "Upserted %d/%d points", min(i + len(batch), total), total
-            )
-
-
-async def _process_qdrant_retry_queue(
-    client: AsyncQdrantClient,
-    collection_name: str,
-    retry_queue: asyncio.Queue[list[models.PointStruct]],
-    *,
-    config: QdrantRuntimeConfig,
-) -> None:
-    """Retry failed Qdrant batches with exponential backoff."""
-
-    if retry_queue.empty():
-        return
-
-    pending = retry_queue.qsize()
-    logger.info("Retrying %d failed Qdrant batches", pending)
-    while not retry_queue.empty():
-        batch = await retry_queue.get()
-        attempt = 1
-        while attempt <= config.retry_attempts:
-            try:
-                await client.upsert(
-                    collection_name=collection_name,
-                    points=batch,
-                )
-            except Exception:
-                logger.exception(
-                    "Retry %d/%d failed for Qdrant batch of %d points",
-                    attempt,
-                    config.retry_attempts,
-                    len(batch),
-                )
-                attempt += 1
-                if attempt > config.retry_attempts:
-                    logger.error(
-                        "Giving up on Qdrant batch after %d attempts; %d points were not indexed",
-                        config.retry_attempts,
-                        len(batch),
-                    )
-                    break
-                await asyncio.sleep(config.retry_backoff * attempt)
-                continue
-            else:
-                logger.info(
-                    "Successfully retried Qdrant batch of %d points on attempt %d",
-                    len(batch),
-                    attempt,
-                )
-                break
-
-
-async def _ensure_collection(
-    client: AsyncQdrantClient,
-    collection_name: str,
-    *,
-    dense_size: int,
-    dense_distance: models.Distance,
-) -> None:
-    """Create the collection and payload indexes if they do not already exist."""
-
-    created_collection = False
-    if not await client.collection_exists(collection_name):
-        await client.create_collection(
-            collection_name=collection_name,
-            vectors_config={"dense": models.VectorParams(size=dense_size, distance=dense_distance)},
-            sparse_vectors_config={"sparse": models.SparseVectorParams()},
-        )
-        created_collection = True
-
-    if not created_collection:
-        return
-
-    suppress_payload_warning = _is_local_qdrant(client)
-
-    async def _create_index(
-        field_name: str,
-        field_schema: models.PayloadSchemaType | models.TextIndexParams,
-    ) -> None:
-        if suppress_payload_warning:
-            with warnings.catch_warnings():
-                warnings.filterwarnings(
-                    "ignore",
-                    message="Payload indexes have no effect in the local Qdrant.*",
-                    category=UserWarning,
-                )
-                await client.create_payload_index(
-                    collection_name=collection_name,
-                    field_name=field_name,
-                    field_schema=field_schema,
-                )
-        else:
-            await client.create_payload_index(
-                collection_name=collection_name,
-                field_name=field_name,
-                field_schema=field_schema,
-            )
-
-    text_index = models.TextIndexParams(
-        type=models.PayloadSchemaType.TEXT,
-        tokenizer=models.TokenizerType.WORD,
-        min_token_len=2,
-        lowercase=True,
-    )
-    await _create_index("title", text_index)
-    await _create_index("type", models.PayloadSchemaType.KEYWORD)
-    await _create_index("year", models.PayloadSchemaType.INTEGER)
-    await _create_index("added_at", models.PayloadSchemaType.INTEGER)
-    await _create_index("actors", models.PayloadSchemaType.KEYWORD)
-    await _create_index("directors", models.PayloadSchemaType.KEYWORD)
-    await _create_index("writers", models.PayloadSchemaType.KEYWORD)
-    await _create_index("genres", models.PayloadSchemaType.KEYWORD)
-    await _create_index("show_title", models.PayloadSchemaType.KEYWORD)
-    await _create_index("season_number", models.PayloadSchemaType.INTEGER)
-    await _create_index("episode_number", models.PayloadSchemaType.INTEGER)
-    await _create_index("collections", models.PayloadSchemaType.KEYWORD)
-    await _create_index("summary", text_index)
-    await _create_index("overview", text_index)
-    await _create_index("plot", text_index)
-    await _create_index("tagline", text_index)
-    await _create_index("reviews", text_index)
-    await _create_index("data.plex.rating_key", models.PayloadSchemaType.KEYWORD)
-    await _create_index("data.imdb.id", models.PayloadSchemaType.KEYWORD)
-    await _create_index("data.tmdb.id", models.PayloadSchemaType.INTEGER)
-
-
-def _format_primary_title(item: AggregatedItem) -> str:
-    """Format the primary title text for ``item``."""
-
-    primary_title = item.plex.title
-    if item.plex.type == "episode":
-        title_bits: list[str] = []
-        if item.plex.show_title:
-            title_bits.append(item.plex.show_title)
-        se_parts: list[str] = []
-        if item.plex.season_number is not None:
-            se_parts.append(f"S{item.plex.season_number:02d}")
-        if item.plex.episode_number is not None:
-            se_parts.append(f"E{item.plex.episode_number:02d}")
-        if se_parts:
-            title_bits.append("".join(se_parts))
-        if item.plex.title:
-            title_bits.append(item.plex.title)
-        if title_bits:
-            primary_title = " - ".join(title_bits)
-    return primary_title
-
-
-def _build_point_text(item: AggregatedItem) -> str:
-    """Return the vector text for ``item``."""
-
-    parts = [
-        _format_primary_title(item),
-        item.plex.summary or "",
-        item.tmdb.overview if item.tmdb and hasattr(item.tmdb, "overview") else "",
-        item.imdb.plot if item.imdb else "",
-    ]
-    directors_text = ", ".join(p.tag for p in item.plex.directors if p.tag)
-    writers_text = ", ".join(p.tag for p in item.plex.writers if p.tag)
-    actors_text = ", ".join(p.tag for p in item.plex.actors if p.tag)
-    if directors_text:
-        parts.append(f"Directed by {directors_text}")
-    if writers_text:
-        parts.append(f"Written by {writers_text}")
-    if actors_text:
-        parts.append(f"Starring {actors_text}")
-    if item.plex.tagline:
-        parts.append(item.plex.tagline)
-    if item.tmdb and hasattr(item.tmdb, "tagline"):
-        tagline = getattr(item.tmdb, "tagline", None)
-        if tagline:
-            parts.append(tagline)
-    if item.tmdb and hasattr(item.tmdb, "reviews"):
-        parts.extend(r.get("content", "") for r in getattr(item.tmdb, "reviews", []))
-    return "\n".join(p for p in parts if p)
-
-
-class _BaseQdrantPayload(TypedDict):
-    data: dict[str, JSONValue]
-    title: str
-    type: str
-
-
-class QdrantPayload(_BaseQdrantPayload, total=False):
-    show_title: str
-    season_title: str
-    season_number: int
-    episode_number: int
-    actors: list[str]
-    directors: list[str]
-    writers: list[str]
-    genres: list[str]
-    collections: list[str]
-    summary: str
-    overview: str
-    plot: str
-    tagline: str
-    reviews: list[str]
-    year: int
-    added_at: int
-
-
-def _build_point_payload(item: AggregatedItem) -> QdrantPayload:
-    """Construct the Qdrant payload for ``item``."""
-
-    payload: QdrantPayload = {
-        "data": item.model_dump(mode="json"),
-        "title": item.plex.title,
-        "type": item.plex.type,
-    }
-    if item.plex.type == "episode":
-        if item.plex.show_title:
-            payload["show_title"] = item.plex.show_title
-        if item.plex.season_title:
-            payload["season_title"] = item.plex.season_title
-        if item.plex.season_number is not None:
-            payload["season_number"] = item.plex.season_number
-        if item.plex.episode_number is not None:
-            payload["episode_number"] = item.plex.episode_number
-    if item.plex.actors:
-        payload["actors"] = [p.tag for p in item.plex.actors if p.tag]
-    if item.plex.directors:
-        payload["directors"] = [p.tag for p in item.plex.directors if p.tag]
-    if item.plex.writers:
-        payload["writers"] = [p.tag for p in item.plex.writers if p.tag]
-    if item.plex.genres:
-        payload["genres"] = item.plex.genres
-    if item.plex.collections:
-        payload["collections"] = item.plex.collections
-    summary = item.plex.summary
-    if summary:
-        payload["summary"] = summary
-    overview = getattr(item.tmdb, "overview", None) if item.tmdb else None
-    if overview:
-        payload["overview"] = overview
-    plot = item.imdb.plot if item.imdb else None
-    if plot:
-        payload["plot"] = plot
-    taglines = [item.plex.tagline]
-    if item.tmdb and hasattr(item.tmdb, "tagline"):
-        taglines.append(getattr(item.tmdb, "tagline", None))
-    taglines = [t for t in taglines if t]
-    if taglines:
-        payload["tagline"] = "\n".join(dict.fromkeys(taglines))
-    if item.tmdb and hasattr(item.tmdb, "reviews"):
-        review_texts = [r.get("content", "") for r in getattr(item.tmdb, "reviews", [])]
-        review_texts = [r for r in review_texts if r]
-        if review_texts:
-            payload["reviews"] = review_texts
-    if item.plex.year is not None:
-        payload["year"] = item.plex.year
-    if item.plex.added_at is not None:
-        added = item.plex.added_at
-        if hasattr(added, "timestamp"):
-            payload["added_at"] = int(added.timestamp())
-    return payload
-
-
-def build_point(
-    item: AggregatedItem,
-    dense_model_name: str,
-    sparse_model_name: str,
-) -> models.PointStruct:
-    """Build a Qdrant point for ``item`` using the configured model names."""
-
-    text = _build_point_text(item)
-    payload = _build_point_payload(item)
-    point_id: int | str = (
-        int(item.plex.rating_key)
-        if item.plex.rating_key.isdigit()
-        else item.plex.rating_key
-    )
-    return models.PointStruct(
-        id=point_id,
-        vector={
-            "dense": models.Document(text=text, model=dense_model_name),
-            "sparse": models.Document(text=text, model=sparse_model_name),
-        },
-        payload=payload,
-    )
-
-
 def _load_from_sample(sample_dir: Path) -> list[AggregatedItem]:
     """Load items from local sample JSON files."""
 
diff --git a/mcp_plex/loader/qdrant.py b/mcp_plex/loader/qdrant.py
new file mode 100644
index 0000000..8ec0dd9
--- /dev/null
+++ b/mcp_plex/loader/qdrant.py
@@ -0,0 +1,363 @@
+"""Qdrant helper utilities shared across the loader pipeline."""
+from __future__ import annotations
+
+import asyncio
+import logging
+import warnings
+from typing import TYPE_CHECKING, Sequence, TypedDict
+
+from qdrant_client import models
+from qdrant_client.async_qdrant_client import AsyncQdrantClient
+
+from ..common.types import AggregatedItem, JSONValue
+
+if TYPE_CHECKING:  # pragma: no cover - imported for typing only
+    from . import QdrantRuntimeConfig
+
+logger = logging.getLogger("mcp_plex.loader.qdrant")
+
+
+def _is_local_qdrant(client: AsyncQdrantClient) -> bool:
+    """Return ``True`` if *client* targets an in-process Qdrant instance."""
+
+    inner = getattr(client, "_client", None)
+    return bool(inner) and inner.__class__.__module__.startswith("qdrant_client.local")
+
+
+# Known Qdrant-managed dense embedding models with their dimensionality and
+# similarity metric. To support a new server-side embedding model, add an entry
+# here with the appropriate vector size and `models.Distance` value.
+_DENSE_MODEL_PARAMS: dict[str, tuple[int, models.Distance]] = {
+    "BAAI/bge-small-en-v1.5": (384, models.Distance.COSINE),
+    "BAAI/bge-base-en-v1.5": (768, models.Distance.COSINE),
+    "BAAI/bge-large-en-v1.5": (1024, models.Distance.COSINE),
+    "text-embedding-3-small": (1536, models.Distance.COSINE),
+    "text-embedding-3-large": (3072, models.Distance.COSINE),
+}
+
+
+def _resolve_dense_model_params(model_name: str) -> tuple[int, models.Distance]:
+    """Look up Qdrant vector parameters for a known dense embedding model."""
+
+    try:
+        return _DENSE_MODEL_PARAMS[model_name]
+    except KeyError as exc:
+        raise ValueError(
+            f"Unknown dense embedding model '{model_name}'. Update _DENSE_MODEL_PARAMS with the model's size and distance."
+        ) from exc
+
+
+async def _ensure_collection(
+    client: AsyncQdrantClient,
+    collection_name: str,
+    *,
+    dense_size: int,
+    dense_distance: models.Distance,
+) -> None:
+    """Create the collection and payload indexes if they do not already exist."""
+
+    created_collection = False
+    if not await client.collection_exists(collection_name):
+        await client.create_collection(
+            collection_name=collection_name,
+            vectors_config={"dense": models.VectorParams(size=dense_size, distance=dense_distance)},
+            sparse_vectors_config={"sparse": models.SparseVectorParams()},
+        )
+        created_collection = True
+
+    if not created_collection:
+        return
+
+    suppress_payload_warning = _is_local_qdrant(client)
+
+    async def _create_index(
+        field_name: str,
+        field_schema: models.PayloadSchemaType | models.TextIndexParams,
+    ) -> None:
+        if suppress_payload_warning:
+            with warnings.catch_warnings():
+                warnings.filterwarnings(
+                    "ignore",
+                    message="Payload indexes have no effect in the local Qdrant.*",
+                    category=UserWarning,
+                )
+                await client.create_payload_index(
+                    collection_name=collection_name,
+                    field_name=field_name,
+                    field_schema=field_schema,
+                )
+        else:
+            await client.create_payload_index(
+                collection_name=collection_name,
+                field_name=field_name,
+                field_schema=field_schema,
+            )
+
+    text_index = models.TextIndexParams(
+        type=models.PayloadSchemaType.TEXT,
+        tokenizer=models.TokenizerType.WORD,
+        min_token_len=2,
+        lowercase=True,
+    )
+    await _create_index("title", text_index)
+    await _create_index("type", models.PayloadSchemaType.KEYWORD)
+    await _create_index("year", models.PayloadSchemaType.INTEGER)
+    await _create_index("added_at", models.PayloadSchemaType.INTEGER)
+    await _create_index("actors", models.PayloadSchemaType.KEYWORD)
+    await _create_index("directors", models.PayloadSchemaType.KEYWORD)
+    await _create_index("writers", models.PayloadSchemaType.KEYWORD)
+    await _create_index("genres", models.PayloadSchemaType.KEYWORD)
+    await _create_index("show_title", models.PayloadSchemaType.KEYWORD)
+    await _create_index("season_number", models.PayloadSchemaType.INTEGER)
+    await _create_index("episode_number", models.PayloadSchemaType.INTEGER)
+    await _create_index("collections", models.PayloadSchemaType.KEYWORD)
+    await _create_index("summary", text_index)
+    await _create_index("overview", text_index)
+    await _create_index("plot", text_index)
+    await _create_index("tagline", text_index)
+    await _create_index("reviews", text_index)
+    await _create_index("data.plex.rating_key", models.PayloadSchemaType.KEYWORD)
+    await _create_index("data.imdb.id", models.PayloadSchemaType.KEYWORD)
+    await _create_index("data.tmdb.id", models.PayloadSchemaType.INTEGER)
+
+
+def _format_primary_title(item: AggregatedItem) -> str:
+    """Format the primary title text for ``item``."""
+
+    primary_title = item.plex.title
+    if item.plex.type == "episode":
+        title_bits: list[str] = []
+        if item.plex.show_title:
+            title_bits.append(item.plex.show_title)
+        se_parts: list[str] = []
+        if item.plex.season_number is not None:
+            se_parts.append(f"S{item.plex.season_number:02d}")
+        if item.plex.episode_number is not None:
+            se_parts.append(f"E{item.plex.episode_number:02d}")
+        if se_parts:
+            title_bits.append("".join(se_parts))
+        if item.plex.title:
+            title_bits.append(item.plex.title)
+        if title_bits:
+            primary_title = " - ".join(title_bits)
+    return primary_title
+
+
+def _build_point_text(item: AggregatedItem) -> str:
+    """Return the vector text for ``item``."""
+
+    parts = [
+        _format_primary_title(item),
+        item.plex.summary or "",
+        item.tmdb.overview if item.tmdb and hasattr(item.tmdb, "overview") else "",
+        item.imdb.plot if item.imdb else "",
+    ]
+    directors_text = ", ".join(p.tag for p in item.plex.directors if p.tag)
+    writers_text = ", ".join(p.tag for p in item.plex.writers if p.tag)
+    actors_text = ", ".join(p.tag for p in item.plex.actors if p.tag)
+    if directors_text:
+        parts.append(f"Directed by {directors_text}")
+    if writers_text:
+        parts.append(f"Written by {writers_text}")
+    if actors_text:
+        parts.append(f"Starring {actors_text}")
+    if item.plex.tagline:
+        parts.append(item.plex.tagline)
+    if item.tmdb and hasattr(item.tmdb, "tagline"):
+        tagline = getattr(item.tmdb, "tagline", None)
+        if tagline:
+            parts.append(tagline)
+    if item.tmdb and hasattr(item.tmdb, "reviews"):
+        parts.extend(r.get("content", "") for r in getattr(item.tmdb, "reviews", []))
+    return "\n".join(p for p in parts if p)
+
+
+class _BaseQdrantPayload(TypedDict):
+    data: dict[str, JSONValue]
+    title: str
+    type: str
+
+
+class QdrantPayload(_BaseQdrantPayload, total=False):
+    show_title: str
+    season_title: str
+    season_number: int
+    episode_number: int
+    actors: list[str]
+    directors: list[str]
+    writers: list[str]
+    genres: list[str]
+    collections: list[str]
+    summary: str
+    overview: str
+    plot: str
+    tagline: str
+    reviews: list[str]
+    year: int
+    added_at: int
+
+
+def _build_point_payload(item: AggregatedItem) -> QdrantPayload:
+    """Construct the Qdrant payload for ``item``."""
+
+    payload: QdrantPayload = {
+        "data": item.model_dump(mode="json"),
+        "title": item.plex.title,
+        "type": item.plex.type,
+    }
+    if item.plex.type == "episode":
+        if item.plex.show_title:
+            payload["show_title"] = item.plex.show_title
+        if item.plex.season_title:
+            payload["season_title"] = item.plex.season_title
+        if item.plex.season_number is not None:
+            payload["season_number"] = item.plex.season_number
+        if item.plex.episode_number is not None:
+            payload["episode_number"] = item.plex.episode_number
+    if item.plex.actors:
+        payload["actors"] = [p.tag for p in item.plex.actors if p.tag]
+    if item.plex.directors:
+        payload["directors"] = [p.tag for p in item.plex.directors if p.tag]
+    if item.plex.writers:
+        payload["writers"] = [p.tag for p in item.plex.writers if p.tag]
+    if item.plex.genres:
+        payload["genres"] = item.plex.genres
+    if item.plex.collections:
+        payload["collections"] = item.plex.collections
+    summary = item.plex.summary
+    if summary:
+        payload["summary"] = summary
+    overview = getattr(item.tmdb, "overview", None) if item.tmdb else None
+    if overview:
+        payload["overview"] = overview
+    plot = item.imdb.plot if item.imdb else None
+    if plot:
+        payload["plot"] = plot
+    taglines = [item.plex.tagline]
+    if item.tmdb and hasattr(item.tmdb, "tagline"):
+        taglines.append(getattr(item.tmdb, "tagline", None))
+    taglines = [t for t in taglines if t]
+    if taglines:
+        payload["tagline"] = "\n".join(dict.fromkeys(taglines))
+    if item.tmdb and hasattr(item.tmdb, "reviews"):
+        review_texts = [r.get("content", "") for r in getattr(item.tmdb, "reviews", [])]
+        review_texts = [r for r in review_texts if r]
+        if review_texts:
+            payload["reviews"] = review_texts
+    if item.plex.year is not None:
+        payload["year"] = item.plex.year
+    if item.plex.added_at is not None:
+        added = item.plex.added_at
+        if hasattr(added, "timestamp"):
+            payload["added_at"] = int(added.timestamp())
+    return payload
+
+
+def build_point(
+    item: AggregatedItem,
+    dense_model_name: str,
+    sparse_model_name: str,
+) -> models.PointStruct:
+    """Build a Qdrant point for ``item`` using the configured model names."""
+
+    text = _build_point_text(item)
+    payload = _build_point_payload(item)
+    point_id: int | str = (
+        int(item.plex.rating_key)
+        if item.plex.rating_key.isdigit()
+        else item.plex.rating_key
+    )
+    return models.PointStruct(
+        id=point_id,
+        vector={
+            "dense": models.Document(text=text, model=dense_model_name),
+            "sparse": models.Document(text=text, model=sparse_model_name),
+        },
+        payload=payload,
+    )
+
+
+async def _upsert_in_batches(
+    client: AsyncQdrantClient,
+    collection_name: str,
+    points: Sequence[models.PointStruct],
+    *,
+    batch_size: int,
+    retry_queue: asyncio.Queue[list[models.PointStruct]] | None = None,
+) -> None:
+    """Upsert points into Qdrant in batches, logging HTTP errors."""
+
+    total = len(points)
+    for i in range(0, total, batch_size):
+        batch = points[i : i + batch_size]
+        try:
+            await client.upsert(collection_name=collection_name, points=batch)
+        except Exception:
+            logger.exception("Failed to upsert batch %d-%d", i, i + len(batch))
+            if retry_queue is not None:
+                await retry_queue.put(list(batch))
+        else:
+            logger.info("Upserted %d/%d points", min(i + len(batch), total), total)
+
+
+async def _process_qdrant_retry_queue(
+    client: AsyncQdrantClient,
+    collection_name: str,
+    retry_queue: asyncio.Queue[list[models.PointStruct]],
+    *,
+    config: "QdrantRuntimeConfig",
+) -> None:
+    """Retry failed Qdrant batches with exponential backoff."""
+
+    if retry_queue.empty():
+        return
+
+    pending = retry_queue.qsize()
+    logger.info("Retrying %d failed Qdrant batches", pending)
+    while not retry_queue.empty():
+        batch = await retry_queue.get()
+        attempt = 1
+        while attempt <= config.retry_attempts:
+            try:
+                await client.upsert(
+                    collection_name=collection_name,
+                    points=batch,
+                )
+            except Exception:
+                logger.exception(
+                    "Retry %d/%d failed for Qdrant batch of %d points",
+                    attempt,
+                    config.retry_attempts,
+                    len(batch),
+                )
+                attempt += 1
+                if attempt > config.retry_attempts:
+                    logger.error(
+                        "Giving up on Qdrant batch after %d attempts; %d points were not indexed",
+                        config.retry_attempts,
+                        len(batch),
+                    )
+                    break
+                await asyncio.sleep(config.retry_backoff * attempt)
+                continue
+            else:
+                logger.info(
+                    "Successfully retried Qdrant batch of %d points on attempt %d",
+                    len(batch),
+                    attempt,
+                )
+                break
+
+
+__all__ = [
+    "_DENSE_MODEL_PARAMS",
+    "_resolve_dense_model_params",
+    "_is_local_qdrant",
+    "_ensure_collection",
+    "_build_point_text",
+    "_build_point_payload",
+    "QdrantPayload",
+    "build_point",
+    "_upsert_in_batches",
+    "_process_qdrant_retry_queue",
+]
diff --git a/pyproject.toml b/pyproject.toml
index 605e78d..4a5df13 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "mcp-plex"
-version = "2.0.2"
+version = "2.0.3"
 
 description = "Plex-Oriented Model Context Protocol Server"
 requires-python = ">=3.11,<3.13"
diff --git a/tests/test_loader_unit.py b/tests/test_loader_unit.py
index f002061..b98ada6 100644
--- a/tests/test_loader_unit.py
+++ b/tests/test_loader_unit.py
@@ -10,6 +10,7 @@
 import pytest
 
 from mcp_plex import loader
+import mcp_plex.loader.qdrant as loader_qdrant
 from mcp_plex.loader.imdb_cache import IMDbCache
 from mcp_plex.loader import (
     IMDbRuntimeConfig,
@@ -20,7 +21,12 @@
     _load_imdb_retry_queue,
     _persist_imdb_retry_queue,
     _process_imdb_retry_queue,
+)
+from mcp_plex.loader.qdrant import (
+    _ensure_collection,
+    _process_qdrant_retry_queue,
     _resolve_dense_model_params,
+    _upsert_in_batches,
     build_point,
 )
 from mcp_plex.loader.pipeline.channels import IMDbRetryQueue
@@ -239,7 +245,7 @@ async def run_test():
     asyncio.run(run_test())
     assert queue.qsize() == 1
     assert queue.snapshot() == ["tt0111161"]
-def test_upsert_in_batches_handles_errors(monkeypatch):
+def test_upsert_in_batches_handles_errors():
     class DummyClient:
         def __init__(self):
             self.calls = 0
@@ -252,7 +258,7 @@ async def upsert(self, collection_name: str, points, **kwargs):
     client = DummyClient()
     points = [models.PointStruct(id=i, vector={}, payload={}) for i in range(3)]
     asyncio.run(
-        loader._upsert_in_batches(
+        _upsert_in_batches(
             client,
             "c",
             points,
@@ -262,7 +268,7 @@ async def upsert(self, collection_name: str, points, **kwargs):
     assert client.calls == 3
 
 
-def test_upsert_in_batches_enqueues_retry_batches(monkeypatch):
+def test_upsert_in_batches_enqueues_retry_batches():
     class DummyClient:
         def __init__(self):
             self.calls = 0
@@ -277,7 +283,7 @@ async def upsert(self, collection_name: str, points, **kwargs):
     retry_queue: asyncio.Queue[list[models.PointStruct]] = asyncio.Queue()
 
     async def main() -> None:
-        await loader._upsert_in_batches(
+        await _upsert_in_batches(
             client,
             "collection",
             points,
@@ -313,9 +319,9 @@ async def main() -> None:
         async def fake_sleep(delay: float) -> None:
             sleeps.append(delay)
 
-        monkeypatch.setattr(loader.asyncio, "sleep", fake_sleep)
+        monkeypatch.setattr(loader_qdrant.asyncio, "sleep", fake_sleep)
 
-        await loader._process_qdrant_retry_queue(
+        await _process_qdrant_retry_queue(
             client,
             "collection",
             retry_queue,
@@ -370,7 +376,7 @@ async def create_payload_index(self, *args, **kwargs):
             raise AssertionError("should not create index")
 
     asyncio.run(
-        loader._ensure_collection(
+        _ensure_collection(
             DummyClient(),
             "media-items",
             dense_size=1,
diff --git a/uv.lock b/uv.lock
index ac3731a..2764cf3 100644
--- a/uv.lock
+++ b/uv.lock
@@ -730,7 +730,7 @@ wheels = [
 
 [[package]]
 name = "mcp-plex"
-version = "2.0.2"
+version = "2.0.3"
 source = { editable = "." }
 dependencies = [
     { name = "fastapi" },