CaddyGlow · CaddyGlow · Apr 13, 2026 · Apr 13, 2026 · Copilot · Apr 13, 2026
diff --git a/ccproxy/streaming/buffer.py b/ccproxy/streaming/buffer.py
@@ -560,8 +560,16 @@ async def _parse_collected_stream(
                 continue
             event_type = payload.get("type")
             if isinstance(event_type, str) and stream_accumulator is not None:
-                with contextlib.suppress(Exception):
+                try:
                     stream_accumulator.accumulate(event_type, payload)
+                except Exception as exc:  # pragma: no cover - defensive logging
+                    logger.warning(
+                        "streaming_buffer_accumulate_failed",
+                        event_type=event_type,
+                        error=str(exc),
-                        error=str(exc),
+                        error=str(exc),
+                        exc_info=exc,
-                        error=str(exc),
+                        error=str(exc),
+                        exc_info=exc,
+                        request_id=getattr(request_context, "request_id", None),
+                        category="streaming",
+                    )
             if event_type == "response.reasoning_summary_part.added":
                 part = payload.get("part")
                 if isinstance(part, dict):
@@ -584,7 +592,10 @@ async def _parse_collected_stream(
             response_obj.setdefault("created_at", 0)
             response_obj.setdefault("status", "completed")
             response_obj.setdefault("model", response_obj.get("model") or "")
-            response_obj.setdefault("output", response_obj.get("output") or {})
+            # ResponseObject.output must be a list; coerce stray dicts/None to [].
+            existing_output = response_obj.get("output")
+            if not isinstance(existing_output, list):
+                response_obj["output"] = []
             response_obj.setdefault(
                 "parallel_tool_calls", response_obj.get("parallel_tool_calls", False)
             )
@@ -602,8 +613,16 @@ async def _parse_collected_stream(
                         continue
                     event_type = payload.get("type")
                     if isinstance(event_type, str):
-                        with contextlib.suppress(Exception):
+                        try:
                             accumulator_for_rebuild.accumulate(event_type, payload)
+                        except Exception as exc:  # pragma: no cover - defensive logging
+                            logger.warning(
+                                "streaming_buffer_rebuild_accumulate_failed",
+                                event_type=event_type,
+                                error=str(exc),
+                                request_id=getattr(request_context, "request_id", None),
+                                category="streaming",
+                            )
 
             if accumulator_for_rebuild is not None:
                 completed_payload = accumulator_for_rebuild.get_completed_response()
@@ -635,12 +654,21 @@ async def _parse_collected_stream(
                             request_id=getattr(request_context, "request_id", None),
                         )
                 except Exception as exc:  # pragma: no cover - defensive logging
-                    logger.debug(
+                    logger.warning(
                         "response_rebuild_failed",
                         error=str(exc),
                         request_id=getattr(request_context, "request_id", None),
+                        category="streaming",
-                        category="streaming",
+                        category="streaming",
+                        exc_info=exc,
-                        category="streaming",
+                        category="streaming",
+                        exc_info=exc,
                     )
 
+            # Final safety net: ResponseObject.output is required and must be a
+            # list. If upstream event schema drift caused the accumulator to drop
+            # the completed event and rebuild to leave a non-list output behind,
+            # coerce it so downstream format chain validation doesn't explode
+            # with a bare "Field required" error.
+            if not isinstance(response_obj.get("output"), list):
+                response_obj["output"] = []
+
             if not response_obj.get("usage"):
                 usage = self._extract_usage_from_chunks(chunks)
                 if usage:

diff --git a/tests/unit/streaming/test_buffer_parse_responses.py b/tests/unit/streaming/test_buffer_parse_responses.py
@@ -0,0 +1,213 @@
+"""Regression tests for StreamingBufferService._parse_collected_stream.
+
+Covers issue #55: when the Codex Responses API SSE stream has drifted away
+from the shape ResponsesAccumulator knows about, the buffer must still emit
+a dict whose ``output`` field is a list so the downstream format chain's
+ResponseObject validation does not fail with ``Field required``.
+"""
+
+from __future__ import annotations
+
+import json
+from typing import Any
+
+import httpx
+import pytest
+
+from ccproxy.llms.models import openai as openai_models
+from ccproxy.llms.streaming.accumulators import ResponsesAccumulator
+from ccproxy.streaming.buffer import StreamingBufferService
+
+
+class _Ctx:
+    request_id = "test-req"
+    _tool_accumulator_class = ResponsesAccumulator
+
+
+def _sse(event_type: str, payload: dict[str, Any]) -> bytes:
+    body = {"type": event_type, **payload}
+    return f"event: {event_type}\ndata: {json.dumps(body)}\n\n".encode()
+
+
+@pytest.fixture
+def buffer() -> StreamingBufferService:
+    return StreamingBufferService(http_client=httpx.AsyncClient())
+
+
+@pytest.mark.asyncio
+async def test_parse_collected_stream_output_is_always_a_list(
+    buffer: StreamingBufferService,
+) -> None:
+    """A Codex stream whose completed event is unrecognizable must still
+    yield a dict with ``output`` as a list (issue #55)."""
+
+    base_response = {
+        "id": "resp_abc",
+        "object": "response",
+        "model": "gpt-5-codex",
+        "parallel_tool_calls": True,
+        "top_logprobs": 0,
+    }
+    chunks = [
+        _sse(
+            "response.created",
+            {"sequence_number": 1, "response": base_response},
+        ),
+        _sse(
+            "response.in_progress",
+            {"sequence_number": 2, "response": base_response},
+        ),
+        _sse(
+            "response.completed",
+            {
+                "sequence_number": 3,
+                "response": {**base_response, "unexpected_future_field": True},
+            },
+        ),
+    ]
+
+    parsed = await buffer._parse_collected_stream(
+        chunks=chunks,
+        handler_config=None,  # type: ignore[arg-type]
+        request_context=_Ctx(),  # type: ignore[arg-type]
+    )
+
+    assert parsed is not None
+    assert isinstance(parsed.get("output"), list), (
+        f"output must be list for ResponseObject validation, got {type(parsed.get('output'))}"
+    )
+    openai_models.ResponseObject.model_validate(parsed)
+
+
+@pytest.mark.asyncio
+async def test_parse_collected_stream_coerces_non_list_output(
+    buffer: StreamingBufferService,
+) -> None:
+    """Even if upstream sends ``output`` as a bare dict, the buffer coerces it."""
+
+    base_response = {
+        "id": "resp_xyz",
+        "object": "response",
+        "model": "gpt-5-codex",
+        "parallel_tool_calls": False,
+        "output": {},
+    }
+    chunks = [
+        _sse(
+            "response.created",
+            {"sequence_number": 1, "response": base_response},
+        ),
+    ]
+
+    parsed = await buffer._parse_collected_stream(
+        chunks=chunks,
+        handler_config=None,  # type: ignore[arg-type]
+        request_context=_Ctx(),  # type: ignore[arg-type]
+    )
+
+    assert parsed is not None
+    assert isinstance(parsed.get("output"), list)
+    openai_models.ResponseObject.model_validate(parsed)
+
+
+@pytest.mark.asyncio
+async def test_parse_collected_stream_preserves_rebuilt_output(
+    buffer: StreamingBufferService,
+) -> None:
+    """When the accumulator successfully rebuilds message outputs from
+    valid events, those outputs must reach the parsed payload."""
+
+    response_dict: dict[str, Any] = {
+        "id": "resp_done",
+        "object": "response",
+        "model": "gpt-5-codex",
+        "parallel_tool_calls": False,
+        "output": [],
+    }
+    chunks = [
+        _sse(
+            "response.created",
+            {"sequence_number": 1, "response": response_dict},
+        ),
+        _sse(
+            "response.output_item.added",
+            {
+                "sequence_number": 2,
+                "output_index": 0,
+                "item": {
+                    "type": "message",
+                    "id": "msg_1",
+                    "status": "in_progress",
+                    "role": "assistant",
+                    "content": [],
+                },
+            },
+        ),
+        _sse(
+            "response.output_text.delta",
+            {
+                "sequence_number": 3,
+                "item_id": "msg_1",
+                "output_index": 0,
+                "content_index": 0,
+                "delta": "hello",
+            },
+        ),
+        _sse(
+            "response.output_text.done",
+            {
+                "sequence_number": 4,
+                "item_id": "msg_1",
+                "output_index": 0,
+                "content_index": 0,
+                "text": "hello",
+            },
+        ),
+        _sse(
+            "response.output_item.done",
+            {
+                "sequence_number": 5,
+                "output_index": 0,
+                "item": {
+                    "type": "message",
+                    "id": "msg_1",
+                    "status": "completed",
+                    "role": "assistant",
+                    "content": [{"type": "output_text", "text": "hello"}],
+                },
+            },
+        ),
+        _sse(
+            "response.completed",
+            {
+                "sequence_number": 6,
+                "response": {
+                    **response_dict,
+                    "status": "completed",
+                    "output": [
+                        {
+                            "type": "message",
+                            "id": "msg_1",
+                            "status": "completed",
+                            "role": "assistant",
+                            "content": [{"type": "output_text", "text": "hello"}],
+                        }
+                    ],
+                },
+            },
+        ),
+    ]
+
+    parsed = await buffer._parse_collected_stream(
+        chunks=chunks,
+        handler_config=None,  # type: ignore[arg-type]
+        request_context=_Ctx(),  # type: ignore[arg-type]
+    )
+
+    assert parsed is not None
+    output = parsed.get("output")
+    assert isinstance(output, list) and output, (
+        "output should contain the rebuilt message"
+    )
+    validated = openai_models.ResponseObject.model_validate(parsed)
+    assert validated.output