feat(ai-insights): conversations endpoint (#101916)

obostjancic · web-flow · commit ec760c4d8f4a · 2025-10-23T10:26:32.000+02:00
diff --git a/src/sentry/api/endpoints/organization_ai_conversations.py b/src/sentry/api/endpoints/organization_ai_conversations.py
@@ -0,0 +1,247 @@
+import dataclasses
+from collections import defaultdict
+from datetime import datetime
+
+from rest_framework import serializers
+from rest_framework.request import Request
+from rest_framework.response import Response
+
+from sentry import features
+from sentry.api.api_owners import ApiOwner
+from sentry.api.api_publish_status import ApiPublishStatus
+from sentry.api.base import region_silo_endpoint
+from sentry.api.bases import NoProjects, OrganizationEventsV2EndpointBase
+from sentry.api.paginator import GenericOffsetPaginator
+from sentry.api.utils import handle_query_errors
+from sentry.models.organization import Organization
+from sentry.search.eap.types import SearchResolverConfig
+from sentry.snuba.referrer import Referrer
+from sentry.snuba.spans_rpc import Spans
+
+
+class OrganizationAIConversationsSerializer(serializers.Serializer):
+    """Serializer for validating query parameters."""
+
+    sort = serializers.CharField(required=False, default="-timestamp")
+    query = serializers.CharField(required=False, allow_blank=True)
+
+    def validate_sort(self, value):
+        allowed_sorts = {
+            "timestamp",
+            "-timestamp",
+            "duration",
+            "-duration",
+            "errors",
+            "-errors",
+            "llmCalls",
+            "-llmCalls",
+            "toolCalls",
+            "-toolCalls",
+            "totalTokens",
+            "-totalTokens",
+            "totalCost",
+            "-totalCost",
+        }
+        if value not in allowed_sorts:
+            raise serializers.ValidationError(f"Invalid sort option: {value}")
+        return value
+
+
+@region_silo_endpoint
+class OrganizationAIConversationsEndpoint(OrganizationEventsV2EndpointBase):
+    """Endpoint for fetching AI agent conversation traces."""
+
+    publish_status = {
+        "GET": ApiPublishStatus.PRIVATE,
+    }
+    owner = ApiOwner.VISIBILITY
+
+    def get(self, request: Request, organization: Organization) -> Response:
+        """
+        Retrieve AI conversation traces for an organization.
+        """
+        if not features.has("organizations:gen-ai-conversations", organization, actor=request.user):
+            return Response(status=404)
+
+        try:
+            snuba_params = self.get_snuba_params(request, organization)
+        except NoProjects:
+            return Response(status=404)
+
+        serializer = OrganizationAIConversationsSerializer(data=request.GET)
+        if not serializer.is_valid():
+            return Response(serializer.errors, status=400)
+
+        validated_data = serializer.validated_data
+
+        # Create paginator with data function
+        def data_fn(offset: int, limit: int):
+            return self._get_conversations(
+                snuba_params=snuba_params,
+                offset=offset,
+                limit=limit,
+                _sort=validated_data.get("sort", "-timestamp"),
+                _query=validated_data.get("query", ""),
+            )
+
+        with handle_query_errors():
+            return self.paginate(
+                request=request,
+                paginator=GenericOffsetPaginator(data_fn=data_fn),
+                on_results=lambda results: results,
+            )
+
+    def _get_conversations(
+        self, snuba_params, offset: int, limit: int, _sort: str, _query: str
+    ) -> list[dict]:
+        """
+        Fetch conversation data by querying spans grouped by gen_ai.conversation.id.
+
+        This is a two-step process:
+        1. Find conversation IDs that have spans in the time range (with pagination/sorting)
+        2. Get complete aggregations for those conversations (all spans, ignoring time filter)
+
+        Args:
+            snuba_params: Snuba parameters including projects, time range, etc.
+            offset: Starting index for pagination
+            limit: Number of results to return
+            _sort: Sort field and direction (currently only supports timestamp sorting, unused for now)
+            _query: Search query (not yet implemented)
+        """
+        # Step 1: Find conversation IDs with spans in the time range
+        conversation_ids_results = Spans.run_table_query(
+            params=snuba_params,
+            query_string="has:gen_ai.conversation.id",
+            selected_columns=[
+                "gen_ai.conversation.id",
+                "max(precise.finish_ts)",
+            ],
+            orderby=["-max(precise.finish_ts)"],
+            offset=offset,
+            limit=limit,
+            referrer=Referrer.API_AI_CONVERSATIONS.value,
+            config=SearchResolverConfig(auto_fields=True),
+            sampling_mode=None,
+        )
+
+        conversation_ids: list[str] = [
+            conv_id
+            for row in conversation_ids_results.get("data", [])
+            if (conv_id := row.get("gen_ai.conversation.id"))
+        ]
+
+        if not conversation_ids:
+            return []
+
+        # Step 2: Get complete aggregations for these conversations (all time)
+        all_time_params = dataclasses.replace(
+            snuba_params,
+            start=datetime(2020, 1, 1),
+            end=datetime(2100, 1, 1),
+        )
+
+        results = Spans.run_table_query(
+            params=all_time_params,
+            query_string=f"gen_ai.conversation.id:[{','.join(conversation_ids)}]",
+            selected_columns=[
+                "gen_ai.conversation.id",
+                "failure_count()",
+                "count_if(gen_ai.operation.type,equals,ai_client)",
+                "count_if(span.op,equals,gen_ai.execute_tool)",
+                "sum(gen_ai.usage.total_tokens)",
+                "sum(gen_ai.usage.total_cost)",
+                "min(precise.start_ts)",
+                "max(precise.finish_ts)",
+                "count_unique(trace)",
+            ],
+            orderby=None,
+            offset=0,
+            limit=len(conversation_ids),
+            referrer=Referrer.API_AI_CONVERSATIONS_COMPLETE.value,
+            config=SearchResolverConfig(auto_fields=True),
+            sampling_mode=None,
+        )
+
+        # Create a map of conversation data by ID
+        conversations_map = {}
+        for row in results.get("data", []):
+            start_ts = row.get("min(precise.start_ts)", 0)
+            finish_ts = row.get("max(precise.finish_ts)", 0)
+            duration_ms = int((finish_ts - start_ts) * 1000) if finish_ts and start_ts else 0
+            timestamp_ms = int(finish_ts * 1000) if finish_ts else 0
+
+            conv_id = row.get("gen_ai.conversation.id", "")
+            conversations_map[conv_id] = {
+                "conversationId": conv_id,
+                "flow": [],
+                "duration": duration_ms,
+                "errors": int(row.get("failure_count()") or 0),
+                "llmCalls": int(row.get("count_if(gen_ai.operation.type,equals,ai_client)") or 0),
+                "toolCalls": int(row.get("count_if(span.op,equals,gen_ai.execute_tool)") or 0),
+                "totalTokens": int(row.get("sum(gen_ai.usage.total_tokens)") or 0),
+                "totalCost": float(row.get("sum(gen_ai.usage.total_cost)") or 0),
+                "timestamp": timestamp_ms,
+                "traceCount": int(row.get("count_unique(trace)") or 0),
+                "traceIds": [],
+            }
+
+        # Preserve the order from step 1
+        conversations = [
+            conversations_map[conv_id]
+            for conv_id in conversation_ids
+            if conv_id in conversations_map
+        ]
+
+        if conversations:
+            self._enrich_conversations(all_time_params, conversations)
+
+        return conversations
+
+    def _enrich_conversations(self, snuba_params, conversations: list[dict]) -> None:
+        """
+        Enrich conversations with flow and trace IDs by querying all spans.
+        """
+        conversation_ids = [conv["conversationId"] for conv in conversations]
+
+        # Query all spans for these conversations to get both agent flows and trace IDs
+        all_spans_results = Spans.run_table_query(
+            params=snuba_params,
+            query_string=f"gen_ai.conversation.id:[{','.join(conversation_ids)}]",
+            selected_columns=[
+                "gen_ai.conversation.id",
+                "span.op",
+                "span.description",
+                "trace",
+                "precise.start_ts",
+            ],
+            orderby=["gen_ai.conversation.id", "precise.start_ts"],
+            offset=0,
+            limit=10000,
+            referrer=Referrer.API_AI_CONVERSATIONS_ENRICHMENT.value,
+            config=SearchResolverConfig(auto_fields=True),
+            sampling_mode=None,
+        )
+
+        flows_by_conversation = defaultdict(list)
+        traces_by_conversation = defaultdict(set)
+
+        for row in all_spans_results.get("data", []):
+            conv_id = row.get("gen_ai.conversation.id", "")
+            if not conv_id:
+                continue
+
+            # Collect trace IDs
+            trace_id = row.get("trace", "")
+            if trace_id:
+                traces_by_conversation[conv_id].add(trace_id)
+
+            # Collect agent flow (only from invoke_agent spans)
+            if row.get("span.op") == "gen_ai.invoke_agent":
+                agent_name = row.get("span.description", "")
+                if agent_name:
+                    flows_by_conversation[conv_id].append(agent_name)
+
+        for conversation in conversations:
+            conv_id = conversation["conversationId"]
+            conversation["flow"] = flows_by_conversation.get(conv_id, [])
+            conversation["traceIds"] = list(traces_by_conversation.get(conv_id, set()))
diff --git a/src/sentry/api/urls.py b/src/sentry/api/urls.py
@@ -3,6 +3,7 @@
 from django.conf.urls import include
 from django.urls import URLPattern, URLResolver, re_path
 
+from sentry.api.endpoints.organization_ai_conversations import OrganizationAIConversationsEndpoint
 from sentry.api.endpoints.organization_auth_token_details import (
     OrganizationAuthTokenDetailsEndpoint,
 )
@@ -1678,6 +1679,11 @@ def create_group_urls(name_prefix: str) -> list[URLPattern | URLResolver]:
         OrganizationTracesEndpoint.as_view(),
         name="sentry-api-0-organization-traces",
     ),
+    re_path(
+        r"^(?P<organization_id_or_slug>[^/]+)/ai-conversations/$",
+        OrganizationAIConversationsEndpoint.as_view(),
+        name="sentry-api-0-organization-ai-conversations",
+    ),
     re_path(
         r"^(?P<organization_id_or_slug>[^/]+)/trace-items/attributes/$",
         OrganizationTraceItemAttributesEndpoint.as_view(),
diff --git a/src/sentry/snuba/referrer.py b/src/sentry/snuba/referrer.py
@@ -469,6 +469,9 @@ class Referrer(StrEnum):
     API_ORGANIZATION_SPANS_HISTOGRAM_MIN_MAX = "api.organization-spans-histogram-min-max"
     API_ORGANIZATION_VITALS_PER_PROJECT = "api.organization-vitals-per-project"
     API_ORGANIZATION_VITALS = "api.organization-vitals"
+    API_AI_CONVERSATIONS = "api.ai-conversations"
+    API_AI_CONVERSATIONS_COMPLETE = "api.ai-conversations.complete"
+    API_AI_CONVERSATIONS_ENRICHMENT = "api.ai-conversations.enrichment"
     API_AI_PIPELINES_VIEW = "api.ai-pipelines.view"
     API_AI_PIPELINES_DETAILS_VIEW = "api.ai-pipelines.details.view"
     API_PROFILING_ONBOARDING = "profiling-onboarding"
diff --git a/static/app/views/insights/agents/components/conversationsTable.tsx b/static/app/views/insights/agents/components/conversationsTable.tsx
@@ -11,6 +11,8 @@ import useStateBasedColumnResize from 'sentry/components/tables/gridEditable/use
 import TimeSince from 'sentry/components/timeSince';
 import {IconArrow} from 'sentry/icons';
 import {t} from 'sentry/locale';
+import {useApiQuery} from 'sentry/utils/queryClient';
+import {useLocation} from 'sentry/utils/useLocation';
 import {useNavigate} from 'sentry/utils/useNavigate';
 import useOrganization from 'sentry/utils/useOrganization';
 import usePageFilters from 'sentry/utils/usePageFilters';
@@ -27,12 +29,14 @@ interface TableData {
   conversationId: string;
   duration: number;
   errors: number;
-  flow: string;
+  flow: string[];
   llmCalls: number;
   timestamp: number;
   toolCalls: number;
   totalCost: number | null;
   totalTokens: number;
+  traceCount: number;
+  traceIds: string[];
 }
 
 export function ConversationsTable() {
@@ -69,10 +73,35 @@ const rightAlignColumns = new Set([
 
 function ConversationsTableInner() {
   const navigate = useNavigate();
+  const location = useLocation();
+  const organization = useOrganization();
   const {columns: columnOrder, handleResizeColumn} = useStateBasedColumnResize({
     columns: defaultColumnOrder,
   });
 
+  // Fetch data from the API
+  const queryCursor =
+    typeof location.query.tableCursor === 'string'
+      ? location.query.tableCursor
+      : undefined;
+
+  const {
+    data = [],
+    isLoading,
+    error,
+    getResponseHeader,
+  } = useApiQuery<TableData[]>(
+    [
+      `/organizations/${organization.slug}/ai-conversations/`,
+      {query: {cursor: queryCursor}},
+    ],
+    {
+      staleTime: 0,
+    }
+  );
+
+  const pageLinks = getResponseHeader?.('Link');
+
   const handleCursor: CursorHandler = (cursor, pathname, previousQuery) => {
     navigate(
       {
@@ -107,9 +136,9 @@ function ConversationsTableInner() {
     <Fragment>
       <GridEditableContainer>
         <GridEditable
-          isLoading={false}
-          error={null}
-          data={[]}
+          isLoading={isLoading}
+          error={error}
+          data={data}
           columnOrder={columnOrder}
           columnSortBy={EMPTY_ARRAY}
           stickyHeader
@@ -120,7 +149,7 @@ function ConversationsTableInner() {
           }}
         />
       </GridEditableContainer>
-      <Pagination pageLinks={undefined} onCursor={handleCursor} />
+      <Pagination pageLinks={pageLinks} onCursor={handleCursor} />
     </Fragment>
   );
 }
@@ -139,14 +168,16 @@ const BodyCell = memo(function BodyCell({
   switch (column.key) {
     case 'conversationId':
       return <span>{dataRow.conversationId}</span>;
+    case 'flow':
+      return <span>{dataRow.flow.join(' → ')}</span>;
     case 'duration':
       return <DurationCell milliseconds={dataRow.duration} />;
     case 'errors':
       return (
         <ErrorCell
           value={dataRow.errors}
           target={getExploreUrl({
-            // query: `${query} span.status:internal_error trace:[${dataRow.traceId}]`,
+            query: `span.status:internal_error trace:[${dataRow.traceIds.join(',')}]`,
             organization,
             selection,
             referrer: Referrer.TRACES_TABLE,
diff --git a/tests/sentry/api/endpoints/test_organization_ai_conversations.py b/tests/sentry/api/endpoints/test_organization_ai_conversations.py