grafana · mdisibio · Mar 19, 2024 · Mar 19, 2024 · joe-elliott · Mar 19, 2024
@@ -2,6 +2,7 @@ package receiver
 
 import (
 	"context"
+	"errors"
 	"fmt"
 	"os"
 	"time"
@@ -342,6 +343,12 @@ func (r *receiversShim) ConsumeTraces(ctx context.Context, td ptrace.Traces) err
 	metricPushDuration.Observe(time.Since(start).Seconds())
 	if err != nil {
 		r.logger.Log("msg", "pusher failed to consume trace data", "err", err)
+
+		// Client disconnects are logged but not propogated back.
+		if errors.Is(err, context.Canceled) {
 localCtx, cancel := context.WithTimeout(ctx, d.clientCfg.RemoteTimeout) 
 defer cancel() 
 localCtx, cancel := context.WithTimeout(ctx, d.clientCfg.RemoteTimeout) 
 defer cancel() 
+			return nil
+		}
+
 		err = wrapErrorIfRetryable(err, r.retryDelay)
 	}
 

@@ -1,6 +1,8 @@
 package frontend
 
 import (
+	"context"
+	"errors"
 	"net/http"
 	"time"
 
@@ -66,8 +68,10 @@ func sloHook(allByTenantCounter, withinSLOByTenantCounter *prometheus.CounterVec
 
 		// most errors are SLO violations
 		if err != nil {
-			// however, if this is a grpc resource exhausted error (429) then we are within SLO
-			if status.Code(err) == codes.ResourceExhausted {
+			// However these errors are considered within SLO:
+			// * grpc resource exhausted error (429)
+			// * context canceled (client disconnected or canceled)
+			if status.Code(err) == codes.ResourceExhausted || errors.Is(err, context.Canceled) {
 				withinSLOByTenantCounter.WithLabelValues(tenant).Inc()
 			}
 			return

@@ -1,6 +1,7 @@
 package frontend
 
 import (
+	"context"
 	"errors"
 	"net/http"
 	"testing"
@@ -32,6 +33,11 @@ func TestSLOHook(t *testing.T) {
 			name: "no slo fails : error",
 			err:  errors.New("foo"),
 		},
+		{
+			name:            "client disconnect (context canceled) passes",
+			err:             context.Canceled,
+			expectedWithSLO: 1.0,
+		},
 		{
 			name:            "no slo passes : resource exhausted grpc error",
 			err:             status.Error(codes.ResourceExhausted, "foo"),