Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Telemetry ved hjelp av otel-collector #374

Closed
sechmann opened this issue Feb 14, 2024 · 1 comment
Closed

Telemetry ved hjelp av otel-collector #374

sechmann opened this issue Feb 14, 2024 · 1 comment
Assignees
Labels

Comments

@sechmann
Copy link
Contributor

sechmann commented Feb 14, 2024

Beskrivelse / Essensen

Vi ønsker bedre kontroll på hvordan naisdevice oppfører seg på enhetene.

Investeringsvilje

2 uker

Ikke-mål

  • backend-intrumentering
  • logger (dette kan vi se på senere når go-otel client får støtte for det)

Løsningen i grove trekk

Vi tar i bruk open-telemetry-collector. Denne vil ta i mot metrics og traces. Vi gjør noen naive antakelser om at ingen vil dytte falske data til vår collector.

Opt-out mulighet i klienten for de som måtte ønske det

Sikkert lurt å la URL være en del av bootstrap (men med en hardkodet default), slik at den lar seg overstyre.

Nøkkelmetrikker:

  • alle komponenter:
    • uptime
    • version
  • naisdevice-helper
    • antall WireGuard config syncs
    • antall routes
  • naisdevice-systray
    • redraws (hvis mulig)
    • agentstatuses received
  • naisdevice-agent
    • tid brukt i hver state (i state machine) før man går til neste
    • antall configs mottatt fra apiserver
    • tid fra login til første gateway er connected
    • helsesjekker som har feilet (mot gateways)

Antar vi vil legge til flere metrikker når man først er inne og ser i koden.

Eventuell annen relevant informasjon

graph LR;
A[device-agent]  -- grpc --> L
B[device-systray] -- grpc --> L
C[device-helper] -- grpc --> L
L{Load Balancer} -- grpc --> D[otel-collector]
D --> P[Prometheus]
D --> T[Tempo]
Loading

superseeds #355

@sechmann sechmann changed the title Telemtry Telemetry ved hjelp av otel-collector Feb 15, 2024
Copy link

Nothing has happened here for a while (60 days), marking as stale. Add preserve label to avoid deletion

@github-actions github-actions bot added the stale No activity on this issue label Apr 16, 2024
@sechmann sechmann added preserve and removed stale No activity on this issue labels Apr 17, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants