pkg/parcacol: Group all profiles of a write request into one buffer #2202

brancz · 2022-11-30T18:36:21Z

$ benchstat old.txt new.txt
name                              old time/op    new time/op    delta
ProfileColumnStoreWriteSeries-10    2.74ms ± 4%    0.00ms ± 6%  -99.99%  (p=0.000 n=10+10)

name                              old alloc/op   new alloc/op   delta
ProfileColumnStoreWriteSeries-10    4.05MB ± 0%    0.00MB ± 0%  -99.99%  (p=0.000 n=10+10)

name                              old allocs/op  new allocs/op  delta
ProfileColumnStoreWriteSeries-10     32.3k ± 0%      0.0k ± 0%  -99.98%  (p=0.000 n=10+10)

metalmatze · 2022-11-30T18:45:07Z

pkg/profilestore/profilecolumnstore.go

+func sortedKeys(m map[string]struct{}) []string {
+	keys := make([]string, 0, len(m))
+	for k := range m {
+		keys = append(keys, k)
+	}
+	sort.Strings(keys)
+	return keys
+}


Suggested change

func sortedKeys(m map[string]struct{}) []string {

keys := make([]string, 0, len(m))

for k := range m {

keys = append(keys, k)

}

sort.Strings(keys)

return keys

}

func sortedKeys(in map[string]struct{}) []string {

if len(in) == 0 {

return []string{}

}

out := maps.Keys(in)

sort.Strings(out)

return out

}

Sadly the sort.Sort isn't generic yet, but when it's going to be, there will only be one of this ever.

metalmatze · 2022-11-30T18:47:07Z

YAY! 🎉 🚀
Soooo happy this has the same impact for Parca.

thorfour

LGTM

This benchmark was previously used to optimize label handling so it didn't need profiling data, but that's now changing.

metalmatze · 2022-12-01T10:52:11Z

pkg/parcacol/ingest.go

+	for _, s := range series {
+		for _, normalizedProfiles := range s.Samples {
+			for _, p := range normalizedProfiles {


So this is the biggest change I would still propose to this.
Given that we built this nested series>profiles>samples construct earlier on, but then use it here for just a bit of reusing labels, I'd propose to flatten this earlier already.
Basically, the Ingest takes in []normalizedSamples and we only have one loop to iterate over.

brancz requested a review from a team as a code owner November 30, 2022 18:36

vercel bot deployed to Preview – parca-ui November 30, 2022 18:38 View deployment

brancz changed the title ~~Single parquet buffer~~ pkg/parcacol: Group all profiles of a write request into one buffer Nov 30, 2022

metalmatze reviewed Nov 30, 2022

View reviewed changes

thorfour approved these changes Nov 30, 2022

View reviewed changes

brancz force-pushed the single-parquet-buffer branch from 7d4b971 to 0026fa3 Compare December 1, 2022 09:44

brancz requested a review from a team as a code owner December 1, 2022 09:44

vercel bot deployed to Preview – parca-ui December 1, 2022 09:47 View deployment

vercel bot deployed to Preview – parca-ui December 1, 2022 09:49 View deployment

brancz force-pushed the single-parquet-buffer branch from 2d6958b to 8f9d950 Compare December 1, 2022 10:00

vercel bot deployed to Preview – parca-ui December 1, 2022 10:03 View deployment

pkg/profilestore: Add profiling data to ingest benchmark

04d29cb

This benchmark was previously used to optimize label handling so it didn't need profiling data, but that's now changing.

brancz force-pushed the single-parquet-buffer branch from de7df55 to 1165bc6 Compare December 1, 2022 10:05

vercel bot deployed to Preview – parca-ui December 1, 2022 10:08 View deployment

pkg/parcacol: Group all profiles of a write request into one buffer

e09e165

brancz force-pushed the single-parquet-buffer branch from 1165bc6 to e09e165 Compare December 1, 2022 10:23

vercel bot deployed to Preview – parca-ui December 1, 2022 10:25 View deployment

brancz enabled auto-merge December 1, 2022 10:47

metalmatze reviewed Dec 1, 2022

View reviewed changes

brancz merged commit 9b7a8c9 into main Dec 1, 2022

metalmatze mentioned this pull request Dec 1, 2022

pkg/parcacol: NormalizeWriteRawRequest returns flat slice of samples #2205

Closed

metalmatze deleted the single-parquet-buffer branch December 1, 2022 13:01

brancz mentioned this pull request Dec 6, 2022

Parca server pod evicted on kubernetes #2182

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pkg/parcacol: Group all profiles of a write request into one buffer #2202

pkg/parcacol: Group all profiles of a write request into one buffer #2202

brancz commented Nov 30, 2022 •

edited

Loading

metalmatze Nov 30, 2022

metalmatze commented Nov 30, 2022

thorfour left a comment

metalmatze Dec 1, 2022

pkg/parcacol: Group all profiles of a write request into one buffer #2202

pkg/parcacol: Group all profiles of a write request into one buffer #2202

Conversation

brancz commented Nov 30, 2022 • edited Loading

metalmatze Nov 30, 2022

Choose a reason for hiding this comment

metalmatze commented Nov 30, 2022

thorfour left a comment

Choose a reason for hiding this comment

metalmatze Dec 1, 2022

Choose a reason for hiding this comment

brancz commented Nov 30, 2022 •

edited

Loading