LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level disjunctions #1018

zacharymorn · 2022-07-13T04:38:11Z

Description (or a Jira issue link if you have one)

Use BulkScorer to limit BMMScorer to only top-level disjunctions

~~Note: Tests update pending~~ Test updated

…junctions

zacharymorn · 2022-07-13T05:13:58Z

Benchmark results with wikinightly.tasks boolean queries below:

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
           BrowseMonthTaxoFacets       28.81     (37.2%)       26.45     (32.0%)   -8.2% ( -56% -   97%) 0.454
          OrHighMedDayTaxoFacets       17.65      (4.5%)       16.78      (5.3%)   -5.0% ( -14% -    5%) 0.001
     BrowseRandomLabelTaxoFacets       27.58     (50.2%)       26.72     (45.1%)   -3.1% ( -65% -  185%) 0.836
                  TermBGroup1M1P       37.75      (7.6%)       36.62      (6.5%)   -3.0% ( -15% -   11%) 0.179
                    TermGroup100       36.05      (5.4%)       35.18      (4.5%)   -2.4% ( -11% -    8%) 0.130
                          IntNRQ       90.71      (4.7%)       88.69      (7.2%)   -2.2% ( -13% -   10%) 0.248
                    TermBGroup1M       30.11      (5.3%)       29.64      (5.1%)   -1.6% ( -11% -    9%) 0.343
                  TermDateFacets       48.93      (4.5%)       48.28      (5.0%)   -1.3% ( -10% -    8%) 0.377
                    SloppyPhrase       13.21      (3.3%)       13.05      (3.5%)   -1.2% (  -7% -    5%) 0.256
                IntervalsOrdered      125.27      (7.0%)      123.79      (7.9%)   -1.2% ( -14% -   14%) 0.615
            MedTermDayTaxoFacets       78.33      (4.2%)       77.48      (4.5%)   -1.1% (  -9% -    8%) 0.429
               TermDayOfYearSort      254.99      (3.5%)      252.39      (2.9%)   -1.0% (  -7% -    5%) 0.312
         AndHighMedDayTaxoFacets      122.91      (2.6%)      121.74      (2.8%)   -1.0% (  -6% -    4%) 0.265
                        SpanNear        6.11      (5.6%)        6.05      (4.4%)   -0.9% ( -10% -    9%) 0.583
                      AndHighMed      144.28      (4.2%)      143.04      (4.9%)   -0.9% (  -9% -    8%) 0.556
                     AndHighHigh       43.39      (2.6%)       43.04      (4.0%)   -0.8% (  -7% -    5%) 0.449
                          Phrase       52.64      (4.4%)       52.26      (4.6%)   -0.7% (  -9% -    8%) 0.615
        AndHighHighDayTaxoFacets       11.91      (2.9%)       11.83      (3.6%)   -0.7% (  -6% -    6%) 0.527
                      TermDTSort      331.47      (3.4%)      329.38      (3.3%)   -0.6% (  -7% -    6%) 0.552
                 AndHighOrMedMed       90.33      (4.4%)       90.06      (4.8%)   -0.3% (  -9% -    9%) 0.841
                    TermGroup10K       42.46      (4.3%)       42.38      (4.3%)   -0.2% (  -8% -    8%) 0.886
           BrowseMonthSSDVFacets       29.10     (14.2%)       29.05      (9.5%)   -0.2% ( -20% -   27%) 0.965
                     TermGroup1M       40.35      (4.0%)       40.30      (4.3%)   -0.1% (  -8% -    8%) 0.932
                AndMedOrHighHigh       86.73      (3.5%)       86.76      (3.9%)    0.0% (  -7% -    7%) 0.978
                   TermMonthSort      273.18      (7.7%)      273.28      (8.4%)    0.0% ( -14% -   17%) 0.989
                          Fuzzy2       81.84      (2.8%)       81.91      (2.9%)    0.1% (  -5% -    5%) 0.918
                        PKLookup      321.81      (5.4%)      322.43      (5.8%)    0.2% ( -10% -   12%) 0.914
                   TermTitleSort      188.55      (8.0%)      188.92      (8.3%)    0.2% ( -14% -   17%) 0.939
                         Respell      111.20      (2.5%)      111.46      (3.7%)    0.2% (  -5% -    6%) 0.815
                          Fuzzy1       78.31      (2.9%)       78.64      (2.9%)    0.4% (  -5% -    6%) 0.648
     BrowseRandomLabelSSDVFacets       19.92      (8.2%)       20.03      (6.4%)    0.5% ( -13% -   16%) 0.821
                            Term     3440.49      (3.9%)     3461.12      (4.8%)    0.6% (  -7% -    9%) 0.664
       BrowseDayOfYearSSDVFacets       26.22     (12.5%)       26.47      (4.8%)    0.9% ( -14% -   20%) 0.751
            BrowseDateTaxoFacets       27.49     (32.2%)       27.82     (32.6%)    1.2% ( -48% -   97%) 0.905
       BrowseDayOfYearTaxoFacets       27.84     (31.8%)       28.20     (32.4%)    1.3% ( -47% -   96%) 0.900
            BrowseDateSSDVFacets        3.75     (27.0%)        3.80     (28.3%)    1.3% ( -42% -   77%) 0.879
                        Wildcard      113.02      (4.3%)      114.66      (5.3%)    1.5% (  -7% -   11%) 0.342
                         Prefix3       83.80      (7.4%)       85.97      (7.3%)    2.6% ( -11% -   18%) 0.266
                      OrHighHigh      113.87      (3.9%)      156.08      (8.9%)   37.1% (  23% -   51%) 0.000
                       OrHighMed       92.87      (5.1%)      210.48     (13.0%)  126.6% ( 103% -  152%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                   TermTitleSort      188.71      (5.6%)      183.28      (3.5%)   -2.9% ( -11% -    6%) 0.050
                   TermMonthSort      149.91      (5.6%)      145.60      (3.3%)   -2.9% ( -11% -    6%) 0.046
     BrowseRandomLabelTaxoFacets       32.23     (53.0%)       31.53     (44.8%)   -2.2% ( -65% -  203%) 0.889
                AndMedOrHighHigh       91.67      (4.8%)       89.95      (5.0%)   -1.9% ( -11% -    8%) 0.227
       BrowseDayOfYearSSDVFacets       26.61      (7.5%)       26.14      (6.2%)   -1.8% ( -14% -   12%) 0.407
                         Prefix3      401.75      (8.2%)      396.17      (9.1%)   -1.4% ( -17% -   17%) 0.612
                            Term     2461.88      (4.3%)     2428.89      (5.9%)   -1.3% ( -11% -    9%) 0.411
                      TermDTSort      336.78      (2.4%)      333.41      (6.1%)   -1.0% (  -9% -    7%) 0.495
                        Wildcard      226.55      (5.0%)      224.30      (5.9%)   -1.0% ( -11% -   10%) 0.568
                  TermDateFacets       40.50      (4.4%)       40.11      (5.5%)   -1.0% ( -10% -    9%) 0.544
            MedTermDayTaxoFacets       75.15      (4.0%)       74.47      (4.7%)   -0.9% (  -9% -    8%) 0.513
        AndHighHighDayTaxoFacets       53.04      (1.7%)       52.64      (2.8%)   -0.8% (  -5% -    3%) 0.297
                          Fuzzy1      129.74      (3.1%)      128.76      (3.0%)   -0.8% (  -6% -    5%) 0.431
                    TermBGroup1M       30.05      (3.5%)       29.84      (3.8%)   -0.7% (  -7% -    6%) 0.539
                         Respell      109.95      (3.5%)      109.19      (2.5%)   -0.7% (  -6% -    5%) 0.474
                    TermGroup100       51.02      (4.2%)       50.67      (4.8%)   -0.7% (  -9% -    8%) 0.636
                 AndHighOrMedMed      114.19      (5.7%)      113.43      (5.8%)   -0.7% ( -11% -   11%) 0.712
                     TermGroup1M       40.46      (2.1%)       40.22      (2.6%)   -0.6% (  -5% -    4%) 0.431
                          Fuzzy2      139.53      (2.7%)      138.72      (2.9%)   -0.6% (  -6% -    5%) 0.507
         AndHighMedDayTaxoFacets      195.10      (3.7%)      194.06      (4.2%)   -0.5% (  -8% -    7%) 0.668
                          Phrase       51.67      (5.2%)       51.42      (6.6%)   -0.5% ( -11% -   11%) 0.796
                      AndHighMed      118.69      (4.6%)      118.24      (4.5%)   -0.4% (  -9% -    9%) 0.794
               TermDayOfYearSort      178.99      (2.3%)      178.42      (5.4%)   -0.3% (  -7% -    7%) 0.808
                    TermGroup10K       31.90      (2.7%)       31.80      (3.4%)   -0.3% (  -6% -    5%) 0.747
           BrowseMonthSSDVFacets       29.03      (9.8%)       28.97      (9.3%)   -0.2% ( -17% -   20%) 0.947
                          IntNRQ      106.66      (1.6%)      106.57      (2.0%)   -0.1% (  -3% -    3%) 0.883
                     AndHighHigh       99.10      (3.8%)       99.03      (3.6%)   -0.1% (  -7% -    7%) 0.946
          OrHighMedDayTaxoFacets       25.38      (5.6%)       25.37      (5.6%)   -0.0% ( -10% -   11%) 1.000
                  TermBGroup1M1P       43.68      (4.7%)       43.68      (5.6%)    0.0% (  -9% -   10%) 0.995
                        SpanNear        6.04      (4.7%)        6.09      (5.3%)    0.8% (  -8% -   11%) 0.632
                    SloppyPhrase       13.22      (5.0%)       13.34      (4.4%)    0.9% (  -8% -   10%) 0.549
     BrowseRandomLabelSSDVFacets       19.85      (6.9%)       20.05      (7.3%)    1.0% ( -12% -   16%) 0.651
                        PKLookup      311.58      (6.5%)      315.09      (4.1%)    1.1% (  -8% -   12%) 0.511
                IntervalsOrdered       12.87      (3.5%)       13.05      (3.0%)    1.4% (  -4% -    8%) 0.169
       BrowseDayOfYearTaxoFacets       30.81     (33.5%)       31.50     (31.9%)    2.2% ( -47% -  101%) 0.828
           BrowseMonthTaxoFacets       31.11     (34.6%)       31.83     (34.7%)    2.3% ( -49% -  109%) 0.834
            BrowseDateTaxoFacets       30.37     (34.0%)       31.08     (32.2%)    2.3% ( -47% -  103%) 0.823
            BrowseDateSSDVFacets        3.59     (26.2%)        3.74     (32.9%)    4.2% ( -43% -   85%) 0.654
                      OrHighHigh       22.23      (5.0%)       28.36      (5.9%)   27.6% (  15% -   40%) 0.000
                       OrHighMed       90.16      (5.0%)      206.19     (10.2%)  128.7% ( 108% -  151%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                            Term     3286.93      (4.1%)     3169.95      (4.3%)   -3.6% ( -11% -    5%) 0.007
          OrHighMedDayTaxoFacets       25.73      (5.6%)       25.06      (5.3%)   -2.6% ( -12% -    8%) 0.135
               TermDayOfYearSort      207.37      (9.4%)      202.08      (3.9%)   -2.6% ( -14% -   11%) 0.264
                        Wildcard      162.54      (5.7%)      158.47      (7.6%)   -2.5% ( -14% -   11%) 0.241
                   TermTitleSort      151.92      (9.3%)      148.49      (8.6%)   -2.3% ( -18% -   17%) 0.427
     BrowseRandomLabelSSDVFacets       19.14      (8.3%)       18.73      (8.8%)   -2.1% ( -17% -   16%) 0.429
                   TermMonthSort      222.69      (8.9%)      218.26      (8.6%)   -2.0% ( -17% -   16%) 0.471
                AndMedOrHighHigh       88.57      (4.1%)       86.92      (3.3%)   -1.9% (  -8% -    5%) 0.114
                  TermDateFacets       48.42      (4.3%)       47.70      (5.2%)   -1.5% ( -10% -    8%) 0.317
                      AndHighMed      153.98      (4.4%)      151.71      (4.7%)   -1.5% ( -10% -    7%) 0.304
                         Prefix3      451.17      (5.0%)      444.73      (8.8%)   -1.4% ( -14% -   13%) 0.530
            MedTermDayTaxoFacets       75.95      (3.7%)       75.00      (4.6%)   -1.2% (  -9% -    7%) 0.344
                 AndHighOrMedMed      118.33      (4.0%)      116.89      (4.2%)   -1.2% (  -9% -    7%) 0.351
        AndHighHighDayTaxoFacets       17.00      (3.7%)       16.82      (3.8%)   -1.1% (  -8% -    6%) 0.372
                  TermBGroup1M1P       44.63      (7.0%)       44.21      (7.2%)   -0.9% ( -14% -   14%) 0.675
                    TermGroup100       28.21      (3.7%)       27.95      (3.5%)   -0.9% (  -7% -    6%) 0.422
                IntervalsOrdered       22.52      (4.3%)       22.32      (3.5%)   -0.9% (  -8% -    7%) 0.468
                          Phrase       37.73      (2.3%)       37.39      (2.6%)   -0.9% (  -5% -    4%) 0.252
                         Respell      113.41      (3.3%)      112.53      (3.7%)   -0.8% (  -7% -    6%) 0.486
                        PKLookup      306.72      (5.0%)      304.50      (4.5%)   -0.7% (  -9% -    9%) 0.629
                    TermBGroup1M       46.71      (4.5%)       46.40      (4.0%)   -0.7% (  -8% -    8%) 0.617
                     AndHighHigh       96.96      (3.0%)       96.41      (2.8%)   -0.6% (  -6% -    5%) 0.538
                          Fuzzy1      129.09      (3.4%)      128.39      (3.4%)   -0.5% (  -7% -    6%) 0.620
           BrowseMonthTaxoFacets       26.85     (35.1%)       26.73     (34.7%)   -0.5% ( -51% -  106%) 0.965
           BrowseMonthSSDVFacets       29.39     (15.2%)       29.27     (14.9%)   -0.4% ( -26% -   34%) 0.930
                     TermGroup1M       38.86      (3.8%)       38.74      (3.6%)   -0.3% (  -7% -    7%) 0.783
                    TermGroup10K       23.10      (3.5%)       23.09      (3.7%)   -0.0% (  -6% -    7%) 0.987
                          Fuzzy2      117.98      (3.7%)      117.96      (4.1%)   -0.0% (  -7% -    8%) 0.992
         AndHighMedDayTaxoFacets       38.61      (3.1%)       38.63      (2.8%)    0.1% (  -5% -    6%) 0.943
       BrowseDayOfYearSSDVFacets       26.80     (11.7%)       26.82     (12.1%)    0.1% ( -21% -   27%) 0.985
                    SloppyPhrase        3.06      (4.8%)        3.06      (4.8%)    0.2% (  -8% -   10%) 0.886
                        SpanNear       15.79      (4.1%)       15.93      (3.8%)    0.9% (  -6% -    9%) 0.476
                          IntNRQ      117.55      (9.6%)      119.71      (7.2%)    1.8% ( -13% -   20%) 0.492
                      TermDTSort      251.34      (8.0%)      258.83      (9.4%)    3.0% ( -13% -   22%) 0.281
            BrowseDateSSDVFacets        4.15     (26.0%)        4.34     (25.9%)    4.6% ( -37% -   76%) 0.575
       BrowseDayOfYearTaxoFacets       26.03     (25.6%)       27.32     (32.1%)    5.0% ( -41% -   84%) 0.589
            BrowseDateTaxoFacets       25.45     (25.8%)       26.82     (32.8%)    5.4% ( -42% -   86%) 0.563
     BrowseRandomLabelTaxoFacets       23.16     (39.1%)       24.71     (47.4%)    6.7% ( -57% -  152%) 0.624
                      OrHighHigh      110.60      (3.9%)      147.71      (8.9%)   33.6% (  20% -   48%) 0.000
                       OrHighMed       87.22      (4.2%)      190.07      (8.4%)  117.9% ( 101% -  136%) 0.000

jpountz · 2022-07-15T14:34:22Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+        optionalScorers.add(ss.get(Long.MAX_VALUE));
+      }
+
+      return new BulkScorer() {


I wonder if we could reuse DefaultBulkScorer instead of this anonymous bulk scorer?

Thanks for the suggestion! I gave that a try and it did work, but it would reduce the performance boost for OrHighMed from around 110+% to 70+%, most likely due to the extra logic inside DefaultBulkScorer. I guess my preference would be to use the anonymous bulk scorer to maintain the performance advantage, but I'm also good with using DefaultBulkScorer if reducing potentially duplicated code and keeping things consistent are preferred?

TaskQPS baseline StdDevQPS my_modified_version StdDev Pct diff p-value TermBGroup1M1P 55.89 (7.1%) 54.01 (6.1%) -3.4% ( -15% - 10%) 0.108 TermDateFacets 34.46 (5.8%) 33.58 (5.0%) -2.5% ( -12% - 8%) 0.138 AndHighOrMedMed 90.90 (5.6%) 88.59 (4.6%) -2.5% ( -12% - 8%) 0.115 BrowseDayOfYearSSDVFacets 28.63 (12.5%) 28.01 (14.5%) -2.2% ( -25% - 28%) 0.612 MedTermDayTaxoFacets 79.74 (5.1%) 78.04 (4.3%) -2.1% ( -10% - 7%) 0.150 TermGroup100 36.28 (3.5%) 35.54 (3.1%) -2.1% ( -8% - 4%) 0.050 TermBGroup1M 30.37 (3.7%) 29.87 (3.8%) -1.6% ( -8% - 6%) 0.165 TermGroup10K 41.33 (3.2%) 40.66 (3.3%) -1.6% ( -7% - 5%) 0.117 PKLookup 330.84 (5.1%) 326.20 (4.3%) -1.4% ( -10% - 8%) 0.349 SloppyPhrase 13.56 (2.8%) 13.39 (2.5%) -1.2% ( -6% - 4%) 0.139 TermGroup1M 39.76 (3.2%) 39.32 (3.2%) -1.1% ( -7% - 5%) 0.272 AndMedOrHighHigh 88.13 (5.5%) 87.22 (4.4%) -1.0% ( -10% - 9%) 0.511 BrowseDateSSDVFacets 4.17 (29.0%) 4.13 (29.0%) -0.8% ( -45% - 80%) 0.933 SpanNear 169.70 (2.6%) 168.59 (2.0%) -0.7% ( -5% - 4%) 0.369 Fuzzy2 83.59 (2.4%) 83.12 (2.2%) -0.6% ( -5% - 4%) 0.442 Respell 96.22 (3.1%) 95.85 (2.6%) -0.4% ( -5% - 5%) 0.672 IntervalsOrdered 23.02 (4.3%) 22.94 (4.2%) -0.3% ( -8% - 8%) 0.799 Wildcard 231.51 (4.5%) 230.74 (5.0%) -0.3% ( -9% - 9%) 0.827 AndHighMed 143.73 (5.8%) 143.48 (4.0%) -0.2% ( -9% - 10%) 0.914 AndHighHighDayTaxoFacets 54.80 (1.3%) 54.71 (1.5%) -0.2% ( -2% - 2%) 0.717 Fuzzy1 154.41 (2.8%) 154.44 (1.9%) 0.0% ( -4% - 4%) 0.981 BrowseMonthSSDVFacets 28.06 (10.4%) 28.06 (13.3%) 0.0% ( -21% - 26%) 0.995 OrHighMedDayTaxoFacets 7.38 (5.7%) 7.39 (5.4%) 0.0% ( -10% - 11%) 0.981 AndHighMedDayTaxoFacets 134.39 (2.0%) 134.59 (1.9%) 0.2% ( -3% - 4%) 0.809 Phrase 38.80 (1.8%) 38.86 (2.5%) 0.2% ( -4% - 4%) 0.823 TermMonthSort 357.58 (5.2%) 359.31 (6.7%) 0.5% ( -10% - 13%) 0.801 TermTitleSort 274.32 (5.1%) 275.77 (6.8%) 0.5% ( -10% - 13%) 0.781 TermDayOfYearSort 259.44 (2.5%) 261.32 (5.9%) 0.7% ( -7% - 9%) 0.615 TermDTSort 208.81 (2.6%) 210.65 (5.8%) 0.9% ( -7% - 9%) 0.532 Term 2535.91 (3.4%) 2562.20 (3.1%) 1.0% ( -5% - 7%) 0.317 AndHighHigh 32.15 (3.3%) 32.55 (3.1%) 1.2% ( -5% - 7%) 0.231 BrowseMonthTaxoFacets 32.02 (34.2%) 32.57 (35.8%) 1.7% ( -50% - 109%) 0.876 Prefix3 404.00 (9.7%) 411.80 (8.5%) 1.9% ( -14% - 22%) 0.505 IntNRQ 86.95 (9.5%) 88.74 (8.7%) 2.1% ( -14% - 22%) 0.475 BrowseRandomLabelSSDVFacets 19.82 (7.6%) 20.34 (9.2%) 2.7% ( -13% - 21%) 0.318 BrowseDayOfYearTaxoFacets 28.80 (33.0%) 31.25 (33.8%) 8.5% ( -43% - 112%) 0.420 BrowseDateTaxoFacets 28.68 (33.1%) 31.15 (33.9%) 8.6% ( -43% - 113%) 0.415 BrowseRandomLabelTaxoFacets 28.81 (45.1%) 31.60 (47.4%) 9.7% ( -57% - 186%) 0.508 OrHighHigh 23.12 (3.5%) 29.67 (6.8%) 28.3% ( 17% - 39%) 0.000 OrHighMed 103.75 (3.7%) 180.03 (11.5%) 73.5% ( 56% - 92%) 0.000

TaskQPS baseline StdDevQPS my_modified_version StdDev Pct diff p-value BrowseDateSSDVFacets 4.27 (27.4%) 3.92 (26.3%) -8.2% ( -48% - 62%) 0.333 BrowseRandomLabelTaxoFacets 32.05 (49.5%) 30.51 (47.1%) -4.8% ( -67% - 181%) 0.753 BrowseDateTaxoFacets 30.22 (32.6%) 29.15 (32.4%) -3.6% ( -51% - 91%) 0.730 BrowseDayOfYearTaxoFacets 30.27 (32.4%) 29.24 (32.4%) -3.4% ( -51% - 90%) 0.738 TermDateFacets 34.74 (4.2%) 33.81 (5.9%) -2.7% ( -12% - 7%) 0.101 Prefix3 475.23 (5.7%) 462.80 (5.7%) -2.6% ( -13% - 9%) 0.146 TermBGroup1M1P 55.99 (7.5%) 54.91 (8.1%) -1.9% ( -16% - 14%) 0.434 MedTermDayTaxoFacets 77.78 (3.6%) 76.33 (4.7%) -1.9% ( -9% - 6%) 0.160 BrowseMonthTaxoFacets 30.33 (37.8%) 29.78 (35.6%) -1.8% ( -54% - 115%) 0.877 PKLookup 332.94 (5.3%) 327.77 (5.3%) -1.6% ( -11% - 9%) 0.351 BrowseRandomLabelSSDVFacets 21.30 (9.6%) 21.01 (8.8%) -1.3% ( -18% - 18%) 0.648 AndHighMedDayTaxoFacets 140.47 (1.7%) 138.62 (4.1%) -1.3% ( -6% - 4%) 0.186 IntervalsOrdered 130.34 (5.8%) 128.98 (6.8%) -1.0% ( -12% - 12%) 0.602 SloppyPhrase 97.23 (7.7%) 96.30 (6.1%) -1.0% ( -13% - 13%) 0.667 AndMedOrHighHigh 35.81 (4.0%) 35.48 (3.3%) -0.9% ( -7% - 6%) 0.431 TermGroup100 36.34 (4.1%) 36.02 (3.9%) -0.9% ( -8% - 7%) 0.481 AndHighOrMedMed 92.43 (6.3%) 91.64 (5.2%) -0.9% ( -11% - 11%) 0.635 AndHighMed 151.18 (5.3%) 150.06 (5.0%) -0.7% ( -10% - 10%) 0.651 AndHighHighDayTaxoFacets 13.90 (2.1%) 13.82 (3.0%) -0.6% ( -5% - 4%) 0.461 Phrase 53.96 (4.9%) 53.66 (4.6%) -0.5% ( -9% - 9%) 0.716 Wildcard 382.71 (4.6%) 380.67 (4.5%) -0.5% ( -9% - 8%) 0.710 TermDTSort 142.16 (3.3%) 141.51 (3.2%) -0.5% ( -6% - 6%) 0.659 Term 3700.77 (3.7%) 3686.00 (3.5%) -0.4% ( -7% - 7%) 0.726 TermBGroup1M 36.19 (4.7%) 36.07 (3.5%) -0.3% ( -8% - 8%) 0.808 TermTitleSort 191.76 (6.3%) 191.17 (7.4%) -0.3% ( -13% - 14%) 0.888 TermDayOfYearSort 211.60 (3.5%) 210.97 (4.6%) -0.3% ( -8% - 8%) 0.819 TermMonthSort 224.12 (6.1%) 223.53 (7.6%) -0.3% ( -13% - 14%) 0.902 TermGroup1M 23.75 (3.9%) 23.72 (3.0%) -0.1% ( -6% - 7%) 0.924 OrHighMedDayTaxoFacets 15.65 (5.1%) 15.64 (5.3%) -0.0% ( -9% - 10%) 0.985 IntNRQ 110.02 (0.4%) 109.99 (0.4%) -0.0% ( 0% - 0%) 0.823 Fuzzy1 164.30 (1.3%) 164.42 (2.0%) 0.1% ( -3% - 3%) 0.889 Fuzzy2 83.64 (1.4%) 83.85 (2.0%) 0.2% ( -3% - 3%) 0.649 AndHighHigh 44.91 (3.5%) 45.09 (3.7%) 0.4% ( -6% - 7%) 0.724 Respell 117.19 (2.2%) 117.69 (2.7%) 0.4% ( -4% - 5%) 0.585 SpanNear 28.79 (2.9%) 29.02 (3.4%) 0.8% ( -5% - 7%) 0.426 TermGroup10K 43.33 (3.8%) 43.73 (2.4%) 0.9% ( -5% - 7%) 0.357 BrowseDayOfYearSSDVFacets 26.67 (12.7%) 26.94 (8.8%) 1.0% ( -18% - 25%) 0.767 BrowseMonthSSDVFacets 27.30 (8.6%) 28.47 (10.1%) 4.3% ( -13% - 25%) 0.149 OrHighHigh 25.20 (4.7%) 39.24 (4.8%) 55.7% ( 44% - 68%) 0.000 OrHighMed 103.99 (5.1%) 184.11 (5.5%) 77.0% ( 63% - 92%) 0.000

TaskQPS baseline StdDevQPS my_modified_version StdDev Pct diff p-value BrowseMonthSSDVFacets 29.26 (10.2%) 28.24 (5.9%) -3.5% ( -17% - 13%) 0.185 BrowseRandomLabelSSDVFacets 20.62 (6.1%) 20.36 (7.4%) -1.2% ( -13% - 13%) 0.565 Prefix3 475.09 (6.1%) 470.79 (6.7%) -0.9% ( -12% - 12%) 0.655 IntervalsOrdered 13.21 (3.1%) 13.12 (2.9%) -0.7% ( -6% - 5%) 0.461 TermDateFacets 48.80 (6.2%) 48.56 (6.2%) -0.5% ( -12% - 12%) 0.800 PKLookup 329.55 (4.9%) 328.09 (3.9%) -0.4% ( -8% - 8%) 0.750 AndHighOrMedMed 117.25 (3.9%) 116.74 (4.9%) -0.4% ( -8% - 8%) 0.759 MedTermDayTaxoFacets 78.41 (5.5%) 78.16 (5.5%) -0.3% ( -10% - 11%) 0.855 Phrase 232.22 (2.8%) 231.49 (2.3%) -0.3% ( -5% - 4%) 0.694 TermTitleSort 224.25 (6.4%) 223.78 (6.3%) -0.2% ( -12% - 13%) 0.916 TermBGroup1M 39.69 (3.2%) 39.60 (3.9%) -0.2% ( -6% - 7%) 0.852 TermMonthSort 277.13 (6.3%) 276.61 (6.4%) -0.2% ( -12% - 13%) 0.925 TermDayOfYearSort 259.60 (3.2%) 259.15 (3.6%) -0.2% ( -6% - 6%) 0.872 AndHighMed 185.96 (3.9%) 185.74 (5.3%) -0.1% ( -8% - 9%) 0.936 TermGroup100 51.51 (3.3%) 51.52 (3.8%) 0.0% ( -6% - 7%) 0.976 TermGroup1M 39.83 (2.7%) 39.85 (3.4%) 0.1% ( -5% - 6%) 0.957 TermGroup10K 41.38 (2.9%) 41.40 (3.1%) 0.1% ( -5% - 6%) 0.950 Wildcard 238.58 (4.1%) 238.92 (3.4%) 0.1% ( -7% - 7%) 0.904 SloppyPhrase 4.75 (4.1%) 4.76 (3.0%) 0.2% ( -6% - 7%) 0.834 IntNRQ 265.85 (1.0%) 266.60 (0.7%) 0.3% ( -1% - 1%) 0.298 AndHighHighDayTaxoFacets 54.33 (1.6%) 54.49 (1.5%) 0.3% ( -2% - 3%) 0.554 TermBGroup1M1P 62.07 (4.4%) 62.41 (5.6%) 0.5% ( -9% - 11%) 0.735 AndHighMedDayTaxoFacets 202.86 (2.6%) 204.19 (2.6%) 0.7% ( -4% - 6%) 0.434 Respell 111.78 (3.4%) 112.52 (3.1%) 0.7% ( -5% - 7%) 0.519 Fuzzy1 155.04 (3.6%) 156.09 (3.4%) 0.7% ( -6% - 7%) 0.541 SpanNear 13.68 (1.7%) 13.77 (1.3%) 0.7% ( -2% - 3%) 0.142 Fuzzy2 144.74 (2.9%) 145.81 (2.8%) 0.7% ( -4% - 6%) 0.419 TermDTSort 214.37 (7.3%) 216.04 (8.8%) 0.8% ( -14% - 18%) 0.761 AndMedOrHighHigh 35.72 (3.2%) 36.03 (3.8%) 0.9% ( -5% - 8%) 0.441 AndHighHigh 44.40 (2.8%) 44.83 (4.7%) 1.0% ( -6% - 8%) 0.429 OrHighMedDayTaxoFacets 4.34 (5.5%) 4.38 (7.7%) 1.1% ( -11% - 15%) 0.621 BrowseRandomLabelTaxoFacets 29.93 (46.8%) 30.38 (47.5%) 1.5% ( -63% - 179%) 0.921 BrowseDateSSDVFacets 3.98 (33.0%) 4.04 (32.0%) 1.6% ( -47% - 99%) 0.879 Term 2674.87 (3.8%) 2721.55 (4.1%) 1.7% ( -5% - 10%) 0.164 BrowseDayOfYearTaxoFacets 29.20 (31.2%) 29.75 (33.2%) 1.9% ( -47% - 96%) 0.853 BrowseDateTaxoFacets 29.07 (31.3%) 29.63 (33.1%) 1.9% ( -47% - 96%) 0.851 BrowseDayOfYearSSDVFacets 26.74 (9.6%) 27.76 (9.4%) 3.8% ( -13% - 25%) 0.205 BrowseMonthTaxoFacets 30.73 (33.3%) 32.84 (35.6%) 6.9% ( -46% - 113%) 0.528 OrHighHigh 117.70 (4.1%) 161.58 (10.4%) 37.3% ( 21% - 54%) 0.000 OrHighMed 105.09 (4.3%) 186.95 (10.2%) 77.9% ( 60% - 96%) 0.000

It shouldn't be slower than the current code in main since main is using DefaultBulkScorer, is it?

OK to keep it.

It shouldn't be slower than the current code in main since main is using DefaultBulkScorer, is it?

The baseline of all of the above benchmark results are still using the head prior to all BMM changes. Since this approach (anonymous bulk scorer + BMM scorer) still has similar performance boost with the previous one (just BMM scorer) for top-level disjunctions, but no impact to nested boolean queries, I would think so? I'm not sure I'm fully understanding this question though.

jpountz

Thanks for explaining the motivation for the dedicated bulk scorer, I left some suggestions.

jpountz · 2022-07-16T12:31:23Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+        @Override
+        public int score(LeafCollector collector, Bits acceptDocs, int min, int max)
+            throws IOException {
+          max = Math.min(max, maxDoc);


I don't think we need this, do tests fail without it?

Yup this is indeed optional and tests didn't fail without it. I've removed it.

jpountz · 2022-07-16T12:31:31Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+              return DocIdSetIterator.NO_MORE_DOCS;
+            } else if (advancedDoc >= max) {
+              return max;
+            }


I think the entire above if statement could become:

if (advanceDoc >= max) { return advanceDoc; }

since max is guaranteed to be less than maxDoc.

jpountz · 2022-07-16T12:31:44Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+        optionalScorers.add(ss.get(Long.MAX_VALUE));
+      }
+
+      return new BulkScorer() {


OK to keep it.

jpountz · 2022-07-16T12:35:06Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+            doc = advancedDoc + 1;
+          }
+
+          return max == maxDoc ? DocIdSetIterator.NO_MORE_DOCS : max;


Maybe we could remove the end condition from the for loop, so that we would hit the if (advanceDoc >= max) condition instead, and remove the above line?

zacharymorn · 2022-07-17T03:59:00Z

Thanks for explaining the motivation for the dedicated bulk scorer, I left some suggestions.

No problem and thanks for the suggestions! I have incorporated them and like how clean the bulk scorer looks now!

zacharymorn · 2022-07-17T04:58:07Z

Here are the latest wikinightly benchmark results:

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
            BrowseDateSSDVFacets        3.98     (34.1%)        3.73     (29.8%)   -6.2% ( -52% -   87%) 0.541
          OrHighMedDayTaxoFacets       24.64      (5.9%)       23.96      (9.5%)   -2.7% ( -17% -   13%) 0.271
                      TermDTSort      342.77      (7.8%)      336.36      (4.7%)   -1.9% ( -13% -   11%) 0.359
     BrowseRandomLabelSSDVFacets       20.43      (9.3%)       20.06      (9.4%)   -1.8% ( -18% -   18%) 0.539
                  TermBGroup1M1P       37.19      (7.0%)       36.72      (5.2%)   -1.3% ( -12% -   11%) 0.521
        AndHighHighDayTaxoFacets       12.29      (3.1%)       12.13      (2.9%)   -1.3% (  -7% -    4%) 0.191
            MedTermDayTaxoFacets       75.53      (5.2%)       75.06      (5.3%)   -0.6% ( -10% -   10%) 0.706
                   TermMonthSort      351.78      (6.0%)      349.61      (2.6%)   -0.6% (  -8% -    8%) 0.675
                          Fuzzy1       79.12      (2.5%)       78.71      (2.4%)   -0.5% (  -5% -    4%) 0.509
                IntervalsOrdered       13.21      (3.1%)       13.14      (3.4%)   -0.5% (  -6% -    6%) 0.625
                  TermDateFacets       72.10      (5.6%)       71.78      (5.5%)   -0.4% ( -10% -   11%) 0.797
                   TermTitleSort      350.94      (6.0%)      349.80      (2.8%)   -0.3% (  -8% -    8%) 0.826
                        PKLookup      322.25      (5.8%)      321.46      (4.3%)   -0.2% (  -9% -   10%) 0.879
                        SpanNear      166.41      (3.5%)      166.06      (2.1%)   -0.2% (  -5% -    5%) 0.821
                    SloppyPhrase        4.74      (4.4%)        4.75      (3.7%)    0.1% (  -7% -    8%) 0.942
                            Term     3394.26      (5.0%)     3398.22      (5.5%)    0.1% (  -9% -   11%) 0.944
                AndMedOrHighHigh       70.98      (5.5%)       71.07      (5.5%)    0.1% ( -10% -   11%) 0.945
         AndHighMedDayTaxoFacets      121.81      (2.5%)      122.12      (2.3%)    0.3% (  -4% -    5%) 0.737
                          Phrase       38.19      (2.5%)       38.29      (2.2%)    0.3% (  -4% -    5%) 0.724
                 AndHighOrMedMed      120.53      (5.4%)      120.92      (5.4%)    0.3% (  -9% -   11%) 0.849
                         Respell       91.05      (2.9%)       91.55      (2.5%)    0.5% (  -4% -    6%) 0.522
                          Fuzzy2      120.74      (2.5%)      121.46      (2.5%)    0.6% (  -4% -    5%) 0.453
                     AndHighHigh       99.32      (3.3%)      100.24      (3.7%)    0.9% (  -5% -    8%) 0.403
                          IntNRQ     1188.88      (3.2%)     1200.31      (3.4%)    1.0% (  -5% -    7%) 0.361
                        Wildcard      163.38      (7.0%)      165.12      (4.5%)    1.1% (  -9% -   13%) 0.566
                      AndHighMed      156.13      (5.2%)      158.09      (5.1%)    1.3% (  -8% -   12%) 0.439
               TermDayOfYearSort      140.35      (3.1%)      142.36      (4.7%)    1.4% (  -6% -    9%) 0.255
       BrowseDayOfYearSSDVFacets       26.19     (12.8%)       26.60     (11.7%)    1.6% ( -20% -   29%) 0.686
                    TermGroup100       65.78      (2.5%)       66.85      (3.7%)    1.6% (  -4% -    8%) 0.109
           BrowseMonthTaxoFacets       28.68     (34.4%)       29.16     (37.1%)    1.7% ( -52% -  111%) 0.883
                         Prefix3       85.54      (6.6%)       87.24      (5.6%)    2.0% (  -9% -   15%) 0.301
       BrowseDayOfYearTaxoFacets       28.90     (30.4%)       29.64     (33.9%)    2.6% ( -47% -   96%) 0.800
                    TermGroup10K       40.11      (3.8%)       41.31      (4.0%)    3.0% (  -4% -   11%) 0.017
                     TermGroup1M       38.63      (3.8%)       39.82      (3.7%)    3.1% (  -4% -   10%) 0.009
                    TermBGroup1M       46.33      (3.8%)       47.77      (4.5%)    3.1% (  -5% -   11%) 0.019
            BrowseDateTaxoFacets       28.50     (30.4%)       29.46     (34.6%)    3.4% ( -47% -   98%) 0.745
           BrowseMonthSSDVFacets       28.27     (14.7%)       29.70     (15.4%)    5.0% ( -21% -   41%) 0.292
     BrowseRandomLabelTaxoFacets       28.78     (50.1%)       30.70     (52.7%)    6.7% ( -64% -  219%) 0.680
                      OrHighHigh       25.55      (5.9%)       37.99      (6.8%)   48.7% (  34% -   65%) 0.000
                       OrHighMed       92.43      (6.4%)      210.19     (11.3%)  127.4% ( 103% -  155%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       31.88     (50.1%)       28.62     (41.9%)  -10.3% ( -68% -  163%) 0.482
       BrowseDayOfYearTaxoFacets       30.09     (32.8%)       28.05     (29.6%)   -6.8% ( -52% -   82%) 0.492
            BrowseDateTaxoFacets       29.97     (32.8%)       27.96     (29.6%)   -6.7% ( -52% -   82%) 0.498
           BrowseMonthSSDVFacets       29.02     (11.0%)       28.18     (11.9%)   -2.9% ( -23% -   22%) 0.425
                AndMedOrHighHigh       74.76      (5.4%)       73.11      (4.4%)   -2.2% ( -11% -    8%) 0.157
                      AndHighMed      126.28      (3.9%)      124.07      (3.4%)   -1.8% (  -8% -    5%) 0.131
                        PKLookup      335.29      (4.1%)      329.55      (4.7%)   -1.7% ( -10% -    7%) 0.220
                 AndHighOrMedMed       75.76      (5.5%)       74.49      (4.6%)   -1.7% ( -11% -    8%) 0.295
                     AndHighHigh       45.63      (4.0%)       45.00      (3.1%)   -1.4% (  -8% -    5%) 0.217
                         Respell       92.03      (3.5%)       90.91      (3.0%)   -1.2% (  -7% -    5%) 0.232
                  TermDateFacets       74.23      (4.1%)       73.56      (5.0%)   -0.9% (  -9% -    8%) 0.533
            MedTermDayTaxoFacets       77.51      (4.0%)       76.87      (4.7%)   -0.8% (  -9% -    8%) 0.555
                          Fuzzy2       83.30      (2.2%)       82.66      (1.7%)   -0.8% (  -4% -    3%) 0.213
                            Term     2672.66      (5.2%)     2652.80      (5.4%)   -0.7% ( -10% -   10%) 0.658
                          Fuzzy1      143.05      (2.9%)      142.09      (2.2%)   -0.7% (  -5% -    4%) 0.413
               TermDayOfYearSort      211.44      (5.9%)      210.04      (5.5%)   -0.7% ( -11% -   11%) 0.716
       BrowseDayOfYearSSDVFacets       26.79     (12.0%)       26.62     (12.5%)   -0.6% ( -22% -   27%) 0.873
                      TermDTSort      210.96      (6.8%)      209.84      (4.3%)   -0.5% ( -10% -   11%) 0.768
                          IntNRQ     1210.91      (2.1%)     1207.39      (2.2%)   -0.3% (  -4% -    4%) 0.666
        AndHighHighDayTaxoFacets       13.87      (2.6%)       13.84      (2.9%)   -0.2% (  -5% -    5%) 0.792
                        Wildcard      379.64      (6.2%)      378.85      (5.2%)   -0.2% ( -10% -   11%) 0.908
         AndHighMedDayTaxoFacets      138.54      (2.7%)      138.34      (2.2%)   -0.1% (  -4% -    4%) 0.854
     BrowseRandomLabelSSDVFacets       20.50      (7.4%)       20.48      (9.4%)   -0.1% ( -15% -   18%) 0.971
                    TermGroup100       41.71      (3.3%)       41.73      (4.0%)    0.0% (  -7% -    7%) 0.975
                     TermGroup1M       30.78      (3.0%)       30.80      (3.8%)    0.1% (  -6% -    7%) 0.953
                          Phrase       39.17      (2.9%)       39.20      (1.9%)    0.1% (  -4% -    4%) 0.929
                IntervalsOrdered       13.06      (3.3%)       13.08      (3.3%)    0.1% (  -6% -    6%) 0.915
                  TermBGroup1M1P       55.47      (7.1%)       55.55      (6.9%)    0.1% ( -12% -   15%) 0.950
                        SpanNear       16.33      (3.6%)       16.36      (3.3%)    0.2% (  -6% -    7%) 0.843
                    TermBGroup1M       35.79      (3.4%)       35.88      (4.6%)    0.3% (  -7% -    8%) 0.835
                    SloppyPhrase        3.07      (5.8%)        3.09      (4.8%)    0.7% (  -9% -   12%) 0.695
                    TermGroup10K       32.35      (3.1%)       32.57      (3.6%)    0.7% (  -5% -    7%) 0.515
          OrHighMedDayTaxoFacets       16.45      (7.0%)       16.57      (9.1%)    0.7% ( -14% -   17%) 0.785
                         Prefix3       86.68      (8.1%)       87.62      (5.9%)    1.1% ( -11% -   16%) 0.628
                   TermTitleSort      350.23      (3.8%)      354.44      (4.4%)    1.2% (  -6% -    9%) 0.356
                   TermMonthSort      146.79      (3.6%)      149.01      (4.5%)    1.5% (  -6% -    9%) 0.238
           BrowseMonthTaxoFacets       28.91     (34.8%)       30.32     (35.8%)    4.9% ( -48% -  115%) 0.662
            BrowseDateSSDVFacets        3.84     (32.1%)        4.27     (38.8%)   11.1% ( -45% -  120%) 0.326
                      OrHighHigh      116.26      (4.4%)      151.51     (10.6%)   30.3% (  14% -   47%) 0.000
                       OrHighMed       92.59      (5.0%)      198.39     (11.5%)  114.3% (  93% -  137%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       35.97     (44.1%)       34.15     (43.7%)   -5.0% ( -64% -  147%) 0.716
            BrowseDateTaxoFacets       33.38     (32.4%)       32.02     (31.5%)   -4.1% ( -51% -   88%) 0.685
       BrowseDayOfYearTaxoFacets       33.52     (32.3%)       32.22     (31.7%)   -3.9% ( -51% -   88%) 0.701
                 AndHighOrMedMed       74.23      (4.4%)       73.29      (5.1%)   -1.3% ( -10% -    8%) 0.402
                IntervalsOrdered       23.44      (4.3%)       23.15      (4.0%)   -1.2% (  -9% -    7%) 0.350
                    SloppyPhrase        3.12      (4.2%)        3.09      (3.0%)   -1.2% (  -8% -    6%) 0.316
       BrowseDayOfYearSSDVFacets       26.92     (11.8%)       26.65      (9.8%)   -1.0% ( -20% -   23%) 0.769
                AndMedOrHighHigh       35.38      (3.0%)       35.14      (3.8%)   -0.7% (  -7% -    6%) 0.532
         AndHighMedDayTaxoFacets       96.65      (2.1%)       96.07      (2.3%)   -0.6% (  -4% -    3%) 0.393
                            Term     2606.76      (3.4%)     2593.19      (4.1%)   -0.5% (  -7% -    7%) 0.663
                    TermGroup10K       32.13      (2.8%)       32.00      (4.0%)   -0.4% (  -7% -    6%) 0.710
                          Phrase       39.32      (2.2%)       39.17      (2.1%)   -0.4% (  -4% -    4%) 0.586
                    TermBGroup1M       52.51      (3.4%)       52.34      (4.6%)   -0.3% (  -8% -    7%) 0.801
                          IntNRQ     1217.04      (2.8%)     1213.57      (1.6%)   -0.3% (  -4% -    4%) 0.698
                        SpanNear      168.03      (2.9%)      167.70      (2.6%)   -0.2% (  -5% -    5%) 0.818
                          Fuzzy2      101.68      (2.4%)      101.54      (1.9%)   -0.1% (  -4% -    4%) 0.848
                     TermGroup1M       28.02      (3.0%)       27.99      (4.1%)   -0.1% (  -6% -    7%) 0.931
                          Fuzzy1      155.71      (2.9%)      155.60      (2.8%)   -0.1% (  -5% -    5%) 0.935
                      AndHighMed      162.62      (4.8%)      162.69      (4.4%)    0.0% (  -8% -    9%) 0.978
                  TermDateFacets       57.30      (4.5%)       57.34      (3.7%)    0.1% (  -7% -    8%) 0.964
           BrowseMonthTaxoFacets       31.34     (34.7%)       31.36     (34.7%)    0.1% ( -51% -  106%) 0.995
            MedTermDayTaxoFacets       76.65      (4.2%)       76.76      (3.4%)    0.2% (  -7% -    8%) 0.897
                         Respell       96.97      (3.1%)       97.18      (2.5%)    0.2% (  -5% -    6%) 0.809
     BrowseRandomLabelSSDVFacets       20.66      (8.9%)       20.70      (6.6%)    0.2% ( -14% -   17%) 0.928
        AndHighHighDayTaxoFacets       38.21      (1.6%)       38.30      (1.6%)    0.2% (  -2% -    3%) 0.649
                    TermGroup100       41.22      (3.0%)       41.38      (4.0%)    0.4% (  -6% -    7%) 0.717
                     AndHighHigh       44.28      (3.7%)       44.53      (4.2%)    0.6% (  -7% -    8%) 0.655
                      TermDTSort      205.94      (2.0%)      207.27      (2.8%)    0.6% (  -4% -    5%) 0.407
          OrHighMedDayTaxoFacets       17.46      (6.4%)       17.59      (8.2%)    0.7% ( -13% -   16%) 0.752
                  TermBGroup1M1P       44.35      (6.1%)       44.70      (6.9%)    0.8% ( -11% -   14%) 0.700
               TermDayOfYearSort      141.77      (5.8%)      142.91      (6.7%)    0.8% ( -11% -   14%) 0.685
                        PKLookup      332.31      (2.9%)      335.34      (3.2%)    0.9% (  -5% -    7%) 0.344
                        Wildcard      372.08      (5.5%)      380.76      (6.0%)    2.3% (  -8% -   14%) 0.198
                   TermTitleSort      271.30      (4.6%)      278.23      (7.7%)    2.6% (  -9% -   15%) 0.206
                   TermMonthSort      187.19      (4.8%)      192.13      (7.8%)    2.6% (  -9% -   16%) 0.198
                         Prefix3      299.92      (8.2%)      308.42      (7.5%)    2.8% ( -11% -   20%) 0.255
           BrowseMonthSSDVFacets       28.70     (11.8%)       29.70     (11.8%)    3.5% ( -17% -   30%) 0.351
            BrowseDateSSDVFacets        3.75     (27.7%)        4.06     (30.6%)    8.2% ( -39% -   92%) 0.372
                      OrHighHigh       25.85      (4.7%)       38.22      (7.7%)   47.8% (  33% -   63%) 0.000
                       OrHighMed       94.56      (4.7%)      212.52      (8.9%)  124.7% ( 106% -  145%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       31.25     (50.1%)       29.56     (46.8%)   -5.4% ( -68% -  183%) 0.725
           BrowseMonthTaxoFacets       29.33     (36.9%)       27.79     (33.8%)   -5.3% ( -55% -  103%) 0.639
     BrowseRandomLabelSSDVFacets       20.79      (7.1%)       19.84      (7.1%)   -4.6% ( -17% -   10%) 0.043
                         Prefix3       86.68      (7.4%)       82.99      (9.8%)   -4.3% ( -20% -   13%) 0.121
           BrowseMonthSSDVFacets       29.56     (11.8%)       28.39      (9.4%)   -4.0% ( -22% -   19%) 0.240
          OrHighMedDayTaxoFacets       24.99      (5.5%)       24.25      (8.8%)   -3.0% ( -16% -   11%) 0.202
       BrowseDayOfYearTaxoFacets       29.40     (32.5%)       28.63     (32.7%)   -2.6% ( -51% -   92%) 0.800
            BrowseDateTaxoFacets       29.33     (32.7%)       28.59     (32.8%)   -2.5% ( -51% -   93%) 0.806
                 AndHighOrMedMed       76.38      (5.3%)       74.46      (5.5%)   -2.5% ( -12% -    8%) 0.141
                  TermBGroup1M1P       37.13      (8.5%)       36.39      (4.9%)   -2.0% ( -14% -   12%) 0.360
                      AndHighMed      170.75      (4.6%)      167.47      (3.9%)   -1.9% ( -10% -    6%) 0.157
                AndMedOrHighHigh       36.61      (4.6%)       35.96      (3.3%)   -1.8% (  -9% -    6%) 0.162
               TermDayOfYearSort      344.59      (8.1%)      339.13      (2.6%)   -1.6% ( -11% -    9%) 0.405
                     AndHighHigh       46.17      (4.3%)       45.46      (3.5%)   -1.5% (  -8% -    6%) 0.212
                        SpanNear       13.79      (1.7%)       13.60      (4.4%)   -1.4% (  -7% -    4%) 0.192
            MedTermDayTaxoFacets       79.56      (5.1%)       78.49      (4.4%)   -1.3% ( -10% -    8%) 0.370
                  TermDateFacets       73.55      (5.3%)       72.59      (4.5%)   -1.3% ( -10% -    9%) 0.401
                        PKLookup      332.29      (3.7%)      328.27      (5.2%)   -1.2% (  -9% -    8%) 0.399
                          Fuzzy1       81.10      (1.5%)       80.21      (2.6%)   -1.1% (  -5% -    3%) 0.097
                        Wildcard      377.60      (6.0%)      374.74      (5.9%)   -0.8% ( -11% -   11%) 0.687
                    TermGroup100       41.50      (4.4%)       41.19      (3.2%)   -0.8% (  -8% -    7%) 0.536
                    TermBGroup1M       29.94      (5.5%)       29.73      (3.0%)   -0.7% (  -8% -    8%) 0.620
                          Fuzzy2      145.36      (1.8%)      144.59      (2.3%)   -0.5% (  -4% -    3%) 0.412
         AndHighMedDayTaxoFacets       39.44      (2.0%)       39.31      (2.1%)   -0.3% (  -4% -    3%) 0.626
                            Term     3651.07      (3.4%)     3639.90      (3.0%)   -0.3% (  -6% -    6%) 0.763
                         Respell       96.31      (2.4%)       96.05      (3.3%)   -0.3% (  -5% -    5%) 0.773
                    TermGroup10K       40.70      (5.2%)       40.60      (2.8%)   -0.2% (  -7% -    8%) 0.854
        AndHighHighDayTaxoFacets       54.55      (1.3%)       54.43      (1.4%)   -0.2% (  -2% -    2%) 0.581
                          IntNRQ      266.78      (0.9%)      267.03      (0.5%)    0.1% (  -1% -    1%) 0.694
                     TermGroup1M       40.32      (5.2%)       40.50      (3.2%)    0.4% (  -7% -    9%) 0.750
                          Phrase      235.70      (2.1%)      236.75      (2.2%)    0.4% (  -3% -    4%) 0.520
                    SloppyPhrase        7.35      (3.6%)        7.43      (4.1%)    1.0% (  -6% -    9%) 0.398
                IntervalsOrdered      126.38      (8.0%)      127.93      (6.9%)    1.2% ( -12% -   17%) 0.604
                   TermMonthSort      188.44      (4.8%)      191.57      (6.4%)    1.7% (  -9% -   13%) 0.352
                   TermTitleSort      355.92      (4.3%)      362.31      (6.1%)    1.8% (  -8% -   12%) 0.283
                      TermDTSort      180.53      (4.7%)      184.05      (7.7%)    2.0% (  -9% -   15%) 0.332
       BrowseDayOfYearSSDVFacets       26.68      (9.3%)       27.74     (12.0%)    4.0% ( -15% -   27%) 0.238
            BrowseDateSSDVFacets        4.05     (28.4%)        4.39     (35.0%)    8.3% ( -42% -  100%) 0.410
                      OrHighHigh       31.32      (4.8%)       48.33      (7.1%)   54.3% (  40% -   69%) 0.000
                       OrHighMed      128.39      (4.7%)      239.33      (6.8%)   86.4% (  71% -  102%) 0.000

zacharymorn · 2022-07-17T05:00:43Z

@jpountz If this approach to limiting BMM scorer to top-level disjunctions looks good to you, I can go ahead and update the corresponding tests to make this PR ready?

zacharymorn · 2022-07-18T05:05:47Z

I can go ahead and update the corresponding tests to make this PR ready?

I've updated / added the tests, and also tried out the idea to use a dedicated test query to ensure the right scorer under tests.

jpountz

I left two comments but it looks good to me otherwise.

jpountz · 2022-07-18T05:46:51Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+
+          int doc = min;
+          while (true) {
+            doc = iterator.advance(doc);


we should only advance the scorer if the current doc is not already greater than or equal to min, otherwise we should retrieve the doc ID with Scorer#docID.

Do you mean something like this?

new BulkScorer() { final Scorer bmmScorer = new BlockMaxMaxscoreScorer(BooleanWeight.this, optionalScorers); final DocIdSetIterator iterator = bmmScorer.iterator(); @Override public int score(LeafCollector collector, Bits acceptDocs, int min, int max) throws IOException { collector.setScorer(bmmScorer); int doc = min; while (true) { // updated logic below if (doc < min) { doc = iterator.advance(doc); } else { doc = iterator.docID(); } if (doc >= max) { return doc; } if (acceptDocs == null || acceptDocs.get(doc)) { collector.collect(doc); } doc++; } } }

I'm not sure how doc would get advanced with this though, and the benchmark tests also seems stuck in a loop?

Yes, indeed, though we might be able to simplify it to look like below:

new BulkScorer() { final Scorer bmmScorer = new BlockMaxMaxscoreScorer(BooleanWeight.this, optionalScorers); final DocIdSetIterator iterator = bmmScorer.iterator(); @Override public int score(LeafCollector collector, Bits acceptDocs, int min, int max) throws IOException { collector.setScorer(bmmScorer); int doc = bmmScorer.docID(); if (doc < min) { doc = bmmScorer.advance(min); } while (doc < max) { if (acceptDocs == null || acceptDocs.get(doc)) { collector.collect(doc); } doc = bmmScorer.nextDoc(); } return doc; } }

The reason is that a consumer of the bulk scorer could do something like:

bulkScorer.score(collector, null, 0, 1000); bulkScorer.score(collector, null, 1000, 2000);

If the last match of the first window is say 998 and the first match after the first window is 1005. Then we should make sure to score 1005 when scoring the second window before starting to advance.

If the last match of the first window is say 998 and the first match after the first window is 1005. Then we should make sure to score 1005 when scoring the second window before starting to advance.

Thanks for the explanation, it makes sense! I thought the old implementation would take care of this boundary case as it initiated doc with min before advancing, but the behavior is indeed undefined if the previous call to bulkScorer#score already advanced its internal scorer past the next min used. I've updated the code with the above solution.

jpountz · 2022-07-18T05:47:44Z

lucene/core/src/java/org/apache/lucene/search/BooleanWeight.java

+
+        @Override
+        public long cost() {
+          return maxDoc;


Return bmmScorer.cost() instead?

zacharymorn · 2022-07-19T05:24:14Z

Here are the latest benchmark results:

wikinightly

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                  TermBGroup1M1P       55.21      (7.3%)       53.75      (5.5%)   -2.6% ( -14% -   11%) 0.200
                        PKLookup      330.25      (4.3%)      326.53      (3.9%)   -1.1% (  -8% -    7%) 0.387
                  TermDateFacets       71.88      (4.7%)       71.13      (4.8%)   -1.0% ( -10% -    8%) 0.487
            MedTermDayTaxoFacets       77.44      (4.5%)       76.67      (4.8%)   -1.0% (  -9% -    8%) 0.502
                          IntNRQ     1216.26      (2.5%)     1207.48      (2.8%)   -0.7% (  -5% -    4%) 0.387
        AndHighHighDayTaxoFacets       13.63      (2.2%)       13.55      (2.6%)   -0.5% (  -5% -    4%) 0.471
                        SpanNear       28.99      (3.4%)       28.86      (2.6%)   -0.5% (  -6% -    5%) 0.621
                          Fuzzy1      142.65      (1.4%)      142.01      (1.5%)   -0.4% (  -3% -    2%) 0.333
                      TermDTSort      142.65      (3.1%)      142.02      (2.9%)   -0.4% (  -6% -    5%) 0.644
                         Respell       96.15      (1.5%)       95.76      (2.0%)   -0.4% (  -3% -    3%) 0.483
                    TermBGroup1M       52.81      (3.0%)       52.60      (4.1%)   -0.4% (  -7% -    6%) 0.731
               TermDayOfYearSort      259.79      (3.1%)      258.78      (2.8%)   -0.4% (  -6% -    5%) 0.681
                   TermMonthSort      275.05      (6.2%)      274.05      (7.0%)   -0.4% ( -12% -   13%) 0.861
                    TermGroup10K       43.13      (2.8%)       42.98      (3.8%)   -0.4% (  -6% -    6%) 0.731
                            Term     2665.46      (4.2%)     2656.78      (4.1%)   -0.3% (  -8% -    8%) 0.803
                    TermGroup100       66.52      (3.4%)       66.35      (4.2%)   -0.3% (  -7% -    7%) 0.834
                     TermGroup1M       30.69      (2.5%)       30.62      (3.5%)   -0.3% (  -6% -    5%) 0.792
                   TermTitleSort      190.21      (6.2%)      189.75      (7.0%)   -0.2% ( -12% -   13%) 0.908
                          Fuzzy2       83.28      (1.7%)       83.17      (1.9%)   -0.1% (  -3% -    3%) 0.809
                 AndHighOrMedMed       73.32      (5.9%)       73.41      (5.7%)    0.1% ( -10% -   12%) 0.946
                IntervalsOrdered        4.63      (4.0%)        4.64      (4.0%)    0.2% (  -7% -    8%) 0.877
         AndHighMedDayTaxoFacets       48.94      (2.1%)       49.06      (2.6%)    0.2% (  -4% -    5%) 0.743
                AndMedOrHighHigh       72.55      (5.1%)       72.74      (4.7%)    0.3% (  -9% -   10%) 0.863
       BrowseDayOfYearSSDVFacets       26.43      (5.6%)       26.51      (4.2%)    0.3% (  -9% -   10%) 0.837
                          Phrase       53.31      (4.7%)       53.49      (4.9%)    0.3% (  -8% -   10%) 0.820
                         Prefix3      416.08      (9.2%)      417.57      (9.1%)    0.4% ( -16% -   20%) 0.901
           BrowseMonthSSDVFacets       30.34     (11.6%)       30.58     (12.5%)    0.8% ( -20% -   28%) 0.836
                    SloppyPhrase        4.71      (3.7%)        4.75      (3.6%)    0.9% (  -6% -    8%) 0.427
     BrowseRandomLabelSSDVFacets       20.64      (6.6%)       20.83      (5.7%)    0.9% ( -10% -   14%) 0.630
                      AndHighMed      111.69      (3.5%)      113.66      (3.3%)    1.8% (  -4% -    8%) 0.101
                     AndHighHigh      102.15      (3.4%)      104.05      (3.3%)    1.9% (  -4% -    8%) 0.079
                        Wildcard      162.58      (7.6%)      165.88      (5.6%)    2.0% ( -10% -   16%) 0.337
          OrHighMedDayTaxoFacets       22.45      (5.7%)       22.96      (4.7%)    2.3% (  -7% -   13%) 0.174
            BrowseDateSSDVFacets        4.24     (32.2%)        4.44     (30.1%)    4.7% ( -43% -   98%) 0.630
       BrowseDayOfYearTaxoFacets       27.90     (31.8%)       29.47     (33.8%)    5.6% ( -45% -  104%) 0.586
            BrowseDateTaxoFacets       27.82     (31.8%)       29.39     (33.9%)    5.7% ( -45% -  104%) 0.587
                      OrHighHigh       21.30      (5.9%)       22.64      (5.3%)    6.3% (  -4% -   18%) 0.000
     BrowseRandomLabelTaxoFacets       28.61     (48.5%)       30.61     (50.4%)    7.0% ( -61% -  205%) 0.656
           BrowseMonthTaxoFacets       27.81     (33.3%)       30.05     (38.0%)    8.1% ( -47% -  118%) 0.475
                       OrHighMed      122.60      (6.1%)      234.50      (7.2%)   91.3% (  73% -  111%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                            Term     2669.38      (2.9%)     2616.83      (3.4%)   -2.0% (  -8% -    4%) 0.052
                         Respell       92.34      (1.9%)       91.09      (4.3%)   -1.4% (  -7% -    4%) 0.193
                  TermBGroup1M1P       54.70      (6.9%)       53.97      (5.5%)   -1.3% ( -12% -   11%) 0.504
                AndMedOrHighHigh       94.36      (4.8%)       93.33      (3.5%)   -1.1% (  -8% -    7%) 0.412
               TermDayOfYearSort      144.09      (7.0%)      142.80      (6.2%)   -0.9% ( -13% -   13%) 0.671
                  TermDateFacets       73.65      (5.5%)       73.07      (4.5%)   -0.8% ( -10% -    9%) 0.623
     BrowseRandomLabelTaxoFacets       35.63     (43.4%)       35.40     (39.9%)   -0.6% ( -58% -  145%) 0.962
           BrowseMonthSSDVFacets       29.40     (16.0%)       29.21     (14.3%)   -0.6% ( -26% -   35%) 0.895
            MedTermDayTaxoFacets       76.37      (5.1%)       75.90      (4.1%)   -0.6% (  -9% -    9%) 0.677
                          Fuzzy1       79.86      (1.9%)       79.43      (2.5%)   -0.5% (  -4% -    3%) 0.452
                          Fuzzy2       83.54      (1.6%)       83.11      (2.9%)   -0.5% (  -4% -    4%) 0.481
                    TermBGroup1M       52.98      (3.3%)       52.73      (2.9%)   -0.5% (  -6% -    5%) 0.625
                          IntNRQ      108.80      (3.5%)      108.38      (4.5%)   -0.4% (  -8% -    7%) 0.762
                    TermGroup10K       41.18      (3.1%)       41.02      (2.6%)   -0.4% (  -5% -    5%) 0.670
                      AndHighMed      152.45      (4.7%)      151.90      (3.9%)   -0.4% (  -8% -    8%) 0.791
                     TermGroup1M       30.72      (3.0%)       30.62      (2.7%)   -0.3% (  -5% -    5%) 0.705
                        Wildcard      376.05      (5.6%)      374.87      (5.1%)   -0.3% ( -10% -   10%) 0.853
        AndHighHighDayTaxoFacets       13.80      (3.1%)       13.75      (2.9%)   -0.3% (  -6% -    5%) 0.746
                     AndHighHigh       58.98      (3.4%)       58.81      (2.8%)   -0.3% (  -6% -    6%) 0.769
                    TermGroup100       28.40      (4.0%)       28.34      (3.6%)   -0.2% (  -7% -    7%) 0.859
                          Phrase      116.22      (5.8%)      115.97      (4.4%)   -0.2% (  -9% -   10%) 0.898
       BrowseDayOfYearSSDVFacets       28.12     (14.0%)       28.07     (12.1%)   -0.2% ( -23% -   30%) 0.969
         AndHighMedDayTaxoFacets       48.87      (3.7%)       48.86      (3.2%)   -0.0% (  -6% -    7%) 0.985
                   TermMonthSort      151.67      (6.4%)      151.88      (7.1%)    0.1% ( -12% -   14%) 0.949
            BrowseDateSSDVFacets        4.32     (27.8%)        4.33     (30.4%)    0.1% ( -45% -   80%) 0.987
                      TermDTSort      179.58      (7.1%)      179.85      (6.2%)    0.2% ( -12% -   14%) 0.943
                        SpanNear       28.81      (3.1%)       28.89      (2.9%)    0.3% (  -5% -    6%) 0.773
                   TermTitleSort      151.58      (6.5%)      152.05      (7.2%)    0.3% ( -12% -   14%) 0.885
                        PKLookup      330.34      (3.2%)      331.57      (4.0%)    0.4% (  -6% -    7%) 0.747
                IntervalsOrdered       13.18      (3.1%)       13.24      (2.7%)    0.5% (  -5% -    6%) 0.622
                 AndHighOrMedMed       93.13      (5.6%)       93.72      (4.2%)    0.6% (  -8% -   11%) 0.683
                         Prefix3      310.09      (7.7%)      312.54      (6.4%)    0.8% ( -12% -   16%) 0.723
          OrHighMedDayTaxoFacets       16.36      (5.8%)       16.49      (3.8%)    0.8% (  -8% -   11%) 0.611
                    SloppyPhrase        3.03      (3.9%)        3.07      (4.6%)    1.1% (  -7% -   10%) 0.399
     BrowseRandomLabelSSDVFacets       19.56      (8.6%)       19.86      (6.7%)    1.5% ( -12% -   18%) 0.537
            BrowseDateTaxoFacets       33.74     (31.5%)       34.42     (29.7%)    2.0% ( -44% -   92%) 0.833
       BrowseDayOfYearTaxoFacets       33.86     (31.4%)       34.57     (29.6%)    2.1% ( -44% -   91%) 0.827
           BrowseMonthTaxoFacets       29.99     (35.1%)       31.87     (36.1%)    6.3% ( -48% -  119%) 0.577
                      OrHighHigh      117.79      (4.4%)      159.21      (7.4%)   35.2% (  22% -   49%) 0.000
                       OrHighMed       92.34      (4.9%)      202.28      (4.6%)  119.1% ( 104% -  135%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       33.74     (47.0%)       31.68     (45.2%)   -6.1% ( -66% -  162%) 0.676
       BrowseDayOfYearTaxoFacets       31.93     (32.8%)       30.33     (29.1%)   -5.0% ( -50% -   84%) 0.609
            BrowseDateTaxoFacets       31.86     (32.8%)       30.28     (29.2%)   -5.0% ( -50% -   84%) 0.612
          OrHighMedDayTaxoFacets       15.55      (5.2%)       15.03      (8.5%)   -3.3% ( -16% -   10%) 0.137
                  TermBGroup1M1P       86.03      (7.1%)       83.43      (6.6%)   -3.0% ( -15% -   11%) 0.163
                  TermDateFacets       74.21      (5.2%)       72.42      (4.2%)   -2.4% ( -11% -    7%) 0.103
            MedTermDayTaxoFacets       77.74      (4.9%)       76.01      (4.0%)   -2.2% ( -10% -    6%) 0.116
                AndMedOrHighHigh       94.98      (4.3%)       93.03      (4.3%)   -2.1% ( -10% -    6%) 0.131
                        Wildcard      114.27      (5.6%)      112.61      (6.1%)   -1.4% ( -12% -   10%) 0.437
                         Prefix3      446.55      (9.5%)      440.60      (9.9%)   -1.3% ( -18% -   19%) 0.664
                    TermGroup100       36.29      (3.6%)       35.82      (3.3%)   -1.3% (  -7% -    5%) 0.235
        AndHighHighDayTaxoFacets       13.85      (2.7%)       13.68      (2.5%)   -1.2% (  -6% -    4%) 0.158
                    TermGroup10K       29.40      (3.4%)       29.07      (3.5%)   -1.1% (  -7% -    5%) 0.297
           BrowseMonthSSDVFacets       28.03      (6.9%)       27.74      (7.7%)   -1.0% ( -14% -   14%) 0.651
         AndHighMedDayTaxoFacets      126.53      (1.8%)      125.24      (1.6%)   -1.0% (  -4% -    2%) 0.054
                    TermBGroup1M       48.03      (3.8%)       47.54      (3.9%)   -1.0% (  -8% -    6%) 0.402
                        PKLookup      332.31      (4.3%)      329.17      (4.5%)   -0.9% (  -9% -    8%) 0.499
                          Fuzzy2       83.69      (1.7%)       82.90      (1.3%)   -0.9% (  -3% -    2%) 0.051
                         Respell       92.13      (2.2%)       91.32      (2.2%)   -0.9% (  -5% -    3%) 0.204
                     TermGroup1M       30.90      (3.3%)       30.69      (3.6%)   -0.7% (  -7% -    6%) 0.531
                          Fuzzy1       79.86      (2.0%)       79.34      (1.6%)   -0.7% (  -4% -    2%) 0.247
                            Term     2990.17      (3.1%)     2970.74      (3.8%)   -0.6% (  -7% -    6%) 0.555
                 AndHighOrMedMed      115.42      (5.3%)      114.79      (5.1%)   -0.5% ( -10% -   10%) 0.743
     BrowseRandomLabelSSDVFacets       20.49      (7.9%)       20.40      (6.1%)   -0.4% ( -13% -   14%) 0.840
                        SpanNear       13.81      (1.6%)       13.75      (2.0%)   -0.4% (  -3% -    3%) 0.502
                          IntNRQ       86.13     (10.7%)       85.82     (10.6%)   -0.4% ( -19% -   23%) 0.915
            BrowseDateSSDVFacets        4.09     (28.7%)        4.08     (35.0%)   -0.1% ( -49% -   89%) 0.990
                    SloppyPhrase        7.40      (4.1%)        7.40      (5.0%)    0.0% (  -8% -    9%) 0.990
                          Phrase      233.57      (1.8%)      233.64      (2.5%)    0.0% (  -4% -    4%) 0.969
                   TermMonthSort      358.08      (6.7%)      358.32      (6.6%)    0.1% ( -12% -   14%) 0.975
                   TermTitleSort      150.28      (6.8%)      150.47      (6.7%)    0.1% ( -12% -   14%) 0.953
                      AndHighMed      147.66      (4.7%)      147.95      (4.8%)    0.2% (  -8% -   10%) 0.896
                IntervalsOrdered       13.32      (2.7%)       13.36      (3.0%)    0.3% (  -5% -    6%) 0.700
                     AndHighHigh      103.39      (3.0%)      104.13      (3.8%)    0.7% (  -5% -    7%) 0.507
                      TermDTSort      258.56      (2.7%)      262.00      (4.4%)    1.3% (  -5% -    8%) 0.252
       BrowseDayOfYearSSDVFacets       27.36     (10.7%)       27.79     (12.0%)    1.5% ( -19% -   27%) 0.667
               TermDayOfYearSort      179.29      (2.7%)      183.28      (6.5%)    2.2% (  -6% -   11%) 0.155
           BrowseMonthTaxoFacets       29.51     (34.8%)       30.53     (36.6%)    3.5% ( -50% -  114%) 0.759
                      OrHighHigh       21.24      (5.5%)       23.29      (4.4%)    9.6% (   0% -   20%) 0.000
                       OrHighMed      104.45      (4.5%)      179.87      (6.2%)   72.2% (  58% -   86%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
            BrowseDateSSDVFacets        4.17     (34.3%)        3.84     (28.0%)   -7.7% ( -52% -   82%) 0.434
          OrHighMedDayTaxoFacets       14.02      (6.8%)       13.43      (8.4%)   -4.2% ( -18% -   11%) 0.083
                  TermBGroup1M1P       55.17      (5.8%)       53.96      (5.7%)   -2.2% ( -12% -    9%) 0.228
                      TermDTSort      145.63      (6.5%)      142.48      (4.9%)   -2.2% ( -12% -    9%) 0.235
                  TermDateFacets       42.01      (5.0%)       41.29      (4.2%)   -1.7% ( -10% -    7%) 0.242
            MedTermDayTaxoFacets       80.14      (4.6%)       79.08      (3.8%)   -1.3% (  -9% -    7%) 0.321
                 AndHighOrMedMed       71.35      (4.6%)       70.62      (4.2%)   -1.0% (  -9% -    8%) 0.461
                    TermGroup100       66.73      (3.7%)       66.10      (2.8%)   -0.9% (  -7% -    5%) 0.360
                      AndHighMed      180.25      (4.2%)      178.84      (4.0%)   -0.8% (  -8% -    7%) 0.547
        AndHighHighDayTaxoFacets       12.43      (2.7%)       12.34      (3.0%)   -0.7% (  -6% -    5%) 0.427
                     AndHighHigh       56.34      (2.9%)       55.95      (3.3%)   -0.7% (  -6% -    5%) 0.471
                IntervalsOrdered       13.41      (2.8%)       13.33      (2.9%)   -0.6% (  -6% -    5%) 0.526
                        SpanNear       16.50      (3.9%)       16.44      (3.7%)   -0.4% (  -7% -    7%) 0.763
         AndHighMedDayTaxoFacets      202.68      (3.4%)      202.03      (2.9%)   -0.3% (  -6% -    6%) 0.748
                AndMedOrHighHigh       34.43      (4.0%)       34.33      (3.3%)   -0.3% (  -7% -    7%) 0.802
                   TermTitleSort      192.31      (8.2%)      192.06      (7.8%)   -0.1% ( -14% -   17%) 0.959
                    SloppyPhrase        3.05      (4.9%)        3.05      (4.8%)   -0.1% (  -9% -   10%) 0.966
                          Fuzzy2       82.49      (2.1%)       82.45      (2.5%)   -0.0% (  -4% -    4%) 0.945
                    TermGroup10K       28.82      (3.2%)       28.85      (3.3%)    0.1% (  -6% -    6%) 0.916
                          Fuzzy1      132.62      (2.6%)      132.85      (3.2%)    0.2% (  -5% -    6%) 0.850
                   TermMonthSort      277.44      (8.5%)      278.02      (7.8%)    0.2% ( -14% -   18%) 0.936
                    TermBGroup1M       52.20      (3.8%)       52.35      (3.8%)    0.3% (  -7% -    8%) 0.810
                     TermGroup1M       30.38      (3.3%)       30.49      (3.2%)    0.3% (  -5% -    7%) 0.737
                          Phrase       38.94      (2.3%)       39.12      (2.4%)    0.5% (  -4% -    5%) 0.537
                        Wildcard      115.40      (5.4%)      115.96      (4.6%)    0.5% (  -9% -   11%) 0.759
           BrowseMonthSSDVFacets       28.92     (11.0%)       29.15     (10.4%)    0.8% ( -18% -   24%) 0.816
                         Prefix3       85.45      (7.2%)       86.13      (6.3%)    0.8% ( -11% -   15%) 0.708
                         Respell      110.22      (2.8%)      111.23      (3.4%)    0.9% (  -5% -    7%) 0.352
                          IntNRQ      262.90      (3.5%)      265.31      (1.0%)    0.9% (  -3% -    5%) 0.265
                        PKLookup      320.06      (5.5%)      323.50      (4.0%)    1.1% (  -8% -   11%) 0.483
               TermDayOfYearSort      179.37      (2.7%)      181.62      (6.8%)    1.3% (  -8% -   11%) 0.444
       BrowseDayOfYearSSDVFacets       26.62      (9.4%)       27.06      (7.5%)    1.7% ( -13% -   20%) 0.532
                            Term     2968.74      (3.9%)     3023.70      (4.8%)    1.9% (  -6% -   10%) 0.181
     BrowseRandomLabelSSDVFacets       20.13      (8.1%)       20.54      (5.3%)    2.0% ( -10% -   16%) 0.351
           BrowseMonthTaxoFacets       31.83     (35.1%)       35.00     (34.9%)   10.0% ( -44% -  123%) 0.367
       BrowseDayOfYearTaxoFacets       31.92     (32.2%)       35.50     (33.2%)   11.2% ( -41% -  113%) 0.279
            BrowseDateTaxoFacets       31.66     (32.1%)       35.33     (33.5%)   11.6% ( -40% -  113%) 0.265
     BrowseRandomLabelTaxoFacets       33.49     (47.5%)       39.38     (49.7%)   17.6% ( -53% -  218%) 0.253
                      OrHighHigh       22.47      (5.2%)       28.61      (6.6%)   27.3% (  14% -   41%) 0.000
                       OrHighMed      101.24      (4.5%)      177.10      (7.9%)   74.9% (  59% -   91%) 0.000

wikimedium.10M.nostopwords.tasks

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                    OrNotHighLow     2404.13      (4.6%)     2299.23      (5.1%)   -4.4% ( -13% -    5%) 0.005
            BrowseDateSSDVFacets        4.46     (28.1%)        4.27     (31.3%)   -4.2% ( -49% -   76%) 0.652
                   OrHighNotHigh     1446.94      (4.2%)     1386.64      (5.1%)   -4.2% ( -12% -    5%) 0.005
                    OrHighNotMed     1877.72      (4.6%)     1805.21      (5.2%)   -3.9% ( -13% -    6%) 0.013
                    OrHighNotLow     2076.24      (4.2%)     2001.55      (4.8%)   -3.6% ( -12% -    5%) 0.012
                   OrNotHighHigh     1699.54      (4.3%)     1644.55      (5.3%)   -3.2% ( -12% -    6%) 0.034
                    OrNotHighMed     1954.82      (3.4%)     1892.58      (5.0%)   -3.2% ( -11% -    5%) 0.018
                        PKLookup      328.78      (3.3%)      322.32      (3.4%)   -2.0% (  -8% -    4%) 0.063
                        HighTerm     3905.19      (5.7%)     3853.68      (5.2%)   -1.3% ( -11% -   10%) 0.444
                      HighPhrase      207.95      (1.5%)      205.38      (3.0%)   -1.2% (  -5% -    3%) 0.105
       BrowseDayOfYearSSDVFacets       27.87     (12.6%)       27.53     (11.8%)   -1.2% ( -22% -   26%) 0.753
                         MedTerm     3822.96      (4.9%)     3776.97      (4.9%)   -1.2% ( -10% -    9%) 0.438
                         Respell      102.98      (2.9%)      101.77      (2.3%)   -1.2% (  -6% -    4%) 0.149
                      AndHighLow     1571.52      (4.7%)     1553.47      (5.5%)   -1.1% ( -10% -    9%) 0.478
                      AndHighMed      227.66      (5.7%)      225.31      (5.4%)   -1.0% ( -11% -   10%) 0.557
                       LowPhrase      428.47      (1.8%)      424.84      (2.6%)   -0.8% (  -5% -    3%) 0.228
                       OrHighLow      849.69      (3.8%)      842.60      (5.2%)   -0.8% (  -9% -    8%) 0.562
                       MedPhrase      576.49      (2.0%)      571.79      (3.1%)   -0.8% (  -5% -    4%) 0.323
                HighSloppyPhrase       33.43      (2.6%)       33.17      (3.2%)   -0.8% (  -6% -    5%) 0.405
                     AndHighHigh      187.93      (3.8%)      186.51      (4.0%)   -0.8% (  -8% -    7%) 0.539
         AndHighMedDayTaxoFacets      285.75      (1.9%)      283.72      (2.8%)   -0.7% (  -5% -    4%) 0.351
                 MedSloppyPhrase       47.37      (3.3%)       47.09      (3.8%)   -0.6% (  -7% -    6%) 0.601
        AndHighHighDayTaxoFacets       18.77      (2.4%)       18.67      (2.7%)   -0.5% (  -5% -    4%) 0.506
                          Fuzzy1      142.64      (2.0%)      142.02      (2.1%)   -0.4% (  -4% -    3%) 0.509
                 LowSloppyPhrase       43.92      (2.4%)       43.75      (2.8%)   -0.4% (  -5% -    4%) 0.636
               HighTermMonthSort      281.77      (8.3%)      280.80      (7.0%)   -0.3% ( -14% -   16%) 0.888
                          IntNRQ      165.10      (0.6%)      164.79      (1.1%)   -0.2% (  -1% -    1%) 0.519
             MedIntervalsOrdered       10.38      (2.6%)       10.36      (3.4%)   -0.2% (  -6% -    5%) 0.853
                     LowSpanNear       54.15      (2.5%)       54.13      (3.1%)   -0.0% (  -5% -    5%) 0.973
                          Fuzzy2       92.62      (1.6%)       92.62      (2.3%)   -0.0% (  -3% -    3%) 0.997
             LowIntervalsOrdered      118.97      (2.9%)      118.99      (4.1%)    0.0% (  -6% -    7%) 0.990
            MedTermDayTaxoFacets       32.39      (4.9%)       32.43      (4.6%)    0.1% (  -8% -   10%) 0.934
                        Wildcard      233.39      (4.6%)      233.76      (4.0%)    0.2% (  -8% -    9%) 0.907
                         LowTerm     3211.79      (4.7%)     3223.51      (6.5%)    0.4% ( -10% -   12%) 0.839
                     MedSpanNear       12.89      (3.4%)       12.94      (3.5%)    0.4% (  -6% -    7%) 0.738
                         Prefix3      307.89      (9.1%)      309.73      (6.8%)    0.6% ( -13% -   18%) 0.814
     BrowseRandomLabelSSDVFacets       20.03     (10.4%)       20.17      (8.0%)    0.7% ( -16% -   21%) 0.808
           HighTermDayOfYearSort      238.75     (10.4%)      241.59      (8.9%)    1.2% ( -16% -   22%) 0.697
            HighIntervalsOrdered        2.60      (9.0%)        2.64     (11.0%)    1.4% ( -17% -   23%) 0.664
                      TermDTSort      263.12      (7.1%)      266.86      (9.3%)    1.4% ( -14% -   19%) 0.587
           BrowseMonthSSDVFacets       29.11     (15.3%)       29.53     (14.0%)    1.5% ( -24% -   36%) 0.753
                    HighSpanNear        1.96      (6.7%)        2.00      (7.1%)    1.6% ( -11% -   16%) 0.449
           BrowseMonthTaxoFacets       32.60     (33.4%)       33.31     (33.4%)    2.2% ( -48% -  103%) 0.838
          OrHighMedDayTaxoFacets       23.06     (10.7%)       23.68      (6.7%)    2.7% ( -13% -   22%) 0.338
            HighTermTitleBDVSort      132.63      (7.9%)      136.49     (11.2%)    2.9% ( -14% -   23%) 0.342
                      OrHighHigh       36.66      (4.3%)       37.89      (5.0%)    3.4% (  -5% -   13%) 0.024
       BrowseDayOfYearTaxoFacets       30.08     (35.3%)       32.20     (36.3%)    7.1% ( -47% -  121%) 0.533
            BrowseDateTaxoFacets       29.97     (35.3%)       32.11     (36.4%)    7.1% ( -47% -  121%) 0.529
     BrowseRandomLabelTaxoFacets       33.87     (55.4%)       36.44     (55.6%)    7.6% ( -66% -  266%) 0.665
                       OrHighMed       59.43      (4.4%)       73.60      (6.1%)   23.8% (  12% -   35%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
           BrowseMonthTaxoFacets       29.67     (35.9%)       26.63     (30.3%)  -10.2% ( -56% -   87%) 0.330
     BrowseRandomLabelTaxoFacets       32.36     (49.1%)       29.36     (44.0%)   -9.3% ( -68% -  164%) 0.530
            BrowseDateTaxoFacets       30.55     (32.1%)       28.48     (29.5%)   -6.8% ( -51% -   80%) 0.488
       BrowseDayOfYearTaxoFacets       30.62     (32.1%)       28.56     (29.4%)   -6.7% ( -51% -   80%) 0.490
                    OrHighNotLow     2000.65      (4.5%)     1895.41      (4.0%)   -5.3% ( -13% -    3%) 0.000
                    OrHighNotMed     1620.74      (3.8%)     1548.14      (3.6%)   -4.5% ( -11% -    3%) 0.000
                   OrHighNotHigh     1893.27      (4.3%)     1813.55      (4.6%)   -4.2% ( -12% -    4%) 0.003
                   OrNotHighHigh     1618.28      (2.9%)     1552.39      (3.3%)   -4.1% ( -10% -    2%) 0.000
                    OrNotHighMed     1875.84      (2.9%)     1808.01      (3.0%)   -3.6% (  -9% -    2%) 0.000
                         Prefix3      540.69      (7.6%)      523.50      (7.3%)   -3.2% ( -16% -   12%) 0.178
                    OrNotHighLow     3778.86      (4.4%)     3679.45      (4.9%)   -2.6% ( -11% -    6%) 0.074
                         MedTerm     3251.04      (3.8%)     3187.70      (3.8%)   -1.9% (  -9% -    5%) 0.105
                        HighTerm     5042.01      (3.7%)     4948.92      (3.9%)   -1.8% (  -9% -    5%) 0.125
                        Wildcard      206.72      (5.4%)      203.08      (5.4%)   -1.8% ( -11% -    9%) 0.305
                         LowTerm     3923.37      (3.8%)     3867.22      (5.1%)   -1.4% (  -9% -    7%) 0.316
           BrowseMonthSSDVFacets       29.89      (9.8%)       29.59     (10.4%)   -1.0% ( -19% -   21%) 0.755
       BrowseDayOfYearSSDVFacets       27.14      (7.7%)       26.91      (8.4%)   -0.9% ( -15% -   16%) 0.738
            HighIntervalsOrdered        2.97      (6.5%)        2.95      (5.8%)   -0.8% ( -12% -   12%) 0.687
                      AndHighLow     2171.32      (3.5%)     2156.36      (2.9%)   -0.7% (  -6% -    5%) 0.501
         AndHighMedDayTaxoFacets      137.76      (1.8%)      136.92      (1.4%)   -0.6% (  -3% -    2%) 0.236
            MedTermDayTaxoFacets       47.10      (3.1%)       46.86      (2.9%)   -0.5% (  -6% -    5%) 0.588
             LowIntervalsOrdered      130.34      (4.5%)      129.84      (4.0%)   -0.4% (  -8% -    8%) 0.772
                     MedSpanNear       47.38      (2.5%)       47.20      (2.4%)   -0.4% (  -5% -    4%) 0.621
        AndHighHighDayTaxoFacets       39.66      (1.7%)       39.53      (1.0%)   -0.3% (  -2% -    2%) 0.470
                    HighSpanNear       16.29      (3.7%)       16.24      (3.4%)   -0.3% (  -7% -    7%) 0.787
                       MedPhrase      254.77      (2.2%)      254.00      (1.9%)   -0.3% (  -4% -    3%) 0.640
                     LowSpanNear       86.34      (4.3%)       86.08      (4.0%)   -0.3% (  -8% -    8%) 0.821
                 MedSloppyPhrase       16.35      (3.2%)       16.31      (2.9%)   -0.3% (  -6% -    5%) 0.793
                     AndHighHigh       82.69      (3.2%)       82.50      (3.9%)   -0.2% (  -7% -    7%) 0.837
                HighSloppyPhrase       42.39      (3.4%)       42.31      (3.2%)   -0.2% (  -6% -    6%) 0.856
           HighTermDayOfYearSort      269.36      (9.8%)      268.97      (8.6%)   -0.1% ( -16% -   20%) 0.961
                          Fuzzy1      148.89      (2.4%)      148.74      (2.7%)   -0.1% (  -5% -    5%) 0.901
                 LowSloppyPhrase       18.20      (3.0%)       18.18      (2.4%)   -0.1% (  -5% -    5%) 0.926
               HighTermMonthSort      293.73      (8.4%)      293.57      (8.3%)   -0.1% ( -15% -   18%) 0.984
                       LowPhrase       35.24      (2.6%)       35.23      (2.8%)   -0.1% (  -5% -    5%) 0.954
                      HighPhrase      135.32      (2.7%)      135.39      (2.7%)    0.0% (  -5% -    5%) 0.953
                      AndHighMed      431.17      (4.0%)      431.40      (3.5%)    0.1% (  -7% -    7%) 0.965
                          IntNRQ      151.77      (0.4%)      152.06      (0.4%)    0.2% (   0% -    0%) 0.136
     BrowseRandomLabelSSDVFacets       20.68      (5.4%)       20.72      (7.3%)    0.2% ( -11% -   13%) 0.915
             MedIntervalsOrdered       55.15      (5.9%)       55.28      (5.1%)    0.2% ( -10% -   11%) 0.893
                        PKLookup      323.66      (5.3%)      324.64      (5.2%)    0.3% (  -9% -   11%) 0.855
                          Fuzzy2      104.69      (2.1%)      105.03      (2.8%)    0.3% (  -4% -    5%) 0.680
                         Respell      117.94      (2.5%)      118.67      (3.3%)    0.6% (  -5% -    6%) 0.510
          OrHighMedDayTaxoFacets       21.39      (7.1%)       21.72      (5.3%)    1.5% ( -10% -   14%) 0.437
            BrowseDateSSDVFacets        4.50     (34.5%)        4.58     (32.6%)    1.8% ( -48% -  105%) 0.868
                      TermDTSort      147.90      (8.7%)      151.02      (9.1%)    2.1% ( -14% -   21%) 0.454
            HighTermTitleBDVSort      209.37      (8.6%)      214.00     (10.2%)    2.2% ( -15% -   23%) 0.459
                       OrHighLow      613.03      (6.4%)      643.95      (8.1%)    5.0% (  -8% -   20%) 0.029
                      OrHighHigh       34.86      (5.9%)       42.92      (8.7%)   23.1% (   8% -   40%) 0.000
                       OrHighMed      228.50      (4.7%)      339.92      (7.6%)   48.8% (  34% -   64%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                    OrHighNotLow     1910.62      (5.2%)     1834.57      (4.0%)   -4.0% ( -12% -    5%) 0.007
                    OrNotHighMed     1930.95      (4.3%)     1859.27      (3.4%)   -3.7% ( -10% -    4%) 0.002
                   OrHighNotHigh     1547.82      (4.5%)     1491.21      (3.8%)   -3.7% ( -11% -    4%) 0.005
                    OrNotHighLow     1904.34      (3.8%)     1836.39      (4.0%)   -3.6% ( -10% -    4%) 0.004
                    OrHighNotMed     1841.59      (3.8%)     1778.33      (3.3%)   -3.4% ( -10% -    3%) 0.002
                       OrHighMed      468.71      (4.3%)      455.39      (6.0%)   -2.8% ( -12% -    7%) 0.086
          OrHighMedDayTaxoFacets       19.06      (5.2%)       18.64      (5.2%)   -2.2% ( -11% -    8%) 0.182
                         Prefix3      194.53      (7.6%)      190.38      (8.5%)   -2.1% ( -16% -   15%) 0.401
                   OrNotHighHigh     1218.01      (3.9%)     1194.20      (3.4%)   -2.0% (  -8% -    5%) 0.092
            MedTermDayTaxoFacets       73.83      (3.9%)       72.53      (5.2%)   -1.8% ( -10% -    7%) 0.226
                          IntNRQ       95.60      (5.6%)       93.98      (7.5%)   -1.7% ( -14% -   12%) 0.418
        AndHighHighDayTaxoFacets       12.42      (4.2%)       12.23      (2.9%)   -1.6% (  -8% -    5%) 0.170
                        Wildcard       99.34      (5.4%)       97.88      (5.7%)   -1.5% ( -11% -   10%) 0.402
                       LowPhrase      163.91      (2.9%)      161.78      (1.9%)   -1.3% (  -5% -    3%) 0.089
     BrowseRandomLabelSSDVFacets       20.32      (8.4%)       20.06      (8.6%)   -1.3% ( -16% -   17%) 0.632
           BrowseMonthSSDVFacets       29.23     (12.9%)       28.88     (13.1%)   -1.2% ( -24% -   28%) 0.771
       BrowseDayOfYearSSDVFacets       27.50     (12.6%)       27.18     (13.3%)   -1.2% ( -23% -   28%) 0.775
                        PKLookup      325.48      (3.3%)      321.76      (3.8%)   -1.1% (  -7% -    6%) 0.308
                      AndHighLow     1399.92      (5.7%)     1385.77      (4.0%)   -1.0% ( -10% -    9%) 0.518
                HighSloppyPhrase       77.82      (4.5%)       77.26      (3.4%)   -0.7% (  -8% -    7%) 0.570
         AndHighMedDayTaxoFacets      100.34      (3.0%)       99.71      (2.4%)   -0.6% (  -5% -    4%) 0.468
                 MedSloppyPhrase       15.49      (2.9%)       15.43      (2.3%)   -0.4% (  -5% -    4%) 0.655
                         Respell      100.24      (1.0%)       99.89      (2.2%)   -0.3% (  -3% -    2%) 0.517
                    HighSpanNear       11.03      (5.0%)       11.00      (5.0%)   -0.3% (  -9% -   10%) 0.834
                       MedPhrase       25.58      (2.7%)       25.50      (1.9%)   -0.3% (  -4% -    4%) 0.663
                     MedSpanNear        9.46      (4.0%)        9.44      (3.8%)   -0.2% (  -7% -    7%) 0.891
                     LowSpanNear       45.24      (2.9%)       45.16      (2.5%)   -0.2% (  -5% -    5%) 0.851
                      AndHighMed      172.29      (4.0%)      172.03      (4.4%)   -0.2% (  -8% -    8%) 0.907
                        HighTerm     3559.92      (3.5%)     3554.88      (4.4%)   -0.1% (  -7% -    8%) 0.910
                          Fuzzy1      140.34      (1.1%)      140.15      (1.5%)   -0.1% (  -2% -    2%) 0.747
                         MedTerm     2737.67      (4.0%)     2739.26      (4.8%)    0.1% (  -8% -    9%) 0.967
                          Fuzzy2      103.03      (1.3%)      103.25      (1.6%)    0.2% (  -2% -    3%) 0.642
                     AndHighHigh      153.37      (4.3%)      153.90      (4.3%)    0.3% (  -7% -    9%) 0.799
                      HighPhrase      245.46      (2.2%)      246.96      (1.9%)    0.6% (  -3% -    4%) 0.340
                 LowSloppyPhrase      160.72      (4.9%)      162.01      (5.5%)    0.8% (  -9% -   11%) 0.628
                         LowTerm     3476.45      (5.1%)     3514.16      (4.2%)    1.1% (  -7% -   10%) 0.463
             LowIntervalsOrdered      206.89      (9.1%)      209.20      (9.2%)    1.1% ( -15% -   21%) 0.700
             MedIntervalsOrdered      122.86      (5.1%)      124.24      (4.9%)    1.1% (  -8% -   11%) 0.479
            HighIntervalsOrdered        7.06      (5.1%)        7.16      (5.2%)    1.3% (  -8% -   12%) 0.426
               HighTermMonthSort      150.35      (9.1%)      153.91     (10.3%)    2.4% ( -15% -   23%) 0.441
                      TermDTSort      339.63      (5.1%)      348.20      (8.1%)    2.5% ( -10% -   16%) 0.238
            HighTermTitleBDVSort      222.02      (8.0%)      229.38     (12.8%)    3.3% ( -16% -   26%) 0.325
           HighTermDayOfYearSort      125.24      (7.6%)      129.96     (10.6%)    3.8% ( -13% -   23%) 0.197
       BrowseDayOfYearTaxoFacets       29.94     (34.1%)       31.45     (36.7%)    5.0% ( -48% -  114%) 0.653
            BrowseDateTaxoFacets       29.86     (34.2%)       31.38     (36.9%)    5.1% ( -49% -  115%) 0.652
           BrowseMonthTaxoFacets       28.21     (36.0%)       30.33     (39.6%)    7.5% ( -50% -  129%) 0.530
                       OrHighLow     1167.40      (3.3%)     1270.69      (5.0%)    8.8% (   0% -   17%) 0.000
            BrowseDateSSDVFacets        3.96     (36.7%)        4.33     (38.8%)    9.4% ( -48% -  134%) 0.429
     BrowseRandomLabelTaxoFacets       32.46     (52.6%)       35.65     (58.6%)    9.8% ( -66% -  255%) 0.576
                      OrHighHigh       44.52      (5.2%)       77.19     (13.2%)   73.4% (  52% -   96%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                   OrNotHighHigh     2582.82      (5.0%)     2422.92      (4.1%)   -6.2% ( -14% -    2%) 0.000
                    OrHighNotLow     1824.30      (4.0%)     1723.99      (4.4%)   -5.5% ( -13% -    2%) 0.000
                    OrHighNotMed     1887.09      (3.6%)     1791.22      (3.8%)   -5.1% ( -12% -    2%) 0.000
                   OrHighNotHigh     1595.90      (3.7%)     1518.30      (3.4%)   -4.9% ( -11% -    2%) 0.000
       BrowseDayOfYearSSDVFacets       27.93     (10.6%)       26.62     (11.7%)   -4.7% ( -24% -   19%) 0.184
                    OrNotHighMed     1870.56      (4.3%)     1802.13      (4.0%)   -3.7% ( -11% -    4%) 0.006
                        HighTerm     4189.00      (5.0%)     4046.35      (5.2%)   -3.4% ( -12% -    7%) 0.034
                         LowTerm     4064.46      (5.6%)     3960.30      (5.9%)   -2.6% ( -13% -    9%) 0.161
                         MedTerm     3216.56      (3.0%)     3137.93      (3.6%)   -2.4% (  -8% -    4%) 0.018
                    OrNotHighLow     1736.25      (4.3%)     1697.00      (4.5%)   -2.3% ( -10% -    6%) 0.102
                         Respell      125.82      (1.7%)      123.46      (2.6%)   -1.9% (  -6% -    2%) 0.007
                        PKLookup      327.57      (4.3%)      321.48      (6.0%)   -1.9% ( -11% -    8%) 0.260
                      TermDTSort      188.79      (9.1%)      185.37      (7.5%)   -1.8% ( -16% -   16%) 0.492
                     MedSpanNear       86.69      (6.5%)       85.26      (6.0%)   -1.7% ( -13% -   11%) 0.404
            MedTermDayTaxoFacets       92.56      (3.7%)       91.11      (4.5%)   -1.6% (  -9% -    6%) 0.229
                      AndHighLow     2061.69      (5.0%)     2031.71      (5.6%)   -1.5% ( -11% -    9%) 0.387
             MedIntervalsOrdered       85.82      (4.5%)       84.67      (4.0%)   -1.3% (  -9% -    7%) 0.321
                     LowSpanNear       87.98      (1.6%)       86.87      (2.2%)   -1.3% (  -4% -    2%) 0.039
             LowIntervalsOrdered      166.70      (4.5%)      164.63      (3.8%)   -1.2% (  -9% -    7%) 0.347
                      AndHighMed      370.30      (5.9%)      366.51      (4.5%)   -1.0% ( -10% -    9%) 0.535
         AndHighMedDayTaxoFacets      151.37      (2.2%)      149.86      (2.2%)   -1.0% (  -5% -    3%) 0.154
            BrowseDateSSDVFacets        4.25     (33.7%)        4.22     (33.3%)   -0.9% ( -50% -   99%) 0.935
                          Fuzzy1      155.00      (1.9%)      153.73      (1.2%)   -0.8% (  -3% -    2%) 0.100
                    HighSpanNear       55.22      (3.3%)       54.78      (2.3%)   -0.8% (  -6% -    5%) 0.378
                     AndHighHigh      239.75      (4.3%)      237.88      (4.2%)   -0.8% (  -8% -    8%) 0.564
        AndHighHighDayTaxoFacets       38.99      (1.6%)       38.72      (1.7%)   -0.7% (  -3% -    2%) 0.173
                       MedPhrase      518.45      (1.5%)      515.34      (2.2%)   -0.6% (  -4% -    3%) 0.314
                       LowPhrase      362.11      (1.7%)      359.95      (2.6%)   -0.6% (  -4% -    3%) 0.390
           BrowseMonthSSDVFacets       28.61      (9.0%)       28.47     (11.8%)   -0.5% ( -19% -   22%) 0.885
                         Prefix3      155.71      (9.5%)      154.99      (9.3%)   -0.5% ( -17% -   20%) 0.876
                      HighPhrase      244.45      (1.7%)      243.35      (2.0%)   -0.5% (  -4% -    3%) 0.445
                        Wildcard      108.83      (5.1%)      108.81      (4.4%)   -0.0% (  -9% -   10%) 0.991
                          IntNRQ      860.00      (1.9%)      861.19      (1.4%)    0.1% (  -3% -    3%) 0.792
                          Fuzzy2      118.03      (1.8%)      118.25      (1.6%)    0.2% (  -3% -    3%) 0.733
           BrowseMonthTaxoFacets       28.07     (36.3%)       28.17     (36.4%)    0.4% ( -53% -  114%) 0.975
                 MedSloppyPhrase      256.13      (2.5%)      257.19      (3.2%)    0.4% (  -5% -    6%) 0.645
                HighSloppyPhrase       33.15      (5.1%)       33.30      (5.9%)    0.4% (  -9% -   12%) 0.797
                 LowSloppyPhrase       22.96      (2.3%)       23.07      (2.5%)    0.5% (  -4% -    5%) 0.537
            HighIntervalsOrdered        2.52     (13.1%)        2.53     (12.9%)    0.5% ( -22% -   30%) 0.894
            HighTermTitleBDVSort      225.53      (9.1%)      227.07     (12.3%)    0.7% ( -18% -   24%) 0.842
               HighTermMonthSort       71.24      (8.3%)       72.02     (12.5%)    1.1% ( -18% -   23%) 0.745
     BrowseRandomLabelTaxoFacets       32.75     (52.5%)       33.25     (51.9%)    1.5% ( -67% -  222%) 0.927
          OrHighMedDayTaxoFacets       17.40      (9.7%)       17.67      (3.2%)    1.5% ( -10% -   15%) 0.502
           HighTermDayOfYearSort       90.52      (7.8%)       92.85     (10.5%)    2.6% ( -14% -   22%) 0.379
     BrowseRandomLabelSSDVFacets       20.34      (6.1%)       20.90     (10.1%)    2.7% ( -12% -   20%) 0.299
            BrowseDateTaxoFacets       29.99     (33.6%)       30.87     (34.1%)    2.9% ( -48% -  106%) 0.783
       BrowseDayOfYearTaxoFacets       30.09     (33.5%)       31.02     (34.1%)    3.1% ( -48% -  106%) 0.772
                      OrHighHigh       49.58      (5.5%)       52.95      (6.2%)    6.8% (  -4% -   19%) 0.000
                       OrHighLow     1157.99      (3.8%)     1278.02      (4.4%)   10.4% (   2% -   19%) 0.000
                       OrHighMed      148.53      (5.5%)      309.01      (8.7%)  108.0% (  88% -  129%) 0.000

It appears this implementation would bring a -4% performance impact to OrXNotY tasks in general.

zacharymorn · 2022-07-19T06:51:46Z

It appears this implementation would bring a -4% performance impact to OrXNotY tasks in general.

I limited the implementation to pure disjunctions here f4fdfea as well and it does seems to help:

wikimedium.10M.nostopwords.tasks results:

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
                    OrNotHighMed     1581.93      (2.4%)     1549.94      (3.3%)   -2.0% (  -7% -    3%) 0.027
                    OrHighNotMed     1991.40      (3.6%)     1957.40      (4.7%)   -1.7% (  -9% -    6%) 0.199
                   OrHighNotHigh     1785.23      (3.3%)     1756.53      (3.5%)   -1.6% (  -8% -    5%) 0.134
                   OrNotHighHigh     2021.35      (3.8%)     1997.89      (4.3%)   -1.2% (  -8% -    7%) 0.362
            BrowseDateSSDVFacets        4.64     (31.5%)        4.59     (30.3%)   -1.0% ( -47% -   88%) 0.922
                          IntNRQ      134.80      (0.3%)      133.52      (3.8%)   -0.9% (  -5% -    3%) 0.274
                    OrNotHighLow     2953.48      (5.5%)     2925.66      (4.9%)   -0.9% ( -10% -    9%) 0.566
                         MedTerm     3755.74      (4.3%)     3728.74      (4.9%)   -0.7% (  -9% -    8%) 0.623
                      AndHighLow     2170.32      (4.1%)     2154.98      (3.5%)   -0.7% (  -7% -    7%) 0.556
                       LowPhrase      213.41      (2.1%)      212.05      (1.8%)   -0.6% (  -4% -    3%) 0.312
                      AndHighMed      405.12      (4.3%)      402.86      (4.8%)   -0.6% (  -9% -    9%) 0.701
                        HighTerm     2262.86      (4.6%)     2252.96      (4.7%)   -0.4% (  -9% -    9%) 0.765
                    OrHighNotLow     1674.08      (3.8%)     1666.78      (5.0%)   -0.4% (  -8% -    8%) 0.755
                     MedSpanNear      185.05      (3.0%)      184.50      (3.1%)   -0.3% (  -6% -    6%) 0.762
       BrowseDayOfYearSSDVFacets       26.80     (12.2%)       26.73     (11.9%)   -0.3% ( -21% -   27%) 0.940
                       MedPhrase      250.33      (2.1%)      249.81      (2.3%)   -0.2% (  -4% -    4%) 0.767
                    HighSpanNear       58.57      (3.8%)       58.53      (4.1%)   -0.1% (  -7% -    8%) 0.958
         AndHighMedDayTaxoFacets       93.86      (1.9%)       93.82      (1.7%)   -0.1% (  -3% -    3%) 0.927
            HighIntervalsOrdered       14.41      (5.3%)       14.41      (5.8%)   -0.0% ( -10% -   11%) 0.984
                     LowSpanNear       56.31      (2.7%)       56.38      (2.4%)    0.1% (  -4% -    5%) 0.880
                      HighPhrase       52.42      (3.2%)       52.54      (2.8%)    0.2% (  -5% -    6%) 0.815
                     AndHighHigh      107.35      (3.7%)      107.65      (3.7%)    0.3% (  -6% -    7%) 0.812
             MedIntervalsOrdered       13.19      (2.3%)       13.24      (2.0%)    0.4% (  -3% -    4%) 0.584
                         LowTerm     3849.77      (3.4%)     3865.43      (3.4%)    0.4% (  -6% -    7%) 0.706
             LowIntervalsOrdered       12.28      (4.9%)       12.33      (5.4%)    0.4% (  -9% -   11%) 0.797
        AndHighHighDayTaxoFacets       22.30      (2.4%)       22.39      (2.3%)    0.4% (  -4% -    5%) 0.565
                         Prefix3      129.48      (6.0%)      130.23      (5.1%)    0.6% (  -9% -   12%) 0.745
               HighTermMonthSort      198.37      (6.9%)      199.63      (6.8%)    0.6% ( -12% -   15%) 0.768
                        PKLookup      321.51      (3.9%)      323.87      (4.8%)    0.7% (  -7% -    9%) 0.595
                 MedSloppyPhrase       91.15      (2.2%)       91.95      (2.2%)    0.9% (  -3% -    5%) 0.214
                         Respell       86.99      (2.1%)       87.84      (2.5%)    1.0% (  -3% -    5%) 0.174
                          Fuzzy1      118.73      (2.0%)      120.09      (2.1%)    1.1% (  -2% -    5%) 0.084
                          Fuzzy2       46.39      (2.2%)       46.92      (2.8%)    1.1% (  -3% -    6%) 0.153
                 LowSloppyPhrase       23.79      (2.4%)       24.08      (2.6%)    1.2% (  -3% -    6%) 0.122
                      TermDTSort      262.23      (6.6%)      265.58      (7.0%)    1.3% ( -11% -   15%) 0.552
           BrowseMonthSSDVFacets       29.37     (12.5%)       29.75     (13.7%)    1.3% ( -22% -   31%) 0.753
           HighTermDayOfYearSort      226.43      (9.4%)      229.75      (9.4%)    1.5% ( -15% -   22%) 0.622
                HighSloppyPhrase        7.13      (4.1%)        7.24      (3.7%)    1.6% (  -6% -    9%) 0.206
                        Wildcard       42.26      (5.8%)       42.93      (5.5%)    1.6% (  -9% -   13%) 0.372
     BrowseRandomLabelSSDVFacets       20.18      (9.5%)       20.56      (7.5%)    1.9% ( -13% -   20%) 0.488
            MedTermDayTaxoFacets       40.85      (5.1%)       41.71      (3.7%)    2.1% (  -6% -   11%) 0.137
            HighTermTitleBDVSort      174.36     (10.0%)      178.14     (13.7%)    2.2% ( -19% -   28%) 0.567
       BrowseDayOfYearTaxoFacets       26.72     (31.6%)       27.49     (30.0%)    2.9% ( -44% -   94%) 0.767
            BrowseDateTaxoFacets       26.61     (31.8%)       27.38     (30.0%)    2.9% ( -44% -   94%) 0.767
          OrHighMedDayTaxoFacets       20.56      (6.0%)       21.31      (4.4%)    3.7% (  -6% -   15%) 0.029
     BrowseRandomLabelTaxoFacets       27.45     (50.4%)       28.68     (53.6%)    4.5% ( -66% -  218%) 0.785
           BrowseMonthTaxoFacets       24.69     (29.3%)       26.90     (36.0%)    8.9% ( -43% -  105%) 0.390
                      OrHighHigh       33.33      (6.7%)       37.85      (6.1%)   13.6% (   0% -   28%) 0.000
                       OrHighMed      255.31      (5.8%)      341.88      (6.2%)   33.9% (  20% -   48%) 0.000
                       OrHighLow      565.31      (4.2%)      901.24      (9.6%)   59.4% (  43% -   76%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       38.64     (46.7%)       30.11     (37.6%)  -22.1% ( -72% -  116%) 0.100
       BrowseDayOfYearTaxoFacets       34.26     (31.9%)       29.08     (27.8%)  -15.1% ( -56% -   65%) 0.110
            BrowseDateTaxoFacets       34.17     (32.0%)       29.01     (27.9%)  -15.1% ( -56% -   65%) 0.112
           BrowseMonthTaxoFacets       33.00     (35.4%)       29.58     (32.3%)  -10.4% ( -57% -   88%) 0.334
            HighIntervalsOrdered        2.57     (12.2%)        2.38     (10.1%)   -7.2% ( -26% -   17%) 0.041
                       OrHighMed      216.31      (4.2%)      201.56      (2.2%)   -6.8% ( -12% -    0%) 0.000
            BrowseDateSSDVFacets        4.53     (35.6%)        4.28     (31.9%)   -5.4% ( -53% -   96%) 0.610
                        Wildcard      349.33      (3.9%)      334.56      (6.1%)   -4.2% ( -13% -    6%) 0.009
                         Prefix3     1000.00      (4.1%)      963.01      (7.0%)   -3.7% ( -14% -    7%) 0.041
                      OrHighHigh       51.06      (4.9%)       49.82      (3.5%)   -2.4% ( -10% -    6%) 0.073
                      AndHighLow     2009.67      (4.7%)     1965.68      (4.1%)   -2.2% ( -10% -    6%) 0.114
                    OrHighNotLow     2276.88      (4.0%)     2229.02      (4.5%)   -2.1% ( -10% -    6%) 0.119
                    OrHighNotMed     2248.93      (4.6%)     2204.54      (5.6%)   -2.0% ( -11% -    8%) 0.221
           HighTermDayOfYearSort      286.21      (9.1%)      280.72      (8.2%)   -1.9% ( -17% -   16%) 0.484
                   OrHighNotHigh     1863.00      (3.4%)     1831.75      (3.8%)   -1.7% (  -8% -    5%) 0.143
     BrowseRandomLabelSSDVFacets       20.44      (9.3%)       20.11      (8.0%)   -1.6% ( -17% -   17%) 0.563
            HighTermTitleBDVSort      162.15     (12.4%)      159.82     (12.1%)   -1.4% ( -23% -   26%) 0.710
                     LowSpanNear       34.19      (3.0%)       33.70      (1.9%)   -1.4% (  -6% -    3%) 0.068
                    HighSpanNear       18.03      (3.2%)       17.77      (2.0%)   -1.4% (  -6% -    3%) 0.098
                     MedSpanNear       29.32      (3.0%)       28.90      (1.8%)   -1.4% (  -6% -    3%) 0.072
                          Fuzzy1      160.70      (3.0%)      158.45      (2.8%)   -1.4% (  -7% -    4%) 0.127
                   OrNotHighHigh     1306.34      (3.8%)     1289.77      (4.3%)   -1.3% (  -8% -    7%) 0.320
                    OrNotHighMed     1336.74      (3.2%)     1320.05      (3.0%)   -1.2% (  -7% -    5%) 0.207
                         Respell      168.43      (3.4%)      166.55      (3.1%)   -1.1% (  -7% -    5%) 0.278
                    OrNotHighLow     1611.67      (3.7%)     1594.59      (3.6%)   -1.1% (  -8% -    6%) 0.357
                 LowSloppyPhrase       62.14      (3.0%)       61.64      (2.7%)   -0.8% (  -6% -    5%) 0.376
                HighSloppyPhrase       12.23      (4.2%)       12.13      (2.3%)   -0.8% (  -6% -    5%) 0.461
             MedIntervalsOrdered       28.67      (3.7%)       28.46      (3.6%)   -0.7% (  -7% -    6%) 0.525
             LowIntervalsOrdered       52.93      (4.2%)       52.54      (4.0%)   -0.7% (  -8% -    7%) 0.571
                          Fuzzy2      164.68      (3.3%)      163.55      (1.8%)   -0.7% (  -5% -    4%) 0.412
                       LowPhrase      819.81      (2.9%)      814.75      (3.2%)   -0.6% (  -6% -    5%) 0.522
                      HighPhrase      157.68      (1.8%)      156.76      (2.1%)   -0.6% (  -4% -    3%) 0.344
                     AndHighHigh      143.04      (2.6%)      142.24      (4.2%)   -0.6% (  -7% -    6%) 0.612
                 MedSloppyPhrase       55.49      (1.7%)       55.31      (2.7%)   -0.3% (  -4% -    4%) 0.641
                         MedTerm     3731.56      (3.5%)     3719.98      (5.0%)   -0.3% (  -8% -    8%) 0.821
                       MedPhrase       46.19      (1.1%)       46.07      (1.8%)   -0.3% (  -3% -    2%) 0.593
                        PKLookup      326.18      (3.5%)      325.80      (4.3%)   -0.1% (  -7% -    8%) 0.927
                      TermDTSort      274.95     (10.0%)      274.88      (9.4%)   -0.0% ( -17% -   21%) 0.993
                          IntNRQ      323.66      (1.0%)      323.99      (0.7%)    0.1% (  -1% -    1%) 0.696
                        HighTerm     2193.93      (3.6%)     2196.56      (4.7%)    0.1% (  -7% -    8%) 0.928
         AndHighMedDayTaxoFacets      169.03      (2.5%)      169.30      (1.8%)    0.2% (  -4% -    4%) 0.813
                      AndHighMed      281.92      (3.4%)      282.64      (5.4%)    0.3% (  -8% -    9%) 0.858
               HighTermMonthSort       75.99      (9.1%)       76.29     (10.7%)    0.4% ( -17% -   22%) 0.900
        AndHighHighDayTaxoFacets       43.31      (1.9%)       43.57      (1.5%)    0.6% (  -2% -    4%) 0.269
       BrowseDayOfYearSSDVFacets       28.63     (12.9%)       28.86     (11.5%)    0.8% ( -20% -   28%) 0.834
           BrowseMonthSSDVFacets       28.67     (13.7%)       28.95     (13.2%)    1.0% ( -22% -   32%) 0.818
                         LowTerm     3320.96      (3.9%)     3355.48      (4.7%)    1.0% (  -7% -   10%) 0.449
            MedTermDayTaxoFacets       39.04      (5.3%)       39.47      (3.9%)    1.1% (  -7% -   10%) 0.450
          OrHighMedDayTaxoFacets       19.95      (6.4%)       20.37      (5.5%)    2.1% (  -9% -   15%) 0.270
                       OrHighLow      252.14      (5.0%)      290.27      (4.7%)   15.1% (   5% -   26%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
            BrowseDateSSDVFacets        4.43     (30.3%)        3.81     (25.8%)  -14.0% ( -53% -   60%) 0.117
                    OrHighNotLow     1939.06      (4.5%)     1876.88      (4.0%)   -3.2% ( -11% -    5%) 0.016
                    OrNotHighLow     2210.28      (3.4%)     2140.00      (5.9%)   -3.2% ( -12% -    6%) 0.035
                      AndHighLow     1955.48      (4.4%)     1893.32      (6.4%)   -3.2% ( -13% -    8%) 0.068
                    OrHighNotMed     2267.50      (3.2%)     2195.43      (4.1%)   -3.2% ( -10% -    4%) 0.006
                   OrNotHighHigh     1407.52      (2.6%)     1365.59      (3.3%)   -3.0% (  -8% -    3%) 0.002
                   OrHighNotHigh     1546.78      (3.4%)     1503.65      (4.2%)   -2.8% ( -10% -    4%) 0.021
                         Prefix3      677.61      (6.7%)      659.15      (5.4%)   -2.7% ( -13% -   10%) 0.157
                    OrNotHighMed     1604.37      (2.3%)     1561.53      (3.4%)   -2.7% (  -8% -    3%) 0.004
           BrowseMonthSSDVFacets       29.07     (10.9%)       28.43      (9.5%)   -2.2% ( -20% -   20%) 0.497
                        Wildcard      100.16     (10.0%)       98.06     (10.1%)   -2.1% ( -20% -   20%) 0.512
                        HighTerm     3146.88      (3.8%)     3085.74      (3.6%)   -1.9% (  -8% -    5%) 0.096
            BrowseDateTaxoFacets       29.97     (29.5%)       29.41     (32.7%)   -1.9% ( -49% -   85%) 0.849
       BrowseDayOfYearTaxoFacets       30.05     (29.4%)       29.50     (32.6%)   -1.8% ( -49% -   85%) 0.853
     BrowseRandomLabelSSDVFacets       20.84      (6.7%)       20.46      (7.4%)   -1.8% ( -14% -   13%) 0.419
                      AndHighMed      389.73      (5.2%)      383.92      (4.1%)   -1.5% ( -10% -    8%) 0.317
                         MedTerm     3681.32      (3.6%)     3626.90      (3.7%)   -1.5% (  -8% -    6%) 0.203
          OrHighMedDayTaxoFacets       16.00      (5.6%)       15.80      (5.9%)   -1.3% ( -12% -   10%) 0.480
         AndHighMedDayTaxoFacets       64.14      (1.5%)       63.43      (2.3%)   -1.1% (  -4% -    2%) 0.074
                     AndHighHigh      111.43      (4.4%)      110.44      (3.7%)   -0.9% (  -8% -    7%) 0.489
        AndHighHighDayTaxoFacets       14.09      (3.0%)       13.97      (3.5%)   -0.8% (  -7% -    5%) 0.429
               HighTermMonthSort       98.04      (7.8%)       97.27      (6.9%)   -0.8% ( -14% -   15%) 0.736
                       LowPhrase      628.41      (2.1%)      623.71      (2.5%)   -0.7% (  -5% -    3%) 0.305
                    HighSpanNear       58.28      (3.5%)       57.90      (4.3%)   -0.7% (  -8% -    7%) 0.596
           HighTermDayOfYearSort      152.98      (4.8%)      152.19      (4.4%)   -0.5% (  -9% -    9%) 0.725
                      HighPhrase      575.47      (3.1%)      572.90      (4.3%)   -0.4% (  -7% -    7%) 0.707
                     MedSpanNear       49.30      (2.5%)       49.10      (2.8%)   -0.4% (  -5% -    4%) 0.623
                          Fuzzy2      119.60      (1.5%)      119.16      (1.4%)   -0.4% (  -3% -    2%) 0.427
                       MedPhrase      463.55      (2.7%)      461.86      (3.5%)   -0.4% (  -6% -    5%) 0.710
       BrowseDayOfYearSSDVFacets       27.63      (9.3%)       27.55     (12.6%)   -0.3% ( -20% -   23%) 0.932
                HighSloppyPhrase        7.13      (4.9%)        7.11      (4.3%)   -0.3% (  -9% -    9%) 0.844
                 LowSloppyPhrase      178.95      (4.5%)      178.56      (3.3%)   -0.2% (  -7% -    7%) 0.859
                          Fuzzy1      166.38      (1.0%)      166.11      (1.1%)   -0.2% (  -2% -    1%) 0.619
            MedTermDayTaxoFacets       53.00      (4.5%)       52.94      (4.4%)   -0.1% (  -8% -    9%) 0.936
                         Respell      135.17      (1.5%)      135.29      (1.3%)    0.1% (  -2% -    2%) 0.840
                 MedSloppyPhrase       36.21      (3.5%)       36.26      (2.8%)    0.1% (  -5% -    6%) 0.886
                          IntNRQ       91.35      (6.5%)       91.54      (6.5%)    0.2% ( -12% -   14%) 0.920
                        PKLookup      320.95      (4.4%)      322.26      (3.2%)    0.4% (  -6% -    8%) 0.736
                     LowSpanNear      102.75      (2.0%)      103.22      (1.8%)    0.5% (  -3% -    4%) 0.454
                      TermDTSort      340.77      (4.9%)      342.53      (5.5%)    0.5% (  -9% -   11%) 0.754
             LowIntervalsOrdered       38.71      (9.4%)       39.18      (9.0%)    1.2% ( -15% -   21%) 0.680
                         LowTerm     3586.21      (4.5%)     3631.70      (4.0%)    1.3% (  -6% -   10%) 0.346
             MedIntervalsOrdered      157.18     (11.6%)      159.21     (11.5%)    1.3% ( -19% -   27%) 0.724
            HighTermTitleBDVSort      191.23      (4.8%)      193.77     (11.0%)    1.3% ( -13% -   17%) 0.620
            HighIntervalsOrdered       17.26     (12.5%)       17.59     (12.6%)    1.9% ( -20% -   30%) 0.636
     BrowseRandomLabelTaxoFacets       30.66     (45.4%)       32.34     (56.8%)    5.5% ( -66% -  197%) 0.736
           BrowseMonthTaxoFacets       29.35     (35.1%)       31.01     (37.5%)    5.7% ( -49% -  120%) 0.623
                      OrHighHigh       38.24      (6.6%)       44.25      (4.4%)   15.7% (   4% -   28%) 0.000
                       OrHighMed      272.42      (6.1%)      334.13      (3.7%)   22.7% (  12% -   34%) 0.000
                       OrHighLow     1111.20      (3.3%)     1372.05      (6.0%)   23.5% (  13% -   33%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
           BrowseMonthTaxoFacets       32.94     (35.4%)       31.69     (33.8%)   -3.8% ( -53% -  101%) 0.728
                      AndHighLow     1589.29      (4.1%)     1535.38      (4.3%)   -3.4% ( -11% -    5%) 0.010
                    OrHighNotMed     2678.87      (4.2%)     2603.99      (4.1%)   -2.8% ( -10% -    5%) 0.033
                    OrNotHighLow     1651.24      (3.4%)     1610.11      (2.8%)   -2.5% (  -8% -    3%) 0.012
               HighTermMonthSort      155.29     (17.4%)      152.21      (8.1%)   -2.0% ( -23% -   28%) 0.644
                   OrHighNotHigh     1651.06      (3.8%)     1619.73      (2.9%)   -1.9% (  -8% -    4%) 0.076
                    OrNotHighMed     2001.69      (3.1%)     1966.78      (2.3%)   -1.7% (  -6% -    3%) 0.046
                   OrNotHighHigh     1297.60      (3.8%)     1276.32      (3.2%)   -1.6% (  -8% -    5%) 0.139
                    OrHighNotLow     1914.41      (4.3%)     1883.69      (3.8%)   -1.6% (  -9% -    6%) 0.213
     BrowseRandomLabelSSDVFacets       20.84      (7.0%)       20.53      (8.2%)   -1.5% ( -15% -   14%) 0.533
                      AndHighMed      258.39      (3.6%)      254.76      (4.2%)   -1.4% (  -8% -    6%) 0.257
                     AndHighHigh       84.49      (3.2%)       83.42      (3.9%)   -1.3% (  -8% -    6%) 0.264
         AndHighMedDayTaxoFacets      173.38      (1.8%)      171.78      (3.2%)   -0.9% (  -5% -    4%) 0.265
                      HighPhrase     1165.81      (2.4%)     1155.56      (1.9%)   -0.9% (  -5% -    3%) 0.207
                    HighSpanNear       50.60      (3.2%)       50.25      (2.2%)   -0.7% (  -5% -    4%) 0.414
                     MedSpanNear       86.31      (2.7%)       85.70      (2.2%)   -0.7% (  -5% -    4%) 0.368
                       LowPhrase     1004.54      (1.9%)      997.52      (3.0%)   -0.7% (  -5% -    4%) 0.380
                     LowSpanNear       71.35      (2.5%)       70.92      (2.6%)   -0.6% (  -5% -    4%) 0.453
       BrowseDayOfYearSSDVFacets       27.05      (7.6%)       26.90      (7.7%)   -0.5% ( -14% -   15%) 0.824
                          Fuzzy2       97.64      (2.0%)       97.19      (1.5%)   -0.5% (  -3% -    3%) 0.418
             MedIntervalsOrdered       11.73      (5.3%)       11.68      (4.7%)   -0.5% (  -9% -   10%) 0.774
                         MedTerm     4450.91      (3.8%)     4432.76      (3.3%)   -0.4% (  -7% -    6%) 0.716
            HighIntervalsOrdered        6.85      (6.5%)        6.82      (6.0%)   -0.4% ( -12% -   13%) 0.840
                         Respell       79.04      (2.1%)       78.76      (2.3%)   -0.4% (  -4% -    4%) 0.604
                        HighTerm     3020.69      (4.4%)     3010.41      (4.4%)   -0.3% (  -8% -    8%) 0.807
             LowIntervalsOrdered       16.52      (4.2%)       16.47      (3.7%)   -0.3% (  -7% -    7%) 0.806
        AndHighHighDayTaxoFacets       49.78      (1.2%)       49.64      (2.0%)   -0.3% (  -3% -    2%) 0.595
                       MedPhrase      154.84      (2.4%)      154.69      (2.5%)   -0.1% (  -4% -    4%) 0.900
                          Fuzzy1      111.34      (2.0%)      111.29      (1.7%)   -0.0% (  -3% -    3%) 0.934
                 LowSloppyPhrase       61.65      (2.0%)       61.68      (2.0%)    0.0% (  -3% -    4%) 0.949
                HighSloppyPhrase       21.74      (3.1%)       21.77      (3.0%)    0.1% (  -5% -    6%) 0.894
            MedTermDayTaxoFacets       62.75      (3.9%)       62.87      (4.6%)    0.2% (  -7% -    8%) 0.890
          OrHighMedDayTaxoFacets       15.52      (7.6%)       15.59      (9.4%)    0.4% ( -15% -   18%) 0.868
                        PKLookup      328.59      (3.1%)      330.10      (3.9%)    0.5% (  -6% -    7%) 0.679
                          IntNRQ      102.88     (10.3%)      103.47      (9.3%)    0.6% ( -17% -   22%) 0.854
           HighTermDayOfYearSort      262.99      (8.4%)      265.60      (9.2%)    1.0% ( -15% -   20%) 0.723
           BrowseMonthSSDVFacets       30.47     (12.9%)       30.88     (13.9%)    1.4% ( -22% -   32%) 0.748
                        Wildcard      165.19      (6.3%)      167.74      (5.1%)    1.5% (  -9% -   13%) 0.394
       BrowseDayOfYearTaxoFacets       30.16     (31.4%)       30.71     (34.7%)    1.8% ( -48% -   99%) 0.862
            BrowseDateTaxoFacets       30.06     (31.5%)       30.62     (34.7%)    1.9% ( -48% -   99%) 0.859
                 MedSloppyPhrase      201.68      (2.7%)      205.90      (3.7%)    2.1% (  -4% -    8%) 0.043
                         LowTerm     3010.88      (6.6%)     3085.71      (6.3%)    2.5% (  -9% -   16%) 0.224
            HighTermTitleBDVSort      276.19      (9.6%)      283.82      (9.4%)    2.8% ( -14% -   24%) 0.357
                         Prefix3      538.28      (7.9%)      553.48      (6.9%)    2.8% ( -11% -   19%) 0.228
                      TermDTSort      151.15     (12.6%)      155.61     (13.2%)    3.0% ( -20% -   32%) 0.470
     BrowseRandomLabelTaxoFacets       31.72     (48.5%)       33.27     (53.9%)    4.9% ( -65% -  208%) 0.763
            BrowseDateSSDVFacets        4.29     (28.0%)        4.58     (32.4%)    6.7% ( -41% -   93%) 0.481
                       OrHighMed       66.55      (4.5%)       71.34      (5.6%)    7.2% (  -2% -   18%) 0.000
                       OrHighLow     1047.83      (3.0%)     1331.03      (4.3%)   27.0% (  19% -   35%) 0.000
                      OrHighHigh       41.21      (4.0%)       66.06      (8.8%)   60.3% (  45% -   76%) 0.000

zacharymorn · 2022-07-19T07:39:21Z

Latest wikinightly results:

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
     BrowseRandomLabelTaxoFacets       33.93     (45.8%)       31.30     (42.6%)   -7.8% ( -65% -  148%) 0.579
       BrowseDayOfYearTaxoFacets       32.16     (32.2%)       30.75     (30.4%)   -4.4% ( -50% -   86%) 0.659
            BrowseDateTaxoFacets       32.06     (32.3%)       30.70     (30.5%)   -4.2% ( -50% -   86%) 0.670
           BrowseMonthTaxoFacets       30.50     (35.5%)       29.61     (32.4%)   -2.9% ( -52% -  100%) 0.785
       BrowseDayOfYearSSDVFacets       28.74     (12.2%)       28.22      (9.4%)   -1.8% ( -20% -   22%) 0.598
                  TermDateFacets       74.31      (3.6%)       73.08      (2.6%)   -1.7% (  -7% -    4%) 0.098
                        Wildcard      118.54      (4.7%)      116.74      (5.3%)   -1.5% ( -10% -    8%) 0.338
            MedTermDayTaxoFacets       83.35      (3.6%)       82.16      (2.7%)   -1.4% (  -7% -    5%) 0.159
               TermDayOfYearSort      143.35      (6.9%)      141.77      (5.4%)   -1.1% ( -12% -   11%) 0.571
                  TermBGroup1M1P       55.30      (8.4%)       54.71      (7.6%)   -1.1% ( -15% -   16%) 0.674
          OrHighMedDayTaxoFacets        7.55      (4.0%)        7.47      (3.7%)   -1.0% (  -8% -    7%) 0.397
                      TermDTSort      336.04      (4.7%)      332.86      (2.3%)   -0.9% (  -7% -    6%) 0.418
                    SloppyPhrase       96.28      (6.5%)       95.51      (5.9%)   -0.8% ( -12% -   12%) 0.686
                        PKLookup      332.42      (4.9%)      330.67      (5.9%)   -0.5% ( -10% -   10%) 0.760
                         Prefix3      470.45      (5.4%)      468.31      (7.1%)   -0.5% ( -12% -   12%) 0.820
        AndHighHighDayTaxoFacets        7.07      (3.4%)        7.04      (3.2%)   -0.4% (  -6% -    6%) 0.691
                         Respell      113.24      (2.4%)      112.80      (2.9%)   -0.4% (  -5% -    4%) 0.641
                            Term     2898.31      (3.3%)     2888.15      (3.5%)   -0.4% (  -6% -    6%) 0.744
                   TermTitleSort      356.75      (6.3%)      355.58      (5.7%)   -0.3% ( -11% -   12%) 0.863
                   TermMonthSort      273.22      (6.3%)      272.54      (5.7%)   -0.2% ( -11% -   12%) 0.896
                    TermGroup100       66.60      (4.2%)       66.45      (3.5%)   -0.2% (  -7% -    7%) 0.850
                          Fuzzy2      101.30      (1.8%)      101.17      (2.5%)   -0.1% (  -4% -    4%) 0.851
                    TermGroup10K       43.34      (3.7%)       43.28      (3.2%)   -0.1% (  -6% -    7%) 0.908
         AndHighMedDayTaxoFacets       39.86      (2.3%)       39.82      (2.5%)   -0.1% (  -4% -    4%) 0.897
                 AndHighOrMedMed       74.95      (4.6%)       75.07      (4.3%)    0.2% (  -8% -    9%) 0.910
                     TermGroup1M       41.04      (3.4%)       41.12      (3.1%)    0.2% (  -6% -    6%) 0.840
                    TermBGroup1M       52.88      (3.7%)       53.00      (3.3%)    0.2% (  -6% -    7%) 0.837
                     AndHighHigh       43.55      (2.8%)       43.68      (2.9%)    0.3% (  -5% -    6%) 0.752
                          Fuzzy1      134.20      (1.5%)      134.59      (2.5%)    0.3% (  -3% -    4%) 0.657
                          Phrase       54.51      (3.5%)       54.72      (3.4%)    0.4% (  -6% -    7%) 0.722
                      AndHighMed      187.17      (3.2%)      188.13      (4.0%)    0.5% (  -6% -    7%) 0.658
                AndMedOrHighHigh       90.65      (3.2%)       91.14      (4.2%)    0.5% (  -6% -    8%) 0.649
                        SpanNear       13.83      (1.3%)       13.92      (1.4%)    0.6% (  -2% -    3%) 0.140
                IntervalsOrdered        4.75      (3.7%)        4.82      (3.6%)    1.4% (  -5% -    9%) 0.232
           BrowseMonthSSDVFacets       28.45     (12.4%)       29.09     (11.1%)    2.2% ( -18% -   29%) 0.547
     BrowseRandomLabelSSDVFacets       19.87      (8.0%)       20.32      (7.2%)    2.2% ( -11% -   18%) 0.351
                          IntNRQ       86.49     (11.5%)       89.75      (8.0%)    3.8% ( -14% -   26%) 0.230
            BrowseDateSSDVFacets        4.10     (29.7%)        4.43     (31.0%)    8.1% ( -40% -   97%) 0.400
                      OrHighHigh       25.47      (4.5%)       37.72      (7.7%)   48.1% (  34% -   63%) 0.000
                       OrHighMed      123.39      (4.2%)      238.58      (8.2%)   93.4% (  77% -  110%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
            BrowseDateSSDVFacets        4.01     (32.1%)        3.54     (27.6%)  -11.7% ( -54% -   70%) 0.218
     BrowseRandomLabelSSDVFacets       20.51      (5.6%)       20.03      (8.3%)   -2.3% ( -15% -   12%) 0.298
       BrowseDayOfYearSSDVFacets       27.79      (7.9%)       27.28     (12.5%)   -1.8% ( -20% -   20%) 0.586
                AndMedOrHighHigh       97.89      (3.4%)       96.34      (4.2%)   -1.6% (  -8% -    6%) 0.193
                            Term     2973.05      (3.4%)     2928.04      (3.9%)   -1.5% (  -8% -    5%) 0.192
                 AndHighOrMedMed      116.31      (4.6%)      114.84      (5.3%)   -1.3% ( -10% -    9%) 0.420
                      TermDTSort      181.49      (6.4%)      179.67      (2.7%)   -1.0% (  -9% -    8%) 0.516
                          IntNRQ       86.10     (11.0%)       85.26     (11.3%)   -1.0% ( -20% -   23%) 0.784
         AndHighMedDayTaxoFacets       97.10      (3.4%)       96.41      (3.8%)   -0.7% (  -7% -    6%) 0.536
                     AndHighHigh       45.25      (3.2%)       44.95      (3.0%)   -0.7% (  -6% -    5%) 0.482
                          Phrase      235.12      (1.6%)      233.52      (1.6%)   -0.7% (  -3% -    2%) 0.185
           BrowseMonthTaxoFacets       31.18     (33.7%)       30.98     (32.7%)   -0.6% ( -50% -   99%) 0.951
                      AndHighMed      151.64      (3.5%)      150.76      (4.2%)   -0.6% (  -7% -    7%) 0.635
                        PKLookup      334.62      (3.2%)      332.91      (2.5%)   -0.5% (  -5% -    5%) 0.569
                        SpanNear      169.96      (2.7%)      169.29      (3.0%)   -0.4% (  -5% -    5%) 0.666
                IntervalsOrdered       10.71      (3.3%)       10.67      (3.9%)   -0.3% (  -7% -    7%) 0.763
                     TermGroup1M       30.78      (2.8%)       30.77      (3.7%)   -0.1% (  -6% -    6%) 0.961
                    SloppyPhrase        3.08      (2.9%)        3.08      (2.9%)    0.1% (  -5% -    6%) 0.936
                          Fuzzy1      165.92      (3.8%)      166.12      (2.6%)    0.1% (  -6% -    6%) 0.906
                        Wildcard      380.45      (5.5%)      380.95      (5.1%)    0.1% (  -9% -   11%) 0.938
                          Fuzzy2      124.51      (3.8%)      124.67      (3.0%)    0.1% (  -6% -    7%) 0.903
        AndHighHighDayTaxoFacets       48.61      (1.9%)       48.69      (2.7%)    0.2% (  -4% -    4%) 0.817
                    TermGroup10K       41.21      (3.1%)       41.30      (3.9%)    0.2% (  -6% -    7%) 0.853
            MedTermDayTaxoFacets       78.34      (3.7%)       78.53      (4.9%)    0.2% (  -8% -    9%) 0.860
                    TermBGroup1M       39.41      (3.2%)       39.55      (4.4%)    0.4% (  -7% -    8%) 0.760
                  TermDateFacets       48.53      (4.3%)       48.73      (5.6%)    0.4% (  -9% -   10%) 0.786
                         Prefix3       86.48      (6.9%)       87.05      (7.0%)    0.7% ( -12% -   15%) 0.765
          OrHighMedDayTaxoFacets       13.63      (5.6%)       13.74      (8.8%)    0.8% ( -12% -   16%) 0.739
                         Respell      114.04      (3.5%)      115.01      (2.8%)    0.9% (  -5% -    7%) 0.393
           BrowseMonthSSDVFacets       28.86      (8.2%)       29.13     (13.0%)    0.9% ( -18% -   24%) 0.785
                    TermGroup100       51.16      (3.4%)       51.87      (3.7%)    1.4% (  -5% -    8%) 0.212
               TermDayOfYearSort      337.45      (4.4%)      342.73      (6.1%)    1.6% (  -8% -   12%) 0.354
                  TermBGroup1M1P       53.96      (6.2%)       55.14      (7.8%)    2.2% ( -11% -   17%) 0.326
                   TermTitleSort      274.15      (5.1%)      280.79      (8.5%)    2.4% ( -10% -   16%) 0.273
                   TermMonthSort      274.34      (5.2%)      281.56      (8.6%)    2.6% ( -10% -   17%) 0.244
       BrowseDayOfYearTaxoFacets       28.20     (29.6%)       32.18     (38.2%)   14.1% ( -41% -  116%) 0.191
            BrowseDateTaxoFacets       28.12     (29.8%)       32.09     (38.0%)   14.1% ( -41% -  116%) 0.191
     BrowseRandomLabelTaxoFacets       28.70     (45.9%)       34.96     (57.5%)   21.8% ( -55% -  231%) 0.184
                      OrHighHigh       23.71      (5.6%)       29.52      (8.4%)   24.5% (   9% -   40%) 0.000
                       OrHighMed       94.94      (5.7%)      202.03     (12.4%)  112.8% (  89% -  138%) 0.000

                            TaskQPS baseline      StdDevQPS my_modified_version      StdDev                Pct diff p-value
           BrowseMonthTaxoFacets       30.37     (34.3%)       27.82     (28.7%)   -8.4% ( -53% -   83%) 0.403
            BrowseDateSSDVFacets        4.43     (24.2%)        4.22     (24.5%)   -4.9% ( -43% -   57%) 0.527
     BrowseRandomLabelTaxoFacets       30.71     (47.3%)       30.00     (43.4%)   -2.3% ( -63% -  167%) 0.872
                   TermTitleSort      359.13      (5.5%)      351.57      (3.0%)   -2.1% ( -10% -    6%) 0.135
                   TermMonthSort      275.12      (5.6%)      269.40      (3.2%)   -2.1% ( -10% -    7%) 0.148
               TermDayOfYearSort      147.37      (8.1%)      145.09      (7.1%)   -1.5% ( -15% -   14%) 0.521
          OrHighMedDayTaxoFacets       17.50      (6.5%)       17.23      (7.8%)   -1.5% ( -14% -   13%) 0.503
                      TermDTSort      342.08      (5.9%)      336.94      (3.0%)   -1.5% (  -9% -    7%) 0.312
                 AndHighOrMedMed      124.08      (4.7%)      122.67      (4.9%)   -1.1% ( -10% -    8%) 0.456
                  TermDateFacets       57.55      (3.3%)       57.01      (4.0%)   -0.9% (  -7% -    6%) 0.418
            MedTermDayTaxoFacets       76.93      (3.0%)       76.33      (3.9%)   -0.8% (  -7% -    6%) 0.478
        AndHighHighDayTaxoFacets       12.40      (2.6%)       12.31      (2.7%)   -0.7% (  -5% -    4%) 0.417
                    TermGroup100       67.52      (3.5%)       67.10      (4.0%)   -0.6% (  -7% -    7%) 0.600
                     AndHighHigh      102.82      (3.2%)      102.22      (4.5%)   -0.6% (  -8% -    7%) 0.637
                  TermBGroup1M1P       63.36      (5.1%)       63.01      (6.1%)   -0.5% ( -11% -   11%) 0.758
                AndMedOrHighHigh       93.90      (4.9%)       93.40      (4.2%)   -0.5% (  -9% -    8%) 0.710
                IntervalsOrdered       23.51      (3.8%)       23.39      (4.1%)   -0.5% (  -8% -    7%) 0.691
                          Fuzzy1      144.65      (2.6%)      144.10      (1.9%)   -0.4% (  -4% -    4%) 0.607
                        PKLookup      333.86      (4.2%)      332.67      (4.5%)   -0.4% (  -8% -    8%) 0.798
                    TermGroup10K       29.40      (2.8%)       29.30      (3.5%)   -0.3% (  -6% -    6%) 0.727
                          Fuzzy2      101.53      (2.7%)      101.21      (1.6%)   -0.3% (  -4% -    4%) 0.644
                        SpanNear      169.28      (2.5%)      168.87      (1.7%)   -0.2% (  -4% -    4%) 0.726
                    TermBGroup1M       48.12      (3.0%)       48.01      (3.9%)   -0.2% (  -6% -    6%) 0.837
                         Respell       97.43      (2.4%)       97.25      (1.8%)   -0.2% (  -4% -    4%) 0.780
                     TermGroup1M       28.53      (2.8%)       28.49      (3.4%)   -0.2% (  -6% -    6%) 0.878
                      AndHighMed      147.85      (4.3%)      147.86      (5.4%)    0.0% (  -9% -   10%) 0.996
                          IntNRQ      109.94      (0.4%)      109.99      (0.3%)    0.1% (   0% -    0%) 0.670
     BrowseRandomLabelSSDVFacets       21.13      (8.8%)       21.14      (6.0%)    0.1% ( -13% -   16%) 0.980
                            Term     3064.11      (3.3%)     3070.26      (3.4%)    0.2% (  -6% -    7%) 0.851
       BrowseDayOfYearTaxoFacets       29.84     (32.2%)       29.90     (30.1%)    0.2% ( -46% -   92%) 0.983
            BrowseDateTaxoFacets       29.74     (32.2%)       29.81     (30.2%)    0.2% ( -47% -   92%) 0.981
                          Phrase       38.99      (2.3%)       39.24      (2.3%)    0.6% (  -3% -    5%) 0.366
                    SloppyPhrase        7.47      (3.3%)        7.54      (2.6%)    0.9% (  -4% -    7%) 0.323
                         Prefix3       88.11      (6.5%)       89.06      (5.3%)    1.1% ( -10% -   13%) 0.569
         AndHighMedDayTaxoFacets      207.09      (1.4%)      209.48      (1.9%)    1.2% (  -2% -    4%) 0.029
       BrowseDayOfYearSSDVFacets       26.84      (9.0%)       27.25      (7.5%)    1.6% ( -13% -   19%) 0.551
           BrowseMonthSSDVFacets       28.82     (11.4%)       29.29     (10.0%)    1.6% ( -17% -   25%) 0.636
                        Wildcard      382.86      (5.8%)      389.05      (4.4%)    1.6% (  -8% -   12%) 0.321
                      OrHighHigh       23.47      (6.4%)       28.73      (4.3%)   22.4% (  11% -   35%) 0.000
                       OrHighMed      123.52      (6.6%)      237.11      (4.7%)   92.0% (  75% -  110%) 0.000

zacharymorn · 2022-07-19T07:41:02Z

Thanks @jpountz for the feedback and approval!

jpountz · 2022-07-19T07:51:55Z

Sure, thanks for doing all this work!

jpountz · 2022-07-19T21:35:43Z

Let's merge this PR to have it in 9.3 and resolve LUCENE-10480?

zacharymorn · 2022-07-20T01:59:12Z

Let's merge this PR to have it in 9.3 and resolve LUCENE-10480?

Sure sounds good!

…junctions (apache#1018) (cherry picked from commit 28ce8ab)

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level dis…

02c0801

…junctions

zacharymorn requested a review from jpountz July 13, 2022 04:38

jpountz reviewed Jul 15, 2022

View reviewed changes

zacharymorn requested a review from jpountz July 16, 2022 06:44

jpountz reviewed Jul 16, 2022

View reviewed changes

Incorporate feedback to simplify logic

bd04c1d

Update tests

27ec359

zacharymorn requested a review from jpountz July 18, 2022 05:05

jpountz reviewed Jul 18, 2022

View reviewed changes

Address feedback on advancing

dc75985

limit bmm bulk scorer to pure disjunctions (excluding OrXNotY)

f4fdfea

jpountz approved these changes Jul 19, 2022

View reviewed changes

zacharymorn merged commit 28ce8ab into apache:main Jul 20, 2022

zacharymorn added a commit to zacharymorn/lucene that referenced this pull request Jul 20, 2022

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level dis…

c4ce10d

…junctions (apache#1018) (cherry picked from commit 28ce8ab)

zacharymorn mentioned this pull request Jul 20, 2022

LUCENE-10480: (Backporting) Use BulkScorer to limit BMMScorer to only top-level disjunctions #1037

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level disjunctions #1018

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level disjunctions #1018

zacharymorn commented Jul 13, 2022 •

edited

Loading

zacharymorn commented Jul 13, 2022

jpountz Jul 15, 2022

zacharymorn Jul 16, 2022

jpountz Jul 16, 2022

jpountz Jul 16, 2022

zacharymorn Jul 17, 2022

jpountz left a comment

jpountz Jul 16, 2022

zacharymorn Jul 17, 2022

jpountz Jul 16, 2022

zacharymorn Jul 17, 2022

jpountz Jul 16, 2022

jpountz Jul 16, 2022

zacharymorn Jul 17, 2022

zacharymorn commented Jul 17, 2022

zacharymorn commented Jul 17, 2022

zacharymorn commented Jul 17, 2022 •

edited

Loading

zacharymorn commented Jul 18, 2022

jpountz left a comment

jpountz Jul 18, 2022

zacharymorn Jul 18, 2022

jpountz Jul 18, 2022

zacharymorn Jul 19, 2022

jpountz Jul 18, 2022

zacharymorn Jul 19, 2022

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

jpountz commented Jul 19, 2022

jpountz commented Jul 19, 2022

zacharymorn commented Jul 20, 2022

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level disjunctions #1018

LUCENE-10480: Use BulkScorer to limit BMMScorer to only top-level disjunctions #1018

Conversation

zacharymorn commented Jul 13, 2022 • edited Loading

Description (or a Jira issue link if you have one)

zacharymorn commented Jul 13, 2022

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

jpountz left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

zacharymorn commented Jul 17, 2022

zacharymorn commented Jul 17, 2022

zacharymorn commented Jul 17, 2022 • edited Loading

zacharymorn commented Jul 18, 2022

jpountz left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

zacharymorn commented Jul 19, 2022

jpountz commented Jul 19, 2022

jpountz commented Jul 19, 2022

zacharymorn commented Jul 20, 2022

zacharymorn commented Jul 13, 2022 •

edited

Loading

zacharymorn commented Jul 17, 2022 •

edited

Loading