cockroachdb
diff --git a/‎pkg/util/admission/cpu_time_token_filler.go‎
Lines changed: 447 additions & 47 deletions b/‎pkg/util/admission/cpu_time_token_filler.go‎
Lines changed: 447 additions & 47 deletions
diff --git a/‎pkg/util/admission/cpu_time_token_filler_test.go‎
Lines changed: 288 additions & 16 deletions b/‎pkg/util/admission/cpu_time_token_filler_test.go‎
Lines changed: 288 additions & 16 deletions
@@ -6,16 +6,20 @@
 package admission
 
 import (
+	"context"
 	"fmt"
+	"math"
 	"strings"
 	"testing"
 	"time"
 
+	"github.com/cockroachdb/cockroach/pkg/settings/cluster"
 	"github.com/cockroachdb/cockroach/pkg/testutils/datapathutils"
 	"github.com/cockroachdb/cockroach/pkg/util/leaktest"
 	"github.com/cockroachdb/cockroach/pkg/util/log"
 	"github.com/cockroachdb/cockroach/pkg/util/timeutil"
 	"github.com/cockroachdb/datadriven"
+	"github.com/stretchr/testify/require"
 )
 
 func TestCPUTimeTokenFiller(t *testing.T) {
@@ -68,6 +72,8 @@ type testTokenAllocator struct {
 	buf *strings.Builder
 }
 
+func (m *testTokenAllocator) init() {}
+
 func (a *testTokenAllocator) resetInterval() {
 	fmt.Fprintf(a.buf, "resetInterval()\n")
 }
@@ -76,6 +82,31 @@ func (a *testTokenAllocator) allocateTokens(remainingTicks int64) {
 	fmt.Fprintf(a.buf, "allocateTokens(%d)\n", remainingTicks)
 }
 
+type testModel struct {
+	buf   *strings.Builder
+	rates rates
+}
+
+func (m *testModel) init() {}
+
+func (m *testModel) fit(targets targetUtilizations) rates {
+	// targets uses float64, which when written to golden file can lead to
+	// test reproducibility issues. Here, we multiply by 100 & then round to
+	// the nearest integer.
+	round := func(x float64) int {
+		scaled := x * 100
+		return int(math.Round(scaled))
+	}
+	fmt.Fprint(m.buf, "fit(\n")
+	for tier := int(numResourceTiers - 1); tier >= 0; tier-- {
+		for qual := int(numBurstQualifications - 1); qual >= 0; qual-- {
+			fmt.Fprintf(m.buf, "\ttier%d %s -> %v%%\n", tier, burstQualification(qual).String(), round(targets[tier][qual]))
+		}
+	}
+	fmt.Fprint(m.buf, ")\n")
+	return m.rates
+}
+
 func TestCPUTimeTokenAllocator(t *testing.T) {
 	defer leaktest.AfterTest(t)()
 	defer log.Scope(t).Close(t)
@@ -101,43 +132,284 @@ func TestCPUTimeTokenAllocator(t *testing.T) {
 	granter.requester[testTier0] = requesters[testTier0]
 	granter.requester[testTier1] = requesters[testTier1]
 
-	allocator := cpuTimeTokenAllocator{
-		granter: granter,
-	}
-	allocator.rates[testTier0][canBurst] = 5
-	allocator.rates[testTier0][noBurst] = 4
-	allocator.rates[testTier1][canBurst] = 3
-	allocator.rates[testTier1][noBurst] = 2
-	allocator.bucketCapacity = allocator.rates
-
 	var buf strings.Builder
-	flushAndReset := func(printGranter bool) string {
-		if printGranter {
-			fmt.Fprint(&buf, granter.String())
-		}
+	flushAndReset := func() string {
+		fmt.Fprint(&buf, granter.String())
 		str := buf.String()
 		buf.Reset()
 		return str
 	}
 
+	model := &testModel{buf: &buf}
+	model.rates[testTier0][canBurst] = 5
+	model.rates[testTier0][noBurst] = 4
+	model.rates[testTier1][canBurst] = 3
+	model.rates[testTier1][noBurst] = 2
+	allocator := cpuTimeTokenAllocator{
+		granter:  granter,
+		settings: cluster.MakeClusterSettings(),
+		model:    model,
+	}
+
 	datadriven.RunTest(t, datapathutils.TestDataPath(t, "cpu_time_token_allocator"), func(t *testing.T, d *datadriven.TestData) string {
 		switch d.Cmd {
 		case "resetInterval":
+			var increaseRatesBy int64
+			d.MaybeScanArgs(t, "increase_rates_by", &increaseRatesBy)
+			if increaseRatesBy != 0 {
+				model.rates[testTier0][canBurst] += increaseRatesBy
+				model.rates[testTier0][noBurst] += increaseRatesBy
+				model.rates[testTier1][canBurst] += increaseRatesBy
+				model.rates[testTier1][noBurst] += increaseRatesBy
+			}
 			allocator.resetInterval()
-			return flushAndReset(false /* printGranter */)
+			return flushAndReset()
 		case "allocate":
 			var remainingTicks int64
 			d.ScanArgs(t, "remaining", &remainingTicks)
 			allocator.allocateTokens(remainingTicks)
-			return flushAndReset(true /* printGranter */)
+			return flushAndReset()
 		case "clear":
 			granter.mu.buckets[testTier0][canBurst].tokens = 0
 			granter.mu.buckets[testTier0][noBurst].tokens = 0
 			granter.mu.buckets[testTier1][canBurst].tokens = 0
 			granter.mu.buckets[testTier1][noBurst].tokens = 0
-			return flushAndReset(true /* printGranter */)
+			return flushAndReset()
+		case "setClusterSettings":
+			ctx := context.Background()
+			var override float64
+			if d.MaybeScanArgs(t, "app", &override) {
+				fmt.Fprintf(&buf, "SET CLUSTER SETTING admission.cpu_time_tokens.target_util.app_tenant = %v\n", override)
+				KVCPUTimeAppUtilGoal.Override(ctx, &allocator.settings.SV, override)
+			}
+			if d.MaybeScanArgs(t, "system", &override) {
+				fmt.Fprintf(&buf, "SET CLUSTER SETTING admission.cpu_time_tokens.target_util.system_tenant = %v\n", override)
+				KVCPUTimeSystemUtilGoal.Override(ctx, &allocator.settings.SV, override)
+			}
+			if d.MaybeScanArgs(t, "burst", &override) {
+				fmt.Fprintf(&buf, "SET CLUSTER SETTING admission.cpu_time_tokens.target_util.burst_delta = %v\n", override)
+				KVCPUTimeUtilBurstDelta.Override(ctx, &allocator.settings.SV, override)
+			}
+			return flushAndReset()
 		default:
 			return fmt.Sprintf("unknown command: %s", d.Cmd)
 		}
 	})
 }
+
+func TestCPUTimeTokenLinearModel(t *testing.T) {
+	defer leaktest.AfterTest(t)()
+	defer log.Scope(t).Close(t)
+
+	unixNanos := int64(1758938600000000000) // 2025-09-24T14:30:00Z
+	testTime := timeutil.NewManualTime(time.Unix(0, unixNanos).UTC())
+	model := cpuTimeTokenLinearModel{
+		timeSource:               testTime,
+		lastFitTime:              testTime.Now(),
+		totalCPUTimeMillis:       0,
+		tokenToCPUTimeMultiplier: 1,
+	}
+	tokenCPUTime := &testTokenUsageTracker{}
+	model.granter = tokenCPUTime
+	actualCPUTime := &testCPUMetricProvider{
+		capacity: 10,
+	}
+	model.cpuMetricProvider = actualCPUTime
+
+	dur := 5 * time.Second
+	actualCPUTime.append(dur.Nanoseconds(), 1) // appended value ignored by init
+
+	var targets targetUtilizations
+	targets[testTier1][noBurst] = 0.8
+	targets[testTier1][canBurst] = 0.85
+	targets[testTier0][noBurst] = 0.9
+	targets[testTier0][canBurst] = 0.95
+
+	// The first call to fit inits the model, by setting tokenToCPUTimeMultiplier
+	// to one, since in prod on the first call to fit, there will be no CPU
+	// usage data to use to determine tokenToCPUTimeMultiplier.
+	refillRates := model.fit(targets)
+	require.Equal(t, float64(1), model.tokenToCPUTimeMultiplier)
+	// Given that tokenToCPUTimeMultiplier equals one, refillRates is equal
+	// to target utilization for the bucket * the vCPU count (10 vCPUs in this
+	// test). The unit of refillRates is nanoseconds.
+	//
+	// 80% util -> 10 vCPUs * .8 * 1s = 8s
+	require.Equal(t, int64(8000000000), refillRates[testTier1][noBurst])
+	// 85% util -> 10 vCPUs * .85 * 1s = 8.5s
+	require.Equal(t, int64(8500000000), refillRates[testTier1][canBurst])
+	// 90% util -> 10 vCPUs * .9 * 1s = 9s
+	require.Equal(t, int64(9000000000), refillRates[testTier0][noBurst])
+	// 95% util -> 10 vCPUs * .95 * 1s = 9.5s
+	require.Equal(t, int64(9500000000), refillRates[testTier0][canBurst])
+
+	// Below tests are of the computation of tokenToCPUTimeMultiplier only. The
+	// computation of tokenToCPUTimeMultiplier involves state stored on the model,
+	// since the model does exponential smoothing. The computation of refillRates
+	// (given a fixed tokenToCPUTimeMultiplier) is simpler: It is a pure function,
+	// described up above in the test case of the first call to fit. So here we
+	// focus on tokenToCPUTimeMultiplier.
+	//
+	// 2x
+	// Token time is half of actual time, so tokenToCPUTimeMultiplier is two.
+	// 100 data points are appended, to give the filter time to converge on two.
+	tokenCPUTime.append(dur.Nanoseconds()/2, 100)
+	actualCPUTime.append(dur.Milliseconds(), 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	tolerance := 0.01
+	require.InDelta(t, 2, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// 4x
+	// Token time is one fourth of actual time, so tokenToCPUTimeMultiplier is
+	// four.
+	tokenCPUTime.append(dur.Nanoseconds()/2, 100)
+	actualCPUTime.append(dur.Milliseconds()*2, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 4, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// 1x
+	// Token time is one equal to actual time, so tokenToCPUTimeMultiplier is one.
+	tokenCPUTime.append(dur.Nanoseconds()*2, 100)
+	actualCPUTime.append(dur.Milliseconds()*2, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 1, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// 20x
+	// tokenToCPUTimeMultiplier should be 40, based on the data, but the model caps
+	// tokenToCPUTimeMultiplier at 20.
+	tokenCPUTime.append(dur.Nanoseconds(), 100)
+	actualCPUTime.append(dur.Milliseconds()*40, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 20, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// 1x
+	// tokenToCPUTimeMultiplier should be 0.5, based on the data, but the model caps
+	// tokenToCPUTimeMultiplier at 1.
+	tokenCPUTime.append(dur.Nanoseconds()*2, 100)
+	actualCPUTime.append(dur.Milliseconds(), 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 1, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// 2x
+	// Token time is half of actual time, so tokenToCPUTimeMultiplier is two.
+	tokenCPUTime.append(dur.Nanoseconds(), 100)
+	actualCPUTime.append(dur.Milliseconds()*2, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 2, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// Below tests are of the low CPU logic. See the comments in fit for a full
+	// explanation of the logic & especially the rationale for the logic. TLDR:
+	// if CPU is less than 25%, and if tokenToCPUTimeMultiplier is less 3.6,
+	// tokenToCPUTimeMultiplier is left alone. If tokenToCPUTimeMultiplier is
+	// greater than 3.6, tokenToCPUTimeMultiplier is divided by 1.5 until it is
+	// <= 3.6.
+	//
+	// vCPU count is 10. dur /.5 = 1s. 1s / 10s = 0.1 < 0.25. So low CPU mode
+	// should be activated.
+	//
+	// Leave existing tokenToCPUTimeMultiplier multiplier as is, since 2 <= 3.6.
+	tokenCPUTime.append(dur.Nanoseconds()/5, 100)
+	actualCPUTime.append(dur.Milliseconds()/5, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 2, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// Leave low vCPU mode, in order to set tokenToCPUTimeMultiplier equal to 20,
+	// which is set up for the next test case.
+	tokenCPUTime.append(dur.Nanoseconds(), 100)
+	actualCPUTime.append(dur.Milliseconds()*100, 100)
+	for i := 0; i < 100; i++ {
+		testTime.Advance(time.Second)
+		_ = model.fit(targets)
+	}
+	require.InDelta(t, 20, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// Iteratively reduce to 3.6x, since low CPU mode, and
+	// tokenToCPUTimeMultiplier = 20 > 3.6.
+	tokenCPUTime.append(dur.Nanoseconds()/5, 100)
+	actualCPUTime.append(dur.Milliseconds()/5, 100)
+	{
+		lastMult := model.tokenToCPUTimeMultiplier
+		for i := 0; ; i++ {
+			require.Less(t, i, 100)
+			testTime.Advance(time.Second)
+			refillRates = model.fit(targets)
+			mult := model.tokenToCPUTimeMultiplier
+			if mult == lastMult {
+				break
+			}
+			require.Less(t, mult, lastMult)
+			lastMult = mult
+		}
+	}
+	require.InDelta(t, 3.6, model.tokenToCPUTimeMultiplier, tolerance)
+
+	// Check refillRates again, this time with tokenToCPUTimeMultiplier
+	// equal to 3.6 instead of one.
+
+	// 80% -> 10 vCPUs * .8 * 1s = 8s -> 8s / 3.6 ~= 2.22222222s
+	require.Equal(t, int64(2222222222), refillRates[testTier1][noBurst])
+	// 85% -> 10 vCPUs * .85 * 1s = 8.5s -> 8.5s / 3.6 ~= 2.36111111s
+	require.Equal(t, int64(2361111111), refillRates[testTier1][canBurst])
+	// 90% -> 10 vCPUs * .9 * 1s = 9s -> 9s / 3.6 ~= 2.5s
+	require.Equal(t, int64(2500000000), refillRates[testTier0][noBurst])
+	// 95% -> 10 vCPUs * .95 * 1s = 9.5s -> 9.5s / 3.6 ~= 2.63888889
+	require.Equal(t, int64(2638888888), refillRates[testTier0][canBurst])
+}
+
+type testTokenUsageTracker struct {
+	i          int
+	tokensUsed []int64
+}
+
+func (t *testTokenUsageTracker) append(tokens int64, count int) {
+	for i := 0; i < count; i++ {
+		t.tokensUsed = append(t.tokensUsed, tokens)
+	}
+}
+
+func (t *testTokenUsageTracker) resetTokensUsedInInterval() int64 {
+	ret := t.tokensUsed[t.i]
+	t.i++
+	return ret
+}
+
+type testCPUMetricProvider struct {
+	i        int
+	cum      int64
+	millis   []int64
+	capacity float64
+}
+
+func (m *testCPUMetricProvider) GetCPUInfo() (int64, float64) {
+	cycle := m.millis[m.i]
+	m.i++
+	m.cum += cycle
+	return m.cum, m.capacity
+}
+
+func (t *testCPUMetricProvider) append(millis int64, count int) {
+	for i := 0; i < count; i++ {
+		t.millis = append(t.millis, millis)
+	}
+}