AI
/
claude-code-hub
oglindă de https://github.com/ding113/claude-code-hub.git


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273
							import { describe, expect, test } from "vitest";
import {
  calculateRequestCost,
  calculateRequestCostBreakdown,
  matchLongContextPricing,
  type CostBreakdown,
} from "@/lib/utils/cost-calculation";
import type { ModelPriceData } from "@/types/model-price";

function makePriceData(overrides: Partial<ModelPriceData> = {}): ModelPriceData {
  return {
    input_cost_per_token: 0.000003, // $3/MTok
    output_cost_per_token: 0.000015, // $15/MTok
    cache_creation_input_token_cost: 0.00000375, // 1.25x input
    cache_read_input_token_cost: 0.0000003, // 0.1x input
    ...overrides,
  };
}

describe("calculateRequestCostBreakdown", () => {
  test("basic input + output tokens", () => {
    const result = calculateRequestCostBreakdown(
      { input_tokens: 1000, output_tokens: 500 },
      makePriceData()
    );

    expect(result.input).toBeCloseTo(0.003, 6); // 1000 * 0.000003
    expect(result.output).toBeCloseTo(0.0075, 6); // 500 * 0.000015
    expect(result.cache_creation).toBe(0);
    expect(result.cache_read).toBe(0);
    expect(result.total).toBeCloseTo(0.0105, 6);
  });

  test("cache creation (5m + 1h) + cache read", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 100,
        output_tokens: 50,
        cache_creation_5m_input_tokens: 200,
        cache_creation_1h_input_tokens: 300,
        cache_read_input_tokens: 1000,
      },
      makePriceData({
        cache_creation_input_token_cost_above_1hr: 0.000006, // 2x input
      })
    );

    // cache_creation = 200 * 0.00000375 + 300 * 0.000006
    expect(result.cache_creation).toBeCloseTo(0.00255, 6);
    // cache_read = 1000 * 0.0000003
    expect(result.cache_read).toBeCloseTo(0.0003, 6);
    expect(result.total).toBeCloseTo(
      result.input + result.output + result.cache_creation + result.cache_read,
      10
    );
  });

  test("image tokens go to input/output buckets", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 100,
        output_tokens: 50,
        input_image_tokens: 500,
        output_image_tokens: 200,
      },
      makePriceData({
        input_cost_per_image_token: 0.00001,
        output_cost_per_image_token: 0.00005,
      })
    );

    // input = 100 * 0.000003 + 500 * 0.00001
    expect(result.input).toBeCloseTo(0.0053, 6);
    // output = 50 * 0.000015 + 200 * 0.00005
    expect(result.output).toBeCloseTo(0.01075, 6);
  });

  test("tiered pricing with context1mApplied", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 300000, // crosses 200k threshold
        output_tokens: 100,
      },
      makePriceData(),
      true // context1mApplied
    );

    // input: 300000 * 0.000003 * 2.0 = 1.8 (all tokens at premium when context > 200K)
    expect(result.input).toBeCloseTo(1.8, 4);
    // output: 100 * 0.000015 * 1.5 = 0.00225 (output also at premium when context > 200K)
    expect(result.output).toBeCloseTo(0.00225, 6);
  });

  test("200k tier pricing (Gemini style)", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 300000, // crosses 200k threshold
        output_tokens: 100,
      },
      makePriceData({
        input_cost_per_token_above_200k_tokens: 0.000006, // 2x base for >200k
      })
    );

    // input: 300000 * 0.000006 = 1.8 (all tokens at above-200k rate when context > 200K)
    expect(result.input).toBeCloseTo(1.8, 4);
  });

  test("uses priority long-context pricing fields in breakdown when available", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 272001,
        output_tokens: 2,
        cache_read_input_tokens: 10,
      },
      makePriceData({
        mode: "responses",
        model_family: "gpt",
        input_cost_per_token_priority: 2,
        output_cost_per_token_priority: 20,
        cache_read_input_token_cost_priority: 0.2,
        input_cost_per_token_above_272k_tokens: 5,
        output_cost_per_token_above_272k_tokens: 50,
        cache_read_input_token_cost_above_272k_tokens: 0.5,
        input_cost_per_token_above_272k_tokens_priority: 7,
        output_cost_per_token_above_272k_tokens_priority: 70,
        cache_read_input_token_cost_above_272k_tokens_priority: 0.7,
      }),
      false,
      true
    );

    expect(result.input).toBe(1904007);
    expect(result.output).toBe(140);
    expect(result.cache_read).toBe(7);
    expect(result.total).toBe(1904154);
  });

  test("falls back to regular long-context pricing in breakdown when priority long-context fields are absent", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 272001,
        output_tokens: 2,
        cache_read_input_tokens: 10,
      },
      makePriceData({
        mode: "responses",
        model_family: "gpt",
        input_cost_per_token_priority: 2,
        output_cost_per_token_priority: 20,
        cache_read_input_token_cost_priority: 0.2,
        input_cost_per_token_above_272k_tokens: 5,
        output_cost_per_token_above_272k_tokens: 50,
        cache_read_input_token_cost_above_272k_tokens: 0.5,
        input_cost_per_token_above_272k_tokens_priority: undefined,
        output_cost_per_token_above_272k_tokens_priority: undefined,
        cache_read_input_token_cost_above_272k_tokens_priority: undefined,
      }),
      false,
      true
    );

    expect(result.input).toBe(1360005);
    expect(result.output).toBe(100);
    expect(result.cache_read).toBe(5);
    expect(result.total).toBe(1360110);
  });

  test("categories sum to total", () => {
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 5000,
        output_tokens: 2000,
        cache_creation_input_tokens: 1000,
        cache_read_input_tokens: 3000,
      },
      makePriceData()
    );

    const sum = result.input + result.output + result.cache_creation + result.cache_read;
    expect(result.total).toBeCloseTo(sum, 10);
  });

  test("zero usage returns all zeros", () => {
    const result = calculateRequestCostBreakdown({}, makePriceData());

    expect(result).toEqual({
      input: 0,
      output: 0,
      cache_creation: 0,
      cache_read: 0,
      total: 0,
    });
  });

  test("per-request cost goes to input bucket", () => {
    const result = calculateRequestCostBreakdown(
      { input_tokens: 0 },
      makePriceData({ input_cost_per_request: 0.01 })
    );

    expect(result.input).toBeCloseTo(0.01, 6);
    expect(result.total).toBeCloseTo(0.01, 6);
  });

  test("cache_creation_input_tokens distributed by cache_ttl", () => {
    // When only cache_creation_input_tokens is set (no 5m/1h split),
    // it should be assigned based on cache_ttl
    const result = calculateRequestCostBreakdown(
      {
        input_tokens: 0,
        output_tokens: 0,
        cache_creation_input_tokens: 1000,
        cache_ttl: "1h",
      },
      makePriceData({
        cache_creation_input_token_cost_above_1hr: 0.000006,
      })
    );

    // 1000 tokens should go to 1h tier at 0.000006
    expect(result.cache_creation).toBeCloseTo(0.006, 6);
  });

  test("long_context_pricing uses full-request premium prices after threshold", () => {
    const priceData = makePriceData({
      long_context_pricing: {
        threshold_tokens: 272000,
        scope: "request",
        input_multiplier: 2,
        output_multiplier: 1.5,
        cache_read_input_multiplier: 2,
      },
    });

    const usage = {
      input_tokens: 272001,
      output_tokens: 100,
      cache_read_input_tokens: 50,
    };
    const match = matchLongContextPricing(usage, priceData);

    expect(match).not.toBeNull();

    const cost = calculateRequestCost(usage, priceData, {
      multiplier: 1,
      context1mApplied: false,
      longContextPricing: match?.pricing ?? null,
    });

    expect(cost.toNumber()).toBeCloseTo(1.634286, 6);
  });

  test("long_context_pricing threshold is exclusive at exactly 272000 tokens", () => {
    const priceData = makePriceData({
      long_context_pricing: {
        threshold_tokens: 272000,
        scope: "request",
        input_multiplier: 2,
      },
    });

    const match = matchLongContextPricing(
      {
        input_tokens: 272000,
        output_tokens: 10,
      },
      priceData
    );

    expect(match).toBeNull();
  });
});