AI
/
aiproxy
зеркало из https://gitee.com/NovemberRain/aiproxy.git


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117
							package monitor

import (
	"context"
	"net/http"
	"strconv"

	"github.com/gin-gonic/gin"
	"github.com/labring/aiproxy/core/common"
	"github.com/labring/aiproxy/core/common/reqlimit"
	"github.com/labring/aiproxy/core/model"
	"github.com/labring/aiproxy/core/relay/adaptor"
	"github.com/labring/aiproxy/core/relay/meta"
	"github.com/labring/aiproxy/core/relay/plugin"
	"github.com/labring/aiproxy/core/relay/plugin/noop"
)

const (
	GroupModelTokenRPM = "group_model_token_rpm"
	GroupModelTokenRPS = "group_model_token_rps"
	GroupModelTokenTPM = "group_model_token_tpm"
	GroupModelTokenTPS = "group_model_token_tps"
)

var _ plugin.Plugin = (*GroupMonitor)(nil)

type GroupMonitor struct {
	noop.Noop
}

func NewGroupMonitorPlugin() plugin.Plugin {
	return &GroupMonitor{}
}

func (m *GroupMonitor) DoResponse(
	meta *meta.Meta,
	store adaptor.Store,
	c *gin.Context,
	resp *http.Response,
	do adaptor.DoResponse,
) (model.Usage, adaptor.Error) {
	usage, relayErr := do.DoResponse(meta, store, c, resp)

	if usage.TotalTokens > 0 {
		count, overLimitCount, secondCount := reqlimit.PushGroupModelTokensRequest(
			context.Background(),
			meta.Group.ID,
			meta.OriginModel,
			meta.ModelConfig.TPM,
			int64(usage.TotalTokens),
		)
		UpdateGroupModelTokensRequest(c, meta.Group, count+overLimitCount, secondCount)

		count, overLimitCount, secondCount = reqlimit.PushGroupModelTokennameTokensRequest(
			context.Background(),
			meta.Group.ID,
			meta.OriginModel,
			meta.Token.Name,
			int64(usage.TotalTokens),
		)
		UpdateGroupModelTokennameTokensRequest(c, count+overLimitCount, secondCount)
	}

	return usage, relayErr
}

func UpdateGroupModelRequest(c *gin.Context, group model.GroupCache, rpm, rps int64) {
	if group.Status == model.GroupStatusInternal {
		return
	}

	log := common.GetLogger(c)
	log.Data["group_rpm"] = strconv.FormatInt(rpm, 10)
	log.Data["group_rps"] = strconv.FormatInt(rps, 10)
}

func UpdateGroupModelTokensRequest(c *gin.Context, group model.GroupCache, tpm, tps int64) {
	if group.Status == model.GroupStatusInternal {
		return
	}

	log := common.GetLogger(c)
	log.Data["group_tpm"] = strconv.FormatInt(tpm, 10)
	log.Data["group_tps"] = strconv.FormatInt(tps, 10)
}

func UpdateGroupModelTokennameRequest(c *gin.Context, rpm, rps int64) {
	c.Set(GroupModelTokenRPM, rpm)
	c.Set(GroupModelTokenRPS, rps)
	// log := common.GetLogger(c)
	// log.Data["rpm"] = strconv.FormatInt(rpm, 10)
	// log.Data["rps"] = strconv.FormatInt(rps, 10)
}

func UpdateGroupModelTokennameTokensRequest(c *gin.Context, tpm, tps int64) {
	c.Set(GroupModelTokenTPM, tpm)
	c.Set(GroupModelTokenTPS, tps)
	// log := common.GetLogger(c)
	// log.Data["tpm"] = strconv.FormatInt(tpm, 10)
	// log.Data["tps"] = strconv.FormatInt(tps, 10)
}

func GetGroupModelTokenRPM(c *gin.Context) int64 {
	return c.GetInt64(GroupModelTokenRPM)
}

func GetGroupModelTokenRPS(c *gin.Context) int64 {
	return c.GetInt64(GroupModelTokenRPS)
}

func GetGroupModelTokenTPM(c *gin.Context) int64 {
	return c.GetInt64(GroupModelTokenTPM)
}

func GetGroupModelTokenTPS(c *gin.Context) int64 {
	return c.GetInt64(GroupModelTokenTPS)
}