用量统计与限流

适用读者：站长、成本与安全负责人

用量页面展示调用次数、token、失败率、活跃模型、调用明细和每日限额；访客限流按客户端 IP 控制小时和每日频率。

两类限制

类型	目的	维度
模型每日 token 上限	控制预算	模型名称 + 日期
访客频率限制	防止滥用	客户端 IP + 小时/日期

模型限额采用预扣与调用后对账，降低并发请求同时穿透上限的风险。

如果所有访客都被识别为同一个代理 IP，限流会误伤整个站点。

场景用于区分费用来源，例如访客问答、Embedding、Rerank、摘要、脑图、写作、评测和运营智能体。完整枚举见用量场景参考。

白名单等于绕过访客频率限制，不等于绕过模型总预算。不要把不受控的公网代理加入白名单。