|
|
3 месяцев назад | |
|---|---|---|
| .. | ||
| README.cn.md | 6 месяцев назад | |
| README.md | 6 месяцев назад | |
| config.go | 6 месяцев назад | |
| fake.go | 3 месяцев назад | |
Stream Fake Plugin 是一个专门用于解决非流式请求超时问题的插件。当 AI 模型响应时间较长时,非流式请求可能会因为等待完整响应而导致超时。该插件通过在内部将非流式请求转换为流式请求来避免超时问题,然后将流式响应重新组装为非流式格式返回给客户端,从而在保持客户端兼容性的同时解决超时问题。
通过内部流式传输,连接始终保持活跃状态,避免各种超时问题,同时客户端仍然接收到期望的非流式响应格式。
"stream": false 或未设置)"stream": true){
"model": "gpt-4",
"type": 1,
"plugin": {
"stream-fake": {
"enable": true
}
}
}
| 字段 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
enable |
bool | 是 | false | 是否启用 Stream Fake 插件以避免超时问题 |
问题:请求生成 5000 字的技术文档,非流式请求在 60 秒后超时
原始请求:
{
"model": "gpt-4",
"messages": [
{
"role": "user",
"content": "请写一份详细的 5000 字技术文档,介绍微服务架构的设计原则和最佳实践"
}
],
"stream": false,
"max_tokens": 4000
}
插件处理:
"stream": true问题:复杂数学问题需要长时间思考,导致请求超时
解决方案: