togethercomputehighconfig v3

Decagon AI称借助 Together AI 将语音智能体单轮成本压低近 6 倍

摘要与判断

Decagon AI 在企业语音客服场景中从闭源模型切换到微调开源模型，并结合推测解码、提示缓存和基于 NVIDIA Blackwell 的推理优化，把单轮语音交互成本降至原先近六分之一，同时将 p95 模型延迟控制在 400 毫秒以内。该案例直接说明开源模型在实时语音 Agent 上已能兼顾成本、时延与部署速度，影响 AI 产品选型和开发者基础设施路线判断。

Topics

AI 产品有新功能AI 开发者生态变化

引用和原文

Decagon AI cut voice agent cost per turn nearly 6x with Together AI
原文链接

Trace

Raw Item: raw_4497a99ed1bd4a1e
Processed Item: processed_038808663dd24a08
Source: source_x_togethercompute
LLM Logs: llm_120b99c2e4ed41f3
Coze Loop: 09a6a5e2a8611325be14649bbd1920d0