流式语音转文字 API:Nova-3 适合实时字幕,Flux 面向语音 Agent
Deepgram 在 developers.deepgram.com 提供 `/v1/listen`(Nova-3 流式转写)与 `/v2/listen`(Flux 对话式回合检测);SDK 含 listen.v1/v2.connect;文档对比 Agent 与会议场景并支持自建 Flux。
使用场景
- 会议字幕与通话分析
- 语音 Agent 内置回合结束
- Flux vs Nova-3 选型
- 生产延迟基准
- 合规自建
主要功能
- /v1/listen Nova-3 流式
- /v2/listen Flux 回合事件
- SDK v1/v2 connect
- 延迟测量文档
- 自建 Flux Engine
相关推荐
相关推荐
3 收录条目
Groq Cloud API
GroqCloud 通过 Groq 的 HTTP API 提供托管的语言与语音等推理能力;文档说明可将 OpenAI 兼容客户端指向 Groq 的 `base_url` 并使用 Groq API 密钥,亦提供 Groq 官方 Python/JavaScript SDK。定价页面以美元公示按 token 计费档位,便于预估推理成本。
Fireworks AI
Fireworks AI 提供 REST API 调用语言/图像/embedding 模型;支持 serverless 目录模型与专属 GPU 部署 custom base model 及 LoRA;默认不记录 prompt/输出(见文档例外)。
LangSmith
LangSmith 是 LangChain 提供的云端/可自建平台,用于追踪、监控与改进大模型应用。docs.langchain.com 说明可通过环境变量、框架集成(文档集成页列出的 OpenAI、Anthropic、CrewAI、Vercel AI SDK、Pydantic AI 等)或 LangSmith SDK 接入,以便查看多步 run、对比 Prompt 版本、构建数据集、运行离线与在线评测、配置自动化并收集反馈队列。