语音转写、流式转录与 Voice Agent API
AssemblyAI 提供 api.assemblyai.com 预录转写与 wss://streaming.assemblyai.com 流式 STT;预录须传 speech_models;含 Voice Agent、Speech Understanding 与 LLM Gateway。
使用场景
- 预录转写
- 直播字幕
- 语音 Agent
- PII Guardrails
- EU 端点
主要功能
- POST /v2/transcript
- 流式 WebSocket
- Voice Agent API
- Speech Understanding
- LLM Gateway
相关推荐
相关推荐
3 收录条目
Deepgram
Deepgram 在 developers.deepgram.com 提供 `/v1/listen`(Nova-3 流式转写)与 `/v2/listen`(Flux 对话式回合检测);SDK 含 listen.v1/v2.connect;文档对比 Agent 与会议场景并支持自建 Flux。
Fireworks AI
Fireworks AI 提供 REST API 调用语言/图像/embedding 模型;支持 serverless 目录模型与专属 GPU 部署 custom base model 及 LoRA;默认不记录 prompt/输出(见文档例外)。
NVIDIA NIM
NVIDIA NIM 在 docs.api.nvidia.com/nim 与 docs.nvidia.com/nim 文档化性能优化推理微服务:通过容器暴露行业标准 API(OpenAI 兼容的 /v1/chat/completions、/v1/completions、/v1/responses,以及 Anthropic 兼容的 /v1/messages),后端可为 TensorRT-LLM、vLLM 或 SGLang。可在云、数据中心或 RTX 工作站自托管,也可经 Developer Program 使用托管 NIM API 做原型。自托管容器提供 /v1/health/ready 与 /v1/metrics 等管理端点。