G

AI Tool

Groq Cloud API

兼容 OpenAI 客户端的快速推理 API(Groq 托管模型)

GroqCloud 通过 Groq 的 HTTP API 提供托管的语言与语音等推理能力;文档说明可将 OpenAI 兼容客户端指向 Groq 的 `base_url` 并使用 Groq API 密钥,亦提供 Groq 官方 Python/JavaScript SDK。定价页面以美元公示按 token 计费档位,便于预估推理成本。

分类 开发者工具
价格 免费试用 + 按量计费(官网公示 USD)
平台 Web / API
inferenceapiopen-source-models

使用场景

  • 把现有 OpenAI 形态调用迁移到 Groq 托管推理
  • 搭建延迟敏感的对话或 Agent 原型
  • 批量离线推理(参见 Batch API 文档)
  • 语音转写与文本推理链路拆分在不同托管模型上
  • 团队培训 OpenAI 兼容接入范式

主要功能

  • 兼容 OpenAI 形态的 REST:`https://api.groq.com/openai/v1`
  • 官方 Groq SDK 与 OpenAI SDK 迁移说明并存档于控制台文档
  • 多模型目录与 Playground,便于切换开源权重方案
  • 官网 pricing 页面列出按百万 token 计的参考单价
  • 文档说明 OpenAI 兼容层尚未支持的字段与限制

相关推荐

相关推荐

3 收录条目