Skill Entry

多区域 LLM 提供商就绪度核查

将出口管制与多厂商路由整理为规划清单:记录主/备路(含 Helicone、LiteLLM Router)、量化区域封锁敞口,并在管理层对某市场「零预期」时与财务口径一致;含法务会签、故障演练与上线前证据。

分类 运营
平台 跨厂商 LLM 栈
发布时间 2026-05-21
geopoliticsroutingresilience

使用场景

  • GPU 出口市场关闭后服务仍需可用
  • 芯片厂商公开让出区域市场后的董事会评审
  • 许可不确定时的投资者沟通
  • 亚太驻留前 Consolidate 网关路由
  • 年度硬件依赖韧性审查

主要功能

  • 按地理与上游依赖梳理敞口
  • 列出主路与已测备路并附配置
  • 与财务对齐对外预测假设
  • 阻断主区域做技术演练
  • 记录法务/出口合规引用
  • 发布签字备忘录与复测日期

相关推荐

相关推荐

3 收录条目

LiteLLM Router 回退就绪度核查

运营

将 LiteLLM 路由文档转化为上线前清单:核对主/备部署、重试与负载策略;经 Proxy 时验证虚拟密钥与费用;通过可控主路故障演练确认回退触发;若用 MCP Gateway 则检查 store_model_in_db 与 SEP-986 命名。

OWASP GenAI LLM Top 10(v1.1)风险核查清单

安全

将 OWASP GenAI 项目组维护的《大型语言模型应用 Top 10》公开分类(社区页面当前称为 v1.1,自 LLM01 提示注入延伸至 LLM10 模型窃取)转写为可逐项打勾的工程设计清单,覆盖 RAG、工具调用链、插件宿主、持续学习与托管推理等架构。每个风险域的叙述与缓解方向与 genai.owasp.org/项目维基对「提示操控、未验证输出、语料或训练投毒、滥用算力型 DoS、依赖与模型供应链、敏感信息回声、特权工具设计、代理自主性失控、对模型结论的过度信赖、专有模型与权重被外部复制」等条目描述保持一致,并强调将策略控制、观测与安全左移结合,而非仅依赖单次渗透测试结论。

示例 SLO 文档起草

运营

依据 Google SRE Workbook 附录《Example SLO Document》,把示范性「游戏服务 API / HTTP / 分数管道」的写法抽象为可落地的文档模板:先写清用户旅程与数据来源,再选定滚动观测窗口(示例为四周),为每一条 SLI(可用性剔除 5xx、延迟阈值、读取新鲜度、探针正确性、批任务完整性等)写清分子与分母的统计口径并给出目标百分比,解释目标选取与取整惯例,分项计算误差预算并与《示例错误预算策略》联动,最后用 clarifications/caveats 记录 ELB/SYN 探测等盲点。套用模板时需替换为你们自己的业务指标与数据来源。