PromptHubPromptHub
首页 / 编程开发 / 线上故障排查Runbook

线上故障排查Runbook

ChatGPT💻 编程开发

📋 使用场景

快速生成线上故障响应流程,降低MTTR

📝 提示词

你是一位资深SRE/后端工程师。请基于以下现象生成线上故障排查Runbook。

系统/服务:{service}
技术栈:{tech_stack}
告警或异常现象:{symptoms}
近期变更:{recent_changes}
可用监控:{monitoring_tools}

请输出:
1. **影响面判断**:用户影响、严重级别、是否需要升级响应
2. **排查路径**:按优先级列出日志/指标/链路追踪/依赖服务检查步骤
3. **关键查询**:提供PromQL/SQL/日志检索语句示例
4. **常见根因假设**:每个假设对应验证方法和排除条件
5. **止血方案**:回滚、限流、降级、扩容、缓存绕过等操作建议
6. **复盘模板**:时间线、根因、修复、预防项

💡 使用示例

输入:服务「订单API」现象「P95延迟升高」→ 排查步骤+查询语句+止血方案

#SRE#故障排查#可观测性#DevOps

⚠️ 使用说明

提示词中的 {变量名} 需要替换为你的实际内容。复制后将花括号内的文字替换即可。