Discard Prometheus etcd gRPC failure alert

* Kubernetes watch expiry is not a gRPC code we care about * Background: This rule is typically removed, but was added back in
2025-07-23 04:51:34 +02:00 · 2020-11-14 13:17:56 -08:00
parent 1b3a0f6ebc
commit f884de847e
1 changed files with 0 additions and 22 deletions
--- a/addons/prometheus/rules.yaml
+++ b/addons/prometheus/rules.yaml
@ -50,28 +50,6 @@ data:
                "severity": "warning"
              }
            },
            {
              "alert": "etcdHighNumberOfFailedGRPCRequests",
              "annotations": {
                "message": "etcd cluster \"{{ $labels.job }}\": {{ $value }}% of requests for {{ $labels.grpc_method }} failed on etcd instance {{ $labels.instance }}."
              },
              "expr": "100 * sum(rate(grpc_server_handled_total{job=~\".*etcd.*\", grpc_code!=\"OK\"}[5m])) without (grpc_type, grpc_code)\n  /\nsum(rate(grpc_server_handled_total{job=~\".*etcd.*\"}[5m])) without (grpc_type, grpc_code)\n  > 1\n",
              "for": "10m",
              "labels": {
                "severity": "warning"
              }
            },
            {
              "alert": "etcdHighNumberOfFailedGRPCRequests",
              "annotations": {
                "message": "etcd cluster \"{{ $labels.job }}\": {{ $value }}% of requests for {{ $labels.grpc_method }} failed on etcd instance {{ $labels.instance }}."
              },
              "expr": "100 * sum(rate(grpc_server_handled_total{job=~\".*etcd.*\", grpc_code!=\"OK\"}[5m])) without (grpc_type, grpc_code)\n  /\nsum(rate(grpc_server_handled_total{job=~\".*etcd.*\"}[5m])) without (grpc_type, grpc_code)\n  > 5\n",
              "for": "5m",
              "labels": {
                "severity": "critical"
              }
            },
            {
              "alert": "etcdGRPCRequestsSlow",
              "annotations": {