tgoop.com/devopslib/118
Last Update:
💥 Kubernetes хаос и как его приручить
Все красиво, пока не падает прод. А потом ты открываешь kubectl get pods
и видишь 37 подов в статусе CrashLoopBackOff
.
Kubernetes вроде как должен “самоисцеляться”, но иногда он просто сидит и смотрит, как всё горит 🔥
Вот три типичных источника хаоса и как их быстро приручить:
1. Liveness / Readiness пробы
Когда они настроены неправильно - поды убиваются зря.
👉 Проверь, что readinessProbe
не стреляется слишком часто, и добавь initialDelaySeconds
.
Удивительно, как часто это спасает от самоуничтожения.
2. OOMKilled
Если ты видишь это в kubectl describe pod
- у тебя проблема с лимитами.
👉 Поставь requests
чуть ниже среднего потребления, limits
- чуть выше пика.
И не забудь включить VerticalPodAutoscaler
- пусть сам подскажет реальные цифры.
3. NetworkPolicies и DNS
Часто блокируются сервисы внутри кластера, особенно CoreDNS.
👉 Минимальный тест: kubectl exec -it pod -- nslookup kubernetes.default
.
Если не работает - смотри NetworkPolicy
и iptables
в CNI.
Подпишись 👉@devopslib
BY Библиотека девопса | DevOps, SRE, Sysadmin
Share with your friend now:
tgoop.com/devopslib/118