تخطَّ إلى المحتوى

Observability

المهندس الجيد لا يكتفي بتشغيل التطبيق. يجب أن يعرف ماذا يحدث عندما يفشل.

Terminal window
kubectl get pods
kubectl describe pod <pod>
kubectl logs <pod>
kubectl logs <pod> -c <container>
kubectl exec -it <pod> -- sh
kubectl get events --sort-by=.lastTimestamp
kubectl top pods
الخطأالسبب المحتمل
CrashLoopBackOffالتطبيق يبدأ ثم يقع
ImagePullBackOffKubernetes لا يستطيع سحب Image
Pendingلا توجد موارد كافية أو مشكلة Scheduling
OOMKilledالتطبيق استهلك Memory أكثر من Limit
ErrImagePullاسم Image أو صلاحيات Registry خطأ
  • قراءة Logs.
  • استخدام Events.
  • تثبيت Metrics Server.
  • مقدمة Prometheus و Grafana.
  • مقدمة Logging باستخدام Loki أو بدائل مشابهة.
  • بناء Troubleshooting checklist.

انشر Deployment فيه Image خاطئة، ثم استخدم describe و events لاكتشاف السبب وتصحيحه.