Monitoring Systems
Monitoring Systems
Excerpt:
Monitoring systems omogućavaju stalno praćenje stanja sajta, servera, servisa i ključnih produkcionih procesa. Dobar monitoring ne služi samo da prijavi kvar, već da pomogne u ranom otkrivanju problema pre nego što utiču na korisnike.
Blog članak:
Monitoring system je jedan od osnovnih elemenata tehničke stabilizacije. Bez monitoringa, problemi se često otkrivaju tek kada korisnik prijavi da sajt ne radi, checkout puca, email ne stiže ili je server postao spor.
Najosnovniji monitoring proverava da li je sajt dostupan. Ako stranica prestane da odgovara, ako vraća 500 grešku ili ako domen ne može da se učita, sistem treba odmah da pošalje obaveštenje administratoru ili tehničkom timu.
Međutim, ozbiljan monitoring ide dalje od provere “da li je sajt online”. Važno je pratiti vreme odgovora, SSL sertifikat, HTTP status kodove, dostupnost baze, stanje servisa, zauzeće diska, memoriju, CPU i opterećenje servera.
Disk monitoring je posebno važan kod produkcionih servera. Pun disk može zaustaviti MySQL, sprečiti upload fajlova, oboriti email servis ili pokvariti backup proces. Zato sistem treba da upozori mnogo pre nego što disk dođe do kritične tačke.
Monitoring servisa pomaže da se vidi da li rade Apache, Nginx, Caddy, PHP-FPM, MySQL, Docker, Redis, Postfix ili drugi važni procesi. Ako jedan od tih servisa stane, sajt može delovati potpuno oboren iako je server tehnički još uvek aktivan.
Kod e-commerce i poslovnih sajtova treba pratiti i funkcionalne procese. Nije dovoljno da homepage radi; treba proveriti checkout, kontakt forme, sistemske emailove, API konekcije, payment gateway i druge delove koji direktno utiču na konverzije.
Logovi su važan deo monitoring sistema. Povećan broj PHP grešaka, 404 zahteva, neuspešnih login pokušaja, sporih upita ili timeout poruka može pokazati problem pre nego što postane vidljiv korisnicima.
Dobar monitoring mora imati jasna obaveštenja. Poruka treba da kaže šta se dogodilo, kada, koji servis je pogođen i koliko je problem ozbiljan. Previše generičkih ili prečestih upozorenja dovodi do toga da ih tim vremenom ignoriše.
Monitoring treba kombinovati sa dokumentovanim reakcijama. Ako stigne upozorenje da je disk skoro pun, treba znati koje foldere proveriti. Ako MySQL ne radi, treba znati gde su logovi. Ako SSL ističe, treba znati kako se obnavlja.
Monitoring systems daju produkciji dodatni sloj sigurnosti. Kada se server, aplikacija i ključni procesi stalno prate, problemi se rešavaju ranije, downtime se smanjuje, a dugoročna stabilnost sistema postaje mnogo lakša za održavanje.