Menjaga Server Point

Blog image

Menjaga Server Point

Menjaga Server Point adalah hal yang menakjubkan. Mereka bersenandung 24/7, biasanya tanpa masalah, tapi seperti mesin yang mereka butuhkan memerlukan perawatan.

Pemeliharaan dan pemantauan sederhana sering kali mencegah kegagalan server untuk berubah menjadi bencana server. Sebagai contoh, saya telah meminta orang-orang untuk panik bahwa ada server yang mengalami kecelakaan. Kami mulai menyelidiki untuk menemukan bahwa RAID mereka gagal tahun lalu, backup mereka berhenti tiga bulan yang lalu dan disk mereka mencapai kapasitas 100%, merusak basis data mereka.

12 Tips Menjaga Server

1. Verifikasi backup Anda bekerja.

Sebelum membuat perubahan pada sistem produksi Anda, pastikan backup Anda bekerja. Anda bahkan mungkin ingin menjalankan beberapa pemulihan percobaan jika Anda akan menghapus data penting.Sementara fokus pada backup, Anda mungkin ingin memastikan bahwa Anda telah memilih lokasi backup yang tepat.

2. Periksa penggunaan disk.

Jangan gunakan sistem produksi Anda sebagai sistem arsip. Hapus log lama, email, dan versi perangkat lunak yang tidak lagi digunakan. Menjaga sistem Anda bebas dari perangkat lunak lama membatasi masalah keamanan. Jejak data yang lebih kecil berarti pemulihan lebih cepat. Jika penggunaan Anda melebihi 90% dari kapasitas disk, mengurangi penggunaan atau menambahkan lebih banyak penyimpanan. Jika partisi Anda mencapai 100%, server Anda mungkin berhenti merespons, tabel database bisa rusak dan data mungkin hilang.

3. Monitor RAID Alarms.

Semua server produksi harus menggunakan RAID. Lebih penting lagi, Anda harus memantau status RAID Anda. Dalam dekade kami dan dalam bisnis, kami telah mengerjakan sistem yang tak terhitung jumlahnya dimana RAID gagal. Akibatnya, satu kegagalan disk menyebabkan kegagalan sistem yang lengkap. Di rackAID, kami menggunakan penyedia yang memantau RAID kami untuk kami atau kami telah menyiapkan pemantauan RAID langsung. Kira-kira saya memperkirakan bahwa RAID gagal dalam sekitar 1% server per tahun. Satu persen mungkin tampak kecil, namun kegagalan server yang lengkap dapat mengubah penggantian drive sederhana menjadi skenario pemulihan bencana multi-jam.

4. Update OS anda.

Pembaruan untuk sistem Linux sering dilepaskan. Tetap di atas pembaruan ini bisa menjadi tantangan. Inilah sebabnya mengapa kami menggunakan alat pengelolaan patch otomatis dan memantau di tempat untuk mengingatkan kami saat sistem sudah usang. Jika Anda memperbarui server Anda secara manual (atau tidak sama sekali), Anda mungkin akan kehilangan pembaruan keamanan penting. Hacker sering memindai sistem yang rentan dalam beberapa jam setelah sebuah isu diungkapkan. Respons yang begitu cepat adalah kunci. Jika Anda tidak dapat mengotomatisasi pembaruan Anda, buat jadwal untuk memperbarui sistem Anda. Saya merekomendasikan mingguan minimal untuk versi terbaru dan mungkin bulanan untuk versi OS yang lebih lama. Saya juga akan memantau pemberitahuan rilis dari distribusi Anda sehingga Anda mengetahui adanya ancaman keamanan utama dan dapat merespons dengan cepat.

5. Perbarui Control Panel anda.


Jika Anda menggunakan panel kontrol hosting atau server, pastikan untuk memperbaruinya juga. Terkadang ini berarti memperbarui tidak hanya panel kontrol itu sendiri, namun juga perangkat lunak yang dikontrolnya. Misalnya, dengan WHM / cPanel, Anda harus memperbarui versi PHP secara manual untuk memperbaiki masalah yang diketahui. Cukup mengupdate panel kontrol juga tidak mengupdate Apache dan versi PHP yang digunakan oleh OS Anda.

6. Periksa update aplikasi.

Aplikasi web mencakup lebih dari 95% dari semua pelanggaran keamanan yang kami selidiki. Pastikan untuk memperbarui aplikasi web Anda, terutama program populer seperti WordPress.

7. Periksa alat manajemen jarak jauh.

Jika server Anda berada di tempat yang sama atau dengan penyedia server khusus, Anda akan ingin memastikan bahwa alat manajemen jarak jauh Anda bekerja. Konsol jarak jauh, reboot jarak jauh dan mode penyelamatan adalah yang saya sebut 3 alat penting untuk pengelolaan server jarak jauh . Anda ingin tahu bahwa ini akan bekerja bila Anda membutuhkannya.

8. Periksa kesalahan perangkat keras.

Anda mungkin ingin meninjau log untuk tanda-tanda masalah perangkat keras. Overheating pemberitahuan, disk membaca kesalahan, kegagalan jaringan bisa menjadi indikator awal kegagalan perangkat keras potensial. Ini jarang tapi patut dicoba, terutama jika sistemnya belum bekerja dalam rentang normal.

9. Periksa utilisasi server.

Tinjau disk server, CPU , RAM dan utilisasi jaringan Anda. Jika Anda mendekati batas, Anda mungkin perlu merencanakan untuk menambahkan sumber daya ke server Anda atau melakukan migrasi ke yang baru.Jika Anda tidak menggunakan alat pemantau kinerja, Anda dapat menginstal systat pada sebagian besar server Linux. Ini akan memberi Anda beberapa data kinerja dasar.

10. Tinjau kembali akun pengguna.

Jika Anda memiliki perubahan staf, pembatalan klien atau perubahan pengguna lainnya, Anda ingin menghapus pengguna ini dari sistem Anda. Menyimpan situs dan pengguna lama merupakan risiko keamanan dan hukum. Bergantung pada kontrak layanan Anda, Anda mungkin tidak memiliki hak untuk menyimpan data klien setelah mereka menghentikan layanan.

11. Ganti kata sandi.


Saya merekomendasikan mengganti kata sandi setiap 6 sampai 12 bulan, terutama jika Anda telah memberikan kata sandi kepada orang lain untuk perawatan.

12. Periksa keamanan sistem.

Saya menyarankan tinjauan berkala terhadap keamanan server Anda menggunakan alat audit jarak jauh seperti Nessus. Audit keamanan reguler berfungsi sebagai cek pada konfigurasi sistem, update OS dan risiko keamanan potensial lainnya. Saya sarankan ini minimal 4 kali setahun dan sebaiknya bulanan. Juga, Anda mungkin ingin meninjau kembali 10 undang-undang administrasi keamanan yang tidak berubah .

Menjadi Proaktif Mencegah Kegagalan

Sebagai bagian dari layanan manajemen kami, kami memantau lebih dari selusin metrik kesehatan server. Dengan mencatat hal-hal seperti penggunaan swap, beban, kedalaman antrian email dan banyak lagi, tim sysadmin kami sering menemukan masalah sebelum menjadi kegagalan.

Jika terjadi kegagalan, tim kami dapat fokus memperbaiki masalah ini daripada mengkhawatirkan item perawatan. Hal ini memungkinkan kita mengatasi sebagian besar gangguan servis dalam hitungan menit. Kami tidak perlu berhenti dan menerapkan update OS selama enam bulan untuk melihat apakah ada bug yang diketahui adalah masalahnya.

Kami sangat menyarankan untuk mengotomatisasi manajemen dan pemeliharaan server. Jika Anda tidak bisa mengotomatisasi, buat jadwal dan patuhi. Saat pertama kali memulai bisnis ini lebih dari 10 tahun yang lalu, kami melakukan banyak hal secara manual. Itu bekerja dengan baik untuk beberapa severs, tapi begitu Anda memiliki puluhan sistem untuk dikelola, Anda bisa kehilangan banyak hal. Alat seperti nagios, Relic baru, Pingdom, sysstat dan banyak produk open source dan SaaS lainnya dapat membantu Anda mengawasi server Anda.