Penerapan
DRP pada Data Center FKIP UNS
Disaster (bencana)
didefinisikan sebagai kejadian yang waktu terjadinya tidak dapat diprediksi dan
bersifat sangat merusak. Pengertian ini mengidentifikasikan sebuah kejadian
yang tiba-tiba, tidak diharapkan, bersifat sangat merusak, dan kurang
perencanaan. Bencana terjadi dengan frekuensi yang tidak menentu dan akibat
yang ditimbulkannya meningkat bagi mereka yang tidak mempersiapkan diri
terhadap kemungkinan-kemungkinan timbulnya bencana. Berbagai bencana yang
mungkin terjadi antara lain adalah:
- Bencana alam disebabkan oleh
kondisi geografis dan geologis dari lokasi
- Kebakaran disebabkan oleh faktor
lingkungan dan pengaturan sistem elektrik yang dapat menyebabkan
korsleting
- Kerusakan pada jaringan listrik
disebabkan oleh sistem elektrik
- Serangan teroris disebabkan oleh
lemahnya keamanan fisik dan non fisik data center
- Sistem atau perangkat yang rusak
terkait dengan kesalahan manajemen pengawasan perangkat
- Kesalahan operasional akibat ulah
manusia
- Virus misalkan disebabkan oleh
kesalahan pemilihan anti virus yang digunakan
Disaster Recovery
menurut terjemahan aslinya mengandung arti pemulihan bencana. DR jika dikaitkan
dengan dunia bisnis, akan membawa kita pada definisi #Disaster Recovery Planning (DRP) dan #Business Continuity Plan (BCP).Bisnis akan bergantung pada informasi
yang tersebar dan aplikasi yang memproses informasi tersebut, sehingga aplikasi
penopang utama yang spesifik menjadi sangat kritikal sehingga ketika terjadi
gangguan hanya beberapa saat maka dapat melumpuhkan kelangsungan bisnis perusahaan.
Oleh karenanya, beberapa perusahaan mempunyai suatu arahan yang menjamin
availabilitas kelangsungan bisnis ketika terjadi suatu bencana/gangguan yang
tidak direncanakan atau sudah direncanakan. Arahan ini yang dituangkan dalam #Disaster Recovery Planning (DRP).
Replikasi Data
Satu hal yang menjadi
sangat krusial dalam Pemulihan Bencana adalah data dan informasi, sebagaimana
telah disebutkan sebelumnya sangat penting untuk menjaga kekonsistenan dari
data dan informasi bagi perusahaan. Kebutuhan ini dapat diakodomasi dengan
menggunakan teknologi replikasi data. Replikasi data adalah sebuah proses yang
mengkopi isi data ke suatu lokasi remote baik yang berlangsung secara
kontinu ataupun pada interval tertentu. Replikasi data akan menyediakan hasil
kopi data yang lengkap untuk tujuan Pemulihan Bencana. Lokasi remote
biasanya merupakan secondary data center.
Teknologi replikasi
data memiliki fungsi yang rumit karena secara cerdas mengkopi data ke lokasi
yang remote, setelah data yang lengkap sudah direplikasi ke target yang
dimaksud maka hanya data yang berubah yang akan direplikasi selanjutnya,
sehingga akan menghemat kebutuhan bandwith. Data kopian inisial yang ada di
penyimpanan remote biasa disebut sebagai seeding (penanaman
benih). Setelah data di-"seeding", fungsi replikasi berikutnya
dapat berjalan pada dua mode yaitu:
- Mode Replikasi Synchronous
Mode replikasi sinkron memungkinkan pertukaran data secara real-time sehingga kesinkronan suatu data
akan terjaga, dimana saat ada transaksi operasional yang sedang menulis
sesuatu ke disk sumber, maka saat yang bersamaan penulisan juga dilakukan
terhadap disk target yang ada di lokasi remote. Keseluruhan proses
penulisan pada disk sumber dan disk target harus selesai terlebih dahulu
sebelum beranjak ke transaksi operasional selanjutnya dan diberi acknowledge untuk keduanya jika telah
selesai. Pada mode replikasi ini, kebutuhan akan performansi sistem yang
tinggi harus dipertimbangkan. Selain itu jarak antara disk sumber dan disk
target juga menjadi prasyarat utama, bahwa pihak yang terlibat dalam mode
replikasi ini harus berjarak < 100km antara keduanya. Keuntungan dari
mode replikasi ini adalah menyediakan recovery yang konsisten dan lengkap untuk
semua jangka waktu.
- Mode Replikasi Asynchronous
Mode replikasi asinkron memungkinkan pertukaran data secara buffering dalam artian bahwa data akan
diletakkan dalam sebuah 'penampung sementara terlebih dahulu, kemudian
pada jangka waktu tertentu akan direplikasi ke disk target. Data
yang direplikasi ke disk target tidak membutuhkan acknowledgement agar penulisan transaksi
operasional pada disk sumber dapat berlangsung kembali. Sehingga mode
replikasi ini tidak menjamin kesinkronan suatu data pada dua pihak yang
terlibat karena jika suatu saat terjadi crash pada salah satu pihak
dan data belum sempat direplikasi maka data yang terdapat pada kedua pihak
tidak bisa dikatakan sebagai sebuah data yang sinkron. Walaupun hal ini
dapat meningkatkan performansi sistem, namun lebih memiliki banyak risiko.
Jika hal ini terjadi maka recovery yang cukup rumit dilakukan (namun
tidak menjamin data hasil recovery adalah data yang benar dan
konsisten karena ada kemungkinan hilangnya beberapa data). Keuntungan dari
mode replikasi ini adalah efektivitas biaya.
Selain itu,
berdasarkan tempat dimana proses replikasi berjalan, dapat ditentukan tipe
replikasi yang cocok untuk kebutuhan bisnis perusahaan, yaitu:
Database to Database
Proses replikasi berlangsung pada server basis data. Satu server basis data
akan bertindak sebagai master dan kemudian ada beberapa server basis
data sebagai slave yang menyimpan kopi dari basis data tersebut. Ketika
terjadi proses penulisan pada basis data maka akan terjadi penulisan tersebut
akan segera dikirim ke basis data master yang kemudian akan direplikasi
oleh server basis data yang bersifat slave. Ketika dilakukan proses
pembacaan pada basis data, maka dapat dilakukan terhadap semua server
basis data yang tersedia, hal ini tentu saja akan meningkatkan performansi
sistem basis data terkait dengan load sharing. Keunggulan lain dari
replikasi basis data adalah tingkat availabilitas yang tinggi, karena ketika
terjadi crash terhadap server master basis data, server slave basis data
dapat mengambil alih pekerjaan server master.
Host to Host
Disebut juga sebagai
replikasi yang processor-based. Proses replikasi berjalan pada sistem
sumber dan target. Oleh karenanya, sangat mungkin terjadi perselisihan antara
sistem sumber dan target saat berlangsung proses replikasi. Hal ini terjadi
karena agen yang berjalan pada masing-masing sistem dalam menjalankan proses tracking perubahan data dan replikasi data,
jalur yang dilakukan adalah melalui koneksi IP. Replikasi data mode ini
berjalan pada level aplikasi atau level OS. Host-to-host merupakan mode
replikasi yang paling umum diimplementasikan karena merupakan solusi software. Replikasi host-to-host
memanfaatkan sumber daya pada server sumber dan target yang akan berdampak pada
performansi, kemudian mensyaratkan bahwa sistem yang berada di lokasi remote
harus selalu dalam keadaan up sepanjang waktu. Keuntungan yang signifikan dari
mode replikasi ini adalah storage agnostic, yang berarti bahwa dapat dilakukan
pen-deployan tanpa memperhatikan tipe storage yang digunakan
(internal, eksternal, SAN atau NAS).
Disk to Disk
Replikasi mode
disk-to-disk berjalan pada perangkat eksternal storage seperti SAN atau NAS. Mode replikasi ini secara normal diimplementasikan pada
vendor-vendor disk array seperti EMC, Hitachi, IBM, HP dan lainnya. Setiap vendor akan
menyediakan aplikasi software yang cocok dengan array storage
masing-masing vendor.Kebanyakan disk array menggunakan koneksi fibre
channel, sehingga router storage diperlukan untuk meningkatkan
kemampuan koneksi melalui link WAN. Replikasi disk-to-disk
memanfaatkan sumber daya dari perangkat eksternal storage dan bersifat
transparan ke host. Karena proses replikasi berjalan pada perangkat storage,
maka host yang menjadi target tujuan tidak diperlukan lagi.
Implementasi
Lima elemen
utama yang penting untuk fungsi dasar dari sebuah data center adalah :
• Aplikasi
• Database
• Server dan
Operating System
• Jaringan
• Storage Array
Backup Management
Backup merupakan sebuah
proses penduplikasian data kedalam media yang terpisah. Data hasil duplikasi
tersebut nantinya akan digunakan untuk memulihkan kembali data
bila terjadi kerusakan atau
kehilangan data.Backup biasanya digunakan dengan dua tujuan utama yaitu
:
• Untuk memulihkan
kembali data yang mengalami kerusakan/kehilangan pada saat
terjadi bencana.
• Untuk memulihkan
sebagian kecil data yang mengalami kerusakan atau kehilangan akibat kesalahan
manusia.
Jenis – jenis strategi
backup adalah sebagai berikut,
• Snapshot Backup
Data diduplikasi secara live
dengan melakukan penguncian terhadap seluruh data untuk sementara waktu dan
kemudian dilakukan snapshot terhadap data tersebut yang
dilanjutkan dengan dilepas
agar dapat beroperasi kembali.
• Full Backup
Data diduplikasi secara
keseluruhan baik data yang sudah pernah diduplikasi maupun belum pernah kedalam
media yang terpisah. Backup dilakukan secara berkala.
• Differential
Backup
Data yang diduplikasi hanya
merupakan data baru atau data yang mengalami perubahan. Pada proses backup ini,
data tidak pernah dilakukan marking. Backup dilakukan secara berkala.
• Incremental
Backup
Data yang diduplikasi hanya
data yang belum pernah dilakukan backup. Bila terjadi
perbedaan byte pada data,
maka hanya perbedaan dari byte data tersebut yang akan
diduplikasi Backup
dilakukan secara berkala.
• Continuous
Backup
Data dilakukan duplikasi
secara terus menerus terhadap seluruh data yang berubah.
Heartbeat
Merupakan aplikasi dasar
untuk Linux-HA (Linux High Availability). Heartbeat akan
menjalankan script
inisialisasi untuk HA dan saat node atau server mati dan hidup. HeCasing
minicube heartbeat juga melakukan perpindahan IP dari satu node ke
node yang lain (IP floating). Komunikasi heartbeat bisa
dilakukan melalui serial ports, UDP/IP broadcast (ethernet,etc),
UDP/IP multicast (ethernet). Selain itu heartbeat juga menangani service-service
apa saja yang akan dijalankan pada saat node atau server menjadi
aktif.
DRBD Distributed Replicated
Block Device
Merupakan solusi replikasi storage
block device (hard disk, partitions, logical volumes etc) menggunakan
software antar dua server pada linux.
DRBD melakukan mirror data
dengan :
• Uptime: Replikasi
dilakukan secara terus menerus saat aplikasi melakukan modifikasi
data pada block device.
• Synchronous : Dengan
melakukan mirroring sinkron, file system pada aktif node diberitahu bahwa
proses penulisan telah berhasil saat penulisan telah dilakukan pada
kedua block device dari masing masing node. Synchronous mirrorong (
protocol C DRBD) adalah pilihan untuk local network agar tidak
kehilangan single transaction jika terjadi crash saat terjadi penulisan
pada active node.
• Asynchronous : File system
akan diberitahu bahwa penulisan selesai saat data selesai
ditulis pada local disk. Asynchronous
ini dibutuhkan pada saat melakukan mirror jarak
jauh.
Topologi Jaringan
FKIP Universitas Sebelas
Maret mempunyai gedung di berbagai titik di Kota Surakarta antara lain
Kentingan, Kleco, Pabelan dan Manahan, pusat data center sendiri
terletak di Jl. Ir Sutami 36A Kentingan Jebres Surakarta dan juga terdapat data
center kedua pada kampus PGSD Kleco Surakarta. Dari keadaan tersebut backup
data akan di letakan pada data center PGSD Kleco yang jaraknya dengan data
center utama 10Km. Data center utama memiliki bandwidth 50Mbps,
data center PGSD Kleco
terdapat 2 Link, yaitu link
wireless (12Mbps) Lokal Link ke data center utama dan fiber
optic (4Mbps) Local Link
Dengan kondisi tersebut link
data center PGSD Kleco slanjutnya akan dimanfaatkan
sebagai berikut, Link
wireless akan di gunakan sebagai jalur backup data dengan data
center utama dan Link Fiber Optic akan digunakan untuk akses keluar
server backup yang ada pada data center PGSD Kleco.
Metode Backup Data
Dalam perancangan Disater
Recovery Plan backup data merupakan salah satu elemen
penting, metode backup data
yang akan diterapkan adalah metode backup data mirror,
yaitu membuat salinan
persis dari data center utama, backup data akan dilakukan dengan
cara backup berkala dan backup real time. Kedua data center
tersebut akan dijadikan fail over dengan master data center
utama. Aplikasi dan service yang akan digunakan pada
implementasi ini yaitu :
• DRDB
• Heartbeat
• Rsync
• Crontab
Didalam implementasi ini
DRDB akan digunakan untuk mirror data Synchronous
sehingga akan terjadi backup
real time Antara kedua data center. Heartbeat akan digunakan untuk
membuat IP share (IP Floating) antara 2 data center sehingga apabila
master (data center utama) mengalami down maka data center backup (data center
PGSD Kleco) akan mengambil alih peran data center utama secara otomatis, dan semua
aplikasi dan content yang ada pada data center utama akan bisa diakses
melalui mirror pada
data center backup.Rsync akan digunakan untuk melakukan
penyalinan data secara
masal untuk membuat backup yang sifatnya periodik, untuk penjadwalan backup
menggunakan crontab.
Implementasi Sistem dan
Hasil
Implementasi Disaster
Recovery Plan pada data center FKIP Universitas Sebelas Maret
dimulai dengan Instalasi
system dan pemasangan IP, Persiapan Partisi, Instalasi DRBD, Instalasi Hearbeat
dan Uji Coba System.
Instalasi system
Sistem operasi yang
digunakan dalam penelitian ini adalah OS debian 6. OS Debian
akan diinstall di 2 server
dengan kapasitas hardisk dan pembagian partisi yang sama. Pada saat instalasi system,
penulis menyiapkan sisa kapasitas hardisk 80Gb yang nantinya akan digunakan
sebagai DRBD disk. Setiap server harus menggunakan
minimal 2 buah lan card yaitu
satu sebagai DRBD dedicated network dan satu lagi sebagai heartbeat communication
dan client server network. Pembagian IP server sebagai
berikut :
• Server 1 ( Data
Center Utama)
o Eth0 :
203.6.111.2
o Eth1 :
192.168.10.1
• Server 2 ( Data
Center Backup)
o Eth0 : 203.6.111.3
o Eth1 :
192.168.10.2
• Ip Floating
203.6.111.4
Persiapan Partisi
Pada langkah persiapan
partisi, untuk sistem fail over dalam sebuah server, selain
partisi swap dan root,
dibutuhkan 2 buah partisi, yaitu metadisk dan partisi yang akan
digunakan untuk DRBD disk, metadisk diberi kapasitas 1 Gb sedangkan
untuk DRBD disk, diberi kapasitas sisa harddisk, (pastikan bahwa
DRBD disk di setiap server memiliki ukuran partisi yang sama besar). Partisi
hardisk dapat dilakukan dengan
menggunakan tools di
linux. Jika sudah terinstall, bisa dengan menjalankan perintah parted.
Hasil dari table partisi sebagai berikut. Dalam penelitian ini penulis
mengalokasikan 80Gb sebagai DRBD disk.
Instalasi DRBD
Instalasi DRBD memerlukan
beberapa dependency pendukung lainnya. Untuk
melakukan instalasi DRBD
dan paket dependency bisa menggunakan perintah berikut :
Sudo
apt-get install make gcc libc6 flex
linux-headers-`uname
-r` libc6-dev linuxkernel-
headers
DRBD-utils
Setelah proses instalasi
berjalan hingga selesai, selanjutnya memasang file configurasi DRBD disk,
dengan perintah pico /etc/Drbd.conf. isi file Drbd.conf adalah
:
global
{ usage-count yes;}
common
{ syncer { rate 200M; }}
resource
dataku {
protocol
C;
handlers
{
pri-on-incon-degr
"/usr/lib/DRBD/notify-prion-
incon-degr.sh;
/usr/lib/DRBD/notifyemergency-
reboot.sh;
echo b > /proc/sysrq-trigger
;
reboot -f";
pri-lost-after-sb
"/usr/lib/DRBD/notify-prilost-
after-sb.sh;
/usr/lib/DRBD/notify-emergencyreboot.
sh;
echo b > /proc/sysrq-trigger ; reboot -
f";
local-io-error
"/usr/lib/DRBD/notify-ioerror.
sh;
/usr/lib/DRBD/notify-emergencyshutdown.
sh;
echo o > /proc/sysrq-trigger ; halt -
f";
fence-peer
"/usr/lib/heartbeat/DRBD-peeroutdater
-t
5";
}
startup
{
degr-wfc-timeout
120; # 2 minutes.
outdated-wfc-timeout
2; # 2 seconds.
wait-after-sb;
Selanjutnya, membuat
meta-disk pada partisi hard
disk yang telah disiapkan
dengan mengetikan perintah DRBDadm create-md dataku. Dataku
pada perintah terakhir adalah nama source yang dibuat pada file Drbd.conf.
Dalam tahap instalasi DRBD, perlakuan diatas dilakukan kepada server
data center utama dan server data center backup. Untuk
melihat status DRBD bisa dilihat
dengan perintah service
drbd status. Menjadikan salah satu node menjadi master
dengan perintah drbdadm --overwrite-data-of-peer primary data.
Kemudian untuk melihat status DRBD secara real time dengan perintah watch
-n 1 cat /proc/drbd.
Uji Coba system
Pengujian system dilakukan
dengan cara mematikan server pada data center utama, jika system sudah berjalan
dengan sebagaimana mestinya maka server backup akan langsung melakukan take
over dan IP akan berpindah ke server backup. Selanjutnya server
utama dimatikan untuk menguji apakah system yang telah diinstal dan di
konfigurasi bekerja dengan
baik, Dengan berpindahnya IP Floating ke server backup setelah server utama di
matikan menandakan heartbeat berjalan dengan baik dan
system fail over sudah
berjalan.
Sumber :