Minggu, 09 Maret 2014

Penerapan DRP pada Data Center FKIP UNS

Penerapan DRP pada Data Center FKIP UNS
Pengertian
Disaster (bencana) didefinisikan sebagai kejadian yang waktu terjadinya tidak dapat diprediksi dan bersifat sangat merusak. Pengertian ini mengidentifikasikan sebuah kejadian yang tiba-tiba, tidak diharapkan, bersifat sangat merusak, dan kurang perencanaan. Bencana terjadi dengan frekuensi yang tidak menentu dan akibat yang ditimbulkannya meningkat bagi mereka yang tidak mempersiapkan diri terhadap kemungkinan-kemungkinan timbulnya bencana. Berbagai bencana yang mungkin terjadi antara lain adalah:
  1. Bencana alam disebabkan oleh kondisi geografis dan geologis dari lokasi
  2. Kebakaran disebabkan oleh faktor lingkungan dan pengaturan sistem elektrik yang dapat menyebabkan korsleting
  3. Kerusakan pada jaringan listrik disebabkan oleh sistem elektrik
  4. Serangan teroris disebabkan oleh lemahnya keamanan fisik dan non fisik data center
  5. Sistem atau perangkat yang rusak terkait dengan kesalahan manajemen pengawasan perangkat
  6. Kesalahan operasional akibat ulah manusia
  7. Virus misalkan disebabkan oleh kesalahan pemilihan anti virus yang digunakan
Disaster Recovery menurut terjemahan aslinya mengandung arti pemulihan bencana. DR jika dikaitkan dengan dunia bisnis, akan membawa kita pada definisi #Disaster Recovery Planning (DRP) dan #Business Continuity Plan (BCP).Bisnis akan bergantung pada informasi yang tersebar dan aplikasi yang memproses informasi tersebut, sehingga aplikasi penopang utama yang spesifik menjadi sangat kritikal sehingga ketika terjadi gangguan hanya beberapa saat maka dapat melumpuhkan kelangsungan bisnis perusahaan. Oleh karenanya, beberapa perusahaan mempunyai suatu arahan yang menjamin availabilitas kelangsungan bisnis ketika terjadi suatu bencana/gangguan yang tidak direncanakan atau sudah direncanakan. Arahan ini yang dituangkan dalam #Disaster Recovery Planning (DRP).
Replikasi Data
Satu hal yang menjadi sangat krusial dalam Pemulihan Bencana adalah data dan informasi, sebagaimana telah disebutkan sebelumnya sangat penting untuk menjaga kekonsistenan dari data dan informasi bagi perusahaan. Kebutuhan ini dapat diakodomasi dengan menggunakan teknologi replikasi data. Replikasi data adalah sebuah proses yang mengkopi isi data ke suatu lokasi remote baik yang berlangsung secara kontinu ataupun pada interval tertentu. Replikasi data akan menyediakan hasil kopi data yang lengkap untuk tujuan Pemulihan Bencana. Lokasi remote biasanya merupakan secondary data center.
Teknologi replikasi data memiliki fungsi yang rumit karena secara cerdas mengkopi data ke lokasi yang remote, setelah data yang lengkap sudah direplikasi ke target yang dimaksud maka hanya data yang berubah yang akan direplikasi selanjutnya, sehingga akan menghemat kebutuhan bandwith. Data kopian inisial yang ada di penyimpanan remote biasa disebut sebagai seeding (penanaman benih). Setelah data di-"seeding", fungsi replikasi berikutnya dapat berjalan pada dua mode yaitu:
  • Mode Replikasi Synchronous
    Mode replikasi sinkron memungkinkan pertukaran data secara
    real-time sehingga kesinkronan suatu data akan terjaga, dimana saat ada transaksi operasional yang sedang menulis sesuatu ke disk sumber, maka saat yang bersamaan penulisan juga dilakukan terhadap disk target yang ada di lokasi remote. Keseluruhan proses penulisan pada disk sumber dan disk target harus selesai terlebih dahulu sebelum beranjak ke transaksi operasional selanjutnya dan diberi acknowledge untuk keduanya jika telah selesai. Pada mode replikasi ini, kebutuhan akan performansi sistem yang tinggi harus dipertimbangkan. Selain itu jarak antara disk sumber dan disk target juga menjadi prasyarat utama, bahwa pihak yang terlibat dalam mode replikasi ini harus berjarak < 100km antara keduanya. Keuntungan dari mode replikasi ini adalah menyediakan recovery yang konsisten dan lengkap untuk semua jangka waktu.

  • Mode Replikasi Asynchronous
    Mode replikasi asinkron memungkinkan pertukaran data secara
    buffering dalam artian bahwa data akan diletakkan dalam sebuah 'penampung sementara terlebih dahulu, kemudian pada jangka waktu tertentu akan direplikasi ke disk target. Data yang direplikasi ke disk target tidak membutuhkan acknowledgement agar penulisan transaksi operasional pada disk sumber dapat berlangsung kembali. Sehingga mode replikasi ini tidak menjamin kesinkronan suatu data pada dua pihak yang terlibat karena jika suatu saat terjadi crash pada salah satu pihak dan data belum sempat direplikasi maka data yang terdapat pada kedua pihak tidak bisa dikatakan sebagai sebuah data yang sinkron. Walaupun hal ini dapat meningkatkan performansi sistem, namun lebih memiliki banyak risiko. Jika hal ini terjadi maka recovery yang cukup rumit dilakukan (namun tidak menjamin data hasil recovery adalah data yang benar dan konsisten karena ada kemungkinan hilangnya beberapa data). Keuntungan dari mode replikasi ini adalah efektivitas biaya.
Selain itu, berdasarkan tempat dimana proses replikasi berjalan, dapat ditentukan tipe replikasi yang cocok untuk kebutuhan bisnis perusahaan, yaitu:
Database to Database
Proses replikasi berlangsung pada server basis data. Satu server basis data akan bertindak sebagai master dan kemudian ada beberapa server basis data sebagai slave yang menyimpan kopi dari basis data tersebut. Ketika terjadi proses penulisan pada basis data maka akan terjadi penulisan tersebut akan segera dikirim ke basis data master yang kemudian akan direplikasi oleh server basis data yang bersifat slave. Ketika dilakukan proses pembacaan pada basis data, maka dapat dilakukan terhadap semua server basis data yang tersedia, hal ini tentu saja akan meningkatkan performansi sistem basis data terkait dengan load sharing. Keunggulan lain dari replikasi basis data adalah tingkat availabilitas yang tinggi, karena ketika terjadi crash terhadap server master basis data, server slave basis data dapat mengambil alih pekerjaan server master.

Host to Host
Disebut juga sebagai replikasi yang processor-based. Proses replikasi berjalan pada sistem sumber dan target. Oleh karenanya, sangat mungkin terjadi perselisihan antara sistem sumber dan target saat berlangsung proses replikasi. Hal ini terjadi karena agen yang berjalan pada masing-masing sistem dalam menjalankan proses tracking perubahan data dan replikasi data, jalur yang dilakukan adalah melalui koneksi IP. Replikasi data mode ini berjalan pada level aplikasi atau level OS. Host-to-host merupakan mode replikasi yang paling umum diimplementasikan karena merupakan solusi software. Replikasi host-to-host memanfaatkan sumber daya pada server sumber dan target yang akan berdampak pada performansi, kemudian mensyaratkan bahwa sistem yang berada di lokasi remote harus selalu dalam keadaan up sepanjang waktu. Keuntungan yang signifikan dari mode replikasi ini adalah storage agnostic, yang berarti bahwa dapat dilakukan pen-deployan tanpa memperhatikan tipe storage yang digunakan (internal, eksternal, SAN atau NAS).

Disk to Disk
Replikasi mode disk-to-disk berjalan pada perangkat eksternal storage seperti SAN atau NAS. Mode replikasi ini secara normal diimplementasikan pada vendor-vendor disk array seperti EMC, Hitachi, IBM, HP dan lainnya. Setiap vendor akan menyediakan aplikasi software yang cocok dengan array storage masing-masing vendor.Kebanyakan disk array menggunakan koneksi fibre channel, sehingga router storage diperlukan untuk meningkatkan kemampuan koneksi melalui link WAN. Replikasi disk-to-disk memanfaatkan sumber daya dari perangkat eksternal storage dan bersifat transparan ke host. Karena proses replikasi berjalan pada perangkat storage, maka host yang menjadi target tujuan tidak diperlukan lagi.






Implementasi
Lima elemen utama yang penting untuk fungsi dasar dari sebuah data center adalah :
• Aplikasi
• Database
• Server dan Operating System
• Jaringan
• Storage Array

Backup Management

Backup merupakan sebuah proses penduplikasian data kedalam media yang terpisah. Data hasil duplikasi tersebut nantinya akan digunakan untuk memulihkan kembali data
bila terjadi kerusakan atau kehilangan data.Backup biasanya digunakan dengan dua tujuan utama yaitu :
Untuk memulihkan kembali data yang mengalami kerusakan/kehilangan pada saat
terjadi bencana.
Untuk memulihkan sebagian kecil data yang mengalami kerusakan atau kehilangan akibat kesalahan manusia.
Jenis – jenis strategi backup adalah sebagai berikut,
Snapshot Backup
Data diduplikasi secara live dengan melakukan penguncian terhadap seluruh data untuk sementara waktu dan kemudian dilakukan snapshot terhadap data tersebut yang
dilanjutkan dengan dilepas agar dapat beroperasi kembali.
Full Backup
Data diduplikasi secara keseluruhan baik data yang sudah pernah diduplikasi maupun belum pernah kedalam media yang terpisah. Backup dilakukan secara berkala.
Differential Backup
Data yang diduplikasi hanya merupakan data baru atau data yang mengalami perubahan. Pada proses backup ini, data tidak pernah dilakukan marking. Backup dilakukan secara berkala.
Incremental Backup
Data yang diduplikasi hanya data yang belum pernah dilakukan backup. Bila terjadi
perbedaan byte pada data, maka hanya perbedaan dari byte data tersebut yang akan
diduplikasi Backup dilakukan secara berkala.
Continuous Backup
Data dilakukan duplikasi secara terus menerus terhadap seluruh data yang berubah.


Heartbeat

Merupakan aplikasi dasar untuk Linux-HA (Linux High Availability). Heartbeat akan
menjalankan script inisialisasi untuk HA dan saat node atau server mati dan hidup. HeCasing minicube heartbeat juga melakukan perpindahan IP dari satu node ke node yang lain (IP floating). Komunikasi heartbeat bisa dilakukan melalui serial ports, UDP/IP broadcast (ethernet,etc), UDP/IP multicast (ethernet). Selain itu heartbeat juga menangani service-service apa saja yang akan dijalankan pada saat node atau server menjadi aktif.


DRBD Distributed Replicated Block Device

Merupakan solusi replikasi storage block device (hard disk, partitions, logical volumes etc) menggunakan software antar dua server pada linux.

DRBD melakukan mirror data dengan :

Uptime: Replikasi dilakukan secara terus menerus saat aplikasi melakukan modifikasi
data pada block device.
Synchronous : Dengan melakukan mirroring sinkron, file system pada aktif node diberitahu bahwa proses penulisan telah berhasil saat penulisan telah dilakukan pada kedua block device dari masing masing node. Synchronous mirrorong ( protocol C DRBD) adalah pilihan untuk local network agar tidak kehilangan single transaction jika terjadi crash saat terjadi penulisan pada active node.
Asynchronous : File system akan diberitahu bahwa penulisan selesai saat data selesai
ditulis pada local disk. Asynchronous ini dibutuhkan pada saat melakukan mirror jarak
jauh.

Topologi Jaringan

FKIP Universitas Sebelas Maret mempunyai gedung di berbagai titik di Kota Surakarta antara lain Kentingan, Kleco, Pabelan dan Manahan, pusat data center sendiri terletak di Jl. Ir Sutami 36A Kentingan Jebres Surakarta dan juga terdapat data center kedua pada kampus PGSD Kleco Surakarta. Dari keadaan tersebut backup data akan di letakan pada data center PGSD Kleco yang jaraknya dengan data center utama 10Km. Data center utama memiliki bandwidth 50Mbps, data center PGSD Kleco
terdapat 2 Link, yaitu link wireless (12Mbps) Lokal Link ke data center utama dan fiber optic (4Mbps) Local Link
Dengan kondisi tersebut link data center PGSD Kleco slanjutnya akan dimanfaatkan
sebagai berikut, Link wireless akan di gunakan sebagai jalur backup data dengan data center utama dan Link Fiber Optic akan digunakan untuk akses keluar server backup yang ada pada data center PGSD Kleco.


Metode Backup Data

Dalam perancangan Disater Recovery Plan backup data merupakan salah satu elemen
penting, metode backup data yang akan diterapkan adalah metode backup data mirror,
yaitu membuat salinan persis dari data center utama, backup data akan dilakukan dengan cara backup berkala dan backup real time. Kedua data center tersebut akan dijadikan fail over dengan master data center utama. Aplikasi dan service yang akan digunakan pada implementasi ini yaitu :
DRDB
Heartbeat
Rsync
Crontab



Didalam implementasi ini DRDB akan digunakan untuk mirror data Synchronous
sehingga akan terjadi backup real time Antara kedua data center. Heartbeat akan digunakan untuk membuat IP share (IP Floating) antara 2 data center sehingga apabila master (data center utama) mengalami down maka data center backup (data center PGSD Kleco) akan mengambil alih peran data center utama secara otomatis, dan semua aplikasi dan content yang ada pada data center utama akan bisa diakses
melalui mirror pada data center backup.Rsync akan digunakan untuk melakukan
penyalinan data secara masal untuk membuat backup yang sifatnya periodik, untuk penjadwalan backup menggunakan crontab.

Implementasi Sistem dan Hasil

Implementasi Disaster Recovery Plan pada data center FKIP Universitas Sebelas Maret
dimulai dengan Instalasi system dan pemasangan IP, Persiapan Partisi, Instalasi DRBD, Instalasi Hearbeat dan Uji Coba System.

Instalasi system

Sistem operasi yang digunakan dalam penelitian ini adalah OS debian 6. OS Debian
akan diinstall di 2 server dengan kapasitas hardisk dan pembagian partisi yang sama. Pada saat instalasi system, penulis menyiapkan sisa kapasitas hardisk 80Gb yang nantinya akan digunakan sebagai DRBD disk. Setiap server harus menggunakan
minimal 2 buah lan card yaitu satu sebagai DRBD dedicated network dan satu lagi sebagai heartbeat communication dan client server network. Pembagian IP server sebagai berikut :
Server 1 ( Data Center Utama)
o Eth0 : 203.6.111.2
o Eth1 : 192.168.10.1
Server 2 ( Data Center Backup)
o Eth0 : 203.6.111.3
o Eth1 : 192.168.10.2
Ip Floating 203.6.111.4



Persiapan Partisi

Pada langkah persiapan partisi, untuk sistem fail over dalam sebuah server, selain
partisi swap dan root, dibutuhkan 2 buah partisi, yaitu metadisk dan partisi yang akan digunakan untuk DRBD disk, metadisk diberi kapasitas 1 Gb sedangkan untuk DRBD disk, diberi kapasitas sisa harddisk, (pastikan bahwa DRBD disk di setiap server memiliki ukuran partisi yang sama besar). Partisi hardisk dapat dilakukan dengan
menggunakan tools di linux. Jika sudah terinstall, bisa dengan menjalankan perintah parted. Hasil dari table partisi sebagai berikut. Dalam penelitian ini penulis mengalokasikan 80Gb sebagai DRBD disk.

Instalasi DRBD

Instalasi DRBD memerlukan beberapa dependency pendukung lainnya. Untuk
melakukan instalasi DRBD dan paket dependency bisa menggunakan perintah berikut :

Sudo apt-get install make gcc libc6 flex
linux-headers-`uname -r` libc6-dev linuxkernel-
headers DRBD-utils


Setelah proses instalasi berjalan hingga selesai, selanjutnya memasang file configurasi DRBD disk, dengan perintah pico /etc/Drbd.conf. isi file Drbd.conf adalah :

global { usage-count yes;}
common { syncer { rate 200M; }}
resource dataku {
protocol C;
handlers {
pri-on-incon-degr "/usr/lib/DRBD/notify-prion-
incon-degr.sh; /usr/lib/DRBD/notifyemergency-
reboot.sh; echo b > /proc/sysrq-trigger
; reboot -f";
pri-lost-after-sb "/usr/lib/DRBD/notify-prilost-
after-sb.sh; /usr/lib/DRBD/notify-emergencyreboot.
sh; echo b > /proc/sysrq-trigger ; reboot -
f";
local-io-error "/usr/lib/DRBD/notify-ioerror.
sh; /usr/lib/DRBD/notify-emergencyshutdown.
sh; echo o > /proc/sysrq-trigger ; halt -
f";
fence-peer "/usr/lib/heartbeat/DRBD-peeroutdater
-t 5";
}
startup {
degr-wfc-timeout 120; # 2 minutes.
outdated-wfc-timeout 2; # 2 seconds.
wait-after-sb;

Selanjutnya, membuat meta-disk pada partisi hard
disk yang telah disiapkan dengan mengetikan perintah DRBDadm create-md dataku. Dataku pada perintah terakhir adalah nama source yang dibuat pada file Drbd.conf. Dalam tahap instalasi DRBD, perlakuan diatas dilakukan kepada server data center utama dan server data center backup. Untuk melihat status DRBD bisa dilihat
dengan perintah service drbd status. Menjadikan salah satu node menjadi master dengan perintah drbdadm --overwrite-data-of-peer primary data. Kemudian untuk melihat status DRBD secara real time dengan perintah watch -n 1 cat /proc/drbd.


Uji Coba system
Pengujian system dilakukan dengan cara mematikan server pada data center utama, jika system sudah berjalan dengan sebagaimana mestinya maka server backup akan langsung melakukan take over dan IP akan berpindah ke server backup. Selanjutnya server utama dimatikan untuk menguji apakah system yang telah diinstal dan di
konfigurasi bekerja dengan baik, Dengan berpindahnya IP Floating ke server backup setelah server utama di matikan menandakan heartbeat berjalan dengan baik dan
system fail over sudah berjalan.

Sumber :



Tidak ada komentar:

Posting Komentar