Selasa, 27 Mei 2014

DATA WAREHOUSE

PENGERTIAN DATAWAREHOUSE



Nama :
1.      Fairuz Rahman               (1501153721)
2.      Arvin Tobias                   (1501150625)
3.      Kevin Samantha             (1501155802)
4.      Charles                           (1501149232)




datawarehouse adalah suatu sistem komputer untuk mengarsipkan dan menganalisis data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Pada umumnya suatu organisasi menyalin informasi dari sistem operasionalnya (seperti penjualan dan SDM) ke gudang data menurut jadwal teratur, misalnya setiap malam atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan
 
 
kueri kompleks dan analisis (contohnya penambangan data, data mining) terhadap informasi tersebut tanpa membebani sistem yang operasional.


Datawarehose sering di integrasikan dengan berbagai system apliskasi untuk mendukung laporan dan analisa data dengan menyediakan history data yang menyediakan infrastruktur bagi DSS dan EIS


 Data warehouse bukan merupakan basis data operasional, melainkan basis data yang berisi data dalam dimensi waktu tertentu yang sangat berguna untuk keperluan evaluasi, analisis dan perencanaan yang dilakukan oleh pihak manajemen dalam sebuah perusahaan. Meskipun demikian, belum banyak perusahaan yang mengembangkan dan menerapkan data warehouse serta memanfaatkannya guna menunjang berbagai hal penting didalam organisasi atau institusi.

 Perencanaan arsitektur pada pengembangan data warehouse ini meliputi arsitektur logical dan arsitektur fisik.

 Arsitektur logical berupa rancangan tahapan alur data dari sumber data sampai menjadi data pada data warehouse, sedangkan arsitektur fisik berupa gambaran konfigurasi teknis dari data warehouse tersebut.


KOMPONEN DATAWAREHOUSE
Data Source
Untuk membangun suatu datawarehouse yang baik data yang didapatkan harus teralokasi dengan baik. Ini melibatkan OLTP saat ini dimana informasi ‘dari hari ke hari’ tentang bisnis yang berjalan, tentunya dengan data historis periode sebelumnya, yang mungkin telah dikumpulkan dalam beberapa bentuk sistem lain. Sering kali data yang terbentuk bukan terbentuk database relasional, sehingga membutuhkan banyak upaya untuk mengambil data yang diinginkan.
Design Datawarehouse
Proses perancangan datawarehouse sangat berhati-hati untuk memilih jenis query yang digunakan dalam datawarehouse. Tahapan ini sangat memerlukan pemahaman yang baik tentang skema database yang ingin dibuat, dan haruslah selalu aktif untuk berkomunikasi dengan pengguna. Desain adalah proses yang tidak dilakukan satu kali, melainkan berulang-ulang agar model yang dimiliki stabil. Tahap ini harus dilakukan secara berhati-hati karena model akan diisi dengan data yang jumlahnya sangat banyak, yang salah satunya dari beberapa model adalah model yang tak dapat diubah.
Akuisi data
Proses perpindahan data dari sumbernya (source) ke datawarehouse. Proses ini proses yang menggunakan banyak waktu dalam proyek datawarehouse, dan dilakukan dengan software yang dikenal dengan ETL (extract,transform,load) Tools. Sekarang sudah hamper lebih kurang 60 tool yang tersebar diranah maya. Waktu yang dibutuhkan untuk akuisisi data bisa mencapai berbulan-bulan bahkan bertahun-tahun.
Perubahan data tangkapan
Pembaharuan data periodik datawarehouse dari sistem transaksi menjadi rumit karena harus diidentifikasi dari sumber data yang selalu up to date. Ini disebut dengan ‘perubahan data capture’. Ini merupakan tahapan khusus, dan sudah cukup banyak software yang beredar untuk mengatasinya. Seperti Replication Server, Publish/Subscribe, Triggers and Stored Procedures, dan Database log Analysis.
Pembersihan Data
Ini biasanya dilakukan dengan akuisisi data, kalau dalam ETL ini terdapat pada bagian ‘T’. Datawarehouse yang berisi data tidak benar tidak hanya tak berguna, tapi juga menyesatkan. Ide dibalik pembuatan datawarehouse adalah untuk memudahkan pengambilan keputusan, jika keputusan yang besar yang ditunjang oleh data yang tidak valid maka perusahaan mengalami resiko yang amat besar pula.
Pembersihan data suatu proses rumit yang memvalidasi dan bila perlu mengoreksi data sebelum masuk kedalam datawarehouse. Pembersihan data dapat juga disebut sebagai “data scrubbing” atau“penjamin kualitas data”, proses ini harus dilakukan secara berhati-hati dan dilakukan keseluruhan terutama datawarehouse yang diambil dari perangkat yang sudah tua.
Data Aggregation
Termasuk proses tansformasi, datawarehouse dirancang untuk menyimpanan yang amat detil dari tiap transaksi, untuk beberapa tingkat aggregate(ringkasan). Keuntungan jika data diringkas yaitu query khusus dalam datawarehouse berjalan lebih cepat. Kekurangannya adalah informasi yang didapat kurang, karena ringkasnya data yang ada pada datawarehouse. Ini harus berhati-hati karena keputusan tidak dapat dibatalkan tanpa membangun kembali datawarehouse dan mencocokan dengan datawarehouse lain (atau sumber data lain). Paling aman digunakan oleh perusahaan yang amat besar, yang mampu membangun datawarehouse tingkat detail yang tinggi dengan biaya yang besar pula.
3 Model Datawarehouse
Enterprise Datawarehouse
Semua informasi yang dikumpulkan berupa subjek, yang mencakup seluruh organisasi perusahaan.
Data Mart
Sebagian data dari bagian perusahaan yang mempunyai nilai bagi pengguna. Ruang lingkupnya lebih spesifik, seperti data Penjualan atau marketing saja.
Virtual Warehouse
Memantau melalui data operasional pada database. Suatu ringkasan dari data yang fleksibel, mengurangi biaya untuk pengguna yang membutuhkan. Karena tersedianya data yang siap disajikan tidak hanya untuk beberapa pengguna didalam perusahaan, akan tetapi perusahaan lain yang membutuhkan data tersebut dapat mudah untuk memperolehnya.
Keuntungan Datawarehouse
Datawarehouse menyediakan model data yang bervariasi, dan tidak bergantung pada satu sumber data saja. Hal ini memudahkan pimpinan perusahaan/manager membuat laporan dan menganalisa.
Saat me-load data ke dalam datawarehouse, data yang tidak konsisten akan diketahui dan secepatnya dirubah. Mendukung proses pembuatan laporan, agar keputusan yang diambil adalah keputusan yang benar sesuai data.
Keamanan informasi didalam datawarehouse terjamin, karena datawarehouse selalu digunakan dan dimonitor oleh pengguna datawarehouse tersebut.
Dalam membuat laporan tidak membuat proses transaksi yang ada menjadi lambat, karena datawarehouse terpisah dengan database operasional.
Datawarehouse menyediakan berbagai macam bentuk laporan yang terbaru.
Kerugian Datawarehouse
Datawarehouse tidak cocok untuk data yang tidak struktur.
Data perlu di extract, diubah, dan di load ke datawarehouse, sehingga membutuhkan waktu (delay) kerja untuk datawarehouse yang belum terbentuk.
Semakin lama masa hidup bisnis yang menggunakan datawarehouse, maka semakin banyak biaya yang dikeluarkan oleh perusahaan untuk memodifikasi teknologi datawarehouse atau perawatan berjalan datawarehouse.
Jika data yang diambil lambat, maka data yang dimiliki di datawarehouse tidak berkulitas/ sehingga laporan tidak optimal

Tidak ada komentar:

Posting Komentar