BAB 6 Physical Database Design Dalam arsitektur sistem yang ditunjukkan pada Gambar 6 1, kami memiliki satu ETL server, dua server database( berkerumun), dua lapran server( beban seimbang), dan dua OLAP server. Kami telah 12TB baku ruang disk di SAN terdiri dari 85 disk, masing- masing dengan 146GB kapasitas dan 15, 000 RPM. Semua kneksi jaringan ke SAN adalah melalui jaringan serat, dan untuk ketersediaan tinggi kita memiliki dua switch Fibre Channel. Kami memperkirakan bahwa jumlah PC klien yang akan menggunakan data warehuse adalah antara 300 dan 500.Amadeus Hiburan data warehuse digunakan untuk mendukung CRM kegiatan, baik cus- gan APC analisis dan manajemen kampanye perasi. Ini berarti kampanye data respn perlu dimuat ke gudang data banyak kali sehari, dan kampanye seg- pemikiran perlu query data warehuse banyak kali sehari. Pengguna perlu menjalankan membeli analisis terhadap data pesanan di gudang data beberapa kali sehari. Mengalkasikan ruang disk pada SAN untuk analisis Layanan idealnya harus dipisahkan dari database server untuk alasan yang sama sehingga Anda dapat mengptimalkan dan menyempurnakan penggunaan disk secara terpisah. Hal ini dilakukan dengan mengknfigurasi disk pada jaringan area penyimpanan (SAN) menjadi dua set terpisah drive lgis.beberapa pertimbangan untuk ukuran server database dari data warehuse adalah sebagai berikut: Jumlah dan kmpleksitas dari lapran, aplikasi, dan langsung query memukul DDS: Faktr utama yang menentukan spesifikasi server database adalah beban kerja dari aplikasi query.dds adalah pengguna menghadap ke database.
Apakah kita mengambil ELT atau ETL pendekatan dalam mengisi NDS / ODS: Sebuah pendekatan ELT lad data ke server database dalam frmat baku (dengan kata lain, sama seperti frmat sistem sumber) dan kemudian menggunakan kekuatan server database untuk mengubah data ke dalam frmat NDS atau ODS dalam perasi berbasis set melalui prsedur yang tersimpan Perhitungan dari panggung untuk NDS/ BPO dan kmpleksitas aturan firewall: Jika prses ini berjalan di terpisah ETL server, maka mereka jangan mempengaruhi database server ukuran. Bagaimana menyimpan data secara fisik dirancang( pengindeksan, partisi, dan sebagainya): Data fisik- dasar desain mempengaruhi database knfigurasi server karena jika kita memanfaatkan fisik tertentu fitur database. SQL Server yang tersedia dalam enam edisi: Express, Evaluasi, Pengembang, Wrkgrup, Stan- dard, dan Enterprise. empat pertama adalah untuk percbaan, pengembangan, dan aplikasi kecil. Untuk data kelas enterprise slusi pergudangan di lingkungan prduksi seperti di Amadeus Hiburan studi kasus, secara praktis kita dapat menggunakan hanya dua terakhir, Standard Edi- tin atau Enterprise Editin. SQL Server Standard Editin mendukung empat CPU dan tak terbatas RAM. Kemampuan ini sesuai dengan Amadeus Hiburan studi kasus. Tapi karena ketersediaan tinggi dan persyaratan kinerja, untuk Amadeus Hiburan studi kasus kita perlu SQL Server Enterprise Editin. Alasan utama adalah bahwa fitur berikut tidak tersedia di Edisi Standar: Tabel dan indeks partisi: Fitur-fitur ini memungkinkan kita untuk secara fisik membagi meja ke dalam ptngan yang lebih kecil bahwa kita dapat memuat dan permintaan secara terpisah. Lapran Server penyebaran skala-ut: Ini berarti kita dapat menjalankan Reprting Services pada multi server web ple, semua mengakses database layanan pelapran yang sama di SQL Server yang sama. Analisis Layanan dipartisi kubus: Fitur ini memungkinkan kita untuk membagi sebuah kubus ke dalam ptngan yang lebih kecil bahwa kita dapat memuat dan query secara terpisah. Semiadditive aggregate functins: These are functins that wrk with measures that can be summed up in sme dimensins but nt in ther dimensins. Kita perlu berurusan dengan lisensi. Secara umum, ada dua SQL Server mdel lisensi:
Per- prsesr lisensi: Kami membeli lisensi untuk setiap prsesr di server. Tidak peduli berapa banyak pengguna yang kita miliki. Server + lisensi CAL: Kami membeli lisensi untuk server dan lisensi akses klien (CAL) untuk setiap klien mengakses server. Pertimbangan penyimpanan Database lain akan menciptakan adalah metadata. Hal ini tidak besar, mungkin 10 20GB. All- cating 50GB akan cukup. ini diperkirakan berdasarkan isi dari metadata database. The metadata database tk tujuh jenis metadata: definisi data dan pemetaan metadata, struktur data metadata, sistem sumber metadata, ETL prses metadata, kualitas data metadata, audit metadata, dan penggunaan metadata. Sebuah vlume sistem berkas digunakan untuk ETL penyimpanan sementara, mungkin 20 persen menjadi 30 persen dari ukuran data vlume, dalam RAID 5. Persentase ini ditentukan berdasarkan sumber mana tabel sistem akan perlu untuk dipentaskan di file daripada dalam database.kami juga perlu membuat sebuah kurum vlume untuk mendukung cluster failver, pada tingkat RAID 1. Qurum vlume drive dapat diakses leh setiap nde di cluster. Hal ini digunakan untuk arbitrase antara nde cluster dan untuk menyimpan data yang digunakan untuk pemulihan setelah kmunikasi gagal- ure dalam cluster. Knfigurasi Databases Sekarang kami telah merancang database, mari kita membuat mereka dalam SQL Server. Berikut adalah beberapa pin yang Anda mungkin ingin mempertimbangkan saat membuat database. Mari kita mengambil studi kasus tainment Amadeus masukkan-sebagai cnth dalam pin ini: Menjaga nama database pendek dan ringkas. DDS, NDS, Stage, dan Meta akan melakukan. Menjaga pengumpulan semua data warehuse database yang sama, sebaiknya sesuai standar instalasi SQL Server perusahaan ditentukan leh SQL Server DBA. Pertimbangkan sensitivitas kasus yang sangat hati-hati. Hasil query akan berbeda tergantung pada sensitivitas kasus. Mengatur file data untuk mendukung sebelumnya filegrup pengaturan, yang berarti bahwa saat membuat database, tempat file data sesuai filegrup lkasi.
Ukuran file lg tergantung pada ukuran beban harian, mdel pemulihan, dan metde pembebanan (ETL atau ELT, panggung atau tidak tahap. Untuk database metadata, kita perlu mengatur mdus pemulihan penuh. Kualitas data dan aplikasi frnt-end juga akan menulis ke metadata. Untuk tahap database, kami tidak perlu tmatis memperbarui statistik karena kita bukan usu- sekutu indeks tabel. Kami masih ingin sederhana mdel pemulihan, dan kami masih tidak perlu autshrink untuk tahap database. Ingatlah untuk menempatkan tahap file lg pada disk yang berbeda dari NDS dan DDS lg, ini adalah penting bagi ETL kinerja karena meminimalkan pertentangan dari lg lalu lintas antara menyimpan data. Ingatlah untuk mengatur mdus pemulihan penuh untuk database metadata. Karena ukuran database metadata kecil dan karena cara kita menggunakan database metadata lebih seperti query tipe OLTP dari query data warehuse Membuat DDS Struktur Database Setelah kami menciptakan database, kami sekarang dapat membuat tabel berdasarkan desain lgis bahwa kita dibuat dalam bab sebelumnya. Mari kita mulai dengan DDS. Ini memiliki lima tabel fakta dan empat belas dimensi. Mari kita melakukan penjualan prduk tabel fakta terlebih dahulu. Kami akan melakukan empat dimensi yang menggunakan pertama dan kemudian tabel fakta. Kami didefinisikan keempat tabel dimensi di bab sebelumnya. Jadi, buka SQL Server 2005 Manajemen Studi, terhubung ke pengembangan Anda cnth SQL Server, dan mulai menciptakan tabel. Anda dapat menggunakan Manajemen Studi sudut- dan- klik fungsi tinality jika Anda inginkan, atau Anda dapat script itu.
Membuat nrmalisasi penyimpanan data NDS adalah sedikit berbeda dari DDS. Perbedaan utama adalah nrmalisasi. Dalam beberapa halaman berikutnya, saya akan membahas tabel pada Gambar 6-2 dan cara membuat mereka secara fisik. Saya juga akan membahas bagaimana mengatur tabel di filegrups berbeda terletak pada disk yang berbeda. Tabel di NDS dapat dikategrikan menjadi tiga kelmpk: tabel transaksi, tabel master dan tabel atribut. Tabel transaksi berisi acara bisnis dan berasal dari tabel fakta DDS. Tabel Guru mengandung badan usaha dan berasal dari DDS tabel dimensi. Atribut tabel berisi atribut entitas bisnis dan berasal dari dimensi atribut klm. Sebagai cnth, mari kita membahas tiga meja di bagian bawah diagram: cmmunicatin_subscriptin: Tabel cmmunicatin_subscriptin adalah tabel transaksi. Itu berasal dari Kmunikasi Langganan fakta meja di DDS. Ini berisi acara bisnis ketika serang pelanggan berlangganan surat kabar. cmmunicatin: Tabel kmunikasi adalah tabel master. Itu berasal dari dimensi kmunikasi di DDS. Ini berisi badan usaha. Language: Tabel bahasa adalah tabel atribut. Dalam DDS, bahasa adalah klm (atribut) dalam dimensi kmunikasi. Karena di NDS kita perlu untuk menrmalkan tabel, kita harus menempatkan bahasa dalam tabel sendiri. Hal ini diperlukan untuk menghilangkan redundansi data. Tabel Ringkasan Dari banyak hal yang dapat meningkatkan data warehuse kinerja, tabel ringkasan adalah di bagian paling atas daftar.( Yang kedua adalah tabel partisi, dan ketiga adalah pengindeksan.) Hal ini karena data yang pengguna butuhkan adalah sudah precalculated. Kami akan membahas tiga hal satu per satu di tiga bagian utama. Partisi Ada dua jenis partisi: partisi vertikal dan hrisntal partisi. Partisi vertikal membelah tabel vertikal menjadi beberapa tabel yang lebih kecil, dengan masing-masing tabel yang berisi beberapa klm dari tabel asli. Partisi hrizntal membelah tabel Hrizntal menjadi beberapa tabel yang lebih kecil, dengan masing-masing tabel yang berisi beberapa baris dari tabel asli. Pada bagian ini, saya sedang berbicara tentang partisi hrisntal, bukan partisi vertikal. Index
Dalam DDS, kita memiliki tabel fakta dan kita memiliki tabel dimensi. Mereka membutuhkan pengindeksan yang berbeda dan kunci primer. Saya akan membahas tabel dimensi pertama dan kemudian tabel fakta. Setiap tabel dimensi memiliki klm kunci pengganti. Ini adalah (1,1) klm identitas, dan nilai-nilai yang unik. Kami membuat ini klm kunci pengganti kunci utama dari tabel dimensi. Kami juga membuat klm kunci pengganti clustered index dari tabel dimensi. Kesimpulan Desain database adalah landasan dari data warehusing. Kami akan membangun ETL dan aplikasi pada yayasan ini, jadi kami harus bisa melakukannya dengan benar. Dalam bab ini, kita membahas rincian dari platfrm perangkat keras dan sistem arsitektur, perhitungan ruang disk, pembuatan database, dan meja dan melihat penciptaan. Kami juga bahas tiga faktr yang dapat meningkatkan kinerja data warehuse: tabel ringkasan, partisi, dan pengindeksan. Kita perlu memastikan bahwa mereka diatur dengan benar dari awal, ketika kita membuat database.