Sistem Manajemen aje e Basis s Data Sistem Basis Data Terdistribusi Teknik Informatika Universitas Pasundan Caca E. Supriana, S.Si.,MT. caca.e.supriana@unpas.ac.id
2
Pengantar File processing/pemrosesan file menggunakan prinsip setiap aplikasi memiliki data tersendiri. Hal ini mempengaruhi efesiensi dan efektifitas sehingga muncul konsep data base system. Konsep ini mendasarkan pada prinsip bahwa data dibuat, disediakan dan dikelola secara terpusat/sentral. Konsep ini mengakibatkan program aplikasi tidak lagi tergantung pada perubahan data bik baik secara logic maupun fisikik dan juga sebaliknya, ini disebut data independence. 3
Perbedaan file processing dengan database system 4
Perbedaan file processing dengan database system 5
Distributed Data Processing Merupakan sekumpulan peralatan pemrosesan yang saling terhubung melalui jaringan yang mengerjakan tugas-tugas tertentu. Pemrosesan terdistribusi dapat dikelompokan berdasarkan beberapa kriteria yaitu : Degree Coupling : tinggi atau rendah? Jumlah data yang saling digunakan dibandingkan dengan jumlah pemrosesan lokal. Struktur antar hubungan : kuat atau lemah? Jika komponen dapat di share dikatakan kuat Saling tergantungan antar komponen : kuat atau lemah dalam mengekseskusi proses. Keselarasan antar komponen. 6
Distributed Data Processing Pemrosesan terdistribusi berkembang karena kebutuhan untuk dapat memecahkan masalah besar dan kompleks dengan menggunakan berbagai macam aturan divide and conquer. Alasan lain yang mendasar adalah struktur organisasi yang berubah menjadi terdistribusi, karena perkembangan pemrosesan terdistribusi inilah maka kemudian berkembang distributed database system. 7
Distributed Database System Merupakan sekumpulan database yang saling terhubung secara logical dan secara fisik terdistribusi pada berbagai tempat melalui jaringan computer. Sistem yang mengelola database terdistribusi dan menyediakan mekanisme agar distribusi transparent adalah distributed database management system (DDBMS). 8
Database terpusat pada jaringan 9
Sistem Database Terdistribusi 10
DC = Data Communications component DBMS = local ldbms DDBMS = Distributed DBMS component GDD = Global data Dictionary 11
Karakteristik DDBMS Antarmuka aplikasi untuk berinteraksi dengan pengguna (end-user), program aplikasi, dan DBMS lainnya dalam basis data terdistribusi. Validasi yang menganalisis permintaan data untuk kebenaran sintaks. Transformasi untuk menguraikan permintaan yang kompleks (complex query) menjadi komponen permintaan data atomik. Optimasi query untuk menemukan strategi akses terbaik. (fragmen database yang harus diakses oleh lh query, dan bagaimana harus update data, jika ada, akan disinkronkan) Pemetaan untuk menentukan lokasi data fragmen lokal dan jauh (remote). Antarmuka I/O untuk membaca atau menulis data dari atau ke penyimpanan permanen lokal. Memformat untuk mempersiapkan data untuk presentasi kepada pengguna akhir atau ke program aplikasi. 12
Karakteristik DDBMS Keamanan untuk memberikan privasi data pada database baik lokal dan jauh (remote). Backup dan pemulihan untuk menjamin ketersediaan dan pemulihan database dalam kasus kegagalan (error). Fitur DB administrasi untuk administrator database. Concurrency control untuk mengatur akses simultan data dan untuk menjamin konsistensi data di seluruh fragmen database dalam DDBMS. Transaksi pada manajemen untuk memastikan bahwa data bergerak dari satu kondisi konsisten ke kondisi yang lain. Kegiatan ini mencakup sinkronisasi transaksi lokal dan jauh serta transaksi yang didistribusikan di seluruh segmen. 13
Komponen DDBMS Computer Workstations Network HW & SW Communications Media Transaction Processor (TP), komponen perangkat lunak dalam komputer yang meminta data, disebut juga Transaction Manager atau Application Processor Data Processor (DP), komponen perangkat lunak dalam komputer yang menyimpan dan mengeluarkan data, disebut juga Data Manager. 14
Keuntungan sistem database terdistribusi Pengelolaan secara transparan data terdistribusi dan replicated. Mengurangi ketergantungan data Transparansi jaringan Transparansi replikasi i Transparansi fragmentasi Mengacu pada struktur organisasi Meningkatkan kemampuan untuk share dan otonomi local Meningkatkan ketersediaan data Meningkatkan kehandalan Meningkatkan unjuk kerja Memudahkan pengembangan system 15
Kelemahan sistem database terdistribusi Kompleksitas manajemen Control integritas lebih sulit Biaya pengembangan g Keamanan Kurang standarisasi Menambahkan kebutuhan penyimpanan Lebih sulit dalam mengatur lingkungan data Menambah biaya pelatihan. 16
17
Transaction Processor (TP), komponen perangkat lunak dalam komputer yang meminta data, disebut juga Transaction Manager atau Application Processor Data Processor (DP), komponen perangkat lunak dalam komputer yang menyimpan dan mengeluarkan data, disebut juga Data Manager. Setiap TP dapat mengakses data dari setiap DP dan setiap DP dapat melayani akses data dari TP atau akses data lokal 18
19
Single-Site Site Processing, Single-Site Site Data (SPSD) Dalam pengolahan satu situs, skenario SPSD, semua proses dilakukan k pada satu host komputer (server prosesor-tunggal, Server multiprosesor, sistem mainframe) dan semua data disimpan di sistem lokal disk komputer host. Pengolahan tidak bisa dilakukan di sisi pengguna akhir dari sistem. Skenario seperti khas dari kebanyakan k mainframe dan midrange DBMS komputer server. DBMS terletak pada komputer host, yang diakses oleh dumb terminal yang terhubung. Skenario ini juga khas dari generasi pertama dari single-user database mikrokomputer. 20
21
Multiple-Site Processing, Single-Site Site Data (MPSD) Berdasarkan skenario MPSD, beberapa proses berjalan pada komputer yang berbeda berbagi repositori data tunggal. Biasanya, skenario MPSD memerlukan file server jaringan menjalankan aplikasi konvensional yang diakses melalui jaringan. Banyak aplikasi akuntansi multi user berjalan di bawah jaringan komputer pribadi sesuai dengan deskripsi tersebut. 22
23
Multiple-Site Processing, Multiple-Site Data (MPMD) Skenario MPMD menggambarkan DBMS sepenuhnya didistribusikan dengan dukungan beberapa prosesor data dan prosesor transaksi di beberapa situs. Tergantung pada tingkat dukungan untuk berbagai jenis DBMS terpusat, DDBMS diklasifikasikan sebagai homogen atau heterogen. DDBMS homogen mengintegrasikan ik hanya satu jenis DBMS terpusat melalui jaringan. Dengan demikian, DBMS yang sama akan berjalan pada platform server yang berbeda (server tunggal prosesor, Server multiprosesor, server farms, atau server blades). DDBMS heterogen mengintegrasikan berbagai jenis DBMS terpusat melalui jaringan. Sebuah DDBMS sepenuhnya heterogen akan mendukung DBMS yang berbeda b yang mungkin bahkan mendukung model data yang berbeda (relasional, hirarkis, atau jaringan) berjalan di bawah sistem komputer yang berbeda, seperti mainframe dan PC. 24
DDBMS Transparency [1] Sebuah sistem basis data terdistribusi membutuhkan karakteristik fungsional yang dapat dikelompokkan dan digambarkan sebagai transparansi features. DDBMS fitur transparansi memiliki sifat umum yang memungkinkan pengguna akhir untuk merasa seperti menggunakan sebuah database. 25
DDBMS Transparency [2] fitur transparansi DDBMS adalah: Transparansi distribusi, yang memungkinkan database terdistribusi untuk diperlakukan sebagai database logis tunggal. Jika DDBMS menunjukkan transparansi distribusi, pengguna tidak perlu tahu: o Bahwa data dipartisi-berarti baris tabel dan kolom dibagi secara vertikal maupun horizontal dan disimpan di antara beberapa situs. o Bahwa data dapat direplikasi di beberapa situs. o Lokasi data. Transparansi transaksi, yang memungkinkan transaksi untuk memperbarui data pada lebih dari satu situs jaringan. Transparansi Transaksi memastikan bahwa transaksi akan seluruhnya selesai atau dibatalkan, dengan demikian mempertahankan integritas database. 26
DDBMS Transparency [3] Transparansi kegagalan (failure), yang menjamin bahwa sistem akan terus beroperasi jika terjadi kegagalan node. Fungsi yang hilang karena kegagalan gg akan diganti oleh simpul jaringan lain. Transparansi kinerja, yang memungkinkan sistem untuk melakukan seolah-olah itu adalah DBMS terpusat. t Sistem tidak akan menderita penurunan kinerja karena penggunaannya pada jaringan atau karena perbedaan platform jaringan. Transparansi kinerja juga memastikan bahwa sistem akan menemukanbiaya yang paling hemat untuk mengakses data jauh. 27
28
29
30
12 Perintah CJ Date Dengan munculnya database relasional, kebanyakan vendor mengimplementasikan versi database terdistribusi mereka sendiri, umumnya menyoroti kekuatan produk mereka masing-masing. Untuk membuat perbandingan database terdistribusi lebih mudah, CJ Date merumuskan 12 "perintah" atau prinsipprinsip dasar database terdistribusi. Meskipun tidak ada DDBMS yang memenuhi semua perinteh tersebut,,prinsip p tersebut merupakan sasaran yang bermanfaat. 31
12 Perintah CJ Date 1. Local site independence. setiap situs lokal setempat dapat bertindak independen, otonom, situs adalah DBMS. Setiap situs yang terpusat bertanggung jawab atas keamanan, konkurensi kontrol, backup, dan recovery. 2. Central site independence. Tidak ada situs dalam jaringan bergantung pada situs pusat atau situs lainnya. Semua situs memiliki kemampuan yang sama. 3. System independence. Kegagalan tidak terpengaruh oleh sistem failures. setiap node terus beroperasi bahkan dalam kasus kegagalan node atau perluasan jaringan. 4. Location transparency. Para pengguna tidak perlu mengetahui lokasi data untuk mengambil data tersebut. 5. Fragmentasi transparency. Data fragmentasi adalah transparan kepada pengguna, yang melihat hanya satu database logis. Pengguna tidak perlu tahu nama fragmen database untuk mengambil mereka. 32
12 Perintah CJ Date 6. Replication transparency. Hanya melihat satu database logis. Para DDBMS transparan memilih fragmen database untuk mengakses. Untuk pengguna, DDBMS mengelola semua fragmen transparan. 7. Distributed query processing. Sebuah query didistribusikan dapat dilaksanakan di beberapa situs DP berbeda. Pertanyaan optimasi dilakukan secara transparan oleh DDBMS. 8. Distributed transaction processing. Sebuah transaksi dapat memperbarui data pada beberapa situs yang berbeda, dan transaksi dijalankan secara transparan. 9. Hardware independence. Sistem harus berjalan pada platform perangkat keras. 10. Operating system independence. Sistem harus berjalan pada platform sistem operasi. 11. Network independence. Sistem ini harus berjalan pada platform jaringan. 12. System independence. d Database harus mendukung produk database apapun vendor. 33