MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

Ukuran: px
Mulai penontonan dengan halaman:

Download "MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER"

Transkripsi

1 PRAKTIKUM 3 ANALISA CLUSTER Definisi Cluster Analisis cluster merupakan pengelompokan objek berdasarkan informasi yang diperoleh dari suatu data yang menjelaskan hubungan antar objek satu dengan objek lainnya. Tujuannya untuk mengelompokan objek yang memiliki kesamaan karakteristik dengan objek lainnya dalam satu kelompok dan memiliki perbedaan karakteristik dengan objek kelompok lain ( Steinbach et al, 2006) Tujuan Praktikum Cluster 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam melakukan dan menerapkan analisis Cluster 2. Mahasiswa dapat mengetahui dan memahami arti dan garis besar dari analisis Cluster dalam data mining, mulai dari pengambilan data, pengolahan data sampai dengan tahap pengelompokan, serta mengaplikasikannya dalam kasus yang dihadapi. Knowledge Discovery in Database (KDD) dan Data Mining Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar. (Turban et al, 2005 ). Knowledge discovery in database (KDD) adalah keseluruhan proses nontrivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.istilah data mining dan Knowledge Discovery in Database (KDD) sering kali digunakan secara bergantian untuk

2 menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut (Fayyad, 1996). 1. Data Selection Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional. 2. Pre-processing/Cleaning Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses memperkaya data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. 3. Transformation Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

3 4. Data Mining Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. Dalam modul ini kita menggunakan salah satu teknik data mining yaitu cluster. 5. Interpretation/Evaluation Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya. Konsep Cluster Dalam konteks memahami data, cluster mampu mengelompokan data dan analisis cluster merupakan ilmu yang secara teknis dapat mengelompokan data secara otomatis. Sebagai contoh, anak-anak dapat dengan cepat mengelompokan jenis gambar seperti gambar bangunan, tumbuhan, hewan, dan lainnya. (Michael et al, 2006) Ada beberapa tahapan dalam malekukan Analisis Cluster, diantaranya yaitu: 1. Tujuan Analisis Cluster 2. Desain Penelitian dalam Analisis Cluster 3. Asumsi-asumsi dalam Analisis Cluster 4. Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall fit) 5. Interpretasi terhadap Cluster. 6. Proses Validasi dan Pembuatan Profil (profiling) Cluster

4 Penerapan analisis Cluster di dalam pemasaran adalah sebagai berikut : 1. Identifikasi obyek (Recognition) : Dalam bidang image Processing, Computer Vision atau robot vision 2. Decission Support System dan data mining Membuat segmen pasar (segmenting the market). Memahami perilaku pembeli. Mengenali peluang produk baru Tahap-tahap dalam Analisis Cluster Ada beberapa tahapan dalam malekukan Analisis Cluster, diantaranya yaitu: Tahap Pertama : Tujuan Analisis Cluster Tujuan utama analisis Cluster adalah memisahkan suatu himpunan objek menjadi dua kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya. Sedangkan tujuan analisis Cluster secara khusus, antara lain: Penyederhanaan Data Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas observasi/objek dapat dikelompokkan untuk analisis selanjutnya. Identifikasi Hubungan (Relationship Identification) Hubungan antar objek diidentifikasi secara empiris. Struktur analisis Cluster yang sederhana dapat menggambarkan adanya hubungan atau kesamaan dan perbedaan yang tidak dinyatakan sebelumnya. Pemilihan pada Pengelompokan Variabel Tujuan analisis Cluster tidak dapat dipisahkan dengan pemilihan variabel yang digunakan untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang terbentuk merefleksikan

5 struktur yang melekat pada data seperti yang didefinisikan oleh variabel-variabel. Pemilihan variabel harus sesuai dengan teori dan konsep yang umum digunakan dan harus rasional. Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian sebelumnya. Variabelvariabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang akan dikelompokkan dan secara spesifik harus sesuai dengan tujuan analisis Cluster. Tahap Kedua : Desain Penelitian dalam Analisis Cluster 2 hal penting dalam tahap ini adalah pendeteksian outlier dan mengukur kesamaan. Pendeteksian Outliers Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outliers dapat terjadi karena: a. Observasi menyimpang yang tidak mewakili populasi b. Suatu undersampling kelompok-kelompok dalam populasi yang menyebabkan underrepresentation kelompok-kelompok dalam sampel Dalam kedua kasus tersebut, outliers dapat mengubah struktur sebenarnya dalam populasi sehingga kita akan memperoleh Cluster-Cluster yang tidak sesuai dengan struktur sebenarnya dari populasi tersebut dan tidak representatif. Mengukur Kesamaan antar Objek Konsep kesamaan adalah hal yang sangat penting dalam analisis Cluster. Kesamaan antar objek merupakan ukuran kedekatan antar objek. Kesamaan dapat diketahui dengan melakukan pengukuran jarak antar setiap individu. Ukuran jarak merupakan ukuran ketidakmiripan, dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya jarak yang pendek/kecil menunjukkan bahwa suatu objek makin mirip dengan objek lain.

6 Gambar 1. Ilustrasi Pengukuran jarak Metode untuk mengukur kesamaan obyek antara lain : 1). Euclidean Distance Jarak euclidean antara dua titik i dan j merupakan sisi miring (sisi terpanjang) dari segitiga ABC. D(i, j) = A 2 + B 2 = (X i Y i ) 2 = (X 1i X 1j ) 2 +(X 2i X 2j ) 2 2). Squared Euclidean Distance Merupakan pengukuran kuadrat jarak euclidean antara dua titik i dan j. D(i, j) = A 2 + B 2 = (X i Y i ) 2 = (X 1i X 1j ) 2 +(X 2i X 2j ) 2 3). Chebychev D(X,Y)= max i X i Y i 4). City Block Distance D(X,Y)= X i Y i D(I,j) = A + B = X i Y i = X 1i X 1j + X 2i X 2j

7 Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster Seperti hal teknik analisis lain,analisis Cluster juga menetapkan adanya suatu asumsi. Ada dua asumsi dalam analisis Cluster, yaitu : a. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika sampel representatif. Jumlah sampel yang diambil tergantung penelitinya, seorang peneliti harus yakin bahwa sampel yang diambil representatif terhadap populasi. b. Pengaruh Multikolinieritas Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan dalam analisis Cluster karena hal itu berpengaruh, sehingga variabel-variabel yang bersifat multikolinieritas secara eksplisit dieprtimbangkan dengan lebih seksama. Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall fit) Ada dua proses penting yaitu algoritma Cluster dalam pembentukan Clusterdan menentukan jumlah Cluster yang akan dibentuk. Keduanya mempunyai implikasi substansial tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap hasil tersebut.

8 Gambar 2. Algoritma Analisa Kluster Adapun metode pengelompokan dalam analisis Cluster meliputi : 1. Metode Non-Hirarkis. dimulai dengan menentukan terlebih dahulu jumlah Cluster yang diinginkan (dua,tiga, atau yang lain). Setelah jumlah Clusterditentukan, maka proses Cluster dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut K-Means Cluster. Berbeda dengan metode hirarkikal, prosedur non hirarkikal (K-means Clustering) dimulai dengan memilih sejumlah nilai Cluster awal sesuai dengan jumlah yang diinginkan dan kemudian obyek digabungkan ke dalam Cluster-Cluster tersebut.

9 a. Sequential Threshold Procedure Metode ini melakukan pengelompokan dengan terlebih dahulu memilih satu obyek dasar yang akan dijadikan nilai awal Cluster, kemudian semua obyek yang ada didalam jarak terdekat dengan Cluster ini akan bergabung lalu dipilih Cluster kedua dan semua obyek yang mempunyai kemiripan dimasukkan dalam Cluster ini. Demikian seterusnya hingga terbentuk beberapa Cluster dengan keseluruhan obyek didalamnya. b. Parallel Threshold Prosedure Secara prinsip sama dengan prosedur sequential threshold, hanya saja dilakukan pemilihan terhadap beberapa obyek awal Cluster sekaligus dan kemudian melakukan penggabungan obyek ke dalamnya secara bersamaan. c. Optimizing Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada penempatan obyek yang ditukar untuk Cluster lainnya dengan pertimbangan krteria optimasi. 2. Metode Hirarkis. Memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian dilanjutkan pada obyek yang lain dan seterusnya hingga Cluster akan membentuk semacam pohon dimana terdapat tingkatan (hirarki) yangjelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Teknik hirarki (hierarchical methods) adalah teknik Clustering membentuk kontruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan). Alat yang membantu untukmemperjelas proses hirarki ini disebut dendogram.

10 Teknik hirarki (hierarchical methods) adalah teknik Clustering membentuk kontruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan). Dengan demikian proses pengelompokkannya dilakukan secara bertingkat atau bertahap. Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram. Metode-metode yang digunakan dalam teknik hirarki: a. Agglomerative Methods Metode ini dimulai dengan kenyatan bahwa setiap obyek membentuk Clusternya masing-masing. Kemudian dua obyek dengan jarak terdekat bergabung. Selanjutnya obyek ketiga akan bergabung dengan Cluster yang ada atau bersama obyek lain dan membentuk Cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek. Proses akan berlanjut hingga akhirnya terbentuk satu Cluster yang terdiri dari keseluruhan obyek. Ada beberapa teknik dalam Agglomerative methods yaitu: Single linkage (nearest neighbor methods) Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek terdekat dan keduanya membentuk Cluster yang pertama. Pada langkah selanjutnya terdapat dua kemungkinan, yaitu : a. Obyek ketiga akan bergabung dengan Cluster yang telah terbentuk, atau b. Dua obyek lainnya akan membentu Cluster baru. Proses ini akan berlanjut sampai akhirnya terbentuk Cluster tunggal. Pada metode ini jarak antar Cluster didefinisikan sebagai jarak terdekat antar anggotanya.

11 Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu : Gambar 3. Matriks Antara 5 Buah Objek. Langkah penyelesaiannya : a). Mencari obyek dengan jarak minimum Menghitung jarak antara Cluster AB dengan obyek lainnya. D(AB)C = min {dac, dbc}= dbc = 3.0 D(AB)D = min {dad, dbd}= dad = 6.0 D(AB)E = min {dae, dbe}= dbe = 7.0 Dengan demikian terbentuk matriks jarak yang baru Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru b). Mencari obyek dengan jarak terdekat. D dan E mempunyai jarak terdekat, yaitu 2,0 maka obyek D dan E bergabung menjadi satu Cluster. c). Menghitung jarak antara Cluster dengan obyek lainnya.

12 D(AB)C = 3.0 D(AB)(DE) = min {dad, dae, dbd, dbe} = dad = 6.0 D(DE)C = min {dcd, dce} = dcd = 4.0 d). Mencari jarak terdekat antara Cluster dengan obyek dan diperoleh obyek C bergabung dengan Cluster AB e). Pada langkah yang terakhir, Cluster ABC bergabung dengan DE sehingga terbentuk Cluster tunggal. Complete linkage (furthest neighbor methods) Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar obyek. Contoh : Terdapat matriks jarak antara lima buah obyek yaitu : Gambar 5. Matriks Antara 5 Buah Objek. Langkah penyelesaiannya : a) Mencari obyek dengan jarak minimum A dan B mempunyai jarak terdekat yaitu 1.0 maka obyek A dan B bergabung menjadi satu Cluster. b) Menghitung jarak antara Cluster AB dengan obyek lainnya d(ab)c = max {dac, dbc} = dac = 5,0 d(ab)d = max {dad, dbd} = dbd = 8,0 d(ab)e = max {dae, dbe} = dae = 8,0

13 Dengan demikian terbentuk matriks jarak yang baru : Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru c) Mencari obyek dengan jarak terdekat. D dan E mempunyai jarak terdekat yaitu 2.0 maka obyek D dan E bergabung menjadi satu Cluster d) Menghitung jarak antara Cluster dengan obyek lainnya. d(ab)c = 4,0 d(ab)(de) = 1/2{dAD, dae, dbd, dbe} = 7,25 d(de)c = 1/2{dCD, dce,} = dce = 5,00 Maka terbentuklah matrik jarak yang baru, yaitu : Gambar 5. Matriks Akhir e) Mencari jarak terdekat antara Cluster dengan obyek dan diperoleh obyek C bergabung dengan Cluster AB. f) Pada langkah yang terakhir, Cluster ABC bergabung dengan DE sehingga terbentuk Cluster tunggal

14 Ward s error sum of squares methods Ward mengajukan suatu metode pembentukan Cluster yang didasari oleh hilangnya informasi akibat penggabungan obyek menjadi Cluster. Hal ini diukur dengan jumlah total dari deviasi kuadrat pada mean Cluster untuk tiap observasi. Error sum of squares (ESS) digunakan sebagai fungsi obyektif. Dua obyek akan digabungkan apabila mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada. ESS= X ij 2 1 n j ( X ij ) 2 Dengan Xij adalah nilai untuk obyek ke-i pada Cluster ke-j. b. Divisive Methods Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama diawali dengan satu Cluster besar yang mencakup semua observasi (obyek). Selanjutnya obyek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan sehingga membentuk Cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai sejumlah Cluster yang diinginkan. Splinter average distance methods Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing obyek dengan obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada grupnya. Proses tersebut dimulai dengan memisahkan obyek dengan jarak terjauh sehingga terbentuklan dua group. Kemudian dibandingkan dengan jarak rata-rata masing-masing obyek dengan group splinter dengan groupnya sendiri. Apabila suatu obyek mempunyai jarak yang lebih dekat ke group splinter daripada ke groupnya sendiri, maka obyek tersebut haruslah dikeluarkan dari groupnya dan dipisahkan ke

15 group splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu obyek ke groupnya selalu lebih kecil daripada jarak obyek itu ke group splinter, maka proses berhenti dan dilanjutkan dengan tahap pemisahan dalam group. Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu : Gambar 6. Matriks Perbandingan 5 buah Objek Perhitungan : a) Menghitung jarak rata-rata antar obyek A = ¼ ( ) = 21 D = ¼ ( ) = B = ¼ ( ) = E = ¼ ( ) = C = ¼ ( ) = Terlihat bahwa E mempunyai nilai jarak terjauh, yaitu 22.75, maka E dipisahkan dari group utama dan membentuk group splinter. b) Menghitung jarak rata-rata obyek dengan group utama dengan group splinter

16 Gambar 7. Perhitungan Rata-Rata Group Utama Dengan Group Splinter Pada D, jarak rata-rata dengan group splinter lebih dekat daripada dengan group utama. Dengan demikian D harus dikeluarkan dari group utama dan masuk ke group splinter. c) Perhitungan jarak rata-rata Gambar 7. Perhitungan Rata-Rata Group Utama Dengan Group Splinter Karena jarak semua obyek ke group utama sudah lebih besar daripada jaraknya ke group splinter, maka komposisinya sudah stabil. Tahap Kelima : Interpretasi terhadap Cluster Tahap interpretasi meliputi pengujian tiap Cluster dalam term untuk menamai dan menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian Cluster. Membuat profil dan interpretasi Cluster tidak hanya untuk memperoleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata untuk menilai korespondensi pada Cluster yang terbentuk, kedua, profil Cluster memberikan araha bagi penilainan terhadap signifikansi praktis. Namun demikian yang perlu diperhatikan pada tahapan interpretasi adalah karakteristik yang membedakan masing-masing Cluster sehingga kita dapat memberikan label pada masing-masing Cluster tersebut.

17 Tahap Keenam: Proses Validasi dan Pembuatan Profil (profiling) Cluster 1. Proses validasi solusi Cluster Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis Cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek lain. Pendekatan ini membandingkan solusi Cluster dan menilai korespondensi hasil. Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan biaya atau ketidaktersediaan objek untuk analisis Cluster ganda. 2. Pembuatan Profil ( profiling) solusi Cluster Tahap ini menggambarkan karakteristik tiap Cluster untuk menjelaskan Cluster-Cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik beratnya pada karakteristik yang secara signifikan berbeda antar cluster dan memprediksi anggota dalam suatu Cluster khusus.

18 Studi Kasus Salah satu perguruan tinggi ingin memberikan beasiswa kepada beberapa kelompok mahasiswa yang dinyatakan berhak untuk menerima kategori beasiswa berdasarkan hasil seleksi yang telah dilakukan sebelumnya. Dalam pemberian beasiswa akan dikelompokan jenis pemberian beasiswa yaitu kelompok mahasiswa yang mendapatkan beasiswa sebesar Rp ,00, kelompok mahasiswa yang mendapatkan beasiswa sebesar Rp ,00, kelompok mahasiswa yang mendapatkan beasiswa sebesar Rp ,00, kelompok mahasiswa yang mendapatkan beasiswa sebesar Rp , dan kelompok mahasiswa yang mendapatkan beasiswa sebesar Rp Dalam pemberian beasiswa ini perguruan tinggi mengelompokan berdasarkan 5 kriteria yaitu pendapatan orang tua, jumlah tanggungan anak dari orang tua, pekerjaan orang tua, ipk, dan nilai wawancara. Berikut adalah data yang telah diperoleh dari 30 mahasiswa yang mengikuti seleksi. Data Mahasiswa : No Nama Pendapatan Orang Tua (Dalam Rupiah) Jumlah Tanggungan Anak Dari Orang Tua Pekerjaan Orang Tua IPK Nilai Wawancara 1 Rino , Abdul , Viant , Aan , Romi , Ririn , Rahma , Okta , Andre , Niko , Ayuk , Wanti , Mey , Farah ,90 86

19 No Nama Pendapatan Orang Tua (Dalam Rupiah) Jumlah Tanggungan Anak Dari Orang Tua Pekerjaan Orang Tua IPK Nilai Wawancara 15 Maryana , Sifa , Wulan , Ulfa , Syahdan , Awan , Rafi , Edgar , Ira , Nuca , Tere , Ehsan , Ghina , Affan , Dika , Aya ,63 77 Keterangan: Pekerjaan orang tua : 1 = tidak tetap, 2 = tetap

20 Metode Hirarki Langkah Penyelesaian : 1. Tahap Standarisasi Data - Input Data pada Variable View Mengisi data view seperti gambar dibawah ini - Mengganti type dari variabel nama menjadi String

21 - Mengganti values dari variabel pekerjaan seperti gambar dibawah - Pada Data View Pilih descriptive statistics, kemudian pilih descriptives

22 - Pindahkan semua variabel ke kolom variable (S) - Centang pada save standardized values as variables - Kenudian klik OK - Output normalisasi data Dari hasil Output diatas merupakan tampilan pertama hasil proses nomalisasi data. Dari tabel menunjukkan hasil nilai N, Minimum, Maximum, Mean, dan Standar Deviation

23 dari masing-masing kriteria. Jika sudah tampil output seperti gambar diatas, maka anda memastikan tampilan Data View anda sebelumnya sudah seperti gambar dibawah ini. Terdapat tambahan variabel Z hasil dari normalisasi data kuesioner dari masingmasing kriteria. Data "Z score inilah yang kemudian akan diolah untuk tahap pengelompokkan (clustering) berikutnya.

24 2. Tahap Pengelompokkan (clustering) - Pilih Analyze >> Classify >> Hierarchical Cluster

25 - Memindahkan semua variabel Z Score pada kotak variable (s) - Memindahkan variabel nama pada label cases by - Pilih Statistics - Pada kotak dialog statistics centang Agglomerative Schedule dan Proxy Matrix - Pilih range of solution, kemudian isi minimum number menjadi 2, dan maximum number menjadi 5. Kemudian klik continue

26 - Pada kotak dialog Plots mencentang Dendogram, All Cluster, dan Vertical - Pada kotak dialog Method gantilah cluster Method menjadi Nearest Neighboor, dan centang Interval kemudian mengganti pilihannya menjadi Squared Euqlidean Distance - Klik continue -

27 - Maka akan tampillah output spss sepeti beberapa tabel dibawah ini OUTPUT 1 Agglomeration Schedule Agglomeration Schedule Cluster Combined Stage Cluster First Appears Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage , , , , , , , , , , , , , , , , , , , , , , , , , , ,

28 Agglomeration Schedule Cluster Combined Stage Cluster First Appears Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage , , Hasil output tabel pertama memberikan penjelasan mengenai penggabungan antara setiap anggota 1 dengan anggota lainnya. Seperti contoh pembacaan tabel agglomeration schedule : a) Pada stage 1 responden 5 bergabung dengan responden 24 pada jarak yang terdekat pertama yaitu (lihat pada kolom coefficients) 0,099. Dimana anggota 5 dan 24 belum pernah bergabung sebelumnya (nilai 0) dengan anggota manapun (lihat pada kolom stage cluster first appears. Untuk melihat penggabungan anggota yang terlibat pada stage 1 berikutnya lihat pada kolom next stage. b) Pada stage 2 responden 5 bergabung dengan responden 29 pada jarak yang terdekat kedua yaitu (lihat pada kolom coefficients) 0,146. Dimana anggota 5 pernah bergabung sebelumnya (nilai 1) pada stage 1 dan anggota 29 belum pernah bergabung sebelumnya dengan anggota manapun ditandai dengan nilai 0 (lihat pada kolom stage cluster first appears. Untuk melihat penggabungan anggota yang terlibat pada stage 1 berikutnya lihat pada kolom next stage. c) Dan seterusnya.

29 OUTPUT 2 Cluster Membership Cluster Membership Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters 1:Rino :Abdul :Viant :Aan :Romi :Ririn :Rahma :Okta :Andre :Niko :Ayuk :Wanti :Mey :Farah :Maryana :Sifa :Wulan :Ulfa :Syahdan :Awan :Rafi :Edgar :Ira :Nuca :Tere :Ehsan :Ghina :Affan :Dika

30 Cluster Membership Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters 30:Aya Output diatas menunjukkan bahwa setiap terbentuknya n kelompok, maka terdaftarlah anggota-anggota setiap kelompoknya seperti yang sudah tertera pada tabel diatas. Ketika menentukan banyaknya kelompok (cluster) tidak semua anggota berada pada cluster yang sama ketika peneliti ingin membuat kelompok menjadi 2, 3, 4, atau 5. Contohnya : Anggota ke 28 menjadi anggota cluster 3 ketika kelompok yang dibentuk sebanyak 5 kelompok, dan menjadi anggota cluster 2 ketika kelompok yang dibentuk sebanyak 4 kelompok, dan menjadi anggota cluster 1 ketika kelompok yang dibentuk sebanyak 3 kelompok. Hasil ini membantu anda dalam menentukan cluster berdasarkan metode cut off pada hasil dendogram.

31 OUTPUT 3 Dendogram Hasil dendogram menunjukkan bahwa penggabungan setip anggota berdasarkan jarak yang paling dekat, sehingga membentuk satu cluster yang sangat besar. Hasil dendogram ini akan mudah dibaca jika pembacaannya dibantu oleh hasil Agglomerative Schedule Pembentukkan jumlah cluster dapat dibentuk dengan metode cut off pada hasil dendogram. Sebagai contoh: a) Melakukan cut off pada angka 12 b) Akan terlihat cluster yang terbentuk sebanyak 5 cluster dengan 4 Outlier, c) Untuk melihat anggota masing-masing cluster dapat dilihat dari gambar berikut ini:

32 Cut off pada angka Cluster 5 merupakan 2 outlier dimana memiliki karakter yang sama dilihat dari hasil dendogram sebelum dilakukannya cut off Jumlah masing-masing anggota cluster yang terbentuk adalah sebagai berikut: Cluster 1 = 17 (60%) Orang Cluster 2 (Outlier) = 1 (3,3%) Orang Cluster 3 (Outlier) = 1 (3,3%) Orang Cluster 4 = 9 (630%) Orang Cluster 5 (Outlier) = 2 (3,3%) Orang Cluster yang terbentuk jika menggunakan metode Cut Off, sebagai berikut: Jarak Cut Off Cluster yang terbentuk Outlier yang terbentuk

33 3. Tahap pengujian crosstab - Pada Data View menambah variabel baru yaitu variabel Cluster. - Kemudian mengganti measur- nya menjadi nominal - Mengganti label value variabel cluster seperti gambar dibawah ini:

34 - Pada Data View mengisi data untuk variabel cluster berdasarkan masing-anggota pada setiap kelompok seperti gambar dibawah. - Pilih Analyze >> Descriptive Statistics >> Crosstab

35 - Memindahkan seluruh variabel Z score pada kotak dialog Row(s) - Memindahkan variabel cluster pada kotak dialog Coloumn (s). - Pada menu Statistics beri tanda centang pada Correlations - Klik Continue

36 - Pada menu cell display beri centang pada Observed dan total - Klik Continue

37 - Klik OK, maka Output SPSS akan muncul.

38 a) Output Crosstab pertama (Penghasilan Orang Tua) Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total Zscore(penghasilan_orangtua) -1,19772 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% -1,09357 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% -,98942 Count % of Total 0,0% 0,0% 0,0% 13,3% 0,0% 13,3% -,78112 Count % of Total 3,3% 0,0% 0,0% 6,7% 0,0% 10,0% -,57282 Count % of Total 3,3% 3,3% 0,0% 3,3% 0,0% 10,0% -,36452 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,15622 Count % of Total 13,3% 0,0% 0,0% 0,0% 6,7% 20,0%,05207 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,26037 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,46867 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,67697 Count % of Total 13,3% 0,0% 0,0% 0,0% 0,0% 13,3% 1,71847 Count % of Total 3,3% 0,0% 3,3% 0,0% 0,0% 6,7% 1,92677 Count

39 Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% 2,75997 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% Total Count % of Total 56,7% 3,3% 3,3% 30,0% 6,7% 100,0% b) Output Crosstab yang ke 2 (tanggungan anak) Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total Zscore(tanggungan_anak) -1,74075 Count % of Total 0,0% 0,0% 3,3% 0,0% 0,0% 3,3% -,79125 Count % of Total 30,0% 0,0% 0,0% 10,0% 0,0% 40,0%,15825 Count % of Total 20,0% 3,3% 0,0% 13,3% 0,0% 36,7% 1,10775 Count % of Total 6,7% 0,0% 0,0% 6,7% 0,0% 13,3% 2,05725 Count % of Total 0,0% 0,0% 0,0% 0,0% 3,3% 3,3% 3,00676 Count % of Total 0,0% 0,0% 0,0% 0,0% 3,3% 3,3% Total Count % of Total 56,7% 3,3% 3,3% 30,0% 6,7% 100,0%

40 c) Output Crosstab yang ke 3 (Pekerjaan) Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total Zscore(pekerjaan) -1,39044 Count % of Total 0,0% 0,0% 0,0% 30,0% 3,3% 33,3%,69522 Count % of Total 56,7% 3,3% 3,3% 0,0% 3,3% 66,7% Total Count % of Total 56,7% 3,3% 3,3% 30,0% 6,7% 100,0% d) Output Crosstab yang ke 4 (IPK) Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total Zscore(ipk) -2,38288 Count % of Total 0,0% 0,0% 3,3% 0,0% 0,0% 3,3% -1,67422 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -1,27560 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -1,05414 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,87697 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,83268 Count

41 Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total % of Total 3,3% 3,3% 0,0% 0,0% 0,0% 6,7% -,61122 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -,38977 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -,34547 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,16831 Count % of Total 0,0% 0,0% 0,0% 0,0% 3,3% 3,3%,18602 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,27461 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,40748 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,45177 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%,49607 Count % of Total 3,3% 0,0% 0,0% 0,0% 3,3% 6,7%,62894 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,71752 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,80611 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%,85040 Count

42 Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%,89469 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%,93898 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% 1,16044 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% 1,38190 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% 1,42619 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% 1,60335 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% Total Count % of Total 56,7% 3,3% 3,3% 30,0% 6,7% 100,0%

43 e) Output Crosstab yang ke 5 (nilai wawancara) Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total Zscore(wawancara) -1,99252 Count % of Total 0,0% 0,0% 3,3% 0,0% 0,0% 3,3% -1,76128 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -1,41442 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -1,18318 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -1,06756 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -,83632 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -,60508 Count % of Total 6,7% 0,0% 0,0% 0,0% 0,0% 6,7% -,48946 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,37384 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3% -,25822 Count % of Total 3,3% 0,0% 0,0% 0,0% 3,3% 6,7% -,02698 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%

44 Crosstab cluster cluster 1 cluster 2 cluster 3 cluster 4 cluster 5 Total,08864 Count % of Total 0,0% 0,0% 0,0% 3,3% 3,3% 6,7%,20426 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,66674 Count % of Total 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%,78236 Count % of Total 3,3% 0,0% 0,0% 3,3% 0,0% 6,7%,89798 Count % of Total 3,3% 0,0% 0,0% 3,3% 0,0% 6,7% 1,01360 Count % of Total 0,0% 0,0% 0,0% 10,0% 0,0% 10,0% 1,12922 Count % of Total 0,0% 3,3% 0,0% 0,0% 0,0% 3,3% 1,24484 Count % of Total 0,0% 0,0% 0,0% 3,3% 0,0% 3,3% 1,47608 Count % of Total 0,0% 0,0% 0,0% 6,7% 0,0% 6,7% Total Count % of Total 56,7% 3,3% 3,3% 30,0% 6,7% 100,0% Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada hasil crosstab: 1. Jika terdapat karakter yang angkanya menunjukkan angka negatif, berarti cluster yang bersangkutan ada di bawah rata-rata total.

45 2. Jika terdapat karakter yang angkanya menunjukkan angka positif, berarti cluster yang bersangkutan ada di atas rata-rata total. Dari seluruh hasil crosstab diatas, dapat diketahui karakteristik masing-masing cluster berdasarkan karakteristik anggota anggota cluster yang dominan, dapat dilihat dari tabel berikut ini: Penghasilan orang tua Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 0, ,5728 1,7184-0,9894-0,1562 (13,3%) (3,3%) (3,3%) (3,3%) (6,7%) Tanggungan anak - 0,1562 (13,3%) -0,7912 (30%) Pekerjaan 0,69522 (56,7%) IPK Untuk kriteria IPK pada cluster ini dominan diatas bawah 0,1582 (3,3%) 0,69522 (3,3%) - 0,8326 (3,3%) - 1,740 (3,3%) 0,69522 (3,3%) - 2,3828 (3,3%) 0,1582 (13,3%) -1,3904 (30%) Untuk kriteria IPK pada cluster ini dominan diatas rata-rata total Untuk kriteria Tanggungan anak pada cluster ini dominan diatas rata-rata total 0,69522 (3,3%) -1,3904 (3,3%) -0,168 (3,3%) 0,496 (3,3%) Nilai Wawancara Untuk kriteria Nilai wawancara pada cluster ini dominan dibawah ratarata total 1,12922 (3,3%) -1,9925 (3,3%) Untuk kriteria Nilai wawancara pada cluster ini dominan diatas rata-rata total - 0,258 (3,3%) 0,0886 (3,3%)

46 Dari tabel rekapitulasi diatas, maka dapatlah dilihat masing-masing cluster sebagai berikut: Dalam cluster-1 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah ratarata total, jumlah tanggungan anak orang tua dibawah rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK diatas rata-rata total, nilai wawancara dibawah rata-rata total. Sehingga, cluster-1 yang terdiri dari 17 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Dalam cluster-2 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah ratarata total, jumlah tanggungan anak orang tua diatas rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK dibawah rata-rata total, nilai wawancara diatas rata-rata total. Sehingga, cluster-2 yang terdiri dari 1 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Dalam cluster-3 terdiri dari mahasiswa dengan dominan pendapatan orang tua diatas ratarata total, jumlah tanggungan anak orang tua dibawah rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK dibawah rata-rata total, nilai wawancara dibawah rata-rata total. Sehingga, cluster-3 yang terdiri dari 1 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Dalam cluster-4 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah ratarata total, jumlah tanggungan anak orang tua diatas batas rata-rata total, pekerjaan orang tua dibawah rata-rata total (pekerjaan tidak tetap), IPK diatas rata-rata total, nilai wawancara diatas rata-rata total. Sehingga, cluster-4 yang terdiri dari 9 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Dalam cluster-5 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah ratarata total, jumlah tanggungan anak orang tua diatas rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK dibatas rata-rata total, nilai wawancara diatas rata-rata

47 total. Sehingga, cluster-1 yang terdiri dari 1 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Metode Non Hierarki (K-Means Cluster) Langkah Penyelesaian 1. Standarisasi Data Karena data yang dikumpulkan berada dalam satuan yang berbeda maka terlebih dahulu dilakukan proses standarisasi (normalisasi) data. Jika data sudah berada dalam satuan yg sama atau tidak memiliki satuan maka langkah ini dapat diabaikan. Masukkan seluruh data ke dalam spss : a. Klik Analyze > Descriptive Statistics > Descriptives

48 b. Pindahkan variabel dikolom kiri ke kolom Variable (s) c. Aktifkan Save Standardized as Variables d. Klik OK e. Hasil SPSS

49 Descriptive Statistics N Minimum Maximum Mean Std. Deviation Pendapatan_Orang_Tua , , , , Jumlah_Tanggungan_An ak 30 1,00 6,00 2,8333 1,05318 Pekerjaan_Orang_Tua 30 1,00 2,00 1,6667,47946 IPK 30 3,00 3,90 3,5350,23057 Nilai_Wawancara 30 60,00 90,00 77,2333 8,64903 Valid N (listwise) 30 Setelah tahap tersebut dilakukan, maka akan muncul tabel Descriptive Statistics yang akan digunakan untuk membantu menganalisis pengelompokan cluster nantinya. Pastikan tampilan pada data view telah berubah seperti gambar berikut ini: Perhatikan pada variabel data asli akan muncul 5 kriteria dengan awalan Z

50 2. Analisis Cluster Metode K-Means Cluster a. Pada Analyze Classify K-Means Cluster b. Pindahkan Variabel yang berawalan Z ke kolom Variable (s)

51 c. Tentukan jumlah Cluster dengan mengisikan angka 5 pada Number of Cluster d. Pilih Save dan aktifkan Cluster Membership dan Distance from Cluster center, kemudian Continue

52 e. Pilih Option, aktifkan Initial Cluster center dan Anova Table f. Klik OK Langkah tersebut akan menghasilkan tabel Initial Cluster seperti pada gambar di bawah ini. Tabel Initial Cluster Centers menunjukkan hasil proses sementara pengelompokan data yang di lakukan. Initial Cluster Centers Cluster Zscore(Pendapatan_Orang_ Tua), , , , ,78112 Zscore(Jumlah_Tanggunga n_anak) -, , , , ,79125 Zscore(Pekerjaan_Orang_T ua), ,39044,69522, ,39044 Zscore(IPK) -, ,15180, , ,40953 Zscore(Nilai_Wawancara) -,60508,08864, , ,47608

53 Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi dilakukan dalam proses clustering menggunakan 30 data objek dapat dilihat tampilan output berikut: Iteration History a Change in Cluster Centers Iteration ,397,000,498 1,061 1,045 2,300,000,000,580,000 3,156,000,000,273,000 4,000,000,000,000,000 a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is,000. The current iteration is 4. The minimum distance between initial centers is 2,516. Ternyata proses clustering dilakukan melalui 4 iterasi untuk menentukan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari hasil iterasi adalah 2,516.

54 Cluster Membership Nama QCL_1 QCL_2 Rino 4 1,09055 Abdul 1 0,71352 Viant 3 0,49758 Aan 4 1,3932 Romi 1 0,68707 Ririn 5 1,13859 Rahma 3 0,92739 Okta 2 0 Andre 1 0,57372 Niko 1 0,60094 Ayuk 5 0,15775 Wanti 3 0,39411 Mey 4 0,62404 Farah 5 0,54842

55 Nama QCL_1 QCL_2 Maryana 5 1,17413 Sifa 1 1,28944 Wulan 3 0,93314 Ulfa 5 0,44765 Syahdan 1 0,78306 Awan 5 0,86691 Rafi 5 0,41308 Edgar 5 1,04476 Ira 3 2,24368 Nuca 1 0,74862 Tere 4 1,15239 Ehsan 4 0,96217 Ghina 3 1,47674 Affan 5 1,37803 Dika 1 0,79352 Aya 1 1,13173 Terlihat dari gambar diatas menunjukkan tiap responden masuk kedalam masing-masing cluster yang dibentuk. Seperti responden 1 bernama Rino masuk dalam cluster 4, nilai distance sebesar 1,09055.

56 Final Cluster Centers Cluster Zscore(Pendapatan_Orang_ Tua), , , , ,93156 Zscore(Jumlah_Tanggunga n_anak) -, ,05725, ,79125,05275 Zscore(Pekerjaan_Orang_T ua), ,39044,69522, ,39044 Zscore(IPK) -, ,15180, , ,04811 Zscore(Nilai_Wawancara) -,66931,08864, , ,00075 Tabel Final Cluster Centers menunjukkan hasil analisisnya untuk masing-masing krieria dan cluster yang dibentuk. Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada Final Cluster Centers: 1. Jika hasil perhitungan ditemukan negatif, berarti cluster yang bersangkutan ada di bawah rata-rata total. 2. Jika hasil perhitungan ditemukan positif, berarti cluster yang bersangkutan ada di atas rata-rata total.

57 Number of Cases in each Cluster Cluster 1 9, , , , ,000 Valid 30,000 Missing,000 Tabel Number of cases in each cluster menunjukkan jumlah mahasiswa yang masuk ke dalam tiap cluster. Cluster 1 (9 mahasiswa), cluster 2 (1 mahasiswa) dan cluster 3 (6 mahasiswa), cluster 4 (5 mahasiswa), cluster 5 (9 mahasiswa). Dari tabel output Final Cluster Centers, dengan ketentuan yang telah dijabarkan diatas pula, dapat didefinisikan sebagai berikut : 1. Cluster 1 Dalam cluster-1 terdiri dari mahasiswa dengan dominan pendapatan orang tua diatas rata-rata total, jumlah tanggungan anak orang tua dibawah rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK dibawah rata-rata total, nilai wawancara dibawah rata-rata total. Sehingga, cluster-1 yang terdiri dari 9 mahasiswa mendapatkan beasiswa sebesar Rp , Cluster 2 Dalam cluster-2 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah rata-rata total, jumlah tanggungan anak orang tua diatas rata-rata total, pekerjaan orang tua dibawah rata-rata total (pekerjaan tidak tetap), IPK dibawah rata-rata total, nilai

58 wawancara diatas rata-rata total. Sehingga, cluster-2 yang terdiri dari 1 mahasiswa mendapatkan beasiswa sebesar Rp , Cluster 3 Dalam cluster-3 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah rata-rata total, jumlah tanggungan anak orang tua atas rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK diatas rata-rata total, nilai wawancara diatas rata-rata total. Sehingga, cluster-3 yang terdiri dari 6 mahasiswa mendapatkan beasiswa sebesar Rp ,00 4. Cluster 4 Dalam cluster-4 terdiri dari mahasiswa dengan dominan pendapatan orang tua diatas rata-rata total, jumlah tanggungan anak dibawah rata-rata total, pekerjaan orang tua diatas rata-rata total (pekerjaan tetap), IPK dibawah rata-rata total, nilai wawancara dibawah rata-rata total. Sehingga, cluster-4 yang terdiri dari 5 mahasiswa mendapatkan beasiswa sebesar Rp ,00. Walaupun karakteristik anggota cluster 4 mirip dengan cluster 1, namun melihat angka dalam hasil SPSS, maka cluster 4 diberi nominal beasiswa lebih besar karena pendapatan orang tua lebih kecil dan nilai IPK serta wawancara lebih besar daripada cluster Cluster 5 Dalam cluster-5 terdiri dari mahasiswa dengan dominan pendapatan orang tua dibawah rata-rata total, jumlah tanggungan anak diatas rata-rata total, pekerjaan orang tua dibawah rata-rata total (pekerjaan tidak tetap), IPK diatas rata-rata total, nilai

59 wawancara diatas rata-rata total. Sehingga, cluster-5 yang terdiri dari 9 mahasiswa mendapatkan beasiswa sebesar Rp ,00

60 DAFTAR PUSTAKA Bertalya Konsep Data Mining. Universitas Gunadarma. Fayyad, Usama Advances in Knowledge Discovery and Data Mining. MIT Press. Susanto, Hery Tri Cluster Analysis. Seminar Nasional Matematika dan Pendidikan Matematika. Yogyakarta: Universitas Negeri Yogyakarta. Turban, Efraim et al Decision Support Systems and Intelligent Systems. Yogyakarta: Andi Offset Walpole, Ronald E. dan Myers, Raymond H Ilmu Peluang dan Statistik Untuk Insinyur Dan Ilmuwan. Bandung: ITB Press.

PRAKTIKUM 3 ANALISA CLUSTER

PRAKTIKUM 3 ANALISA CLUSTER PRAKTIKUM 3 ANALISA CLUSTER Definisi Cluster Analisis cluster merupakan suatu teknik data mining yang digunakan untuk mengklasifikasikan obyek atau kasus (responden) ke dalam kelompok yang relatif homogen

Lebih terperinci

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER PRAKTIKUM 3 ANALISA CLUSTER Definisi Analisis cluster merupakan pengelompokan objek berdasarkan informasi yang diperoleh dari suatu data yang menjelaskan hubungan antar objek satu dengan objek lainnya.

Lebih terperinci

MODUL 6 ANALISIS CLUSTER

MODUL 6 ANALISIS CLUSTER MODUL 6 ANALISIS CLUSTER Tujuan Praktikum Pada modul 6 ini, tujuan yang hendak dicapai dalam pelaksanaan praktikum antara lain : Mahasiswa mampu mengenali karakteristik analisis cluster. Mahasiswa memahami

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster

Lebih terperinci

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan ciri/sifat daripada pola-pola dalam

Lebih terperinci

BAB IV PENGOLAHAN DATA

BAB IV PENGOLAHAN DATA BAB IV PENGOLAHAN DATA 4.1 Non-Hirarki Cluster (K-Means Cluster) 4.1.1 Print Output dan Analisa Output A. Initial Cluster Center Initial Cluster Centers Cluster 1 2 Kenyamanan 2 5 Kebersihan 3 5 Luas_Parkir

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

MODUL 1 UJI DATA ( 1 ) ANALISIS MISSING VALUE & OUTLIER

MODUL 1 UJI DATA ( 1 ) ANALISIS MISSING VALUE & OUTLIER MODUL 1 UJI DATA ( 1 ) ANALISIS MISSING VALUE & OUTLIER Tujuan dari praktikum modul 1 ini, agar mahasiswa mampu : 1. Mengenali karakteristik missing value.. Memberikan perlakuan atau solusi pemecahan terhadap

Lebih terperinci

Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah

Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah Disusun untuk Memenuhi Tugas Mata Kuliah Metode Analisis Perencanaan (TKP 34) Dosen Pengampu: Dr. Iwan Rudiarto Widjanarko, S.T., M.T. Sri Rahayu,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.

Lebih terperinci

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016 Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering Viga Apriliana Sari, Nur Insani Jurusan Pendidikan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Tempat dan Waktu Penelitian Penelitian telah dilaksanakan di Kebun Bibit Permanen, Kecamatan Kedungpring, Lamongan dan di Laboratorium Biosistematika, Departemen Biologi,

Lebih terperinci

Memulai SPSS dan Mengelola File

Memulai SPSS dan Mengelola File MODUL 1 Memulai SPSS dan Mengelola File A. MEMULAI SPSS Untuk memulai SPSS for Windows langkah yang harus dilakukan adalah: Klik menu Start Programs SPSS for Windows SPSS for Windows. Kemudian akan ditampilkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan. BAB 2 TINJAUAN PUSTAKA 2.1 Metode Pengelompokan ABC Pada abad ke-18, Villfredo Pareto, dalam penelitiannya mengenai distribusi kekayaan penduduk di Milan Italia, menemukan bahwa 20% dari total populasi

Lebih terperinci

Rancangan Percobaan dengan SPSS 13.0 (Untuk kalangan sendiri)

Rancangan Percobaan dengan SPSS 13.0 (Untuk kalangan sendiri) Rancangan Percobaan dengan SPSS 13.0 (Untuk kalangan sendiri) Statistical Product and Service Solution (SPSS) merupakan salah satu perangkat lunak/software statistik yang dapat digunakan sebagai alat pengambil

Lebih terperinci

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

BAB 14 UJI DESKRIPTIF, VALIDITAS DAN NORMALITAS DATA

BAB 14 UJI DESKRIPTIF, VALIDITAS DAN NORMALITAS DATA BAB 14 UJI DESKRIPTIF, VALIDITAS DAN NORMALITAS DATA SPSS menyediakan fasilitas untuk melakukan analisis deskriptif data seperti uji deskriptif, validitas dan normalitas data. Uji deskriptif yang dilakukan

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

BAB IV PENGOLAHAN DATA

BAB IV PENGOLAHAN DATA BAB IV PENGOLAHAN DATA 4.1 Print Output dan Analisa Output A. Diskriminan Parameter : 1. Grup 1 : Konsumen (responden) yang sering berkunjung ke... Grup 2 : Konsumen (responden) yang sering berkunjung

Lebih terperinci

MODUL 3 ANALISIS FAKTOR

MODUL 3 ANALISIS FAKTOR TUJUAN PRAKTIKUM Tujuan dari praktikum modul 3 ini adalah : 1. Mahasiswa memahami apa yang dilakukan dalam proses Analisis Faktor; 2. Mahasiswa dapat menjalankan prosedur Analisis Faktor dalam SPSS; 3.

Lebih terperinci

MODUL 5 ANALISIS DISKRIMINAN

MODUL 5 ANALISIS DISKRIMINAN MODUL 5 ANALISIS DISKRIMINAN TUJUAN PRAKTIKUM Tujuan yang diharapkan dalam pelaksanaan praktikum ini, antara lain : Mahasiswa memahami karakteristik dan kegunaan Metode Analisis Diskriminan. Mahasiswa

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

BAB 3 PENGOLAHAN DATA

BAB 3 PENGOLAHAN DATA BAB 3 PENGOLAHAN DATA 3.1 Menentukan Model Persamaan Regresi Linier Berganda Data yang dikumpulkan dalam penelitian ini adalah jumlah kecelakaan lalu lintas dan faktor-faktor yang mempengaruhinya yaitu

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

BAB 10 ANALISIS REGRESI LINIER SEDERHANA

BAB 10 ANALISIS REGRESI LINIER SEDERHANA BAB 10 ANALISIS REGRESI LINIER SEDERHANA Analisis regresi linier merupakan salah satu jenis metode regresi yang paling banyak digunakan. Regresi linier sederhana terdiri atas satu variabel terikat (dependent)

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB IV ANALISIS HASIL DAN PEMBAHASAN BAB IV ANALISIS HASIL DAN PEMBAHASAN A. Analisis Data 1. Deskriptif Statistik Statistik deskriptif digunakan untuk menjelaskan atau menggambarkan secara umum berbagai karakteristik data yang telah dikumpulkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Analisis statistik multivariat adalah metode statistik di mana masalah yang diteliti bersifat multidimensional dengan menggunakan tiga atau lebih variabel

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB 11 ANALISIS REGRESI LINIER BERGANDA

BAB 11 ANALISIS REGRESI LINIER BERGANDA BAB 11 ANALISIS REGRESI LINIER BERGANDA Selain regresi linier sederhana, metode regresi yang juga banyak digunakan adalah regresi linier berganda. Regresi linier berganda digunakan untuk penelitian yang

Lebih terperinci

Statistik Deskriptif untuk Data Nominal dan Ordinal

Statistik Deskriptif untuk Data Nominal dan Ordinal Statistik Deskriptif untuk Data Nominal dan Ordinal Salah satu ciri utama sehingga sebuah data harus diproses dengan metode nonparametrik adalah jika tipe data tersebut semuanya adalah data nominal atau

Lebih terperinci

POLITEKNIK KESEHATAN SURAKARTA TAHUN

POLITEKNIK KESEHATAN SURAKARTA TAHUN MODUL PRAKTIKUM SPSS Oleh: Ig. Dodiet Aditya Setyawan, SKM. POLITEKNIK KESEHATAN SURAKARTA TAHUN 2013 LATIHAN 1: ENTRY DATA KASUS 1 Misalnya didapatkan data seperti di bawah ini dan akan memasukkannya

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

STATISTIKA DESKRIPTIF

STATISTIKA DESKRIPTIF STATISTIKA DESKRIPTIF 1 Statistika deskriptif berkaitan dengan penerapan metode statistika untuk mengumpulkan, mengolah, menyajikan dan menganalisis data kuantitatif secara deskriptif. Statistika inferensia

Lebih terperinci

LAPORAN PRAKTIKUM 8 & 9 STATISTIKA TENTANG UJI HIPOTESIS (Z OR T) DAN UJI RERATA (STUDENT T)

LAPORAN PRAKTIKUM 8 & 9 STATISTIKA TENTANG UJI HIPOTESIS (Z OR T) DAN UJI RERATA (STUDENT T) LAPORAN PRAKTIKUM 8 & 9 STATISTIKA TENTANG UJI HIPOTESIS (Z OR T) DAN UJI RERATA (STUDENT T) STATISTIKA DISUSUN OLEH : MELINA KRISNAWATI 12.12.0328 SI 12 F JURUSAN SISTEM INFORMASI SEKOLAH TINGGI MANAJEMEN

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISIS DATA

BAB IV DESKRIPSI DAN ANALISIS DATA BAB IV DESKRIPSI DAN ANALISIS DATA A. Deskripsi Data Hasil Penelitian 1. Deskripsi Data Umum Deskripsi data umum berisi mengenai gambaran umum tempat penelitian yakni di MTs N 1 Kudus. MTs N 1 Kudus beralamatkan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Clustering Analysis Clustering analysis merupakan metode pengelompokkan setiap objek ke dalam satu atau lebih dari satu kelompok,sehingga tiap objek yang berada dalam satu kelompok

Lebih terperinci

SPSS FOR WINDOWS BASIC. By : Syafrizal

SPSS FOR WINDOWS BASIC. By : Syafrizal SPSS FOR WINDOWS BASIC By : Syafrizal SPSS merupakan software statistik yang paling populer, fasilitasnya sangat lengkap dibandingkan dengan software lainnya, penggunaannya pun cukup mudah Langkah pertama

Lebih terperinci

MODUL V REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS

MODUL V REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS A. TUJUAN PRAKTIKUM Dengan adanya Praktikum Statistika Industri Modul V tentang Regresi, Korelasi, Analisis Varian, Validitas dan Reliabilitas

Lebih terperinci

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN Fina Nasari 1 1 Sistem Informasi, STMIK Potensi Utama 3 Jalan K.L. Yos Sudarso KM.

Lebih terperinci

Lampiran 1. Kuesioner Self Efficacy (I) dan Persepsi Manajemen Perusahaan (II) Pendidikan terakhir : SMA / D3 / S1 / S2 / S3 / Lainnya,.

Lampiran 1. Kuesioner Self Efficacy (I) dan Persepsi Manajemen Perusahaan (II) Pendidikan terakhir : SMA / D3 / S1 / S2 / S3 / Lainnya,. Lampiran 1. Kuesioner Self Efficacy (I) dan Persepsi Manajemen Perusahaan (II) IDENTITAS RESPONDEN Nama (boleh samaran) : Jenis Kelamin : P / L Usia :. Tahun Pendidikan terakhir : SMA / D3 / S1 / S2 /

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks BAB II KAJIAN TEORI Pada bab II akan dibahas tentang materi-materi dasar yang digunakan untuk mendukung pembahasan pada bab selanjutnya, yaitu matriks, kombinasi linier, varian dan simpangan baku, standarisasi

Lebih terperinci

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu BAB III METODE PENELITIAN 1.1 Lokasi Penelitian Lokasi penelitian ini di Ciputra Taman Dayu Property Pandaan Pasuruan yang terletak di Jl. Raya Surabaya Km. 48 Pandaan 67156 Pasuruan Jawa Timur. Alasan

Lebih terperinci

BAB 8 ANALISIS STUDI DESKRIPTIF DAN DATA DASAR. Bab ini menjelaskan secara lebih mendalam jenis studi deskriptif

BAB 8 ANALISIS STUDI DESKRIPTIF DAN DATA DASAR. Bab ini menjelaskan secara lebih mendalam jenis studi deskriptif BAB 8 ANALISIS STUDI DESKRIPTIF DAN DATA DASAR Bab ini menjelaskan secara lebih mendalam jenis studi deskriptif maupun teknik mendekripsikan data secara grafis maupun secara angka. Sebagai ilustrasi aplikasi

Lebih terperinci

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis

Lebih terperinci

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS Pertemuan 14 HIERARCHICAL CLUSTERING METHODS berdasar gambar berdasar warna A A A A Q Q Q Q K K K K J J J J 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 A K Q J (a). Individual

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISI DATA

BAB IV DESKRIPSI DAN ANALISI DATA BAB IV DESKRIPSI DAN ANALISI DATA A. Deskripsi Data Hasil Penelitian 1. Deskripsi Data Umum Penelitian Deskripsi data umum berisi mengenai gambaran umum tempat penelitian yakni di SMP N 1 Pamotan. SMP

Lebih terperinci

Uji OR dan Regresi Logistik Sederhana

Uji OR dan Regresi Logistik Sederhana Uji OR dan Regresi Logistik Sederhana Pada kesempatan ini, kita akan mencoba melakukan analisa data pada penelitian case control study dimana analisis univariat menggunakan nilai odds ratio dan analisis

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

KORELASI. Alat hitung koefisien korelasi Pearson (data kuantitatif dan berskala rasio) Kendall, Spearman (data kualitatif dan berskala ordinal)

KORELASI. Alat hitung koefisien korelasi Pearson (data kuantitatif dan berskala rasio) Kendall, Spearman (data kualitatif dan berskala ordinal) KORELASI Pada SPSS korelasi ada pada menu Correlate dengan submenu: 1. BIVARIATE Besar hubungan antara dua (bi) variabel. a. Koefisien korelasi bivariate/product moment Pearson Mengukur keeratan hubungan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 05, No. 02 (2016), hal 253-260 PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN

Lebih terperinci

BELAJAR SPSS. Langkah pertama yang harus dilakukan adalah dengan cara menginstal terlebih dahulu software SPSS

BELAJAR SPSS. Langkah pertama yang harus dilakukan adalah dengan cara menginstal terlebih dahulu software SPSS BELAJAR SPSS SPSS merupakan software statistik yang paling populer, fasilitasnya sangat lengkap dibandingkan dengan software lainnya, penggunaannya pun cukup mudah. Langkah pertama yang harus dilakukan

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISIS DATA

BAB IV DESKRIPSI DAN ANALISIS DATA BAB IV DESKRIPSI DAN ANALISIS DATA A. Deskripsi data Hasil Penelitian Data Pengamalan PAI dan Perilaku seks bebas peserta didik SMA N 1 Dempet diperoleh dari hasil angket yang telah diberikan kepada responden

Lebih terperinci

Perhitungan Uji Keseragaman & Keseragaman Data Menggunakan Excel Nama. Dicatat Oleh: Waktu Penyelesaian (detik)

Perhitungan Uji Keseragaman & Keseragaman Data Menggunakan Excel Nama. Dicatat Oleh: Waktu Penyelesaian (detik) Perhitungan Uji Keseragaman & Keseragaman Data Menggunakan Excel Tanggal 06/Mei/2013 Waktu 07.00-14.00 Nama WIB Proses: Operator Pak. Septian Kebisingan 70-80 db Dicatat Oleh: Jumlah Waktu Penyelesaian

Lebih terperinci

BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY

BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY Membuka program SPSS kemudian memilih tab sheet Variable View. Melakukan input variabel yang akan diteliti pada sheet Variable View. Input dilakukan

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

Aplikasi di Bidang Politik

Aplikasi di Bidang Politik Aplikasi di Bidang Politik Pembahasan yang terangkum di dalam bab ini adalah: Aplikasi SPSS 15.0 di bidang Politik dengan menentukan statistika deskriptif menggunakan Explore. Aplikasi SPSS 15.0 di bidang

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN A. Jenis dan Pendekatan Penelitian Ditinjau dari objeknya, penelitian yang dilakukan penulis termasuk penelitian lapangan (field research), karena data-data yang diperlukan untuk

Lebih terperinci

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING Andreas Chandra Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email : andreaschaandra@yahoo.com

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. yang telah dilakukan. Hasil dan pembahasan ini terdiri dari kualitas website, uji

BAB IV HASIL DAN PEMBAHASAN. yang telah dilakukan. Hasil dan pembahasan ini terdiri dari kualitas website, uji BAB IV HASIL DAN PEMBAHASAN Pada bab ini akan membahas mengenai hasil dan pembahasan dari analisis yang telah dilakukan. Hasil dan pembahasan ini terdiri dari kualitas website, uji validitas dan reliabilitas,

Lebih terperinci

Implementasi Data Mining dengan Metode Klastering untuk Meramalkan Permintaan Pasar (Studi Kasus PT. Nutrifood Indonesia )

Implementasi Data Mining dengan Metode Klastering untuk Meramalkan Permintaan Pasar (Studi Kasus PT. Nutrifood Indonesia ) Implementasi Data Mining dengan Metode Klastering untuk Meramalkan Permintaan Pasar (Studi Kasus PT. Nutrifood Indonesia ) November 20, 2010 Arimbi Kurniasari Lintang Yuniar Banowosari Alex Hutapea Manajemen

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan BAB III METODOLOGI PENELITIAN A. Jenis Penelitian Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan metode deskriptif. Menurut Sugiono dalam bukunya Metodologi Penelitian Bisnis (2009)

Lebih terperinci

Nandang Arif Saefuloh, M.Pd. *) Universitas Islam Nusantara, Jl. Soekarno-Hatta No. 530, Bandung, Abstrak

Nandang Arif Saefuloh, M.Pd. *) Universitas Islam Nusantara, Jl. Soekarno-Hatta No. 530, Bandung, Abstrak Jurnal Euclid, vol.3, No.1, p.502 ANALISIS KORESPONDENSI, ALTERNATIF UJI STATISTIK PENELITIAN (Hubungan Tingkat Pendidikan dan Penghasilan Orangtua dengan Nilai Raport Matematika Siswa) Nandang Arif Saefuloh,

Lebih terperinci

Analisis Diskriminan

Analisis Diskriminan Analisis Diskriminan Analisis Diskriminan adalah teknik Multivariat yang termasuk pada Dependence Method, dengan ciri adanya variabel dependen dan independen. Dengan demikian, ada variabel yang hasilnya

Lebih terperinci

Dua sampel independen, tidak terikat, tidak

Dua sampel independen, tidak terikat, tidak 76 PEMANFAATAN SPSS DALAM PENELITIAN BIDANG KESEHATAN & UMUM PEMANFAATAN SPSS DALAM PENELITIAN BIDANG KESEHATAN & UMUM 77 Jadi dari analisis keputusannya : p value < 0,05 Ho ditolak berarti Distribusi

Lebih terperinci

Modul Pembelajaran SPSS (Statistical Package for the Social Sciences)

Modul Pembelajaran SPSS (Statistical Package for the Social Sciences) Modul Pembelajaran SPSS (Statistical Package for the Social Sciences) Pusat Data dan Statistik Pendidikan Kementerian Pendidikan dan Kebudayaan Republik Indonesia 2014 Kata Pengantar Buku Modul Pembelajaran

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Traveling Salesmen Problem (TSP) Travelling Salesman Problem (TSP) merupakan sebuah permasalahan optimasi yang dapat diterapkan pada berbagai kegiatan seperti routing. Masalah

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

BAB 3 PENGUMPULAN DAN PENGOLAHAN DATA

BAB 3 PENGUMPULAN DAN PENGOLAHAN DATA BAB PENGUMPULAN DAN PENGOLAHAN DATA.1 Pengumpulan Data Data yang diambil berupa data karakteristik item spare part baik spare part mekanik maupun elektrik. Data diambil dari salah satu jalur produksi terbesar

Lebih terperinci

Mengolah Data Bidang Industri

Mengolah Data Bidang Industri Mengolah Data Bidang Industri Pengolahan data dalam bidang industri menggunakan aplikasi SPSS 20 mempunyai fungsi sebagai alat bantu untuk memberikan gambaran dalam hal prediksi penjualan atau omzet perusahaan,

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN PEMASARAN PRODUK MENGGUNAKAN DATA MINING DENGAN K-MEANS CLUSTERING

SISTEM PENDUKUNG KEPUTUSAN PEMASARAN PRODUK MENGGUNAKAN DATA MINING DENGAN K-MEANS CLUSTERING Seminar Nasional Sistem Informasi Indonesia, 22 September 2014 SISTEM PENDUKUNG KEPUTUSAN PEMASARAN PRODUK MENGGUNAKAN DATA MINING DENGAN K-MEANS CLUSTERING Arief Samuel Gunawan 1), Evasaria Magdalena

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN A. Jenis dan Pendekatan Penelitian Ditinjau dari obyeknya, penelitian yang dilakukan penulis termasuk penelitian lapangan (field research), karena data-data yang diperlukan untuk

Lebih terperinci

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) ANALISIS MULTIVARIAT ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) Oleh : Rizka Fauzia 1311 100 126 Dosen Pengampu: Santi Wulan Purnami S.Si., M.Si. PROGRAM STUDI SARJANA JURUSAN

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

PENGKLASIFIKASIAN KARAKTERISTIK MAHASISWA BARU DALAM MEMILIH PROGRAM STUDI MENGGUNAKAN ANALISIS CLUSTER

PENGKLASIFIKASIAN KARAKTERISTIK MAHASISWA BARU DALAM MEMILIH PROGRAM STUDI MENGGUNAKAN ANALISIS CLUSTER PENGKLASIFIKASIAN KARAKTERISTIK MAHASISWA BARU DALAM MEMILIH PROGRAM STUDI MENGGUNAKAN ANALISIS CLUSTER Maxsi Ary Program Studi Manajemen Informatika Akademik Manajemen Informatika dan Komputer BSI Bandung

Lebih terperinci

LAMPIRAN. Universitas Sumatera Utara

LAMPIRAN. Universitas Sumatera Utara LAMPIRAN Lampiran 1: Analisis Logit Iteration Step 1 1-2 Log likelihoo d Coefficients Iteration History(a,b,c,d) Constant X1 X2 X3 X4 X5 X6 X7 X8 X9 31.228-2.194.035 -.231 -.080 -.014.819 -.660.443.559

Lebih terperinci

UKDW BAB I PENDAHULUAN

UKDW BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Dalam dunia bisnis pada jaman sekarang, para pelaku bisnis senantiasa selalu berusaha mengembangkan cara-cara untuk dapat mengembangkan usaha mereka dan memperhatikan

Lebih terperinci

BAB I. REGRESI LINIER BERGANDA

BAB I. REGRESI LINIER BERGANDA BAB I. REGRESI LINIER BERGANDA Membuka program SPSS kemudian memilih tab sheet Variable View. Melakukan input variabel yang akan diteliti pada sheet Variable View. Input dilakukan dengan memperhatikan

Lebih terperinci

APLIKASI REGRESI SEDERHANA DENGAN SPSS. HENDRY admin teorionline.net Phone : 021-834 14694 / email : klik.statistik@gmail.com

APLIKASI REGRESI SEDERHANA DENGAN SPSS. HENDRY admin teorionline.net Phone : 021-834 14694 / email : klik.statistik@gmail.com APLIKASI REGRESI SEDERHANA DENGAN SPSS HENDRY admin teorionline.net Phone : 02-834 4694 / email : klik.statistik@gmail.com Tentang Regresi Sederhana Analisis regresi merupakan salah satu teknik analisis

Lebih terperinci

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta 13 BAB III DIVISIVE ANALISIS Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta algoritma dari metode tersebut. 3.1 DEFINISI METODE DIVISIVE Teknik divisive klastering termasuk

Lebih terperinci

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami pemrosesan awal data yang akan diproses

Lebih terperinci