BAHAN DAN METODE. Bahan

dokumen-dokumen yang mirip
PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

BAB 1 PENDAHULUAN 1.1. Latar Belakang

Penggunaan Analisis Two Step Clustering untuk Data Campuran. Two Step Clustering Analysis for Combination Data

PERBANDINGAN HASIL PENGGEROMBOLAN K-MEANS, FUZZY K- MEANS, DAN TWO STEP CLUSTERING. Lathifaturrahmah

STK511 Analisis Statistika. Pertemuan 2 Review Statistika Dasar

Model Regresi Binary Logit (Aplikasi Model dengan Program SPSS)

SIMPULAN DAN SARAN. Simpulan

STK 211 Metode statistika. Agus Mohamad Soleh

STATISTIKA DESKRIPTIF

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

TINJAUAN PUSTAKA Perilaku Pemilih Partai Politik

STATISTIKA INFERENSIAL IM TIRTA

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

STATISTIKA INFERENSIAL

UJI NONPARAMETRIK. Gambar 6.1 Menjalankan Prosedur Nonparametrik

STATISTIK DESKRIPTIF. Abdul Rohman, S.E

BAB I PENDAHULUAN. 1.1 Latar Belakang

STK 211 Metode statistika. Materi 2 Statistika Deskriptif

Statistika Deskriptif

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Resume Regresi Linear dan Korelasi

HASIL DAN PEMBAHASAN

di masa yang akan datang dilihat dari aspek demografi dan kepuasannya. PENDAHULUAN

IV. METODE PENELITIAN

IV METODE PENELITIAN. 4.1 Lokasi dan Waktu Penelitian

BAB III METODE PENELITIAN

STATISTIK DESKRIPTIF

PENGEMBANGAN BAGAN KENDALI MUTU UNTUK KOMPOSISI. simplex-lattice adalah (q+ m-1)!/(m!(q-1)!) (Cornell 1990).

Memulai SPSS dan Mengelola File

Pengantar Pengolahan Data Statistik Menggunakan SPSS 22. Isram Rasal ST, MMSI, MSc

TINJAUAN PUSTAKA Analisis Gerombol

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

BAB 7 STATISTIK NON-PARAMETRIK

PERBANDINGAN UKURAN JARAK LOG-LIKELIHOOD DAN EUCLIDEAN PADA PEMBENTUKAN GEROMBOL DENGAN MENGGUNAKAN ANALISIS TWO STEP CLUSTER NUR MILA SARI

Mendesain Tabel Statistik Secara Profesional

Lampiran 1. Peubah-peubah yang Digunakan dalam Analisis Gerombol

.: Analisis Gerombol - Bagian 1 :.

BAB 3 METODOLOGI PENELITIAN. dengan menggunakan jenis penelitian eksplanatif dan metode penelitian kuantitatif.

BAB IV APLIKASI JARAK MAHALANOBIS

VI. PEMBAHASAN. dengan metode kemungkinan maksimum, tetapi terhadap

III. METODE PENELITIAN. penelitian dilakukan dan diukur dalam satuan tahun. responden dan diukur dalam satuan tahun.

BAB III METODE PENELITIAN. yang dibuat oleh peneliti untuk membantu mengumpulkan dan menganalisis

BAB 1 PENDAHULUAN Latar Belakang

APLIKASI METODE TWOSTEP CLUSTER PADA UKURAN DATA BERBEDA Studi Kasus: Data Potensi Desa 2006 untuk Wilayah Jawa Barat NURSHAUMI FITRIANI HAKIM

HASIL DAN PEMBAHASAN

Analisis Data kategorik tidak berpasangan skala pengukuran numerik

BAB 3 METODOLOGI PENELITIAN

PRAKTIKUM ANALISIS DATA EKSPLORATIF

MAKALAH REGRESI LOGISTIK DAN REGRESI DENGAN VARIABLE DUMMY

Siklus Pengambilan Keputusan

BAB 1 PENDAHULUAN Latar Belakang

Uji Perbandingan Rata-Rata

MODUL UJI NON PARAMETRIK (CHI-SQUARE/X 2 )

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

HASIL DAN PEMBAHASAN. (a) (b) (c)

K O R E L A S I. Referensi :

BAB 3 METODE PENELITIAN

UJI NONPARAMETRIK (CHI SQUARE / X2)

BAB III METODE PENELITIAN. tujuan, gambaran hubungan antar variabel, perumusan hipotesis sampai dengan

PERBANDINGAN KURVA PADA DISTRIBUSI UNIFORM DAN DISTRIBUSI BINOMIAL

PENGOLAHAN DATA DENGAN SPSS

STATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

Statistik Deskriptif untuk Data Nominal dan Ordinal

Sri Indra Maiyanti, Endro Setyo Cahyono, Weni Winata. Universitas Sriwijaya

BAB 2 LANDASAN TEORI

BAB IV SEGMENTASI PASAR

BAB III METODE PENELITIAN. ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Dalam

Uji Perbandingan Rata-Rata

faktornya berbeda, misalnya 2 taraf untuk faktor A dan 3 taraf untuk 2x2x3 maksudnya percobaan faktorial yang terdiri dari 3 faktor dengan taraf

PEREDUKSIAN PEUBAH PADA METODE TWO STEP CLUSTER (Studi Kasus Penggerombolan Desa/Kelurahan di Jawa Barat) RANI KARLINA

BAB I. Pengertian Dasar dalam Statistika. A. Statistika, Statistik, Statistika Deskriptif

TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB III METODOLOGI PENELITIAN

BAB III Riset Pemasaran

BAB I PENDAHULUAN. Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur

Instruksi. Deskripsi Kasus

DAFTAR ISI. Halaman DAFTAR TABEL... xiii DAFTAR GAMBAR... xv DAFTAR LAMPIRAN... xvi

PENGANTAR & STATISTIKA DESKRIPTIF. Utriweni Mukhaiyar

BAB II TINJAUAN PUSTAKA

PENGERTIAN STATISTIK. NO Tahun Jumlah / / / APAKAH INI STATISTIK?

Uji statistik multivariat digunakan untuk menguji

E-book Statistika Gratis... Statistical Data Analyst. Penyajian Data Statistik

IV. METODE PENELITIAN

PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI

III. METODOLOGI PENELITIAN. Keadaan Internal Kebun Raya Bogor

MODUL 1 UJI DATA ( 1 ) ANALISIS MISSING VALUE & OUTLIER

UJI CHI SQUARE. (Uji data kategorik)

BAB III METODE PENELETIAN

KAJIAN METODE BERBASIS MODEL PADA ANALISIS CLUSTER DENGAN PERANGKAT LUNAK MCLUST

MARKET POTENTIAL RESEARCH PASAR TRADISIONAL PD PASAR SURYA DI CABANG SURABAYA SELATAN. M. Jamal Muttaqin ( )

ANOVA (analisis varians), sering disebut juga dengan uji F, mempunyai tujuan yang sama dengan uji t, yakni: o

BAB III METODE PENELITIAN. suatu permasalahan (Azwar,2012:1). Desain penelitian dapat diartikan suatu

LAPORAN PRAKTIKUM I METODE STATISTIKA II PENGUJIAN HIPOTESIS INDEPENDENT DENGAN PENDEKATAN ANALISIS RAGAM

BAB III METODE PENELITIAN

Skala pengukuran dan Ukuran Pemusatan. Ukuran Pemusatan

Transkripsi:

15 BAHAN DAN METODE Bahan Model Populasi Hipotetik Pada penelitian ini akan digunakan pendekatan simulasi untuk mengevaluasi efektivitas algoritma TwoStep Cluster, sebagai mana dinyatakan pada tujuan penelitian. Data bangkitan yang akan digunakan didasarkan pada 5 model data hipotetik, yang dipandang dapat mewakili situasi yang mungkin muncul atau dapat dijadikan rujukan untuk generalisasi berbagai situasi di populasi. Kelima model tersebut adalah : P1 : Populasi yang homogen (1 gerombol), yaitu dapat ditafsirkan bahwa tidak terdapat struktur kelas (gerombol) pada populasi yang dianalisis. Dalam kasus pemasaran, beberapa produk-produk masal (misal minuman ringan/soft drink ) tidak tersegmen, karena preferensi atas produk tersebut tidak terkait dengan kelas sosial ekonomi, gaya hidup, atau demografi. P2 : Populasi yang dibentuk dari 2 gerombol yang memiliki sifat hampir mirip (overlap) atau tidak terpisah secara tegas. Contoh pada kasus pemasaran adalah segmentasi preferensi antara kelompok laki-laki dan perempuan pada kelompok umur muda (15-24 tahun) untuk berbagai jenis produk non kosmetik atau model pakaian. P3 : Populasi yang dibentuk dari 2 gerombol yang terpisah secara tegas (mutually exclusive). Pada penerapan bidang pemasaran, sangat umum dijumpai pemisahan kelas atas (upper class atau high end) dan kelas bawah (lower class atau low end) yang memiliki ciri dan/atau preferensi yang sangat berbeda, sejalan dengan sumber daya (kelas sosial dan ekonomi) dan gaya hidup yang dimiliki.

16 P4 : Populasi yang dibentuk dari 3 gerombol yang terpisah secara tegas. Sama pada kasus di atas (P3), namun populasi yang dianalisis tersegmen menjadi kelompok kelas atas (upper), menengah (middle), dan kelas bawah (lower). P5 : Populasi yang dibentuk dari 5 gerombol yang terdiri dari 3 gerombol yang terbedakan secara tegas, dan 2 gerombol lainnya tumpang tindih satu dengan lainnya serta dengan gerombol lain. Pada bidang pemasaran, segmentasi berdasarkan psikografik atau gaya hidup cukup umum dijump ai pemisahan yang tidak nyata pada beberapa kelompok dan pada kelompok lainnya terdapat perbedaan yang nyata. Model Komposisi Peubah yang Dianalisis Selain model-model populasi hipotetik di atas, pada penelitian ini akan dievaluasi pengaruh jenis peubah yang terlibat dalam proses penggerombolan. Untuk membatasi lingkup penelitian, ditetapkan banyaknya peubah yang terlibat adalah 14. Dalam prakteknya, berdasarkan pengalaman penulis di bidang riset pemasaran, atribut preferensi produk yang diukur untuk tujuan segmentasi umumnya tidak lebih dari 10. Pada segmentasi konsumen berdasarkan psikografik, sangat umum digunakan 14 dimensi nilai (value), sedangkan pada segmentasi berdasarkan sosio - demografik peubah-peubah yang umum digunakan adalah (1) kelompok umur, (2) pendidikan tertinggi, (3) kelas rata-rata pengeluaran rumah tangga per bulan, (4) kelas rata-rata pendapatan rumah tangga per bulan, (5) status perkawinan, (6) status pekerjaan, (7) gender, (8) ukuran keluarga, dan (9) kepemilikan barang-barang tahan lama di rumah tangga. Kelompok peubah yang akan dievaluasi adalah : V1 : Kumpulan peubah yang semuanya merupakan peubah kuantitatif (numerik, dengan skala kontinu atau interval). Kasus ini sangat jarang dijumpai pada bidang pemasaran, namun sangat umum ditemukan di bidang pertanian secara luas, bidang ekonomi dan keuangan, atau bidang kesehatan.

17 V2: Kumpulan peubah yang semuanya merupakan peubah kategorik (nominal atau ordinal yang diperlakukan sebagai nominal). Kasus ini paling banyak dijumpai pada bidang pemasaran, ilmu-ilmu sosial, manajemen, dan politik. V3 : Kumpulan peubah yang terdiri dari sebagian kecil (4) peubah kuantitatif, dan sisanya (10) merupakan peubah kategorik. Pada bidang pemasaran dan ilmuilmu sosial kasus seperti ini mulai mendapat perhatian. V4 : Kumpulan peubah yang terdiri dari sebagian besar (10) merupakan peubah kuantitatif, dan sisanya (4) merupakan peubah kategorik. Pada bidang pertanian dan ekonomi keterlibatan peubah-peubah yang tidak dapat dikuantifikasi, saat ini mulai mendapat perhatian. Data Hipotetik Faktor lain yang dipandang berpengaruh terhadap data bangkitan yang akan digunakan adalah ukuran contoh secara total (banyaknya data). Pada penelitian ini akan dievaluasi kemungkinan ukuran data relatif kecil (500), sedang (2.000), besar (5.000) dan sangat besar (10.000). Dengan demikian, model data bangkitan yang akan digunakan dalam penelitian ini merupakan fungsi dari : 5 Model hipotetik segmentasi di populasi. 4 Komposisi jenis peubah yang terlibat dalam analisis. 4 Ukuran data. Dengan menggunakan rancangan faktorial lengkap, untuk mengkombinasikan berbagai kemungkinan dari masing-masing parameter yang dievaluasi maka dibangkitkan 80(5x4x4) data hipotetik untuk dianalisis. Masing-masing kombinasi akan diulang sebanyak 100 kali, sehingga diperlukan 8.000 gugus data hipotetik yang dibangkitkan melalui simulasi pada percobaan ini untuk dianalisis. Berdasarkan hasil pembangkitan rancangan faktorial lengkap, diperoleh 80 kombinasi model untuk data hipotetik yang akan digunakan dalam penelitian ini, yang secara lengkap disajikan pada Tabel 1.

18 Tabel 1. Kombinasi parameter model data hipotetik yang akan d ibangkitkan. Komposisi jenis peubah Ukuran data (N) Komposisi jenis peubah Ukuran data (N) No Model Segmentasi No Model Segmentasi 1 P1 V1 500 41 P1 V1 5000 2 P1 V2 500 42 P1 V2 5000 3 P1 V3 500 43 P1 V3 5000 4 P1 V4 500 44 P1 V4 5000 5 P2 V1 500 45 P2 V1 5000 6 P2 V2 500 46 P2 V2 5000 7 P2 V3 500 47 P2 V3 5000 8 P2 V4 500 48 P2 V4 5000 9 P3 V1 500 49 P3 V1 5000 10 P3 V2 500 50 P3 V2 5000 11 P3 V3 500 51 P3 V3 5000 12 P3 V4 500 52 P3 V4 5000 13 P4 V1 500 53 P4 V1 5000 14 P4 V2 500 54 P4 V2 5000 15 P4 V3 500 55 P4 V3 5000 16 P4 V4 500 56 P4 V4 5000 17 P5 V1 500 57 P5 V1 5000 18 P5 V2 500 58 P5 V2 5000 19 P5 V3 500 59 P5 V3 5000 20 P5 V4 500 60 P5 V4 5000 21 P1 V1 2000 61 P1 V1 10000 22 P1 V2 2000 62 P1 V2 10000 23 P1 V3 2000 63 P1 V3 10000 24 P1 V4 2000 64 P1 V4 10000 25 P2 V1 2000 65 P2 V1 10000 26 P2 V2 2000 66 P2 V2 10000 27 P2 V3 2000 67 P2 V3 10000 28 P2 V4 2000 68 P2 V4 10000 29 P3 V1 2000 69 P3 V1 10000 30 P3 V2 2000 70 P3 V2 10000 31 P3 V3 2000 71 P3 V3 10000 32 P3 V4 2000 72 P3 V4 10000 33 P4 V1 2000 73 P4 V1 10000 34 P4 V2 2000 74 P4 V2 10000 35 P4 V3 2000 75 P4 V3 10000 36 P4 V4 2000 76 P4 V4 10000 37 P5 V1 2000 77 P5 V1 10000 38 P5 V2 2000 78 P5 V2 10000 39 P5 V3 2000 79 P5 V3 10000 40 P5 V4 2000 80 P5 V4 10000

19 Metode Metode Pembangkitan Data Data hipotetik dibangkitkan dari sebaran normal dengan nilai tengah m dan ragam=1. Lebih lanjut diasumsikan bahwa antar peubah-peubah yang terlibat dalam analisis saling bebas stokastik, dengan sebaran yang sama. Dengan demikian, peubah-peubah yang terlibat dalam analisis menyebar normal, bebas stokastik, identik (normally independently identically distributed), N(m,1). Nilai tengah untuk masingmasing model segmentasi yang dievaluasi dinyatakan sebagai berikut : P1 : Tidak terdapat struktur kelas (gerombol), yaitu populasi dengan 1 gerombol. m (x i ) = 0,00 ; i = 1,2,3,..., N (ukuran data). 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-3.00-2.80-2.60-2.40-2.20-2.00-1.80-1.60-1.40-1.20-1.00-0.80-0.60-0.40-0.200.000.200.400.60 0.80 1.001.20 1.401.601.802.002.202.402.602.80 3.00 Gambar 2. Sebaran populasi tunggal, N (0,1)

20 P 2: Populasi yang dibentuk dari 2 gerombol dengan jarak antar gerombol relatif kecil (pemisahan tidak tegas) Gerombol 1 : m (x 1i ) = -0,50 ; i = 1,2,3,..., n1 (catatan : n1=n/2) Gerombol 2 : m (x 2i ) = +0,50 ; i = 1,2,3,..., n2 (catatan : n2=n/2) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-4.00-3.60-3.20-2.80-2.40-2.00-1.60-1.20-0.80-0.40 0.00 0.40 0.80 1.20 1.60 2.00 2.40 2.80 3.20 3.60 4.00 N(-0.5,1) N(0.5,1) Gambar 3. Sebaran model 2 populasi dengan pemisahan tidak tegas P3 : Populasi yang dibetuk dari 2 gerombol dengan jarak antar gerombol relatif besar (pemisahan antar gerombol tegas) Gerombol 1 : m (x 1i ) = -3,00 ; i = 1,2,3,..., n1 (catatan : n1=n/2) Gerombol 2 : m (x 2i ) =+3,00 ; i = 1,2,3,..., n2 (catatan : n2=n/2) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-6.00-5.60-5.20-4.80-4.40-4.00-3.60-3.20-2.80-2.40-2.00-1.60-1.20-0.80-0.40 0.00 0.40 0.80 1.20 1.60 2.00 2.40 2.80 3.20 3.60 4.00 4.40 4.80 5.20 5.60 6.00 N(-3,1) N(3,1) Gambar 4. Sebaran model 2 populasi dengan pemisahan yang tegas

21 P4 : Populasi yang dibentuk dari 3 gerombol dengan jarak antar gerombol cukup besar (pemisahan secara tegas) Gerombol 1 : m (x 1i ) = -4,00 ; i = 1,2,3,..., n1 (catatan : n1=n/4) Gerombol 2 : m (x 2i ) = 0,00 ; i = 1,2,3,..., n2 (catatan : n2=n/2) Gerombol 3 : m (x 3i ) = +4,00 ; i = 1,2,3,..., n3 (catatan : n3=n/4) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-7.60-7.00-6.40-5.80-5.20-4.60-4.00-3.40-2.80-2.20-1.60-1.00-0.40 0.20 0.80 1.40 2.00 2.60 3.20 3.80 4.40 5.00 5.60 6.20 6.80 7.40 N(-4,1) N(0,1) N(4,1) Gambar 5. Sebaran model 3 populasi dengan pemisahan yang tegas Penyebaran banyaknya data pada masing-masing (ukuran gerombol) ditetapkan tidak seimbang, tetapi proporsional dan menyebar secara simetrik. Pada kasus ini, ukuran contoh masing-masing gerombol adalah 25%, 50%, dan 25% dari jumlah keseluruhan data yang dicobakan. P5 : Populasi yang dibentuk dari 3 gerombol dengan jarak antar gerombol cukup besar dan 2 gerombol lainnya terletak diantara 3 gerombol lain serta tumpang tindih terhadap gerombol lain. Gerombol 1 : m (x 1i ) = -4,00 ; i = 1,2,3,..., n1 (catatan : n1=15% dari N) Gerombol 2 : m (x 2i ) = -1,00 ; i = 1,2,3,..., n2 (catatan : n2= 10% dari N) Gerombol 3 : m (x 3i ) = 0,00 ; i = 1,2,3,..., n3 (catatan : n3= 50% dari N) Gerombol 4 : m (x 4i ) = +1,00 ; i = 1,2,3,..., n4 (catatan : n4= 10% dari N) Gerombol 5 : m (x 5i ) = +4,00 ; i = 1,2,3,..., n5 (catatan : n5= 15% dari N)

22 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-0.05-10.00-9.40-8.80-8.20-7.60-7.00-6.40-5.80-5.20-4.60-4.00-3.40 N(-4,1) N(0,1) N(4,1) N(-1.0,1) N(1.0,1) -2.80-2.20-1.60-1.00-0.40 0.20 0.80 1.40 2.00 2.60 3.20 3.80 4.40 5.00 5.60 6.20 6.80 7.40 8.00 8.60 9.20 9.80 Gambar 6. Sebaran model 5 populasi dengan 3 gerombol terpisah secara tegas dan 2 gerombol saling tumpang tindih dengan lainnya. Seperti pada kasus sebelumnya, ukuran contoh pada masing-masing gerombol ditetapkan menyebar secara simetrik, sehingga pada kasus ini ukuran contoh masingmasing gerombol adalah 10%, 15%, 50%, 15% dan 10% dari jumlah keseluruhan data yang dicobakan. Data hipotetik peubah kategorik akan dibentuk dari pembangkitan dengan menggunakan aturan pada peubah kuantitatif. Transformasi peubah kuantitatif menjadi kategorik dilakukan dengan mengikuti aturan sebagai berikut : Peubah Biner dengan p 1 = 0,5 y i = 1 jika x i < m(x i ) y i = 0 jika x i > m(x i ) dengan x i adalah data bangkitan pada peubah kuantitatif dan m(x i ) adalah nilai tengah gerombol.

23 Prosedur Pembangkitan Data Pembangkitan data untuk masing-masing kasus yang dievaluasi, dilakukan dengan menggunakan bantuan paket program statistika MINITAB versi 13. Pada masing-masing kasus, pemba ngkitan 14 peubah kriteria penggerombolan dilakukan secara serentak (bersamaan), karena nilai tengah dan ragam untuk masing-masing peubah sama dan saling bebas stokastik satu dengan lainnya. Proses pembangkitan data dengan menggunakan perintah pada MINITAB, misal untuk kasus populasi P4, V1, dengan ukuran data 500, adalah sebagai berikut : 1. Memasukkan parameter populasi hipotetik MTB> LET K1=125 MTB> LET K2=250 MTB> LET K3=-4.0 MTB> LET K4=0.0 MTB> LET K5=4.0 2. Makro membangkitkan data masing-masing gerombol hipotetik MTB>SET C1 K1 (1) END. MTB>RANDOM K1 C2-C15; NORMAL K3 1.0. MTB> SET C16 K2 (2) END. MTB> RANDOM K2 C17-C30; NORMAL K4 1.0. MTB>SET C31 K1 (3) END.

24 MTB>RANDOM K1 C32-C45; NORMAL K5 1.0. 3. Makro menggabungkan data dari setiap gerombol bangkitan MTB> STACK C1 C16 C31 C1 MTB> STACK C2 C17 C32 C2 MTB> STACK C3 C18 C33 C3 MTB> STACK C4 C19 C34 C4 MTB> STACK C5 C20 C35 C5 MTB> STACK C6 C21 C36 C6 MTB> STACK C7 C22 C37 C7 MTB> STACK C8 C23 C38 C8 MTB> STACK C9 C24 C39 C9 MTB> STACK C10 C25 C40 C10 MTB> STACK C11 C26 C41 C11 MTB> STACK C12 C27 C42 C12 MTB> STACK C13 C28 C43 C13 MTB> STACK C14 C29 C44 C14 MTB> STACK C15 C30 C45 C15 Konversi data kontinu menjadi data biner dilakukan dengan menggunakan paket program SPSS V. 11.5. Hal ini dilakukan karena pengolahan data hasil pembangkitan, konversi, dan analisis TwoStep Cluster dapat dilakukan pada paket program yang sama. Opsi Penanganan Pencilan dan Tanpa Penanganan Pencilan Sebagaimana disarankan oleh Bacher, Wenzig, dan Vogler (2004), untuk menghindarkan adanya bias akibat pencilan, penggunaan opsi penanganan pencilan (fraction of noise) sebesar 5% dibandingkan dengan pengolahan data tanpa penanganan opsi pencilan. Kotak pilihan penggunaan opsi penanganan pencilan atau

25 tanpa penanganan pencilan ditampilkan pada lampiran 1.gambar 6. Pada penelitian ini, akan dibandingkan hasil penggerombolan TwoStep Cluster antara penggunaan opsi penanganan pencilan dengan tanpa penanganan pencilan. Metode Analisis Fokus penelitian ini adalah mengevaluasi keakuratan algoritma TwoStep Cluster dalam mendeteksi banyaknya gerombol dan ukuran masing-masing gerombol pada gugus data dari populasi yang dianalisis. Analisis yang akan dilakukan adalah : 1. Mengukur tingkat keakuratan algoritma TwoStep Cluster dalam mendeteksi banyaknya gerombol sebenarnya. Pada penelitian ini, tingkat keakuratan didefinisikan sebagai persentase jumlah percobaan (run) yang menghasilkan banyaknya gerombol yang sama dengan populasi data hipotetik (dipandang sebagai banyaknya gerombol sebenarnya). A = Σ Xi / N (14) dengan Xi bernilai 1 bila banyaknya gerombol yang dihasilkan dari algoritma TwoStep Cluster sama dengan banyaknya gerombol sebenarnya di dalam populasi (pada penelitian ini diketahui) dan 0 selainnya. N adalah banyaknya ulangan percobaan, pada penelitian ini sama dengan 100. 2. Analisis berikutnya adalah menelusuri kesesuaian sebaran ukuran gerombol yang dihasilkan dari algoritma TwoStep Cluster dengan sebaran ukuran gerombol sebenarnya pada populasi. Kesesuaian sebaran ukuran gerombol diuji dengan menggunakan uji khi-kuadrat sebagai berikut : Ho : Sebaran ukuran gerombol hasil TwoStep Cluster = sebaran gerombol populasi. H1 : Sebaran ukuran gerombol hasil TwoStep Cluster? sebaran gerombol populasi

26 Pada taraf nyata (a) sebesar 30%, dapat didefinisikan tingkat kesesuaian sebaran ukuran gerombol hasil algoritma TwoStep Cluster dengan ukuran gerombol sebenarnya, yaitu : K = S Yi / N (15) dengan Yi bernilai 1 bila hasil uji khi-kuadrat (pada taraf nyata tertentu) menghasilkan kesimpulan Terima Ho ; dan 0 bila Tolak Ho. N adalah banyaknya ulangan percobaan, pada penelitian ini sama dengan 100. 3. Tingkat salah klasifikasi dari anggota gerombol. Salah klasifikasi dari hasil penggerombolan, pada penelitian ini didefinisikan sebagai total persentase semua individu (objek) yang berasal dari suatu gerombol namun teridentifikasi sebagai anggota gerombol lain pada proses penggerombolan, dalam hal ini adalah hasil penggerombolan SPSS TwoStep Cluster. Hasil Penggerombolan Keanggotaan pada populasi yang sebenarnya Populasi 1 Populasi 2 Gerombol 1 n 1 n 2 Gerombol 2 n 3 n 4 Salah klasifikasi pada 2 populasi (geromb ol) adalah (n2+n3)/(n1+n2+n3+n4) Prosedur dan Pelaksanaan Percobaan 1. Membangkitkan gugus data hipotetik untuk setiap kombinasi struktur populasi, komposisi jenis peubah, dan ukuran data yang tercantum pada Tabel 1. Masing-masing kombinasi perlakuan diulang sebanyak 100 kali. Dengan demikian akan dibangkitkan sebanyak 8.000 gugus data untuk dianalisis. Data hipotetik diperoleh dengan menggunakan prosedur yang telah dipaparkan pada bagian metode pembangkitan data, sedangkan pembangkitan data sebaran Ν(m,1) dilakukan dengan menggunakan alat bantu perangkat

27 lunak (software) statistika yang tersedia, dalam hal ini peneliti menggunakan Minitab versi 13.2. Pada setiap gugus data bangkitan yang akan digunakan sebagai bahan simulasi, akan ditambahkan peubah (kolom atau field) yang menunjukkan indeks asal populasi. 2. Setiap gugus data yang terbentuk akan digerombolkan dengan menggunakan prosedur SPSS TwoStep Cluster. Pada SPSS versi 11.5 tersedia pada modul Analyze -> Clasify. Pilihan menu dasar (basic option) yang digunakan adalah : Distance Measure : Log-likelihood Number of clusters : Determined Automatically, Maximum : 15 Clustering Criterion : BIC Sesuai dengan saran dari Bacher, Wenzig, dan Vogler (2004), pada menu Options, akan dilakukan pilihan pada kotak Outlier Treatment dengan memberi check box pada kotak Use noise handling dan mengisi pada kotak Percentage bilangan 5 (artinya 5%) dan dicobakan pula tanpa pencilan. Pada menu Output akan dipilih Statistik-statistik : a. Deskripsi setiap gerombol (Descriptives by cluster) untuk data kuantitatif. b. Sebaran frekuensi setiap gerombol (Cluster frequencies) untuk data kategorik. c. Informasi BIC, dan d. Simpan data keanggotaan gerombol (Create cluster membership variable). 3. Hasil penggerombolan TwoStep Cluster, khususnya banyaknya gerombol yang terbentuk dan profil masing-masing gerombol, termasuk ukuran gerombol, akan dicatat kemudian dimasukkan sebagai data yang akan dianalisis pada pengolahan selanjutnya. 4. Setelah semua (8.000) gugus data hipotetik terolah dan statistik-statistik yang dihasilkan dicatat sesuai untuk masing-masing kombinasi perlakuan, tahap selanjutnya dilakukan analisis sebagaimana pada persamaan (13), dan menguji kesesuaian sebaran ukuran gerombol serta salah klasifikasi penggerombolan.