MULTI DIMENSIONAL SCALING (MDS) Irlandia Ginanjar Statistika FMIPA ITS
TUJUAN ANALISIS Membuat peta/konfigurasi posisi objek dalam ruang berdimensi rendah (umumnya 2 dimensi) berdasarkan data jarak antar objek atau data multivariate yang sebelumnya diubah dulu menjadi matriks jarak
KEGUNAAN ANALISIS Mendapatkan posisi relatif suatu objek dibandingkan objek lain. Dalam banyak kasus strategi bisnis, digunakan untuk menentukan pesaing dan benchmarking. Melakukan pengelompokan objek, salah satu alternatif untuk cluster analisys
SEKILAS MDS Matriks Jarak A B C D E A 0 d AB d AC d AD d AE B d BA 0 d BC d BD d BE C d CA d CB 0 d CD d CE D d DA d DB d DC 0 d DE E d EA d EB d EC d ED 0 Data multivariate X 1 X 2 X p A X 11 X 12 X 1p B X 21 X 22 X 2p C X 31 X 32 X 3p D X 41 X 42 X 4p E X 51 X 52 X 5p Konfigurasi Obyek
MULTIDIMENSIONAL SCALING (MDS) JARAK EUCLIDEAN Adalah jarak antara dua objek yang dibandingkan. x ' = ( x, x2,..., x Jika dimisalkan objek 1 adalah 1 p dan objek 2 adalah y ' = ( y1, y2,..., y p )' Maka jarak Euclidean-nya adalah: dlh d 2 2 2 ( x, y ) = ( x1 y1 ) + ( x 2 y 2 ) +... + ( x p y p ) Dimana : x i = objek ke-1 1padapengamatanke pengamatan ke-i y i = objek ke-2 pada pengamatan ke-i p= banyaknya pengamatan Atau dalam notasi matrik, rumus jarak Euclidean-nya menjadi: d( x, y) = ( x y)'( x y) )'
MULTIDIMENSIONAL SCALING (MDS) JENIS MDS Berdasarkan skala datanya, MDS dapat dibagi menjadi : MDS metrik jika skala datanya interval atau rasio MDS nonmetrik jika skala datanya nominal atau ordinal MATRIKS JARAK Berdasarkan rumus jarak Euclidean, diperoleh Matriks Jarak yang menyatakan jarak antara pasangan objek yang mungkin terjadi. ndn d11. d12... d1n = M M O M d. n1 d n2... d nn
JENIS MDS (PENSKALAAN DIMENSI GANDA) Penskalaan METRIK : jarak dianggap bertipe rasio. Jika d AB = 2 d BC, maka begitu juga pada jarak di peta (konfigurasi). Penskalaan NON-METRIK : jarak dianggap bertipe ordinal. Jika d AB > d BC, maka begitu juga pada jarak di peta. Asalkan urutannya benar, walaupun rasionya tidak sesuai maka masih diperbolehkan.
ANALISIS MULTIDIMENSIONAL SCALING Hitung matriks jarak D dengan menggunakan rumus jarak Euclidean MDS Metrik d 2 i. = 1 n d Hitung ; ; d = 2 2 2 1 2 ij d. j = d 2 1 n ij.. n j i ij Hitung matrik B dengan elemen-elemen ( 2 2 2 2 d ) i j d i. d. j d.. b = + i j 1 d 2 Cari nilai eigenvalue dan eigenvector det(b-λi) = 0 ; (B-λI)E = 0 Bentuk koordinat objek: F ~ ~ e = e e ' e 1 2 = EΛ i i i i d 2 ij a b
ANALISIS MULTIDIMENSIONAL SCALING Dˆ a b Hitung disparities ( ) yang merupakan jarak Euclidean dari koordinat terbentuk MDS Non-Metrik Hitung nilai stress S = n i j ( ) d ij dˆ ij n i j d 2 ij 2 Stress sesuai kriteria Tidak Ya Titik koordinat akhir
MDS METRIK Centering dengan: H = [ I (1/n) J ] dengan J = 1 1 SD : (-1/2) HDH = E Λ E T Dimana E matiks yang kolomnya corresponding eigenvectors (eigenvectors yang dinormalisasi) (Johnson, 2007) yang bersesuaian dengan eigenvalue λ dari (-1/2) HDH dan Λ adalah matrik diagonal dengan diagonal utamanya adalah λi Konfigurasi pada ruang dimensi 2 adalah : n H n X p = E Λ 1/2 = n E 2 Λ p Metric MDS is identical to principal components analysis
UKURAN KESESUAIAN Untuk MDS Metrik berdasarkan Inertia Persentase keragaman (inertia) yang digunakan sebagai ukuran kualitas pemetaan dihitung dengan cara: τ = ( 1'λ) 1 λ Semakin besar nilai inertia akan memberi indikasi bahwa semakin kecil error antara jarak dan nilai kemiripan dari ruang yang disajikan. Untuk MDS Metrik berdasarkan Stress Adalah suatu ukuran yang digunakan untuk menilai suatu konfigurasi dari objek sebagai titik-titik dalam dimensi q sudah baik atau belum. Dalam perhitungan komputer ALSCAL (Alternatif Least Square Scaling) stress adalah ukuran kesalahan (Lack of fit or error). Semakin kecil nilai stress akan memberi indikasi bahwa semakin kecil error antara jarak dan nilai kemiripan dari ruang yang disajikan.
Kebaikan Hasil MDS Stress 20 % 10 % - 20 % 5%- 10 % 2.5 % - 5 % < 2.5 % Kriteria Kurang Cukup Baik Sangat baik sempurna
Contoh kasus 1 : ANALISIS KEDEKATAN / KEMIRIPAN KOTA-KOTA BESAR DI INDONESIA BERDASARKAN KEADAAN GEOGRAFISNYA DENGAN METODE ANALISIS MULTIDIMENSIONAL SCALING (MDS)
LATAR BELAKANG : Indonesia adalah negara kepulauan, sehingga mempunyai keadaan geografis yang beraneka ragam antar daerah atau kota. Sulit melihat perbedaan dan kesamaan dari data mentah dengan variabel-variabel yang menyertainya.
TUJUAN : Untuk mengetahui posisi atau kedekatan antara kota-kota besar di Indonesia, dimana nantinya akan nampak bagaimana kemiripan kota-kota tersebut dilihat dari faktor-faktor geografisnya (kondisi alam).
SUMBER DATA : diperoleh dari buku terbitan BPS (Badan Pusat Statistik) berjudul Statistik Indonesia 2003 yang terbit pada tahun 2003. berisi i tentang t keadaan geografis kota-kota kt besar di Indonesia, semua data bersumber pada Badan Meteorologi dan Geofisika.
Data kondisi geografis : Kota Ketinggian Suhu Minimum Kecepatan Angin Kelembapan Udara Curah Hujan aceh 21 24,9 11,8 69,7 5,5 medan 25 25,8 98 9,8 70,3 80,3 padang 3 25,8 11,8 68,9 178,5 jambi 25 26,7,3 69,5 147,1 bengkulu 16 26,8 12,6 66,8 400,6 jakarta 2 25,3 15,3 77,3 404,5 bandung 740 27,1 18,5 73,6 168 semarang 3 25,3 14,2 73,8 301,5 yogyakarta 107 25,7 7,9 73,6 364,4 surabaya 3 28,4 17,6 69,7 216,8 denpasar 1 25,6 11,1 74,2 294,2 kupang 108 25,5 7,3 75,2 136,3 samarinda 230 20,3 5,2 76,3 145,8 manado 80 25,7 8,9 74,8 158 ambon 12 25,9 71 7,1 72,22 60,4 jayapura 99 27 11,8 74,6 115,8
1. MASUKAN DATA DENGAN OBYEK PENELITIAN SEBAGAI KOLOM DAN VARIABEL PENDUKUNG SEBAGAI BARIS
2. UNTUK ANALISIS MULTIDIMENSIONAL SCALING, PILIH MENU ANALYZE - SCALE MULTIDIMENSIONAL SCALING
3. MASUKKAN SEMUA OBYEK PENELITIAN KE KOTAK VARIABLES Hitung jarak Euclidean dari data
4. DARI GAMBAR 3 KLIK MODEL, KEMUDIAN CENTANG RATIO (KARENA DATANYA BERSKALA RASIO) KLIK CONTINUE
KLIK OPTION, KEMUDIAN PADA KOTAK DISPLAY CENTANG SEMUA PILIHAN KLIK CONTINUE Apabila semua pilihan pada kotak Display dicentang hasil output SPSS Apabila semua pilihan pada kotak Display dicentang, hasil output SPSS terpotong, maka disarankan dipilih satu-persatu.
SETELAH ITU KEMBALI DAN KLIK OKE.
ANALISIS DATA DAN PEMBAHASAN
PETA KONFIGURASI DUA DIMENSI : S-stress = 0.0004
ANALISIS BERDASARKAN KUADRAN Pada peta konfigurasi kota diatas dapat dilihat pola kedekatan antar kota sebagai berikut : Kelompok I : Jakarta, Bengkulu, Yogyakarta, Semarang, Denpasar, Surabaya. Kelompok II : Bandung. Kelompok III: Samarinda, Kupang, Jayapura. Kelompok IV : Padang, Manado, Jambi, Medan, Ambon, Aceh Pengelompokan kota-kota pada peta konfigurasi diatas Pengelompokan kota kota pada peta konfigurasi diatas didasarkan pada kelima variabel kondisi geografisnya.
BERDASARKAN JARAK (RELATIF) jika tanpa melihat kuadran, misal surabaya dan padang mempunyai jarak yang dekat pada peta konfigurasi, ini menujukkan adanya kemiripan / kedekatan antar keduanya.
CONTOH KASUS 2 Analisis Positioning & Segmentasi Pemirsa Televisi Swasta Nasional Berdasarkan Preferensinya Terhadap Program Acara Tujuan : untuk mengetahui kemiripan stasiun televisi swasta nasional berdasarkan program acaranya. Variabel pengamatan ada 11
VARIABEL PENGAMATAN D1 :Tayangan informasi informasi aktual termasuk news, dokumenter, dsb D2 :Tayangan olah raga, baik tayangan langsung maupun tidak langsung termasuk informasi tentang atlit dan olahraganya D3 :Tayangan tentang musik pop, rock, jazz, dsb juga informasi perkembangannya dan pemutaran lagu D4 :Tayangan musik dangdut serta informasi perkembangannya D5 :Tayangan berbagai gosip; penayangan sisi kehidupan selebritis dan rumornya D6 :Talk Show; acara acara diskusi / dialog yang menghadirkan tokoh/pakar yang membahas suatu topik D7 :Variety Show; berbagai macam hiburan yang disajikan sekaligus seperti bintang tamu, kuis interaksi dengan pemirsa dsb D8 :Tayangan film produksi negara Asia (Mandarin, India, Indonesia) D9 :Tayangan film barat; merupakan produksi luar negara negara Asia D10 :Tayangan berbagai macam sinetron dan telenovela D11 :Reality Show; biasanya bersifat sosial, misteri, maupun kehidupan sehari hari beserta ajang pencarian bakat
RATA - RATA ATRIBUT POSITIONING TIAP-TIAP STASIUN TELEVISI RCTI SCTV TPI ANTV D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 3,4 7 3,66 3,34 2,11 3,8 3,61 3,6 3,66 4,14 3,33 4,04 3,8 2 3,4 3,19 2,35 3,72 3,74 3,46 3,66 4 3,57 3,6 2,7 1 2,52 2,75 3,46 2,97 2,82 3,02 3,15 2,97 2,72 3,42 2,6 6 3,14 2,87 2,36 2,79 2,9 2,95 2,84 2,87 2,59 3,05 INDOSIA 3,2 R 8 2,71 3,4 2,68 3,71 3,45 3,69 3,8 4,05 3,52 3,7 TRANS GLOBAL METRO 3,4 8 2,84 3,46 2,44 3,83 3,82 4,01 3,74 4,15 3,13 3,61 2,6 9 2,75 4,35 2,45 2,92 2,91 3,09 2,96 3,5 2,68 2,94 4,0 4 2,91 2,82 1,98 2,59 3,56 2,91 2,73 2,95 2,27 2,69 2,8 TV7 6 3,44 2,74 2,09 3,1 2,84 2,99 3,06 3,34 2,8 2,87 LATIVI 2,5 5 2,6 2,56 2,08 2,79 2,75 2,72 2,91 3,06 2,56 2,84
OPERASIONAL DENGAN SPSS 13.0
METODOLOGI Analyze > Scale > Multidimensional scaling (ALSCAL) Analyze Multidimensional Scaling (ALSCAL) Scale
METODOLOGI Objek yang diamati Data belum berupa Data Jarak
METODOLOGI Skala data Yg digunakan Model Jarak Euclid
METODOLOGI Pilihan output t option
ANALISA PEMBAHASAN Stress Stress values For matrix Stress =.16502 RSQ =.90932 Di il i i i dlh0 16502 16 502% Dimana nilai stress ini adalah 0. 16502 atau 16.502% berdasarkan garis pedoman kriteria masuk ke dalam kategori cukup.
Perceptual Map
ANALISA PEMBAHASAN Dilihat dari plot secara keseluruhan terdapat tiga kelompok k stasiun televisi i yang memiliki kemiripan i antar anggotanya tetapi berbeda dengan anggota kelompok lainnya. Ketiga kelompok itu adalah: RCTI, SCTV, INDOSIAR dan TRANSTV TPI dan GLOBALTV METROTV, LATIVI, TV7 dan ANTV Pengelompokan ini i didasarkan pada program acara yang ditayangkan.
ANALISA PEMBAHASAN Kemiripan i antara stasiun televisi i juga dapat dilihat dari jarak (distance) antara dua stasiun televisi yang dibandingkan. Semakin KECIL jarak maka semakin MIRIP dua stasiun televisi yang dibandingkan. Dari semua pasangan stasiun televisi yang mungkin ada dalam plot, terdapat dua pasang stasiun televisi yang mempunyai jarak yang kecil. Pasangan tersebut adalah TPI-GlobalTV dan RCTI-SCTV Tetapi jika dilihat lebih jelas lagi, jarak antara RCTI- SCTV lebih kecil daripada d jarak TPI-GlobalTV, ltv ini i berarti, dari sekian banyak pasangan stasiun televisi yang dibandingkan, stasiun televisi SCTV paling mirip dengan stasiun televisi RCTI.
ANALISA PEMBAHASAN o Dari semua stasiun televisi yang diamati, RCTI dan SCTV merupakan dua stasiun televisi yang paling mirip jika dilihat dari jarak (distance) antar keduanya. o RCTI sebagai stasiun televisi swasta favorit memiliki beberapa kompetitor dalam hal program acara yang disenangi masyarakat yaitu Indosiar, SCTV dan TransTV. Namun dari ketiga kompetitor tersebut, SCTV merupakan kompetitor terberat RCTI karena program acaranya yang paling mirip dengan RCTI