2. Pengertian data outlier Data outlier yaitu data dengan kombinasi unik dari karakteristik yang dapat diidentifikasi sebagai sesuatu yang berbeda

dokumen-dokumen yang mirip
TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

BAB 2 LANDASAN TEORI

Probability and Random Process

BAB III METODOLOGI PENELITIAN

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB III DESAIN PENELITIAN. manufaktur yang terdaftar di Bursa Efek Indonesia. Dalam penelitian ini, peneliti

BAB III METODE PENELITIAN. September). Data yang dikumpulkan berupa data jasa pelayanan pelabuhan, yaitu

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB 2 LANDASAN TEORI

BAB III METODE PENELITIAN. menggunakan sistem informasi akuntansi terkomputerisasi.

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

BAB II METODE ANALISIS DATA. memerlukan lebih dari satu variabel dalam membentuk suatu model regresi.

BAB III OBJEK DAN DESAIN PENELITIAN

BAB IV HASIL DAN PEMBAHASAN. metode pengambilan sampel yang digunakan adalah non-probability sampling dan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. pertama digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

BAB 3 METODA PENELITIAN. industri penghasil bahan baku sektor pertambangan yang terdaftar di

BAB III CONTOH KASUS. Pada bab ini akan dibahas penerapan metode robust dengan penaksir M

BAB III METODE PENELITIAN. Jenis penelitian ini adalah explanatory research. Menurut. Singarimbun&Efendi (1995) explanatory research adalah penelitian

ANALISIS MULTIVARIAT BAB II

BAB IV PEMBAHASAN HASIL PENELITIAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB 2 LANDASAN TEORI. bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel

BAB 2 LANDASAN TEORI. 1. Analisis Korelasi adalah metode statstika yang digunakan untuk menentukan

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA

PENERAPAN ANALISIS FAKTOR DAN ANALISIS DISKRIMINAN UNTUK MENENTUKAN KUALITAS PRODUK SUSU BALITA DENGAN GRAFIK KENDALI Z-MR

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

Metode Minimum Covariance Determinan Pada Analisis Regresi Linier Berganda Dengan Kasus Pencilan

MULTIPLE REGRESI. Dwi Martani. 1/26/2010 Statistik untuk Bisnis 8 1

BAB III METODOLOGI PENELITIAN. Data kuantitatif adalah data yang diukur dalam suatu skala numerik atau

BAB 3 METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

JMP : Volume 6 Nomor 1, Juni 2014, hal REGRESI LINEAR BIVARIAT SIMPEL DAN APLIKASINYA PADA DATA CUACA DI CILACAP

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODE PENELITIAN. penelitian ini adalah metode kuantitatif. Metode ini disebut metode kuantitatif

BAB 2 TINJAUAN TEORITIS. Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir Francis Galton.

BAB III METODE PENELITIAN

Regresi Linier Sederhana dan Korelasi. Pertemuan ke 4

BAB III PENGENDALIAN KUALITAS MULTIVARIAT. menghasilkan produk dengan kualitas yang baik, haruslah dilakukan pengendalian

BAB III METODE PENELITIAN. BRI Syariah, dan Syariah Mandiri) di Indonesia periode

BAB III METODOLOGI PENELITIAN

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

BAB III METODE PENELITIAN. Penelitian ini dilakukan melalui 3 tahap, yaitu: Tahap Pendahuluan,

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

Korelasi Pearson. Pendahuluan

BAB III METODE PENELITIAN. Berdasarkan tujuannya penelitian ini termasuk applied research atau

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. yang dikumpulkan dan dinyatakan dalam bentuk angka-angka. Kemudian data

METODE PENELITIAN. Jenis penelitian ini adalah jenis penelitian explanatory research. Jenis penelitian

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini

BAB III METODE PENELITIAN. sebagai metode ilmiah atau scientific karena telah memenuhi kaidah - kaidah

BAB 2 LANDASAN TEORI

Analisis Multivariat

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODE PENELITIAN. analisis tersebut untuk memperoleh kesimpulan. 68 Jenis penelitian kuantitatif

BAB IV ANALISIS DAN PEMBAHASAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB I PENDAHULUAN Latar Belakang Masalah

BAB III METODE PENELITIAN. Penelitian ini dilakukan di Kota Palembang. Penelitian ini dilakukan untuk

UJI ASUMSI KLASIK (Uji Normalitas)

BAB III METODE PENELITIAN. tanggal 31 Desember 2008, 2009, 2010, 2011 dan Sumber data dapat

BAB III METODE PENELITIAN. (time series data). Dalam penelitiaan ini digunakan data perkembangan pertumbuhan ekonomi,

BAB III METODOLOGI PENELITIAN

Standar Audit SA 530. Sampling Audit

BAB III METODE PENELITIAN. dilakukan dengan menggunakan metode tertentu. Menurut Sugiyono (2009:3),

BAB V ANALISIS DATA DAN PEMBAHASAN. penelitian yang dilakukan terhadap 50 orang karyawan pada perusahaan Filter PT.

BAB III METODE PENELITIAN

DAFTAR ISI. KATA PENGANTAR... ii. DAFTAR ISI... iv. DAFTAR GAMBAR... vii. DAFTAR TABEL... viii BAB I PENDAHULUAN Latar Belakang...

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB II DASAR TEORI. Gambar 2.1 : Perbedaan Antara Proses Stationer dan Proses Non-Stationer

BAB III METODE PENELITIAN. dengan Juli Adapun data penelitian diperoleh dengan melakukan

BAB III METODE PENELITIAN. Populasi penelitian ini terdiri atas perusahaan automotif yang terdaftar di Bursa Efek

BAB 2 LANDASAN TEORI

BAB III METODE PENELITIAN

BAB IV ANALISIS HASIL

III. METODE PENELITIAN. Penelitian ini adalah jenis penelitian deskriptif dimana suatu penelitian yang

BAB I PENDAHULUAN. 1.1 Latar Belakang

hasil yang konsisten. Reliabilitas instrumen dalam hal ini diuji dengan menggunakan

III. METODOLOGI PENELITIAN

BAB III KAJIAN SIMULASI

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. Bab ini bertujuan untuk memberikan suatu dasar yang valid dan reliabel untuk

BAB III METODE PENELITIAN. obyek penelitian adalah para pengguna software akuntansi pada perusahaanperusahaan

BAB III METODELOGI PENELITIAN. Pencarian data dilakukan melalui riset perpustakaan (library research)

BAB 3 METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB ΙΙ LANDASAN TEORI

BAB III METODE PENELITIAN. Dalam penelitian ini, penulis akan melaksanakan langkah-langkah sebagai

BAB IV HASIL DAN PEMBAHASAN

Transkripsi:

2. Pengertian data outlier Data outlier yaitu data dengan kombinasi unik dari karakteristik yang dapat diidentifikasi sebagai sesuatu yang berbeda dari observasi yang lainnya. Yang dimaksud dengan karakteristik yang unik yaitu nilai yang terlalu rendah atau tinggi dari suatu variabel atau sekumpulan variabel yang membuat observasi berbeda dari yang lainnya. Untuk menaksir akibat dari adanya data outlier maka harus mempertimbangkan beberapa pertimbangan yang praktis dan substansif. 2.1 Pengaruh adanya data outlier Data outlier memiliki beberapa dampak sebagai berikut : Dari sudut pandang peneliti, data outlier memiliki efek tetap tertentu untuk segala analisis empiris. Sebagai contoh, yaitu misalkan kita mengambil sampel sebanyak 20 individu untuk menentukan pendapatan rata-rata rumah tangga. Pada sampel yang dimiliki, kita memperoleh respon dengan kisaran pendapatan antara $20.000 dan $100.000, sehingga rata-rata pendapatan menjadi $45.000. Tetapi bayangkan bila orang ke-21 memiliki pendapatan $1 juta. Jika kita memasukkan nilai ini ke dalam analisis, rata-rata pendapatan meningkat menjadi lebih dari $90.000. Pada permasalahan ini terdapat data outlier, tetapi mana yang lebih baik untuk mengestimasi rata-rata pendapatan rumah tangga: $45.000 atau $90.000? Peneliti harus mengerti apakah nilai outlier harus dipertahankan atau harus dihilangkan berdasarkan hasilnya. Secara substantif, data outlier harus dilihat seberapa representatif data tersebut terhadap populasi. Dengan menggunakan contoh pengeluaran rumah tangga sebelumnya, seberapa representatif segmen untuk orang-orang kaya adalah milyuner. Jika peneliti merasa bahwa nilai representatif masih terlalu kecil, tetapi segmen di dalam populasi tersebut masih dapat diseimbangkan maka nilai ini patut untuk dipertahankan. Tetapi, jika milyuner ini hanya sebanyak satu orang di keseluruhan populasi dan nilainya merupakan nilai yang terlalu ekstrim maka boleh untuk dibuang.

Data outlier tidak dapat dikategorikan menjadi data yang bermasalah, tetapi harus dilihat secara kontekstual dalam analisis dan harus dievaluasi jenis informasi apa saja yang tersedia. Ketika diuntungkan, data outlier, walaupun berbeda dari mayoritas sampel, mungkin menjadi indikasi karakteristik populasi tersebut tidak dapat dianalisis secara normal. Kebalikannya, masalah outlier tidak representatif terhadap populasi, dan menjadi perhitungan yang tidak obyektif, dan dapat mengacaukan uji statistika dengan serius. Peneliti harus memeriksa adanya data outlier dan menyelidiki pengaruh mereka. Data outlier harus dapat ditempatkan untuk menaksir pengaruh dari observasi individu dan menentukan apakah pengaruh ini membantu atau tidak. Mengapa data outlier dapat terjadi? Data outlier dapat dikategorikan menjadi empat kelas berdasarkan sumber keunikannya yaitu : Kelas pertama terjadi dari procedural error, seperti entri data yang error atau kesalahan dalam pengkodingan. Data outlier ini harus diidentifikasi pada saat proses pembersihan data, tetapi jika terabaikan mereka harus dieliminasi atau diidentifikasi sebagai missing values. Kelas yang kedua terdiri dari observasi yang terjadi pada hasil extraordinary event yang terdapat keunikan dalam observasi. Sebagai contoh, asumsikan kita mencatat rata-rata curah hujan harian pada saat badai datang beberapa hari dan merekam level rata-rata curah hujan yang tinggi. Level rata-rata curah hujan tersebut tidak dapat dibandingkan dengan rata-rata curah hujan pada saat cuaca normal. Jika dimasukkan, mereka akan mengubah pola dari hasil. Peneliti harus memutuskan apakah kejadian tidak biasa tersebut merupakan tujuan peneliti. Jika iya, maka layak untuk dipertahankan tetapi jika tidak seharusnya dibuang. Kelas ketiga dari data outlier dengan extraordinary observations adalah peneliti tidak memiliki penjelasan. Kejadian unik dan tepat bergabung menjadi satu. Walaupun data outlier ini dapat dihilangkan, mereka dapat dipertahankan jika peneliti merasa kehadiran mereka valid terhadap populasi. Kemungkinan mereka merepresentasikan gabungan elemen, atau elemen yang belum digunakan sebelumnya

tidak teridentifikasi. Di sini, peneliti harus menentukan untuk mempertahankan atau menghapus data. 2.2 Langkah-langkah mendeteksi data outlier Untuk mendeteksi adanya data outlier atau tidak dapat diidentifikasi dari perspektif univariat, bivariat atau multivariate berdasarkan pertimbangan banyak variable atau karakteristik. Peneliti sebaiknya menggunakan perspektif tersebut untuk mencari pola yang konsisten untuk mengidentifikasi data outlier. Univariate Detection Identifikasi univariat untuk mengidentifikasi distribusi dari masingmasing variable pada analisis dan memilih data outlier yang memiliki range tinggi atau rendah dari distribusi tersebut. Masalah utama yaitu membuat ambang batas untuk data outlier tersebut. Pendekatan pertama mengkonversikan data ke nilai yang standar, dengan nilai rata-rata 0 dan deviasi standar 1. Karena nilai ini dibuat dalam format standar, perbandingan dari variable dapat dibuat dengan mudah. Pada beberapa kasus, peneliti harus mengenali banyak observasi secara pasti yang dapat terjadi secara normal di luar nilai ambang batas tersebut. Bivariate Detection Pada bivariate detection, pasangan dari variable dapat dijadikan satu pada diagram pencar. Kasus yang terjadi di luar range dari observasi akan diletakkan pada poin yang terisolasi dari diagram pencar. Untuk menentukan range yang diharapkan dari penelitian ini adalah gambaran dua dimensi, sebuah elips yang mempresentasikan tingkat kepercayaan distribusi bivariat normal (biasanya level 90% atau 95%) terdapat di atas pada diagram pencar. Elips menyediakan gambaran yang grafikal pada batas kepercayaan dan memfasilitasi identifikasi data outlier. Varian dari diagram pencar menunjukkan pengaruh dari plot, dengan masing-masing poin bervariasi pada ukuran. Masing-masing metode menyediakan keunikan tersendiri untuk masing-masing observasi dalam hubungan dengan observasi lainnya berdasarkan spesifikasi dari pasangan variabel. Kekurangan pada

metode bivariat yaitu banyak diagram pencar disebabkan oleh banyak variabel yang meningkat. Untuk tiga variabel, hanya tiga grafik untuk seluruh perbandingan pasangan. Tetapi untuk lima variabel, membutuhkan 10 grafik, dan untuk 10 variabel membutuhkan 45 diagram pencar. Akibatnya, peneliti harus membatasi penggunaan metode bivariat untuk menspesifikasikan hubungan antara variabel, seperti hubungan antara variabel dependen dan independen pada analisis regresi. Peneliti kemudian meneliti diagram pencar tersebut untuk mengidentifikasi pola untuk satu atau lebih observasi yang akan menghasilkan desain data yang outlier. Multivariate Detection Karena analisis multivariate melibatkan lebih dari dua variabel, metode bivariat menjadi tidak cocok karena beberapa alas an. Pertama, mereka membutuhkan banyak grafik, seperti yang telah dijelaskan sebelumnya, ketika banyak variabel mencapai ukuran yang cukup. Kedua, mereka dibatasi pada dua dimensi (variabel). Walaupun demikian, ketika lebih dari dua variabel dipertimbangkan, peneliti membutuhkan rata-rata untuk mengukur posisi multidimensional untuk masing-masing observasi yang relative terhadap beberapa poin. Kejadian ini disebut dengan ukuran D 2 Mahalanobis, taksiran multivariate untuk masing-masing observasi pada setiap data set variabel. Metode ini untuk mengukur jarak dari masing-masing observasi pada ruang multidimensional dari tengah rata-rata untuk semua observasi, menyediakan nilai sendiri untuk masing-masing observasi tidak peduli berapa banyak variabel yang dipertimbangkan. Semakin tinggi nilai D 2 mempresentasikan observasi yang semakin jauh dibuang dari distribusi general dari observasi pada ruang multidimensional. Metode ini juga memiliki kekurangan yaitu hanya menyediakan taksiran secara keseluruhan. Outlier Designation Dengan menggunakan metode univariat, bilvariat, multivariate, peneliti memiliki perspektif yang komplit untuk meneliti status

observasi apakah outlier atau bukan. Masing-masing dari metode dapat menyediakan perspektif yang unik pada observasi dan digunakan untuk mengidentifikasi outlier. Ketika observasi dapat diidentifikasi dengan metode univariat, bivariat, dan multivariate sebagai data outlier yang mungkin, peneliti harus memilih observasi yang mendemonstrasikan keunikan yang nyata pada perbandingan dengan menyisakan populasi berlawanan dengan perspektif. Peneliti harus mengulang dari mendesain terlalu banyak observasi sebagai outlierdan tidak bias untuk mengeliminasi kasus tersebut karena mereka berbeda. Outlier description and profiling Ketika data outlier yang potensial teridentifikasi, peneliti sebaiknya membangkitkan profil dari masing masing observasi yang outlier dan mengidentifikasi tanggung jawab variabel mengapa menjadi outlier. Peneliti harus menggunakan tekhnik multivariate seperti analisis diskriminan atau regresi berganda untuk mengidentifikasikan perbedaan antara data outlier dan observasi lainnya. Jika memungkinkan peneliti sebaiknya menyertakan data outlier pada satu kelas hingga empat kelas yang tekah dijelaskan sebelumnya untuk membantu pada keputusan penyimpanan atau pembuangan data yang akan diambil. Peneliti sebaiknya melanjutkan analisis hingga terbentuk aspek yang membedakan outlier dari beberapa observasi. Retention or deletion of the outlier Setelah data outlier diidentifikasi, dikarakteristikkan, dan dikategorikan, peneliti harus menentukan apakah data tetap dipertahankan ataukan dibuang. Beberapa filosofer diantara peneliti menyediakan petunjun untuk memperlakukan data outlier. Data ini harus dipertahankan ada bukti yang menyatakan data tersebut benarbenar tidak representatif terhadap populasi. Ketika data outlier dibuang, peneliti harus memperhitungkan resiko dengan analisis multivariate tetapi membatasi secara umum. 2.3 Cara mengatasi data outlier

Setelah data outlier diidentifikasi, dikarakteristikkan, dan dikategorikan, peneliti harus menentukan apakah data tetap dipertahankan ataukan dibuang. Beberapa filosofer diantara peneliti menyediakan petunjun untuk memperlakukan data outlier. Data ini harus dipertahankan ada bukti yang menyatakan data tersebut benar-benar tidak representatif terhadap populasi. Ketika data outlier dibuang, peneliti harus memperhitungkan resiko dengan analisis multivariate tetapi membatasi secara umum. 2.4 Contoh soal Sebagai contoh pengamatan dari basis data HBAT akan diperiksa adanya kasus outlier atau tidak. Variabel yang dipertimbangkan dalam analisis adalah matriks X 6 melalui X 19 dengan konteks pemeriksaan ini, menggunakan analisis regresi di mana X I9 adalah variabel dependen dan X 6 melalui X I8 adalah variabel independen. Analisis outlier termasuk analisis univariat, bivariat, dan diagnosa multivariat. Ketika data yang menunjukan outlier ditemukan, maka data tersebut diperiksa, dan keputusan tentang penyimpanan atau penghapusan dibuat. Outlier Detection Langkah pertama adalah pemeriksaan semua variabel dari perspektif univariat. Metode bivariat kemudian akan digunakan untuk menguji hubungan antara variabel dependen (XI9) dan masing-masing variabel independen. Dari masing-masing diagram pencar, pengamatan di luar distribusi dapat diidentifikasi dan dampaknya terhadap hubungan itu dipastikan sebagai data outlier. Akhirnya, penilaian multivariat akan dilakukan pada semua variabel independen secara kolektif. Perbandingan dari pengamatan di tiga metode diharapkan akan memberikan dasar bagi keputusan penghapusan / penyimpanan. Univariate Detection Langkah pertama adalah memeriksa pengamatan pada masing-masing variabel individual. Tabel 10 berisi pengamatan dengan nilai-nilai variabel standar melebihi ± 2,5 pada masing-masing variabel (X6 ke XI9). Dari perspektif univariat ini, hanya pengamatan 7, 22, dan 90 melebihi ambang batas pada lebih dari satu variabel. Selain itu, tak satu pun dari pengamatan ini memiliki nilai sangat ekstrim untuk mempengaruhi tindakan

keseluruhan variabel, seperti penyimpangan. Harus dicatat bahwa variabel dependen memiliki satu pengamatan terpencil (22), yang dapat mempengaruhi diagram pencar bivariat karena variabel dependen muncul di setiap sebaran. Tiga pengamatan akan dicatat untuk melihat apakah mereka muncul dalam berikutnya bivariat dan penilaian multivariat. Tabel 2.1 Hasil Deteksi Outliers Bivariat Detection. Untuk perspektif bivariat, 13 diagram pencar dibentuk untuk masingmasing variabel independen ( X6 melalui X18 ) dengan variabel dependen ( X19 ). Elips merepresentasikan tingkat kepercayaan 95 % dari distribusi normal bivariat kemudian ditampilkan pada diagram pencar. Gambar 2.1 berisi contoh-contoh dari dua diagram pencar tersebut yang melibatkan X6 dan X7. Seperti yang bisa dilihat pada sebaran untuk X6 dengan X19, dua data outlier jatuh di luar elips dan tidak memiliki nilai-nilai ekstrim di kedua variabel. Hasil ini berbeda dengan sebaran dari X7 dengan X19, di mana pengamatan 22 berbeda dari pengamatan lain dan menunjukkan nilai-nilai tertinggi baik di X7 dan X19. Yang kedua dari Tabel 2.1 yang berisi kompilasi data yang masih jatuh diluar elips ini untuk setiap variabel. Karena menggunakan tingkat kepercayaan 95 %, yang diharapkan beberapa pengamatan biasanya jatuh di luar elips. Hanya

empat pengamatan ( 2, 22, 24, dan 90 ) berada di luar elips lebih dari dua kali. Pengamatan 22 berada di luar 12 dari 13 diagram pencar, karena data ini adalah data outlier pada variabel dependen. Hanya pengamatan 90 yang tercatat dalam deteksi univariat. Multivariate Detection. Metode diagnostik terakhir adalah untuk menilai data outlier dari metode multivariat dengan menggunakan pengukuran D 2 Mahalanobis (lihat Tabel 10). Analisis ini mengevaluasi posisi dari masing-masing observasi dibandingkan dengan pusat dari setiap pengamatan pada satu set variabel yang ada. Dalam hal ini, semua varibel independen digunakan. Perhitungan dari D 2 /df nilai (df = 13) memungkinkan identifikasi dari outlier melalui pendekatan uji statistik. Karena sampelnya hanya terdiri 100 pengamatan, nilai ambang 2,5 akan lebih baik digunakan daripada nilai 3,5 atau 4,0. dengan ini nilai ambang sebesar 2,5 maka dua pengamatan (98 dan 36) diidentifikasi sebagai pengamatan yang berbeda secara signifikan. Hasil ini menunjukkan bahwa dua pengamatan tersebut tidak unik pada setiap variabel tunggal tetapi unik secara kombinasi. Gambar 2.1 Diagram Pencar Detection Outliers Retention or Deletion of The Outliers Sebagai hasil dari pengujian diagnostik, tidak ada pengamatan yang meunjukkan bahwa karateristik dari data outliers harus dihapuskan. Setiap variabel memiliki beberapa pengamatan yang bernilai ekstrim, dan dari pengamatan tersebut data outliers harus dipertimbangkan untuk tetap digunakan dalam sebuah analisis. Tidak ada pengamatan

yang bernilai ekstrim bila jumlah variabel yang dipertimbangkan cukup memadai dan dapat mewakili populasinya. Peneliti harus selalu memeriksa hasil dari setiap pengujian multivariat untuk mengidentifikasi observasi yang mungkin bisa menjadi data outlier dalam aplikasi tertentu.