PENGANTAR SPSS Saptawati Bardosono
Pendahuluan Pada saat merancang usulan penelitian, maka pengolahan datanya sudah harus direncanakan pula: ١) Teknik pengolahan data meliputi: editing, coding, entry dan cleaning serta analisis ٢) Tabel, grafik atau ringkasan angka2 yang akan dihasilkan Masalah yang sering timbul: Model analisis muncul setelah data terkumpul
Editing Dilakukan pemeriksaan seluruh kuesioner atau seluruh formulir isian setelah data terkumpul, apakah: ١) Dapat dibaca ٢) Semua pertanyaan terisi (lengkap) ٣) Terdapat ketidakserasian antara jawaban yang satu dengan yang lainnya (konsisten) ) ٤ Terdapat kesalahan2 lain yang dapat mengganggu pengolahan data selanjutnya (akurat)
Editing Kegiatan editing dapat dilakukan dengan cara: ١) Editing lapangan, dimana supervisor mengadakan pengecekan ulang terhadap beberapa pertanyaan penting biasanya kepada 10% responden segera setelah data terkumpul semuanya ) ٢ Editing menyeluruh, dilakukan secara menyeluruh terhadap jawaban responden, sehingga dapat diperoleh konsistensi jawaban
Editing Yang sering terjadi misalnya ١) Jawaban tidak tepat dikolom yang tersedia ٢) Salah menulis jawaban pertanyaan, misalnya data kelamin diisi di kolom jawaban umur ٣) Umur diisi 25 tahun tetapi di jumlah anak diisi 10 ٤) Salah menggunakan unit ukuran
Koding Memberi angka2 atau kode2 tertentu yang telah disepakati terhadap jawaban2 pertanyaan dalam kuesioner, sehingga memudahkan pada saat memasukkan data ke komputer Misalnya untuk variabel pendidikan: ١) Tidak sekolah ٢) SD ٣) SMP ٤) SMA ٥) PT
Koding Persyaratan dalam koding: ١) Kesesuaian, variabel harus sesuai dengan tujuan ٢) Klasifikasi, perlu dibuat kategorisasi untuk pengelompokkan jawaban sesuai rujukan/ alasan tertentu, misal: pendapatan ٣) Jawaban tidak mendua, pilihan jawaban yang tersedia harus jelas definisi operasionalnya ٤) Harus tersedia buku definisi variabel
Data Entry Menyiapkan lembar kerja yang berisi variabel2 dalam kuesioner secara lengkap (program SPSS, Stata, Epi-Info, dll) Masukkan data jawaban kuesioner sesuai kode yang telah ditentukan untuk masing-masing variable sehingga menjadi suatu data dasar Siapkan file khusus untuk menyimpan data dasar tersebut yang tidak boleh dianalisis. Untuk melakukan analisis data maka gunakan file khusus
Data Cleaning Merupakan analisis data awal, dimana dilakukan penggolongan, pengurutan dan penyederhanaan data, sehingga mudah dibaca dan diinterpretasi Untuk data nominal dan ordinal, dibuat tabulasi distribusi frekuensi untuk setiap variabel Untuk data interval/rasio, dianalisis nilai tengah dan tes normalitas datanya
Data Cleaning Tabel distribusi frekuensi untuk: ١) Deskripsi ciri-ciri atau karakteristik dari suatu variabel ٢) Mempelajari distribusi dari variabel pokok ) ٣ Memilih klasifikasi2 pokok untuk tabulasi silang
Data Cleaning Tabel silang, yaitu teknik untuk membandingkan atau melihat hubungan antara dua variabel atau lebih: ١) Dihitung persentase responden untuk setiap kelompok ٢) Variabel bebas pada baris (faktor risiko) ٣) Variabel terikat pada kolom (penyakit) Selanjutnya, data siap dianalisis untuk membuktikan hipotesis penelitian dengan analisis statistik bivariat dan multivariat
SPSS (statistical program for social sciences) Tampilan layar SPSS ada 2: Sebagai lembar kerja seperti Excel, dbase = data view Sebagai definisi operasional = variable view Dengan menu2 yang mudah dijalankan
Data view Variabel Variabel Variabel dst 1 2 dst
Variabel view Name Type Width Decimals Label Values dst 1 2 dst
Penggunaan SPSS Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan hipotesis Analisis statistik untuk penyajian data
Skala dan Sifat Data Sifat Nominal (seks) Ordinal (pendidikan) Interval (suhu) Rasio (BB) Klasifikasi + + + + Urutan susunan - + + + Jarak - - + + Titik nol absolut - - - +
Cara penyajian data: Data nominal/ordinal: distribusi frekuensi (proporsi) last education Valid SD SLTP SMU Akademi Perguruan Tinggi Total Cumulative Frequency Percent Valid Percent Percent 15 16.7 16.7 16.7 18 20.0 20.0 36.7 45 50.0 50.0 86.7 7 7.8 7.8 94.4 5 5.6 5.6 100.0 90 100.0 100.0
Cara penyajian data: Data interval/rasio: Distribusi normal: mean ± SD Distribusi tidak normal: median (min-maks)
Distribusi normal? 1. Signifikansi KS >0,05 2. Signifikansi SW >0,05 3. Nilai kerampingan dan kemiringan 4. Histogram dalam area kurva normal
Nilai kemiringan dan kerampingan Nilai kemiringan (skewness) dan nilai kerampingan (kurtosis) digunakan untuk menentukan distribusi normal/simetris dari data bergantung dari bentuk kurva distribusi data
Nilai kemiringan dan kerampingan Distribusi normal/ Miring (skew) ke Miring (skew) ke simetris kiri kanan
Nilai kemiringan dan kerampingan Contoh: Bila diketahui skewness -0,316 dan standard error skewness 0,254 maka rasio skewness = -0,316/0,254 = -1,244 Dengan kurtosis 0,284 dan standard error kurtosis 0,503 maka rasio kurtosis = 0,284/0,503 = 0,564 Sehingga rasio skewness dan kurtosis keduanya berada di antara interval angka -2 dan +2 atau distribusi data normal atau simetris
Histogram 12 Count 8 4 0 10.00 11.00 12.00 13.00 14.00 hemoglobin concentration after intervention
Histogram: Bentuk kurva simetris Mean = median = mode Kiri = kanan = 50%
Latihan Penggunaan SPSS 1. Menyiapkan sarana untuk data entry (penyusunan lembar kerja) 2. Membantu data cleaning (analisis awal) 3. Analisis statistik untuk membuktikan hipotesis 4. Analisis statistik untuk penyajian data
Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Data latihan: File open data pilih file - open Lihat data view: jumlah kasus Lihat variabel view: jumlah variabel Buat code book variable: utilities file info
Menyiapkan sarana untuk data entry: penyusunan lembar kerja Menyiapkan data dasar Data entry
Analisis data: data cleaning Uji normalitas data (KS, histogram) Analisis univariat (deskriptif, frekuensi, explore) Analisis bivariat (crosstab)
Analisis data: data cleaning Uji normalitas data: analyze pilih descriptive statistics pilih explore masukkan variabel rasio dalam dependent list pada pilihan display pilih plots klik plots pilih normality plots with test (non-aktifkan yang lainnya) pilih continue pilih OK. Perhatikan tampilan tabel test of normality dan grafik plot
Uji Kolmogorov-Smirnov (KS) dan Shapiro-Wilk (SW) Kolmogorov- Smirnov a Shapiro-Wilk Tests of Normality Statistic df Sig. Statistic df Sig. hemoglobin concentration after intervention.047 90.200*.987 90.508 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction
Analisis data: data cleaning Explore: Analyze pilih descriptive statistics pilih explore dalam dependent list masukkan variabel rasio pilih OK. Perhatikan outputs: descriptives
Descriptives hemoglobin concentration after intervention Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Statistic Std. Error 12.2244.10460 12.0166 12.4323 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 12.2494 12.2000.985.99233 9.38 14.50 5.12 1.4250 -.316.254.284.503
Analisis data: data cleaning Analisis bivariat (crosstab) Analyze pilih descriptive statistics pilih crosstab pada row masukkan data kategorik variabel bebas pada coulumn(s) masukkan data kategorik variabel terikat pada display aktifkan clustered bar chart dan supressed tablespilih OK. Perhatikan outputnya
Analisis data: data cleaning Analisis bivariat (crosstab) 40 30 20 10 working status Bekerja Count 0 SD SLTP SMU Akademi Perguruan Tinggi Tidak Bekerja/Ibu Ru mah Tangga last education
Analisis data: untuk membuktikan hipotesis Analisis bivariat crosstab, korelasi, uji T dua sampel bebas dan berpasangan) Analisis multivariat (ANOVA)
Analisis data: untuk membuktikan hipotesis Analisis bivariat crosstab: Analyze pilih crosstab pada row masukkan variabel bebas pada coulumn(s) masukkan variabel terikat pilih statistics aktifkan chi-square dan contengency coefficient klik continue OK. Perhatikan hasilnya.
research location * working status Crosstabulation Count research location Total Lembang Jakarta working status Tidak Bekerja/Ibu Rumah Bekerja Tangga Total 3 42 45 26 19 45 29 61 90 Chi-Square Tests Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 26.914 b 1.000 24.624 1.000 29.802 1.000 26.614 1.000 90 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided).000.000 b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.50.
Analisis data: untuk membuktikan hipotesis Korelasi: Analyze pilih correlate pilih bivariate masukkan dua variabel numerik pilih Pearson pilih two tailed aktifkan flag significant correlation pilih option aktifkan exclude case pairwise OK. Perhatikan hasilnya
Analisis data: untuk membuktikan hipotesis Korelasi: Analyze pilih correlate pilih bivariate masukkan dua variabel numerik pilih Spearman pilih two tailed aktifkan flag significant correlation pilih option aktifkan exclude case pairwise OK. Perhatikan hasilnya
Correlations weight after intervention height weight after intervention Pearson Correlation 1.457** Sig. (2-tailed)..000 N 90 90 height Pearson Correlation.457** 1 Sig. (2-tailed).000. N 90 90 **. Correlation is significant at the 0.01 level (2-tailed). Correlations Spearman's rho weight after intervention height Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). weight after intervention height 1.000.402**..000 90 90.402** 1.000.000. 90 90
Analisis data: untuk membuktikan hipotesis Uji T dua sampel bebas: Analyze pilih compare means pilih independent samples t-test pada test variable(s) pilih variabel numerik pada grouping variable masukkan variabel 2 kategorik pada define group masukkan 1 untuk group 1 dan 2 untuk group 2 pilih continue pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis pilih continue dan OK. Perhatikan hasilnya
hemoglobin concentration after intervention working status Bekerja Tidak Bekerja/Ibu Rumah Tangga Group Statistics Std. Error N Mean Std. Deviation Mean 29 11.8855.90385.16784 61 12.3856.99876.12788 Levene's Test for Equality of Variances t-test for Equality of Means Independent Samples Test F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference hemoglobin concentration after intervention Equal variances assumed.557.457 Equal variances not assumed -2.287-2.370 88 60.439.025.021 -.5001 -.5001.21869.21100 95% Confidence Interval of the Difference Lower Upper -.93466 -.92207 -.06545 -.07805
Ranks hemoglobin concentration after intervention working status Bekerja Tidak Bekerja/Ibu Rumah Tangga Total N Mean Rank Sum of Ranks 29 36.48 1058.00 61 49.79 3037.00 90 Mann-Whitney U Wilcoxon W Z Test Statistics a Asymp. Sig. (2-tailed) hemoglobin concentration after intervention 623.000 1058.000-2.259.024 a. Grouping Variable: working status
Analisis data: untuk membuktikan hipotesis Uji T dua sampel berpasangan): Analyze pilih compare means pilih paired samples t-test pada paired variable(s) masukkan variabel numerik sebelum intervensi dan variabel numerik sesudah intervensi - pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis pilih continue dan OK. Perhatikan hasilnya
Paired Samples Statistics Pair 1 hemoglobin concentration before intervention hemoglobin concentration after intervention Mean N Std. Deviation Std. Error Mean 12.5712 90 1.08891.11478 12.2244 90.99233.10460 Paired Samples Test Pair 1 Paired Differences Mean Std. Deviation Std. Error Mean hemoglobin concentration before intervention - hemoglobin concentration after intervention.3468.72686.07662 t df Sig. (2-tailed) 95% Confidence Interval of the Difference Lower Upper.1945.4990 4.526 89.000
hemoglobin concentration after intervention - hemoglobin concentration before intervention Negative Ranks Positive Ranks Ties Total Ranks N Mean Rank Sum of Ranks 65 a 46.27 3007.50 23 b 39.50 908.50 a. hemoglobin concentration after intervention < hemoglobin concentration before intervention Test Statistics b b. hemoglobin concentration after intervention > hemoglobin concentration before intervention c. hemoglobin concentration after intervention = hemoglobin concentration before intervention Z Asymp. Sig. (2-tailed) a. Based on positive ranks. 2 c 90 hemoglobin concentration after intervention - hemoglobin concentration before intervention -4.371 a b. Wilcoxon Signed Ranks Test.000
Analisis data: untuk membuktikan hipotesis Analisis multivariat (ANOVA): Analyze pilih compare means pilih one-way anova pada dependent list pilih variabel numerik pada factor pilih variabel lebih 2 kategorik pada option aktifkan descriptive dan homogeneity of variance pilih continue pada post-hoc pilih bonferroni pilih continue dan OK. Perhatikan hasilnya
hemoglobin concentration after intervention N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound Descriptives SD SLTP SMU Akademi Perguruan Tinggi Total 15 18 45 7 5 90 12.0080 12.8278 12.0773 11.9571 12.4000 12.2244 1.17833.97426.94923.73905.25495.99233.30424.22964.14150.27933.11402.10460 11.3555 12.3433 11.7922 11.2736 12.0834 12.0166 12.6605 13.3123 12.3625 12.6406 12.7166 12.4323 9.65 11.10 9.38 11.00 12.20 9.38 13.70 14.50 13.70 13.40 12.80 14.50 ANOVA hemoglobin concentration after intervention Sum of Squares df Mean Square F Sig. Between Groups 8.883 4 2.221 2.397.057 Within Groups 78.757 85.927 Total 87.640 89
Multiple Comparisons Dependent Variable: hemoglobin concentration after intervention LSD (I) last education SD SLTP SMU Akademi Perguruan Tinggi (J) last education SLTP SMU Akademi Perguruan Tinggi SD SMU Akademi Perguruan Tinggi SD SLTP Akademi Perguruan Tinggi SD SLTP SMU Perguruan Tinggi SD SLTP SMU Akademi *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -.8198*.33652.017-1.4889 -.1507 -.0693.28698.810 -.6399.5013.0509.44061.908 -.8252.9269 -.3920.49707.433-1.3803.5963.8198*.33652.017.1507 1.4889.7504*.26845.006.2167 1.2842.8706*.42877.045.0181 1.7231.4278.48661.382 -.5397 1.3953.0693.28698.810 -.5013.6399 -.7504*.26845.006-1.2842 -.2167.1202.39109.759 -.6574.8978 -.3227.45376.479-1.2249.5795 -.0509.44061.908 -.9269.8252 -.8706*.42877.045-1.7231 -.0181 -.1202.39109.759 -.8978.6574 -.4429.56363.434-1.5635.6778.3920.49707.433 -.5963 1.3803 -.4278.48661.382-1.3953.5397.3227.45376.479 -.5795 1.2249.4429.56363.434 -.6778 1.5635
Ranks hemoglobin concentration after intervention last education SD SLTP SMU Akademi Perguruan Tinggi Total N Mean Rank 15 41.70 18 59.78 45 41.93 7 35.50 5 51.60 90 Test Statistics a,b Chi-Square df Asymp. Sig. hemoglobin concentration after intervention 7.841 4.098 a. Kruskal Wallis Test b. Grouping Variable: last education
Analisis data: untuk penyajian data Hasil analisis statistik Diagram batang (bar) Histogram Boxplot Scatterplot Pie chart dll
Count 60 Bars show counts 40 20 0 Bekerja working status Tidak Bekerja/Ibu Rumah Tangga
12 Count 8 4 0 10.00 11.00 12.00 13.00 14.00 hemoglobin concentration after intervention
hemoglobin concentration after intervention 14.00 13.00 12.00 11.00 10.00
Linear Regression 40.00 50.00 60.00 70.00 80.00 90.00 weight after intervention 150.00 160.00 170.00 height height = 141.89 + 0.23 * w eight_2 R-Square = 0.21
7.78% 5.56% 16.67% last education SD SLTP SMU Akademi Perguruan Tinggi Pies show percents 20.00% 50.00%