BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

RANCANG BANGUN SISTEM PENGELOMPOKAN PELANGGAN POTENSIAL MENGGUNAKAN METODE K-MEANS UNTUK PROMOSI PAKET WISATA (STUDI KASUS PT. BALI SINAR MENTARI)

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

BAB II LANDASAN TEORI

BAB III LANDASAN TEORI. berkaitan secara terpadu, terintegrasi dalam suatu hubungan hirarki.

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI. Kotler (1999) adalah serangkaian organisasi yang saling tergantung dan terlibat

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

BAB 2 LANDASAN TEORI

Sistem Penunjang Keputusan, Pertemuan Ke-3

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

BAB 3 ANALISA SISTEM

BAB II LANDASAN TEORI 2.1. Sistem Pendukung keputusan Pengertian keputusan Keputusan adalah suatu reaksi terhadap beberapa solusi alternative

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA

TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel )

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

SISTEM INFORMASI MANUFAKTUR SESI - 1

BAB 2 LANDASAN TEORI

ANALISIS CLUSTER PADA DOKUMEN TEKS

Pengenalan Pola. K-Means Clustering

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

SISTEM PEMBAGIAN KELOMPOK BIMBINGAN BELAJAR DENGAN METODE K-MEANS CLUSTERING

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Student Clustering Based on Academic Using K-Means Algoritms

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB 2 TINJAUAN PUSTAKA

Outline. Definisi SPK Tujuan SPK Fitur SPK Karakteristik dan Kemampuan SPK Komponen SPK

3.1 Metode Pengumpulan Data

BAB II LANDASAN TEORI. Sistem merupakan suatu kesatuan yang terdiri dari komponen-komponen

Decision Support System (DSS)

PERTEMUAN 14 DATA WAREHOUSE

3. METODE PENELITIAN 3.1 Kerangka Pemikiran

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

DECISION SUPPORT SYSTEMS COMPONENTS

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

SISTEM PENDUKUNG KEPUTUSAN

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA

MANAJEMEN INFORMASI. Manajer mengelola lima sumber daya utama yang ada di perusahaan : 1. Man (Manusia) 2. Material

Konsep Dasar Sistem Pendukung Keputusan (SPK)

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

BAB 2 LANDASAN TEORI

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

I R A P R A S E T Y A N I N G R U M

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

PEMROGRAMAN TERSTRUKTUR

Sistem Pendukung Keputusan. Oleh: Ade Sarah H., M.Kom

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

MANAGEMENT SUPPORT SYSTEM (MSS) FT. UMS

BAB 3 LANDASAN TEORI

BAB II LANDASAN TEORI

ANALISIS CLUSTER PADA DOKUMEN TEKS

PENDAHULUAN. 1.1 Latar Belakang

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB III METODOLOGI PENELITIAN

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

DATA MINING DAN WAREHOUSE A N D R I

BAB I PENDAHULUAN A. Latar Belakang

BAB I. : Kundang K.Juman, Ir.MMSI : Agar Mahasiswa memahami konsep dasar sistem informasi

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

Sistem Pendukung Keputusan (SPK)

dengan Algoritma K Means

BAB II LANDASAN TEORI

Sistem Pendukung Keputusan. Lecture s Structure. Pengambilan Keputusan

BAB II LANDASAN TEORI

Gambar 5.1 Form Master Pegawai

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

SISTEM PENDUKUNG KEPUTUSAN

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means

PRISMA WAHYU WULAN DARA

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB II KAJIAN PUSTAKA

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

BAB III ANALISIS DAN PERANCANGAN

Transkripsi:

BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu. Berdasarkan batasan pengertian tersebut, sistem mempunyai karakteristik sebagai berikut: 1. Sistem adalah kumpulan elemen-elemen atau sumberdaya yang saling berkaitan secara terpadu, terintegrasi dalam suatu hubungan hirarkis. 2. Sistem memiliki sasaran yang akan dicapai. Setiap sistem berusaha mencapai satu atau lebih sasaran yang merupakan arah, yang merupakan kekuatan yang memberikan arah suatu sistem. 3. Konstruksi sistem terdiri dari: Masukan-Proses-Keluaran. Masukan merupakan semua arus berwujud atau tidak berwujud yang masuk ke sistem. Keluaran merupakan semua arus keluar atau akibat yang dihasilkan. Proses terdiri dari metode yang digunakan untuk mengubah masukan menjadi keluaran. 4. Sistem memiliki pengguna. Setiap sistem harus mengarahkan sub sistemnya agar dapat mencapai sasaran. Sasaran sistem sebagai ukuran penentu keberhasilan suatu sistem. 5. Sistem memiliki keterbatasan. 7

8 6. Sistem memiliki sub sistem yang membentuk suatu jaringan terpadu. 7. Sistem memerlukan pengendalian. 2.2 Informasi Informasi adalah data yang sudah diolah menjadi bentuk yang lebih berguna dan lebih berarti (bermanfaat) bagi penerimanya, menggambarkan suatu kejadian dan kesatuan nyata yang dapat dipahami dan dapat digunakan untuk pengambilan keputusan, sekarang maupun masa depan (Gondodiyoto, 2007). Sumber dari informasi adalah data. Data merupakan bentuk jamak dari bentuk tunggal datum atau data item. Data sebagai input perlu diolah oleh suatu sistem pengolahan data agar dapat menjadi output, yaitu informasi yang lebih berguna bagi pemakainya. Dari uraian tersebut dapat dikatakan bahwa : 1. Informasi adalah data yang diolah menjadi bentuk yang lebih berguna, lebih bermanfaat dan lebih berarti bagi penggunanya. 2. Data menggambarkan suatu kejadian-kejadian, data dinyatakan sebagai simbol-simbol, gambar-gambar, kata-kata, angka-angka, atau huruf-huruf yang menunjukkan suatu ide, obyek, kondisi atau situasi tertentu. 3. Informasi digunakan untuk pengambilan keputusan. Bagi manajemen suatu organisasi, informasi berguna untuk membantu dalam pengambilan keputusan yang menentukan keberhasilan atau kesuksesan organisasi pada masa yang akan datang.

9 2.3 Sistem Informasi Sistem adalah kumpulan dari elemen-elemen yang berinteraksi untuk mencapai tujuan tertentu (Jogiyanto, 1995). Informasi adalah terdiri dari data yang telah diambil kembali dan diolah atau sebaliknya dan digunakan untuk tujuan informatif atau kesimpulan, argumentasi, atau sebagai dasar untuk peramalan atau pengambilan keputusan. Sistem Informasi adalah kombinasi antara prosedur kerja, informasi, orang dan teknologi informasi yang diorganisasikan untuk mencapai tujuan dalam sebuah organisasi. Sistem informasi adalah sekumpulan komponen pembentuk sistem yang mempunyai keterkaitan antara satu komponen dengan komponen lainnya yang bertujuan menghasilkan suatu informasi dalam suatu bidang tertentu. Dalam sistem informasi diperlukannya klasifikasi alur informasi, hal ini disebabkan keanekaragaman kebutuhan akan suatu informasi oleh pengguna informasi. 2.4 Sistem Pendukung Keputusan Sistem pendukung keputusan mulai dikembangkan pada tahun 1960-an, tetapi istilah Sistem Pendukung Keputusan itu sendiri baru muncul pada tahun 1071, yang diciptakan oleh G. Anthony Gorry dan Michael S. Scott Morton, keduanya adalah profesor di MIT. Sistem pendukung keputusan pasti tidak terlepas dari proses pengambilan keputusan itu sendiri. Pada dasarnya, proses pengambilan keputusan terdiri dari 3 fase proses: intelligence, design, dan choice. Intelligence yaitu pencarian kondisi-kondisi yang dapat menghasilkan keputusan. Design yaitu menemukan, mengembangkan, dan menganalisis materi-

10 materi yang mungkin untuk dikerjakan, sedangkan choice yaitu pemilihan dari materi-materi yang tersedia, mana yang akan dikerjakan. Proses-proses yang terjadi pada kerangka kerja Decision Support dibedakan atas: 1. Terstruktur, mengacu pada permasalahan rutin dan berulang untuk solusi standar yang ada. 2. Tak terstruktur, adalah fuzzy, permasalahan kompleks dimana tak ada solusi serta merta. Masalah yang tak terstruktur adalah tak adanya 3 fase proses yang terstruktur. 3. Semi terstruktur, terdapat beberapa keputusan terstruktur, tetapi tak semuanya dari fase-fase yang ada. Secara umum, sistem pendukung keputusan (SPK) adalah sistem berbasis komputer yang interaktif, yang membantu pengambil keputusan memanfaatkan data dan model untuk menyelesaikan masalah-masalah yang tak terstruktur dan semi terstruktur. SPK ini mendayagunakan resources individuindividu secara intelek dengan kemampuan komputer untuk meningkatkan kualitas keputusan. Sebenarnya definisi awalnya, SPK adalah sistem berbasis model yang terdiri dari prosedur-prosedur dalam pemrosesan data dan pertimbangannya untuk membantu manajer dalam mengambil keputusan. Agar berhasil mencapai tujuannya maka sistem tersebut harus sederhana, mudah untuk dikontrol, mudah beradaptasi, lengkap pada hal-hal penting, dan mudah berkomunikasi dengannya. Ada juga definisi yang menyatakan bahwa SPK adalah sistem berbasis komputer yang terdiri 3 komponen interaktif: (1) sistem bahasa-mekanisme yang

11 menyediakan komunikasi diantara user dan pelbagai komponen dalam SPK, (2) knowledge sistem-penyimpanan knowledge domain permasalahan yang ditanamkan dalam SPK, baik sebagai data ataupun prosedur, dan (3) sistem pemrosesan permasalahan-link diantara dua komponen, mengandung satu atau lebih kemampuan memanipulasi masalah yang dibutuhkan untuk pengambilan keputusan. Definisi terakhir, SPK mengacu pada situasi dimana sistem final dapat dikembangkan hanya melalui adaptive process pembelajaran dan evolusi. 2.5 Data Mining Faktor penentu bagi bentuk usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi secara seefektif mungkin. Pengunaan data yang strategis ini bisa diakibatkan oleh kesempatan-kesempatan yang dihasilkan atau ditimbulkan karena penemuan fakta-fakta sangat berharga yang cukup sering, tersembunyi dan tidak terdeteksi sebelumnya mengenai konsumen, retailer dan supplier, tren tren bisnis, dan faktor faktor petunjuk yang lain (Berson, 1997). Menurut Kamber (2007) secara sederhana data mining mengacu kepada mengekstrak atau menambang pengetahuan dari sekumpulan besar data. Menambang dalam hal ini bukan diibaratkan sebagai menambang emas atau menambang pasir, tetapi lebih diibaratkan sebagai knowledge mining from data atau lebih ringkasnya menambang pengetahuan. Pengertian lain data mining juga dapat berarti prose untuk mempekerjakan satu atau lebih teknik pembelajaran terkomputerisasi untuk mengotomasi analisa dan mengekstrak pengetahuan dari data didalam database (Roger and Geatz, 2003).

12 Data Mining mempunyai langkah-langkah yang penting dalam proses knowledge discovery. Prosesnya disusun berurutan sebagai berikut : 1. Tahap seleksi (Selection). Tahap memilih atau memilah-milah data berdasarkan kepada sejumlah kriteria. 2. Tahap proses awal (Prepocessing). Tahap pembersihan data dimana informasi-informasi tertentu dipindahkan karena dianggap tidak penting dan bisa memperlambat queries. 3. Tahap transformasi (Transformation). Dalam tahap ini data tidak hanya dipindahkan saja tetapi diubah sehingga dapat ditambahkan lapisan-lapisan seperti contoh lapisan demografis yang biasanya digunakan dalam penelitian. 4. Tahap data mining (Data Mining). Tahap ini mengenai ekstraksi pola dari data. 5. Tahap implementasi dan evaluasi (Interpretation and evaluation). Pola-pola yang diidentifikasikan oleh sistem yang ada di interpretasikan ke dalam pengetahuan yang kemudian bisa digunakan untuk mendukung pengambilan keputusan. 2.6 Clustering Cluster adalah suatu kumpulan dari entitas yang hampir sama (Everit, 1993). Pengertian lain menurut Kamber (2007), cluster adalah kumpulan dari objek yang mirip dengan objek lainnya dan berada pada kelompok yang sama. Sedangkan proses untuk mengelompokkan data baik itu bersifat fisik atau abstrak kedalam suatu kelompok atau kelas yang memiliki kesamaan sifat disebut clustering.

13 Clustering dikategorikan kedalam teknik Undirect Knowledge atau Unsupervised Learning karena tidak membutuhkan proses pelatihan untuk klasifikasi awal data dalam masing-masing kelompok atau cluster. Tujuan utama clustering adalah untuk menemukan atau mencari pola yang bermanfaat atau berguna pada suatu database, kemudian merangkumnya dan membuat lebih mudah untuk dipahami. Dalam melakukan proses analisa terhadap cluster-cluster yang telah terbentuk dan pencarian pengetahuan dengan metode tertentu disebut cluster analyse (Kamber, 2007). 2.7 K-Means Clustering Metode K-Means adalah metode pengelompokan data dengan mengambil parameter sejumlah k cluster, dan mempartisi data kedalam cluster tersebut, dengan berpatokan pada kemiripan antar data dalam satu cluster dan ketidakmiripan di antar cluster yang berbeda, pusat dari cluster adalah rata-rata dari nilai anggota cluster yang disebut centroid atau center of gravity (Kamber, 2007). Selain itu K-Means melakukan pengelompokan dengan meminimalkan jumlah kuadrat dari jarak (distance) antara data dengan centroid cluster yang cocok (Teknomo, 2006). Algoritma K-Means adalah algoritma partitional (Non Hierarchical) clustering yang paling umum digunakan, hal ini disebabkan karena kesederhanaan dan keefisienan algoritma tersebut. Algoritma K-Means mempartisi atau membagi sekumpulan data ke dalam sejumlah cluster. Algoritma pseudocode dari perhitungan k-means (Kamber, 2007) yaitu :

14 Input : k : jumlah cluster yang akan di bentuk D : dataset yang berisikan n objek Output : cluster sebanyak k Method : (1) Pilih secara random objek k dari D sebagai centroid awal (2) Ulangi (3) Masukkan objek ke cluster yang beranggotakan objek yang mirip, sesuai nilai rata-rata dari objek yang ada pada cluster. (4) Perbaharui nilai rata-rata cluster. (5) Sampai tidak ada perubahan Untuk lebih mengetahui alur algoritma dari metode K-Means, dapat dilihat pada gambar 1. Mulai Menentukan banyaknya cluster k yang diinginkan Hitung Centroid Hitung jarak objek ke centroid Pengelompokan berdasarkan jarak terdekat ya Ada objek yang berpindah kelompok? tidak Selesai Gambar 2.1 Flowchart Algoritma Clustering K-Means (Teknomo, 2006) Pada gambar diatas, pertama user menentukan banyaknya jumlah cluster yang diinginkan, kemudian menghitung centroid. Pada iterasi awal, pemilihan centroid dilakukan secara acak pada objek. Langkah selanjutnya adalah

15 menghitung jarak setiap anggota cluster ke semua centroid. Lalu dilakukan pengelompokan berdasarkan jarak terdekat yang telah dihitung sebelumnya. Selanjutnya adalah menghitung kembali centroid yang baru. Titik centroid baru didapat dari rata-rata semua titik anggota cluster. Langkah-langkah diatas terus dilakukan hingga tidak ada satupun anggota cluster yang berpindah cluster. 2.8 Centroid Centroid merupakan rata-rata dari nilai anggota cluster yang disebut juga center of gravity (Kamber, 2007). Sedangkan menurut Roger and Geatz, 2003, centroid merupakan pusat dari sebuah cluster. Di dalam perhitungan k-means akan terbentuk cluster atau kelompok-kelompok data sejumlah k. Nilai k merupakan nilai parameter yang telah di tentukan sebelumnya. Nilai centroid adalah penjumlahan dari titik koordinat anggota cluster dibagi jumlah anggota. Misalnya terdapat 2 data anggota pada suatu cluster yaitu A = (