BAB II TINJAUAN PUSTAKA

dokumen-dokumen yang mirip
BAB IV METEDOLOGI PENELITIAN

SEQUENTIAL PATTERN MINING DENGAN SPADE UNTUK PREDIKSI PEMBELIAN SPARE PART DAN AKSESORIS KOMPUTER PADA KEDATANGAN KEMBALI KONSUMEN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

SEQUENTIAL PATTERN MINING PADA PENCARIAN POLA PERILAKU PENGGUNA INTERNET MENGGUNAKAN ALGORITMA SPADE

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

PENDAHULUAN. Latar Belakang

Rancang Bangun Fitur Rekomendasi Buku Menggunakan Algoritma PrefixSpan pada Sistem Peminjaman Buku Berbasis Web di Perpustakaan Universitas Ciputra

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB II TINJAUAN PUSTAKA

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support

ANALISIS DAN IMPLEMENTASI WEB USAGE MINING MENGGUNAKAN ALGORITMA SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

ANALISIS ASSOCIATION RULES ALGORITMA APRIORI PENJUALAN KAOS TRAVELLING

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

BAB 2 TINJAUAN PUSTAKA

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

UKDW BAB I PENDAHULUAN

SKRIPSI TI S1 FIK UDINUS 1

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang


BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN Latar Belakang Masalah

II. TINJAUAN PUSTAKA

Penerapan Data Mining Penjualan Sepatu Menggunakan Metode Algoritma Apriori

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

ANALISA ALGORITMA APRIORI UNTUK MENENTUKAN MEREK PAKAIAN YANG PALING DIMINATI PADA MODE FASHION GROUP MEDAN

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

BAB I PENDAHULUAN. Universitas Sumatera Utara

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB I PENDAHULUAN. pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses

BAB I PENDAHULUAN Latar Belakang

2.2 Data Mining. Universitas Sumatera Utara

BAB 2 LANDASAN TEORI

BAB III LANDASAN TEORI

BAB I PENDAHULUAN. yang cepat dan besar di Asia (Kartiwi, 2006). Pertumbuhan e-commerce yang

IMPLEMENTASI DATA MINING PADA PENJUALAN TIKET PESAWAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus: Jumbo Travel Medan)

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. frekuensi tinggi antar himpunan itemset yang disebut fungsi Association

BAB 2 TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

ASSOCIATION RULES PADA TEXT MINING

Journal of Informatics and Technology, Vol 2, No 2, Tahun 2013, p

BAB 1 PENDAHULUAN Latar Belakang

BAB 2 TINJAUAN PUSTAKA

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

Jurnal Edik Informatika Penelitian Bidang Komputer Sains dan Pendidikan Informatika V1.i1(52-62)

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

PENGENALAN POLA TRANSAKSI SIRKULASI BUKU PADA DATABASE PERPUSTAKAAN MENGGUNAKAN ALGORITMA GENERALIZED SEQUENTIAL PATTERN

PENERAPAN ALGORITMA APRIORI DALAM MENENTUKAN STRATEGI PENJUALAN MAKANAN RINGAN (Studi Kasus: Toko Pak Herry Templek - Gadungan)

BAB I PENDAHULUAN 1.1 Latar Belakang

Analisis asosiasi Penguasaan ICT Mahasiswa Baru dan Pencapaian Prestasi Akademik Mahasiswa dengan Algoritma Apriori.

BAB 1 PENDAHULUAN Latar Belakang

PENERAPAN ALGORITMA APRIORI UNTUK MENENTUKAN FREKUENSI ITEM SET SEBAGAI STRATEGI PENJUALAN DI TOKO PUTRA MANIS SURAKARTA SKRIPSI

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING PADA PENJUALAN PRODUK ELEKTRONIK DENGAN ALGORITMA APRIORI (STUDI KASUS : KREDITPLUS)

ASSOCIATION RULES PADA TEXT MINING

BAB II LANDASAN TEORI

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah Identifikasi Masalah Masalah Umum

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

BAB III METODOLOGI PENELITIAN

PENDAHULUAN TINJAUAN PUSTAKA

ANALISIS POLA ASOSIASI DAN SEKUENSIAL DATA REKAM MEDIS RSUD DR. H

BAB III ANALISIS DAN DESAIN SISTEM

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

ASSOCIATION RULES PADA TEXT MINING

BAB I PENDAHULUAN. Keberadaan minimarket di kota-kota besar sangat dibutuhkan bagi. masyarakat khususnya di daerah perumahan. Bagi sebagian besar

BAB I PENDAHULUAN. untuk menemukan pengetahuan atau informasi berharga yang tersembunyi di

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

TINJAUAN PUSTAKA Data Mining

PENERAPAN DATA MINING UNTUK MENGETAHUI POLA ASOSIASI ANTARA DATA MAHASISWA DAN TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FOLD-GROWTH

BAB III METODE PENELITIAN

ANALISIS DATA POLA PEMBELIAN KONSUMEN DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN SUPERMARKET PAMELLA YOGYAKARTA 1.

BAB I PENDAHULUAN. Rumah Sakit Umum Daerah (RSUD) Kabupaten Boyolali merupakan. salah satu instansi pelayanan kesehatan di Kabupaten Boyolali.

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN 1.1 Latar Belakang

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

BAB II LANDASAN TEORI

JURNAL IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI HASIL PENJUALAN BARANG PADA TOKO SINAR BARU DENGAN MENGGUNAKAN ALGORITMA APRIORI

BAB II TINJAUAN PUSTAKA

Transkripsi:

BAB II TINJAUAN PUSTAKA 2.1. Aplikasi Data Mining Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar (Turban et al, 2005). Dalam aplikasinya, data mining merupakan bagian dalam proses Knowledge Discovery in Database (KDD) yang bertugas untuk mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang spesifik. Data mining merupakan suatu bagian langkah yang penting dalam proses knowledge discovery in database terutama berkaitan dengan ekstraksi dan penghitungan data-data yang ditelaah. Adapun proses KDD adalah suatu proses menggunakan database dalam jumlah besar yang meliputi penyeleksian data, preprocessing (subsampling), transformasi data, menerapkan metode data mining (algoritma) untuk menghitung pola data, dan mengevaluasi pola-pola yang terbentuk dari proses data mining sehingga dapat menjadi informasi / pengetahuan baru yang bermanfaat (Fayyad, 1996). 1. Menurut Yanchang Zhao dan Yonghua Cen ini mempersembahkan buku Data Mining dengan menggunakan Program R, harapannya dengan buku ini pembaca dapat mendemonstrasikan data mining dengan menggunakan program open source. Selain open source, program R ini dapat digunakan untuk analisis statistika dan data mining. Selain itu, buku ini tidak hanya menyajikan teori, namun juga dilengkapi dengan praktik yang dilengkapi dengan code atau sintaks-sintaks dalam analisis data mining. 7

8 2. Menurut Mohammed J. Zaki and Wagner Meira JR., 2014) Data mining adalah proses menemukan wawasan, pola menarik, serta deskriptif, dimengerti, dan prediksi dari model data dari data berskala besar. Dengan melihat sifat dasar data yang dimodelkan sebagai matriks data, yang menekankan pandangan geometris dan aljabar, serta interpretasi probabilistik dari data 3. Menurut Ledolter, Johannes, 2001 menyatakan dengan adanya database dalam jumlah besar, maka dengan teknik data mining akan didapatkan pola dan model tertentu dari database tersebut. Penerapan data mining dan analisis statistika merupakan alat yang tepat menggali informasi yang bermanfaat dari data yang besar, sehingga diperoleh model sederhana yang mendeskripsikan data tersebut 4. Menurut Ullah, 2010 Jumlah luas data yang disimpan dalam database medis membutuhkan pengembangan alat khusus untuk mengakses data, analisis data, penemuan pengetahuan. Penggunaan system informasi medis dan pembesaran ledakan database medis memerlukan analisis data manual konvensional akan digabungkan dengan metode analisis dengan bantuan komputer yang kompeten. Dalam tulisan ini, penulis menggunakan teknik data mining untuk analisis data, akses data dan prosedur penemuan pengetahuan melalui eksperimen dan praktik konsisten, mampu dan cepat untuk studi bidang tertentu. Hasil yang diperoleh akan diuji dengan menerapkan pendekatan ke database, gudang data dan semua ukuran yang berbeda dengan nilai-nilai entri yang berbeda. Hasil yang dibentuk dalam penggunaan yang berbeda misalnya diagnose pasien, frekuensi penyakit yang berbeda 2.3. Aplikasi Sequential Pattern Mining Sequential pattern mining pertama kali diperkenalkan oleh Agrwal dan Srikant. Proses sequential pattern mining dapat digambarkan misalnya, diberikan sejumlah sequence. Setiap sequence terdiri atas sederetan elemen, dan setiap elemen terdiri atas sejumlah item, serta diberikan nilai minimum support. Penggalian pola sequential adalah pencarian semua subsequence berulang, yaitu subsequence yang

9 frekuensi kejadiannya lebih besar dari minimum-support.(agrawal, 1995). Untuk menyelesaikan permasalahan sekuensial ini dapat dilakukan dengan beberapa metode antara lain Generalizes Sequential Pattern atau disebut GSP, FreeSpan, dan PrefixSpan. Sebagai contoh proses sequential pattern mining, terdapat table transaksi penjualan yang berisikan customer, tanggal dan item. Dari table transaksi tersebut kemudian dibentuk sequence transaksi tersebut kemudian dibentuk sequence transaksi berdasarkan customer dan diurutkan berdasar tanggal sehingga membentuk beberapa sequence. (Ardiansyah,2013). Adapun beberapa penelitian dari aplikasi sequential pattern mining dengan Sequential Pattern Discovery using Equivalent classes (SPADE) antara lain adalah : Sequential Pattern Mining pada Data Transaksi Penjualan Menggunakan Algoritma Sequential Pattern Mining Discovery using Equivalent classes (SPADE) (Ardiansyah, 2013) Penelitian ini mencoba menggunakan algoritma Sequential Pattern Mining Discovery using Equivalent classes (SPADE) untuk mencari Sequential Pattern pada data transaksi penjualan. Algoritma sequential pattern discovery using equivalent classes (SPADE) dapat diterapkan pada data transaksi penjualan. Dari data transaksi yang digunakan, dicari frequent sequence (pola urutan pembelian barang yang sering muncul) yang dapat dibentuk. Hasil frequent sequence menunjukkan pola belanja konsumen yang sering muncul. Pola belanja konsumen tersebut kemudian dibentuk rule yang diuji menggunakan nilai lift rasio, apabila nilai lift rasio lebih dari 1, maka rule dianggap kuat. Hanya ditemukan 11 rule dari total 6097 rule yang dihasilkan memiliki nilai lift rasio dibawah 1. Sehingga disimpulkan bahwa algoritma SPADE akurat untuk mencari pola sekuensial dari data transaksi penjualan. Dalam jurnal yang berjudul Sequential Pattern Mining Pada Pencarian Pola Perilaku Pengguna Internet Menggunakan Algoritma SPADE menjelaskan tentang Perilaku penggunaan internet dapat dilihat melalui sebuah file yang mencatat segala informasi transaksi penggunaan internet yang disebut access logs. Nilai minimum support dan minimum confidence ditentukan untuk menemukan rule-rule yang

10 bermanfaat. Nilai kekuatan rule atau lift ratio ditentukan dengan besar minimum support sedangkan nilai minimm confidence tidak berpengaruh terhadap besar nilai lift ratio. Dilanjutkan dengan pembentukan data transaksi dan perhitungan SPADE dengan mengkombinasikan itemset dan menghitung frequent-nya untuk mendapatkan rule yang kemudian akan dicari kekuatan setiap rule dengan menghitung lift rationya. Nilai lift ratio terbesar terdapat pada Fakultas Peternakan disaat jam kerja dengan besaran nilai 18,868 dengan rule jika mengakses mozilla.com maka mengakses bbc.co.uk (Yunianto, 2014; Dewi, 2014; yudistira, 2014). Sequential Pattern Mining Dengan Spade Untuk Prediksi Pembelian Spare Part dan Aksesoris Komputer Pada kedatangan Kembali Konsumen (Juliastio & Gunawan, 2015), hasil frequent 4-sequence yang diperoleh dalam penelitian ini mendapatkan hasil yang baik dan dapat dijadikan sebuah prediksi pembelian spare part dan aksesoris komputer pada kedatangan kembali konsumen di toko Seagate Computer Situbondo. Berdasarkan uji coba yang dilakukan menggunakan parameter nilai minimum support, minimum confidence dan jumlah data, kekuatan rule yang dihasilkan terpengaruh pada input nilai minimum support dan jumlah data transaksi, sedangkan nilai minimum confidence tidak berpengaruh terhadap kekuatan rule. Sehingga disimpulkan bahwa algoritma SPADE akurat untuk mencari pola sekuensial dari data transaksi penjualan untuk memprediksi kedatangan kembali konsumen. 2.3. Data Rekam Medis Dalam PERMENKES No: 269/MENKES/PER/III/2008 yang dimaksud rekam medis adalah berkas yang berisi catatan dan dokumen antara lain identitas pasien, hasil pemeriksaan, pengobatan yang telah diberikan, serta tindakan dan pelayanan lain yang telah diberikan kepada pasien. Catatan merupakan tulisan-tulisan yang dibuat oleh dokter mengenai tindakan-tindakan yang dilakukan kepada pasien dalam rangka palayanan kesehatan. Bentuk Rekam Medis dalam berupa manual yaitu tertulis lengkap dan jelas dan dalam bentuk elektronik sesuai ketentuan. Berikut beberapa penelitian yang menggunakan data rekam medis :

11 Mining Assosiation Rules dan Sequential Pattern dari Data Rekam Medis Rumah Sakit DR. H Slamet Martodirdjo Pamekasan (Ramadhani, 2014) Penelitian dilakukan di Rumah Sakit DR. H Slamet Martodirdjo Pamekasan memanfaatkan algoritma Assosiation Rules Mining untuk dapat mengetahui pola penyakit yang diderita oleh seluruh pasien dalam waktu yang sama. Sedangkan pemanfaatan algoritma Sequential Pattern Mining dapat mengetahui pola-pola penyakit yang diderita oleh seluruh pasien pada waktu yang berbeda. Pada kedua metode atribut yang digunakan adalah pasien_id, tanggal_periksa dan diagnose_penyakit. Data yang dipakai adalah data rekam medis tahun 2010, 2011, 2012. Penerapan algoritma Sequential Patterns Discovery Using Equivalent Classes (SPADE) untuk mencari sequential pattern mining Pada Data Rekam Medis dari Puskesmas Bolo di Kabupaten Bima Provinsi Nusa Tenggara Barat (rifani, 2016), penelitian ini dilakukan di Puskesmas Bolo di Kabupaten Bima Provinsi Nusa Tenggara Barat untuk mengetahui pola asosiasi dari diagnose setiap pasien Puskesmas Bolo sehingga dapat memberikan informasi khususnya pihak Puskesmas atau instansi terkait. Information Extraction Data Rekam Medis Pasien Untuk Perolehan Assosiation Rule Sebagai Pendukung Pengambilan Keputusan (Mauladi, 2013), penelitian ini bertujuan untuk memperoleh Assosiation Rule sebagai pendukung pengambilan keputusan dengan menggunakan Information Extraction dari data rekam medis pasien. Informasi ekstraksi dari dokumen rekam medis pasien bias digunakan mengklarifikasikan jenis penyakit yang diderita berdasarkan keluhan yang disampaikan pasien, juga hasil proses mining akan menghasilkan keterkaitan antara jenis penyakit satu dengan penyakit yang lainnya yang sering muncul secara bersamaan.