TUGAS DATA MINING. Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( )

Ukuran: px
Mulai penontonan dengan halaman:

Download "TUGAS DATA MINING. Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( )"

Transkripsi

1 TUGAS DATA MINING Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( ) PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER - FMIPA UNIVERSITAS UDAYANA BUKIT JIMBARAN 2015

2 ALGORITMA ID3 Pengertian ID3 (Iterative Dichotomiser Three) atau yang disebut juga denganinduction of Decision Treeadalah suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. Pengertian laindari ID3 yaitu ID3 merupakan sebuah metode yang digunakan untuk membangkitkan pohon keputusan. ID3 diperkenalkan pertama kali oleh Ross Quinlan (1979).ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan.aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree). Algoritma pada ID3 berbasis pada Occam s razor: lebih memilih pohon keputusan yang lebih kecil (teori sederhana) dibanding yang lebih besar. Tetapi tidak dapat selalu menghasilkan pohon keputusan yang paling kecil dan karena itu occam s razor bersifat heuristik. Occam s razor diformalisasi menggunakan konsep dari entropi informasi. Algoritma ID3 Input : sampel training, label training, atribut Membuat simpul akar untuk pohon yang dibuat Jika semua sampel positif, berhenti dengan suatu pohon dengan satu simpul akar, beri label (+) Jika semua sampel negatif, berhenti dengan suatu pohon dengan satu simpul akar beri label (-) Jika atribut kosong, berhenti dengan suatu pohon dengan satu simpul akar, dengan label sesuai nilai yang terbanyak yang ada pada label training Untuk yang lain, Mulai A atribut yang mengklasifikasikan sampel dengan hasil terbaik (berdasarkan gain ratio) Atribut keputusan untuk simpul akar A Untuk setiap nilai, v i, yang mungkin untuk A, - Tambahkan cabang di bawah akar yang berhubungan dengan A=v i

3 - Tentukan sampel Sv i sebagai subset dari sampel yang mempunyai nilai v i untuk atribut A - Jika sampel Sv i kosong, Di bawah cabang tambahkan simpul daun dengan label = nilai yang terbanyak yang aa pada label training Yang lain, tambah cabang baru di bawah cabang yang sekarang C4.5 (sampel training, label training, atribut-[a]) Berhenti yaitu : Adapun sample data yang digunakan oleh ID3 memiliki beberapa syarat, Deskripsi atribut-nilai. Atribut yang sama harus mendeskripsikan tiap contoh dan memiliki jumlah nilai yang sudah ditentukan. Kelas yang sudah didefinisikan sebelumnya. Suatu atribut contoh harus sudah didefinisikan, karena mereka tidak dipelajari oleh ID3. Kelas-kelas yang diskrit. Kelas harus digambarkan dengan jelas. Kelas yang continue dipecah-pecah menjadi kategori-kategori yang relatif, misalnya saja metal dikategorikan menjadi hard, quite hard, flexible, soft, quite soft. Jumlah contoh (example) yang cukup. Karena pembangkitan induktif digunakan, maka dibutuhkan test case yang cukup untuk membedakan pola yang valid dari peluang suatu kejadian. Pemillihan atribut pada ID3 dilakukan dengan properti statistik, yang disebut dengan information gain.gain mengukur seberapa baik suatu atribut memisahkan training example ke dalam kelas target. Atribut dengan informasi tertinggi akan dipilih. Dengan tujuan untuk mendefinisikan gain, pertama-tama digunakanlah ide dari teori informasi yang disebut entropi.entropi mengukur jumlah dari informasi yang ada pada atribut. Rumus untuk menghitung entropi informasi adalah : log 2 p + p + log 2 p Entropy ( S) p Rumus untuk menghitung gain adalah :

4 Gain (S, A ) Entropy (S ) Σ Sv Entropy (Sv) S Contoh Mencatat Keadaan 14 Minggu Permainan Tenis pada Setiap Sabtu Pagi Ming Ramalan_Cu Suhu Kelemba Angi Bermain_Te gu aca ban n nis M1 Cerah Panas Tinggi Lema h Tidak M2 Cerah Panas Tinggi Kuat Tidak M3 Mendung Panas Tinggi Lema h M4 Hujan Sejuk Tinggi Lema h M5 Hujan Dingin Normal Lema h Ya Ya Ya M6 Hujan Dingin Normal Kuat Tidak M7 Mendung Dingin Normal Kuat Ya M8 Cerah Sejuk Tinggi Lema h M9 Cerah Dingin Normal Lema h M10 Hujan Sejuk Normal Lema h Tidak Ya Ya M11 Cerah Sejuk Normal Kuat Ya M12 Mendung Sejuk Tinggi Kuat Ya M13 Mendung Panas Normal Lema h Ya

5 M14 Hujan Sejuk Tinggi Kuat Tidak Atribut Tujuan adalah Bermain Tenis yang memiliki value ya atau tidak. Atribut adalah Ramalan_Cuaca, Suhu, Kelembaban, dan Angin. Algoritma Dan Flowchart Entropy adalah formula untuk menghitung homogenitas dari sebuah sample/contoh. Solusi menggunakan entropy dari contoh kasus di atas : S adalah koleksi dari 14 contoh dengan 9 contoh positif dan 5 contoh negatif, ditulis dengan notasi [9+,5-]. Positif di sini maksudnya value Bermain_Tenis = Ya sedangkan negatif sebaliknya. Entropy dari S adalah : Entropy(S) = Zi N p i = c i1 - p i log 2 p i Z i = contoh positif + contoh negatif N = jumlah data Entropy([9+,5-]) = - (9/14) log2 (9/14) - (5/14) log2 (5/14) = - (0.6429) ((log (9/14))/log 2) - (0.3571) ((log (5/14))/log 2) = - (0.6429) ( /0.3010) - (0.3571) ( /0.3010) = - (0.6429) ( ) - (0.3571) ( ) = = Catatan : Entropy(S) = 0, jika semua contoh pada S berada dalam kelas yang sama.

6 Entropy(S) = 1, jika jumlah contoh positif dan jumlah contoh negative dalam S adalah sama. 0 < Entropy(S) < 1, jika jumlah contoh positif dan jumlah contoh negatif dalam S tidak sama. Gain(S,A) adalah Information Gain dari sebuah atribut A pada koleksi contoh S : Gain(S,A) = Entropy(S) - v Values( A) Sv S Entropy(S v ) 1. Values(Angin) = Lemah, Kuat SLemah = [6+,2-] SKuat = [3+,3-] Gain(S,Angin) = Entropy(S) - (8/14)Entropy(S Lemah ) - (6/14)Entropy(S Kuat ) = (8/14) (6/14) = Values(Kelembaban) = Tinggi, Normal S Tinggi = [3+,4-] S Normal = [6+,1-] Gain(S,Kelembaban) = Entropy(S) - (7/14)Entropy(S Tinggi ) - (7/14)Entropy(S Normal ) = (7/14) (7/14) = Values(Suhu) = Panas, Sejuk, Dingin S Panas = [2+,2-] S Sejuk = [4+,2-] S Dingin = [3+,1-]

7 Gain(S,Suhu) = Entropy(S) - (4/14)Entropy(S Panas ) - (6/14)Entropy(S Sejuk ) - (4/14)Entropy(S Dingin ) = (4/14) (6/14) (4/14) = Values(Ramalan_Cuaca) = Cerah, Mendung, Hujan S Cerah = [2+,3-] S Mendung = [4+,0-] S Hujan = [3+,2-] Gain(S,Ramalan_Cuaca) = Entropy(S) - (5/14)Entropy(S Cerah ) - (4/14)Entropy(S Mendung ) - (5/14)Entropy(S Hujan ) = (5/14) (4/14) (5/14) = Jadi, information gain untuk 3 atribut yang ada adalah : Gain(S,Angin) = Gain(S,Kelembaban) = Gain(S,Suhu) = Gain(S,Ramalan_Cuaca) = Tampak bahwa attribute Ramalan_Cuaca akan menyediakan prediksi terbaik untuk target attribute Bermain_Tenis. [M1, M2,..., M14] [9+,5-] Ramalan_Cuaca Cerah Mendung Hujan? Ya? [M1, M2, M8, M9, M11] [2+,3-] [M4, M5, M6, M10, M14] [3+,2-]

8 Untuk node cabang Ramalan_Cuaca = Cerah, SCerah = [M1, M2, M8, M9, M11] Ming gu Ramalan_Cu aca Suhu Kelemba ban Angi n Bermain_Te nis M1 Cerah Panas Tinggi Lema h Tidak M2 Cerah Panas Tinggi Kuat Tidak M8 Cerah Sejuk Tinggi Lema h M9 Cerah Dingin Normal Lema h Tidak Ya M11 Cerah Sejuk Normal Kuat Ya 1. Values(Suhu) = Panas, Sejuk, Dingin S Panas = [0+,2-] S Sejuk = [1+,1-] S Dingin = [1+,0-] Gain(S Cerah,Suhu) = Entropy(S Cerah ) - (2/5)Entropy(S Panas ) - (2/5)Entropy(S Sejuk ) - (1/5)Entropy(S Dingin ) = (2/5) (2/5) (1/5) = Values(Kelembaban) = Tinggi, Normal S Tinggi = [0+,3-] S Normal = [2+,0-] Gain(S Cerah,Kelembaban) = Entropy(S Cerah ) - (3/5)Entropy(S Tinggi ) - (2/5)Entropy(S Normal ) = (3/5) (2/5) = Values(Angin) = Lemah, Kuat

9 S Lemah = [1+,2-] S Kuat = [1+,1-] Gain(S Cerah,Angin) = Entropy(S Cerah ) - (3/5)Entropy(S Lemah ) - (2/5)Entropy(S Kuat ) = (3/5) (2/5) = Atribut Kelembaban menyediakan prediksi terbaik pada level ini. [M1, M2,..., M14] [9+,5-] Ramalan_Cuaca [M1, M2, M8, M9, M11] Cerah Mendung Hujan [2+,3-] Kelembaban Ya? [M4, M5, M6, M10, M14] Normal Tinggi [3+,2-] Ya Tidak [M1, M2, M8] [0+,3-] [M9, M11] [2+,0-] Untuk node cabang Ramalan_Cuaca = Hujan, SHujan = [M4, M5, M6, M10, M14] Mingg u Ramalan_Cua ca Suhu Kelembab an Angin Bermain_Teni s M4 Hujan Sejuk Tinggi Lema h Ya

10 M5 Hujan Dingin Normal Lema h Ya M6 Hujan Dingin Normal Kuat Tidak M10 Hujan Sejuk Normal Lema h Ya M14 Hujan Sejuk Tinggi Kuat Tidak 1. Values(Suhu) = Sejuk, Dingin (Tidak ada suhu = panas saat ini) S Sejuk = [2+,1-] S Dingin = [1+,1-] Gain(S Hujan,Suhu) = Entropy(S Hujan ) - (3/5)Entropy(S Sejuk ) - (2/5)Entropy(S Dingin ) = (3/5) (2/5) = Values(Kelembaban) = Tinggi, Normal S Tinggi = [1+,1-] S Normal = [2+,1-] Gain(S Hujan,Kelembaban) = Entropy(S Hujan ) - (2/5)Entropy(S Tinggi ) - (3/5)Entropy(S Normal ) = (2/5) (3/5) = Values(Angin) = Lemah, Kuat S Lemah = [3+,0-] S Kuat = [0+,2-] Gain(S Hujan,Angin) = Entropy(S Hujan ) - (3/5)Entropy(S Lemah ) - (2/5)Entropy(S Kuat ) = (3/5) (2/5) = Atribut Angin menyediakan prediksi terbaik pada level ini.

11 Algoritma : If Ramalan_Cuaca = Cerah AND Kelembaban = Tinggi THEN Bermain_Tenis = Tidak If Ramalan_Cuaca = Cerah AND Kelembaban = Normal THEN Bermain_Tenis = Ya If Ramalan_Cuaca = Mendung THEN Bermain_Tenis = Ya If Ramalan_Cuaca = Hujan AND Angin = Kuat THEN Bermain_Tenis = Tidak If Ramalan_Cuaca = Hujan AND Angin = Lemah THEN Bermain_Tenis = Ya Ramalan_Cuaca Suhu Kelembaban Angin Bermain_Tenis Cerah Panas Tinggi Kuat Tidak Cerah Panas Tinggi Lemah Tidak Cerah Panas Normal Kuat Ya Cerah Panas Normal Lemah Ya Cerah Sejuk Tinggi Kuat Tidak Cerah Sejuk Tinggi Lemah Tidak Cerah Sejuk Normal Kuat Ya

12 Cerah Sejuk Normal Lemah Ya Cerah Dingin Tinggi Kuat Tidak Cerah Dingin Tinggi Lemah Tidak Cerah Dingin Normal Kuat Ya Cerah Dingin Normal Lemah Ya Mendung Panas Tinggi Kuat Ya Mendung Panas Tinggi Lemah Ya Mendung Panas Normal Kuat Ya Mendung Panas Normal Lemah Ya Mendung Sejuk Tinggi Kuat Ya Mendung Sejuk Tinggi Lemah Ya Mendung Sejuk Normal Kuat Ya Mendung Sejuk Normal Lemah Ya Mendung Dingin Tinggi Kuat Ya Mendung Dingin Tinggi Lemah Ya Mendung Dingin Normal Kuat Ya Mendung Dingin Normal Lemah Ya Hujan Sejuk Tinggi Kuat Tidak Hujan Sejuk Tinggi Lemah Ya Hujan Sejuk Normal Kuat Tidak Hujan Sejuk Normal Lemah Ya Hujan Dingin Tinggi Kuat Tidak Hujan Dingin Tinggi Lemah Ya Hujan Dingin Normal Kuat Tidak Hujan Dingin Normal Lemah Ya

13 Flowchart : ALGORITMA C4.5 Pengertian Algoritma C4.5 merupakan algoritma yang digunakan untuk membangun sebuah pohon keputusan (decision tree) dari data.algoritma C4.5 merupakan pengembangan dari algoritma ID3 yang juga merupakan algoritma untuk membangun sebuah pohon keputusan.algoritma C4.5 secara rekursif mengunjungi tiap simpul keputusan, memilih percabangan optimal, sampai tidak ada cabang lagi yang mungkin dihasilkan.

14 Algoritma C4.5 merupakan salah satu algoritma machine learning. Dengan algoritma ini, mesin(komputer) akan diberikan sekelompok data untuk dipelajari yang disebut learning dataset.kemudian hasil dari pembelajaran selanjutnya akan digunakan untuk mengolah data-data yangbaru yang disebut test dataset. Karena algoritma C4.5 digunakan untuk melakukan klasifikasi,jadi hasil dari pengolahan test dataset berupa pengelompokkan data ke dalam kelas-kelasnya. Algoritma C4.5 Algoritma C4.5 menggunakan konsep information gain atau entropy reduction untuk memilih percabangan yang optimal. Misalkan terdapat sebuah variabel X dimana memiliki sejumlah k nilai yang mungkin dengan probabilitas p1, p2,, pk. Entropy menggambarkan keseragaman data dalam variabel X. Entropy variabel X (H(X)) dihitung dengan menggunakan persamaan sebagai berikut. H ( X )= j P j log 2 ( P j ) Misalkan terdapat sebuah kandidat simpul yang akan dikembangkan (S), yang membagi data T ke dalam sejumlah subset T1, T2,, Tk. Dengan menggunakan persamaan entropy diatas, nilai entropy tiap subset dihitung (HS(Ti)). Kemudian total bobot subset simpul S dihitung dengan menggunakan persamaan sebagai berikut. k H s (T )= P i H s (T i ) i=1 dimana Pi merupakan proporsi record pada subset i. Semakin seragam sebuah subset terhadap kelas-kelas pembaginya, maka semakin kecil nilai entropy. Nilai entropy paling kecil adalah 0, yang dicapai ketika record subset berada pada satu kelas yang sama. Sedangkan nilai entropy paling tinggi adalah 1, yang dicapai ketika record subset terbagi sama rata pada untuk tiap kelas. Semakin kecil nilai entropy, semakin baik subset tersebut. Dari nilai-nilai entropy yang didapat, nilai information gain untuk simpul S dihitung melaui persamaan sebagai berikut.

15 gain (S )=H (T ) H s (T ) Pada algoritma C4.5, nilai information gain dihitung untuk seluruh simpul yang mungkin dikembangkan. Simpul yang dikembangkan adalah simpul yang memiliki nilai information gain yang paling besar. Contoh Berikut ini adalah uraian langkah-langkah dalam algoritma C4.5 untuk menyelesaikan kasussuatu pertandingan tenis akan dilakukan atau tidak, berdasarkan keadaan cuaca, suhu,kelembaban, dan angin. Data yang telah ada pada Tabel 1, akan digunakan untuk membentukpohon keputusan. Pada Tabel 1, atribut-atributnya adalah Cuaca, Suhu, Kelembaban, dan Berangin. Setiap atributmemiliki nilai.sedangkan kelasnya ada pada kolom Main yaitu kelas Tidak dan kelas Ya.Kemudian data tersebut dianalisis; dataset tersebut memiliki 14 kasus yang terdiri 10 Ya dan 4 Tidak pada kolom Main (lihat Tabel 2). Tabel 1. Learning Dataset No Cuaca Suhu Kelembaba Berangin Main n 1 Cerah Panas Tinggi Salah Tidak 2 Cerah Panas Tinggi Benar Tidak 3 Berawan Panas Tinggi Salah Ya 4 Hujan Sejuk Tinggi Salah Ya 5 Hujan Dingin Normal Salah Ya 6 Hujan Dingin Normal Benar Ya 7 Berawan Dingin Normal Benar Ya 8 Cerah Sejuk Tinggi Salah Tidak 9 Cerah Dingin Normal Salah Ya 10 Hujan Sejuk Normal Salah Ya 11 Cerah Sejuk Normal Benar Ya 12 Berawan Sejuk Tinggi Benar Ya 13 Berawan Panas Normal Salah Ya 14 Hujan Sejuk Tinggi Benar Tidak Kemudian hitung entropi dengan rumus sebagai berikut :

16 Entropi (S )= P j log 2 P j k j=1 Keterangan : S adalah himpunan (dataset) kasus k adalah banyaknya partisi S Pj adalah probabilitas yang di dapat dari Sum(Ya) dibagi Total Kasus Jadi Entropi (S )=( ( ) log 2( )) + ( ( 4 14 ) log 2( 4 14 )) = Tabel 2. Hasil Perhitungan Pada Dataset Total Kasus Sum (Ya) Sum (Tidak) Entropi Total Setelah mendapatkan entropi dari keseluruhan kasus, lakukan analisis pada setiap atribut dannilai-nilainya dan hitung entropinya seperti yang ditampilkan pada Tabel 3. Tabel 3. Analisis Atribut, Nilai, Banyaknya Kejadian Nilai, Entropi dan Gain Node Atribut Nilai Sum 1 Cuaca Berawa Sum Sum Entropi (Nilai) (Ya) (Tidak) n Hujan Cerah Suhu Dingin Panas Sejuk Kelembaba n Tinggi Normal Berangin Salah Benar Gain

17 Untuk menghitung gain setiap atribut rumusnya adalah : S i S Entropi(S i ) Gain ( A )=Entropi ( S) i=1 k Jadi Gain (Cuaca )= (( 4 14 ) 0+ ( 5 14 ) ( 5 14 ) ) = Hitung pula Gain (Suhu), Gain (Kelembaban), dan Gain (Berangin). Hasilnya dapat dilihat padatabel 3.Karena nilai gain terbesar adalah Gain (Kelembaban).Maka Kelembaban menjadi nodeakar (root node).kemudian pada kelembaban normal, memiliki 7 kasus dansemuanya memiliki jawaban Ya (Sum(Total) / Sum(Ya) = 7/7 = 1).Dengan demikian kelembaban normal menjadi daun atau leaf.lihat Tabel 3 yang selnya berwarna hijau. Gambar. Pohon Keputusan Node 1 (root node) Berdasarkan pembentukan pohon keputusan node 1 (root node), Node 1.1 akan dianalisis lebihlanjut. Untuk mempermudah, Tabel 1 difilter, dengan mengambil data yang memilikikelembaban = Tinggi sehingga jadilah Tabel 4. Tabel 4. Data yang Memiliki Kelembaban = Tinggi No Cuaca Suhu Kelembaba Berangin Main n 1 Cerah Panas Tinggi Salah Tidak 2 Cerah Panas Tinggi Benar Tidak 3 Berawan Panas Tinggi Salah Ya

18 4 Hujan Sejuk Tinggi Salah Ya 5 Cerah Sejuk Tinggi Salah Tidak 6 Berawan Sejuk Tinggi Benar Ya 7 Hujan Sejuk Tinggi Benar Tidak Kemudian data di Tabel 4 dianalisis dan dihitung lagi entropi atribut Kelebaban Tinggi danentropi setiap atribut serta gainnya sehingga hasilnya seperti data pada Tabel 5. Setelah itutentukan pilih atribut yang memiliki gain tertinggi untuk dibuatkan node berikutnya. Tabel 5. Hasil Analisis Node 1.1 Kelembaban Sum (Ya) Sum (Tidak) Entropi Tinggi Node Atribut Nilai Sum 1 Cuaca Berawa Sum Sum Entropi (Nilai) (Ya) (Tidak) n Hujan Cerah Suhu Dingin Panas Sejuk Berangin Salah Benar Gain Dari Tabel 5, gain tertinggi ada pada atribut Cuaca, dan Nilai yang dijadikan daun atau leafadalah Berawan dan Cerah. Jika divualisasi maka pohon keputusan tampak seperti Gambar (Pohon Keputusan Analisis Node 1.1).Untuk menganalisis node 1.1.2, lakukan lagi langkah-langkah yang sama seperti sebelumnya.hasilnya ditampilkan pada Tabel 6 dan Gambar (Pohon Keputusan Akhir).

19 Gambar. Pohon Keputusan Analisis Node 1.1 Tabel 6.Hasil Analisi Node No Cuaca Suhu Kelembaba Berangin Main n 1 Hujan Sejuk Tinggi Salah Ya 2 Hujan Sejuk Tinggi Benar Tidak Kelembaban Sum (Ya) Sum (Tidak) Entropi Tinggi & Hujan Node Atribut Nilai Sum Sum Sum Entropi (Nilai) (Ya) (Tidak) 1 Suhu Dingin Panas Sejuk Berangin Salah Benar Gain 0 1

20 Gambar. Pohon Keputusan Akhir ALGORITMA CART Pengertian Metode CART ini pertama kali diajukan oleh Leo Breiman et al. pada tahun 1984.Pohon keputusan yang dihasilkan CART merupakan pohon biner dimana tiap simpul wajib memiliki dua cabang. CART secara rekursif membagi records pada data latihan ke dalam subset-subset yang memiliki nilai atribut target (kelas) yang sama. Algoritma CART Algoritma CART mengembangkan pohon keputusan dengan memilih percabangan yang paling optimal bagi tiap simpul.pemilihan dilakukan dengan menghitung segala kemungkinan pada tiap variabel. Misalkan Ф(s t) merupakan nilai kebaikan kandidat cabang s pada simpul t, maka nilai Ф(s t) dapat dihitung sebagai berikut: P ( j t L ) P( j t R ) kelas (s t )=2P L P R j=1 Dimana

21 t L =simpul anak kiri dari simpult t R =simpul anak kanandari simpul t P L = jumlah record pada t L jumlah seluruh record pada datalatihan P R = jumlahrecord padat R jumlah seluruhrecord pada datalatihan P( j t L )= jumlahrecord kelas j pada t L jumlah record pada simpult P( j t R )= jumlahrecord kelas j pada t R jumlah record pada simpult Nilai P ( j t L ) P( j t R ) kelas maksimal ketika record yang berada pada j=1 cabang kiri atau kanan simpul memiliki kelas yang sama (seragam). Nilai maksimal yang dicapai sama dengan jumlah kelas pada data. Misalkan jika data terdiri atas dua kelas, maka nilai maksimal P ( j t L ) P( j t R ) kelas adalah 2. j=1 Semakin seragam record pada cabang kiri atau kanan, maka semakin tinggi nilai P ( j t L ) P( j t R ) kelas. Nilai maksimal 2P L P R sebesar 0.5 dicapai ketika j=1 cabang kiri dan kanan memiliki jumlah record yang sama. Kandidat percabangan yang dipilih adalah kandidat yang memiliki nilai Ф(s t) paling besar. Contoh

22 Anda diberi data mengenai 8 orang nasabah yang pernah memperoleh kredit dari Bank Indra. Data tersebut meliputi besarnya tabungan (yang berjenis kategorial: rendah, sedang, atau tinggi), besarnya aset (yang berjenis kategorial: rendah, sedang, atau tinggi), besarnya pendapatan pertahun (dalam ribuan dollars, yang berjenis numerik dan berskala ration) dan risiko kredit (yang berjenis kategorial: risiko baik atau buruk) Nasabah Tabungan Aset Pendapatan Risiko Kredit A Sedang Tinggi 75 Baik B Rendah Rendah 50 Buruk C Tinggi Sedang 25 Buruk D Sedang Sedang 50 Baik E Rendah Sedang 100 Baik F Tinggi Tinggi 25 Baik G Rendah Rendah 25 Buruk H Sedang Sedang 75 Baik Klasifikasi Cart Noktah yang berbentuk elips disebut dengan noktah keputusan. Noktah jenis ini adalah notkah yang masih akan bercabang karena pada noktah ini suatu record belum ditentukan klasifikasinya. Noktah keputusan pertama biasanya disebut noktah dasar Noktah yang berbentuk persegi panjang disebut dengan noktah terminasi Pembahasan Permasalahan Pertama, kita memiliki data dari 8 nasabah seperti tertera di tabel sebelumnya dan ingin memperoleh pengetahuan yang dapat diaplikasikan kepada mereka yang berpotensi menjadi nasabah ke-9, ke-10, etc sehingga dengan mengetahui aset, tabungan, dan pendapatan,,kita dapat menentukan risiko kredit mereka Kedua, data itu kelak akan kita jadikan input bagi suatu algoritma Ketiga, sebagai keluaran dari algoritma, kita akan memperoleh pengetahuan yang secara sederhana dapat direpresentasikan dalam bentuk pohon keputusan Langkah-Langkah Algoritma CART :

23 Pertama, susun calon cabang (candidate split). Penyusunan ini dlakukan terhadap seluruh variabel prediktor. Daftar yang berisi calon cabang disebut daftar calon cabang mutakhir. Calon cabang prediktor tabungan Tabungan=rendah, dan tabungan={sedang, tinggi} Tabungan=sedang, dan tabungan={rendah, tinggi} Tabungan=tinggi, dan tabungan={rendah, sedang} Calon cabang prediktor aset Aset=rendah, dan aset={sedang, tinggi} Aset=sedang, dan aset={rendah, tinggi} Aset=tinggi, dan aset={rendah, sedang} Calon cabang preditor pendapatan Pendapatan dan pendapatan > Pendapatan dan pendapatan > Pendapatan dan pendapatan > Nama Calon Cabang Calon Cabang Kiri Calon Cabang Kanan 1 tabungan=rendah tabungan={sedang, tinggi} 2 tabungan=sedang tabungan={rendah, tinggi} 3 tabungan=tinggi tabungan={rendah, sedang} 4 aset=rendah aset={sedang, tinggi} 5 aset=sedang aset={rendah, tinggi} 6 aset=tinggi aset={rendah, sedang} 7 pendapatan <= pendapatan > pendapatan <= pendapatan > pendapatan <= pendapatan > Kedua, menilai kinerja keseluruhan calon cabang yang ada di daftar calon cabang mutakhir dengan jalan menghitung nilai besaran kesesuaian. Kinerja setiap calon cabang akan diukur melalui ukuran yang disebut dengan kesesuaian (goodness). Kesesuain dari calon cabang s pada noktah keputusan t dilambangkan dengan ɸ ( s t)

24 P ( j t L ) P( j t R ) kelas (s t )=2P L P R j=1 Dimana t L =simpul anak kiri dari simpult t R =simpul anak kanandari simpul t P L = jumlah record pada t L jumlah seluruh record pada datalatihan P R = jumlahrecord padat R jumlah seluruhrecord pada datalatihan P( j t L )= jumlahrecord kelas j pada t L jumlah record pada simpult P( j t R )= jumlahreco rd kelas j pada t R jumlah record pada simpul t N Risiko 2xPLxP Phi (s o PL PR Kredit P(j tl) P(j tr) R Q(s t) t) 3/8=0,37 5/8=0,62 1/3=0,33 0, Baik: 3 4/5=0,8 0, , /3=0,66 Buruk: 7 1/5=0,2 3/8=0,37 5/8=0,62 0, Baik: 3/3=1 2/5=0,4 0, ,2 5 Buruk: 0/3=0 3/5=0,6 3 2/8=0,25 0 6/8=0,75 Baik: 1/2==0,5 Buruk: 1/2=0,5 4/6=0,66 7 0,375 0,333 0,125 2/6=0,33 3

25 4 2/8=0,25 0 6/8=0,75 Baik: 0/2=0 Buruk: 2/2=1 5/6=0,83 3 0,375 1,667 0,625 1/6=0, /8=0,5 4/8=0,5 Baik: 3/4=0,75 2/4=0,5 0,5 0,5 0,5 Buruk: 1/4=0,25 2/4=0,5 6 2/8=0,25 6/8=0,75 Baik: 2/2=1 3/6=0,5 0, ,375 Buruk: 0/2=0 3/6=0,5 3/8=0,37 5/8=0,62 1/3=0,33 0,933 0, Baik: 3 4/5=0,8 0, /3=0,66 Buruk: 7 1/5=0,2 5/8=0,62 3/8=0,37 0, Baik: 2/5=0,4 3/3=1 0, ,2 5 Buruk: 3/5=0,6 0/3=0 7/8=0,87 1/8=0,12 4/7=0,57 0, Baik: 1 1/1=0 0, , /7=0,42 Buruk: 9 0/1=0 Ketiga, menentukan calon cabang manakah yang akan benar-benar menjadi cabang dengan memilih calon cabang yang memiliki nilai kesesuaian ɸ ( s t) terbesar. Setelah itu gambarkan percabangan. Menentukan calon cabang yang manakah yang benar-benar menjadi cabang à ɸ ( s t) terbesar

26 Noktah Keputusan A {Catatan A, C, D, E, F, H} Kembali ke Langkah Kedua dengan melihat daftar calon cabang mutakhir masalah nasabah Nama Calon Cabang Calon Cabang Kiri Calon Cabang Kanan 1 tabungan=rendah tabungan={sedang, tinggi} 2 tabungan=sedang tabungan={rendah, tinggi} 3 tabungan=tinggi tabungan={rendah, sedang} 4 aset=rendah aset={sedang, tinggi} 5 aset=sedang aset={rendah, tinggi} 6 aset=tinggi aset={rendah, sedang} 7 pendapatan <= pendapatan > pendapatan <= pendapatan > pendapatan <= pendapatan > Risik o N Kredi 2xPLxP Q(s Phi o PL PR t P(j tl) P(j tr) R t) (s t) 1/6=0,16 5/6=0,83 0, Baik: 1/1=1 4/5=0,8 0, ,4 1

27 Buruk : 0/1=0 1/5=0,2 2 3/6=0,5 3/6=0,5 Baik: 3/3=1 Buruk : 0/3=0 2/3=0,66 7 0,5 1/3=0,33 3 0,66 7 0, /6=0,33 3 4/6=0,66 7 Baik: 1/2==0,5 4/4=1 0, ,444 Buruk : 1/2=0,5 0/4= /6=0,66 7 2/6=0,33 3 2/6=0,33 3 2/6=0,33 3 Baik: 3/4=0,75 2/2=1 0,444 0,5 0,222 Buruk : 1/4=0,25 0/2=0 4/6=0,66 7 Baik: 2/2=1 3/4=0,75 0,444 0,5 0,222 Buruk : 0/2=0 1/4=0,25 4/6=0,66 7 Baik: 1/2=0,5 4/4=1 0, ,444 Buruk : 1/2=0,5 0/4=0 8 3/6=0,5 3/6=0,5 Baik: Buruk : 2/3=0,66 7 3/3=1 0,5 1/3=0,33 3 0/3=0 0,66 7 0, /6=0,83 3 1/6=0,16 7 Baik: 4/5=0,8 1/1=0 0, ,4 0,111

28 Buruk : 1/5=0,2 0/1=0 Tabungan={rendah, sedang} Kembali ke Langkah Kedua dengan melihat daftar calon cabang mutakhir masalah nasabah Nama Calon Cabang Calon Cabang Kiri Calon Cabang Kanan 1 tabungan=rendah tabungan={sedang, tinggi} 2 tabungan=sedang tabungan={rendah, tinggi} 3 tabungan=tinggi tabungan={rendah, sedang} 4 aset=rendah aset={sedang, tinggi} 5 aset=sedang aset={rendah, tinggi} 6 aset=tinggi aset={rendah, sedang} 7 pendapatan <= pendapatan > pendapatan <= pendapatan > pendapatan <= pendapatan >

29 No PL PR Risiko Kredit P(j tl) P(j tr) 2xPLxPR Q(s t) Phi (s t) 1 0/2=0 2/2=1 Baik: 0 1/2=0, Buruk: 0 1/2=0,5 2 0/2=0 2/2=1 Baik: 0 1/2=0, Buruk: 0 1/2=0,5 5 1/2=0,5 1/2=0,5 Baik: 0/1=0 1/1=0 0,5 2 1 Buruk: 1/1=1 0/1=0 6 1/2=0,5 1/2=0,5 Baik: 1/1=1 0/1=0 0,5 2 1 Buruk: 0/1=0 1/1=1 7 2/2=1 0/2=0 Baik: 1/2=0,5 0/2= Buruk: 1/2=0,5 0/2=0 8 2/2=1 0/2=0 Baik: 1/2=0, Buruk: 1/2=0, /6=0,833 1/6=0,167 Baik: 4/5=0, Buruk: 1/5=0,2 0

30 Aset=tinggi Pegawai Jabatan Kelamin Umur Asal Kategori Level 1 Service Perempuan 45 Kota besar Level 3 2 Service Laki-laki 25 Kota besar Level 1 3 Service Laki-laki 33 kota kecil Level 2 4 Manajemen Laki-laki 25 Kota besar Level 3 5 Manajemen perempuan 35 kota kecil Level 4 6 Manajemen Laki-laki 26 kota kecil Level 3 7 Manajemen Perempuan 45 Kota besar Level 4 8 Sales Perempuan 40 kota kecil Level 3 9 Sales Laki-laki 30 Kota besar Level 2 10 Sales Perempuan 50 Kota besar Level 2 11 Sales Laki-laki 25 kota kecil Level 1

31 Jika tidak ada noktah keputusan, pelaksanaan algoritma CART dihentikan dan sebaliknya jika ada kembali ke langkah kedua. Referensi : Pengertian dan Konsep Algoritma ID3. Diakses dari web, omizer_three.docx, pada tanggal 28 Maret 2015 Pengertian dan Konsep Algoritma C4.5 dan CART. Diakses dari web, article=161148&val=5450&title=perbandingan%20performansi %20ALGORITMA%20C4.5%20DAN%20CART%20DALAM %20%20KLASIFIKSI%20DATA%20NILAI%20MAHASISWA%20PRODI %20TEKNIK%20KOMPUTER%20%20POLITEKNIK%20NEGERI %20PADANG, pada tanggal 28 Maret 2015 Contoh Algoritma ID3. Diakses dari web, pada tanggal 28 Maret 2015 Contoh Algoritma C4.5. Diakses dari web, goritma_data_mining_c4.5.pdf, pada tanggal 28 Maret 2015 Contoh Algoritma CART. Diakses dari web, pada tanggal 28 Maret 2015

Belajar Mudah Algoritma Data Mining : C4.5

Belajar Mudah Algoritma Data Mining : C4.5 Belajar Mudah Algoritma Data Mining : C4.5 Algoritma data mining C4.5 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif.

Lebih terperinci

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3) Kecerdasan Buatan Materi 6 Iterative Dichotomizer Three (ID3) Pengertian ID3 Singkatan dari Iterative Dichotomiser Three. Atau Induction of Decision Tree. Diperkenalkan pertama kali oleh Ross Quinlan (1979)

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) atau dikenal Decision Support System(DSS) adalah sistem informasi interaktif yang menyediakan informasi, pemodelan

Lebih terperinci

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya Berbagai penelitian yang menerapkan algoritma ID3 (Iterative Dichotomizer Three) sebagai metode perhitungannya telah banyak dilakukan. ID3 (Iterative Dichotomizer

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika Classification Decision Tree Classification Decision Tree Pengertian Pohon Keputusan Pohon keputusan adalah

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. BAB 3 ALGORITMA C4.5 Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. A. Pohon Keputusan Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom DATA MINING KLASIFIKASI BERBASIS DECISION TREE Ramadhan Rakhmat Sani, M.Kom Text Book Outline 1. Algoritma Data Mining Algoritma ID3 Algoritma C4.5 Algoritma C4.5 Introduction Algoritma C4.5 merupakan

Lebih terperinci

Algoritma Data Mining (2) Tugas Klasifikasi

Algoritma Data Mining (2) Tugas Klasifikasi Algoritma Data Mining (2) Tugas Klasifikasi Anief Fauzan Rozi, S. Kom., M. Eng. 1 Kompentensi Mahasiswa mengetahui algoritma data mining pada tugas klasifikasi 2 Pokok Bahasan Algoritma C4.5 3 Supervised

Lebih terperinci

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Wahyudin Program Pendidikan Ilmu Komputer, Universitas Pendidikan Indonesia Abstrak Konsep pohon merupakan salah satu

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

ANALISIS DAN IMPLEMENTASI ALGORITMA ID3 DAN CART PADA PENILAIAN KINERJA PEGAWAI. Fathurahman Alhikmah, Erwin Budi Setiawan, Mahmud Imrona

ANALISIS DAN IMPLEMENTASI ALGORITMA ID3 DAN CART PADA PENILAIAN KINERJA PEGAWAI. Fathurahman Alhikmah, Erwin Budi Setiawan, Mahmud Imrona ANALISIS DAN IMPLEMENTASI ALGORITMA ID3 DAN CART PADA PENILAIAN KINERJA PEGAWAI Fathurahman Alhikmah, Erwin Budi Setiawan, Mahmud Imrona Jurusan Ilmu Komputasi, Fakultas Informatika Universitas Telkom,

Lebih terperinci

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

POHON KEPUTUSAN DENGAN ALGORITMA C4.5 POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif

Lebih terperinci

Suyanto, Artificial Intelligence

Suyanto, Artificial Intelligence Suyanto, Artificial Intelligence 12/11/2009 1 Merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit. Banyak digunakan dalam data mining untuk klasifikasi. Dua fase : Learning/pembelajaran

Lebih terperinci

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL ABSTRAK

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL ABSTRAK PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL Oleh Pembimbing : Bambang Setiawan : 1. Prof. Ir. Raden Sjarief Widjaja, Ph.D 2. DR-Ing. Ir. Setyo Nugroho ABSTRAK Salah

Lebih terperinci

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA 53 ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA Marwana*) Abstract : Abstract-This study is a simulation for memperiksi victory in a football game using the C4.5 data

Lebih terperinci

ID3 : Induksi Decision Tree

ID3 : Induksi Decision Tree ID3 : Induksi Decision Tree Singkatan: Iterative Dichotomiser 3 Induction of Decision "3" (baca: Tree Pembuat: Ross Quinlan, sejak akhir dekade 70-an. Pengembangan Lanjut: Cikal bakal algoritma C4.5, pada

Lebih terperinci

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis ALGORITMA C4.5 Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis NO OUTLOOK TEMPERATURE HUMIDITY WINDY PLAY 1 Sunny Hot High FALSE No

Lebih terperinci

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy Sebelumnya... Sistem Pakar berbasis Logika Fuzzy Kecerdasan Buatan Pertemuan 10 Pembelajaran Mesin (Machine Learning) Kelas 10-S1TI-03, 04, 05 Husni Lunix96@gmail.com http://komputasi.wordpress.com S1

Lebih terperinci

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret 2013 12 PENERAPAN ALGORITMA C 4.5 DALAM MEMPEROLEH DECISION TREE UNTUK MEMPREDIKSI PENENTUAN RESIKO KREDIT PADA BANK BPR BUKITTANDANG MANDIRI PADANG MENGGUNAKAN

Lebih terperinci

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3 32 PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3 Yo el Pieter Sumihar* 1, Idris Efendi 2 1,2,3 Jurusan Komputer, Teknik Informatika, Fakultas Sains dan Komputer,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani Jurusan Sistem Informasi, STMIK MDP Palembang Jln. Rajawali No.14 Palembang 30113 Telp. (0711) 376400, Faks.

Lebih terperinci

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE Yusni Amaliah 1), Ummi Syafiqoh 2), Eviana Tjatur Putri (3) 1,2) Sistem

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: 1907-5022 Yogyakarta, 15-16 Juni 2012 PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani

Lebih terperinci

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU Jonathan Rinaldy 1) 1) Program Studi Teknik Informatika, Sekolah Tinggi Informatika & Komputer

Lebih terperinci

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG 1 Ati Suci Dian Martha, 2 Afryanto Redy 1 Program Studi Sistem Informasi STMIK LPKIA 1 Program Studi Sistem Informasi

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1. Algoritma C4.5 1 Kusrini, 2 Emha Taufiq Luthfi 1 Jurusan Sistem Informasi, 2 Jurusan Teknik Informatika 1, 2 STMIK AMIKOM Yogykakarta 1,2 Jl. Ringroad Utara Condong Catur Sleman Yogyakarta Untuk memudahkan

Lebih terperinci

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL) KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL) Budi Utami 1, Yuniarsi Rahayu, 2 1,2 Program Studi Teknik Informatika, Fakultas Ilmu Komputer,

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penerimaan Mahasiswa Baru

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penerimaan Mahasiswa Baru Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penerimaan Mahasiswa Baru Wahyudin Program Studi Ilmu Komputer Universitas Pendidikan Indonesia Abstrak Konsep pohon merupakan salah satu konsep teori graf

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom LEARNING ARTIFICIAL INTELLIGENT Dr. Muljono, S.Si, M. Kom Outline Decision tree learning Jaringan Syaraf Tiruan K-Nearest Neighborhood Naïve Bayes Decision Tree Learning : Klasifikasi untuk penerimaan

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK

TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK 1 Nurma Jayanti Sulistyo Puspitodjati 3 Tety Elida 1 jurusan sistem informasi, universitas gunadarma

Lebih terperinci

1. Pendahuluan 2. Kajian Pustaka

1. Pendahuluan 2. Kajian Pustaka 1. Pendahuluan PTPN IX kebun Ngobo, Ungaran adalah salah satu perusahaan yang bergerak dalam bidang pertanian tanaman semusim dan tahunan. Karet termasuk dalam hasil pertanian tanaman tahunan. Menurut

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM Oleh: BENI KURNIAWAN 12.1.03.02.0201 Dibimbing oleh : 1. Resty

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik

Lebih terperinci

Klasifikasi & Prediksi

Klasifikasi & Prediksi Klasifikasi & Prediksi Elsen Ronando, S.Si.,M.Si.,M.Sc. elsen.ronando@untag-sby.ac.id Teknik Informatika Fakultas Teknik Universitas 17 Agustus 1945 Surabaya 2017 Elsen Ronando, S.Si.,M.Si.,M.Sc. (UNTAG)

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Disusun oleh : Budanis Dwi Meilani Achmad dan Fauzi Slamat Jurusan Sistem Informasi Fakultas Teknologi Informasi.

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015 Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 JUDUL ARTIKEL Identifikasi Kualitas Beras dengan Citra Digital Arissa

Lebih terperinci

ditinjau dari masalah yang ada, objek penelitian dan metode yang digunakan percobaan pada beban dan tegangan input yang berbeda dalam dua keadaan loop

ditinjau dari masalah yang ada, objek penelitian dan metode yang digunakan percobaan pada beban dan tegangan input yang berbeda dalam dua keadaan loop BAB II TINJAUAN PUSTAKA DAN DASAR TEORI.. Tinjauan Pustaka Dalam penelitian ini, penulis menggunakan beberapa sumber pustaka. Sumber pustaka yang dimaksudkan untuk digunakan sebagai pedoman dan pembanding

Lebih terperinci

TUGAS KONSEP DASAR DATA MINING

TUGAS KONSEP DASAR DATA MINING TUGAS KONSEP DASAR DATA MINING Di susun Oleh: Nurkholifah Npm : 2014210052 FAKULTAS ILMU KOMPUTER JURUSAN SISTEM INFORMASI UNIVERSITAS INDO GLOBAL MANDIRI TAHUN 2016 BAB I PENDAHULUAN 1.1 Latar Belakang

Lebih terperinci

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL Besse Helmi Mustawinar Teknik Informatika FTKOM Universitas Cokroaminoto Palopo Jl Latamacelling Nomor 19 Palopo,

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pengunduran Diri Mahasiswa Hampir tidak ada perguruan tinggi baik negeri maupun swasta (PTN/PTS) yang tidak pernah mahasiswanya mengundurkan diri sebagai mahasiswa di PTN/PTS

Lebih terperinci

Manfaat Pohon Keputusan

Manfaat Pohon Keputusan DECISION TREE (POHON KEPUTUSAN) Latar Belakang Pohon Keputusan Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh berbagai macam masalah dari berbagai macam bidang. Masalah-masalah

Lebih terperinci

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN 116 IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN Rismayanti 1 1 Dosen Tetap Program Studi Teknik Informatika, Sekolah Tinggi Teknik Harapan Medan Jl. H.M Joni No.70

Lebih terperinci

BAB III ANALISIS DAN DESAIN SISTEM

BAB III ANALISIS DAN DESAIN SISTEM BAB III ANALISIS DAN DESAIN SISTEM III.1. Analisis Masalah Berdasarkan analisis masalah, maka perangkat lunak sistem data mining menggunakan algoritma C4.5 untuk prediksi ketepatan waktu kelulusan yang

Lebih terperinci

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE Asmah 1), Mussallimah 2), Indrianti 3) 1,2,3) Sistem Informasi STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso rt. 06

Lebih terperinci

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3 APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3 SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Sistem

Lebih terperinci

Decision Tree. Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003

Decision Tree. Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003 Decision Tree Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003 Konsep Decision Tree Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule)

Lebih terperinci

Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree?

Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree? Classification Decision Tree esi 09 Dosen Pembina : Danang Junaedi IF-UTAMA 1 IF-UTAMA Konsep Decision Tree Decision Tree Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan

Lebih terperinci

PENERAPAN ALGORITMA ID3 DAN C45 DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK

PENERAPAN ALGORITMA ID3 DAN C45 DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK PENERAPAN ALGORITMA ID3 DAN C45 DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK Novyana Arista 1, Martaleli Bettiza, S.Si, M.Sc,. 2, Hendra Kurniawan, S.Kom., M.Sc.Eng. 3 Mahasiswa

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan digunakan untuk mengklasifikasi

Lebih terperinci

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK Abet Alpha P Yetli Oslan Abstrak Ketepatan pemilihan rekomendasi produk bagi konsumen

Lebih terperinci

PRAKTIKUM KE-5 KLASIFIKASI I

PRAKTIKUM KE-5 KLASIFIKASI I PRAKTIKUM KE-5 KLASIFIKASI I 1. Tujuan Praktikum 1) Mahasiswa mempunyai pengetahuan dan kemampuan dasar mengenai metode pencarian pengetahuan / pola data dari sejumlah data dengan menggunakan teknik klasifikasi.

Lebih terperinci

Sistem Klasifikasi Jamur Dengan Algoritma Iterative Dichotomiser 3

Sistem Klasifikasi Jamur Dengan Algoritma Iterative Dichotomiser 3 ISSN: 2528-4061 27 Sistem Klasifikasi Jamur Dengan Algoritma Iterative Dichotomiser 3 Junita Eka Sari 1, Nesi Syafitri 2 1,2 Program Studi Teknik Informatika, Fakultas Teknik, Universitas Islam Riau e-mail:

Lebih terperinci

Modul IV KLASIFIKASI

Modul IV KLASIFIKASI LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul IV KLASIFIKASI TUJUAN PRAKTIKUM Setelah mengikuti praktikum modul ini diharapkan: 1. Mahasiswa

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB II TINJAUAN PUSTAKA Sistem Pendukung Keputusan (Decision Support System)

BAB II TINJAUAN PUSTAKA Sistem Pendukung Keputusan (Decision Support System) BAB II TINJAUAN PUSTAKA 2.1. Sistem Pendukung Keputusan (Decision Support System) Sistem Pendukung Keputusan (SPK) merupakan sistem yang dibuat untuk membantu mengambil keputusan oleh komputer dalam suatu

Lebih terperinci

Pohon Keputusan. 6.1 Inductive Learning

Pohon Keputusan. 6.1 Inductive Learning 6 Pohon Keputusan Sometimes you make the right decision, sometimes you make the decision right. Phil McGraw Bab ini akan menelaskan salah satu varian pohon keputusan yaitu ID3 oleh Quinlan [27, 28] yang

Lebih terperinci

PENGEMBANGAN SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN KARYAWAN MENGGUNAKAN METODA POHON KEPUTUSAN ID3

PENGEMBANGAN SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN KARYAWAN MENGGUNAKAN METODA POHON KEPUTUSAN ID3 PENGEMBANGAN SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN KARYAWAN MENGGUNAKAN METODA POHON KEPUTUSAN ID3 Youllia Indrawaty N 1), Mira Musrini Barmawi 2), Andreas Sinaga 3) 1,2,3) Jurusan Teknik Informatika,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Studi Sebelum menyusun tugas akhir ini dilakukan tinjauan pustaka terlebih dahulu terhadap penelitian-penelitian terkait sebagai bahan referensi. Penelitian tentang

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1. Penelitian Terdahulu Dalam penelitian sebelumnya yang berjudul "Perancangan Klasifikasi Penerimaan Beasiswa Menggunakan Algoritma ID3 (Iterative Dichotomizer

Lebih terperinci

Jurnal KomTekInfo Fakultas Ilmu Komputer, Volume 1, No. 2, Desember 2014 ISSN :

Jurnal KomTekInfo Fakultas Ilmu Komputer, Volume 1, No. 2, Desember 2014 ISSN : ALGORITMA C4.5 DALAM MENGANALISA KELAYAKAN KREDIT(STUDI KASUS DI KOPERASI PEGAWAI REPUBLIK INDONESIA (KP-RI) LENGAYANG PESISIR SELATAN, PAINAN, SUMATERA BARAT) Shary Armonitha Lusinia, S.Kom, M.Kom, Fakultas

Lebih terperinci

SATIN Sains dan Teknologi Informasi

SATIN Sains dan Teknologi Informasi SATIN Sains dan Teknologi Informasi journal homepage : http://jurnal.stmik-amik-riau.ac.id Implementasi Algoritma C4.5 dalam Memprediksi Masa Studi Mahasiswa STMIK Dumai. Asparizal Jurusan Teknik Informatika,

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik

Lebih terperinci

PENERAPAN DATA MINING UNTUK MENGANALISA KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA BARU

PENERAPAN DATA MINING UNTUK MENGANALISA KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA BARU PENERAPAN DATA MINING UNTUK MENGANALISA KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA BARU Tacbir Hendro Pudjiantoro, Faiza Renaldi, dan Age Teogunadi Universitas jenderal Achmad Yani Cimahi tacbir235127@yahoo.com

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) / Decision Support Sistem (DSS) adalah sistem komputer yang saling berhubungan dan menjadi alat bantu bagi seorang

Lebih terperinci

MODUL 12 Model Prediktif

MODUL 12 Model Prediktif MODUL 12 Model Prediktif Prediktif Analytics adalah teknologi yang menangkap proses data mining dalam rutinitas sederhana. Kadang-kadang disebut "one-click data mining," Model ini menyederhanakan dan mengotomatisasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Tinjauan pustaka atau disebut juga kajian pustaka (literature review) merupakan sebuah aktivitas untuk meninjau atau mengkaji kembali berbagai

Lebih terperinci

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4. KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.1 Muhammad Syahril Program Studi Sistem Informasi, STMIK Triguna

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ yudi@upi.edu / Okt 2012 Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan

Lebih terperinci

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Seno Setiyawan 1, Yuliana Susanti 2,Tri Atmojo Kusmayadi 3 1,3 Program Studi Matematika FMIPA, Universitas Sebelas Maret 2 Program

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse 1.1.Pengumpulan data BAB IV HASIL DAN PEMBAHASAN Data yang digunakan dalam penelitian ini adalah data warehouse Graduation Universitas Muhammadiyah Yogyakarta pada Fakultas Teknik UMY tahun kelulusan 2013,

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

ALGORITMA C4.5 UNTUK PENILAIAN KINERJA KARYAWAN

ALGORITMA C4.5 UNTUK PENILAIAN KINERJA KARYAWAN SCAN VOL. IX NOMOR JUNI 014 ISSN : 1978-0087 ALGORITMA C4.5 UNTUK PENILAIAN KINERJA KARYAWAN Windy Julianto 1, Rika Yunitarini, Mochammad Kautsar Sophan 3 Universitas Trunojoyo Madura windy.julianto@gmail.com

Lebih terperinci

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI ) Artikel Skripsi APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI ) SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer

Lebih terperinci

ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA

ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA ISSN : 1978-6603 ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA Dian Wirdasari Program Studi Ilmu Komputer, Universitas Sumatera Utara Jl. Alumni No. 9 Kampus USU

Lebih terperinci

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/2007 - Maret 2007 Sub Materi: ID3: Induksi Decision Tree Ross Quinlan Ross Quinlan Pengembang algoritma ID3 pada akhir dekade

Lebih terperinci

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS IPLEENTASI DECISION TREE UNTUK EPREDIKSI JULAH AHASISWA PENGABIL ATAKULIAH DENGAN ENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORATIKA ITS Romauli anullang - 5108100501 Latar Belakang Pembuatan jadwal pada

Lebih terperinci

Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan

Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan Decision Making Using Iterative Dichotomizer 3 Algorithm Arief Kelik Nugroho *1,Dadang Iskandar *2 ariefkeliknugroho@gmail.com dadangiskandar83@gmail.com

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

ARTIKEL. Oleh: SONNY SUSANTO Dibimbing oleh : 1. Fatkur Rhohman, M.Pd. 2. Danar Putra Pamungkas, M.Kom.

ARTIKEL. Oleh: SONNY SUSANTO Dibimbing oleh : 1. Fatkur Rhohman, M.Pd. 2. Danar Putra Pamungkas, M.Kom. ARTIKEL PENENTUAN PENERIMA BKSM (BANTUAN KHUSUS SISWA MISKIN) MENGGUNAKAN METODE CART (CLASSIFICATION AND REGRESSION TREE) (STUDI KASUS : SMKS AL-MAHRUSIYAH KOTA KEDIRI) Oleh: SONNY SUSANTO 13.1.03.02.0008

Lebih terperinci

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE A Sofalul Khazari 1), Fitri Marisa 2), Indra Dharma Wijaya 3) 1) Mahasiswa Fakultas Teknik, Universitas Widyagama Email: khazari.sofalul@gmail.com

Lebih terperinci

Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan

Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan Decision Making Using Iterative Dichotomizer 3 Algorithm Arief Kelik Nugroho 1, Dadang Iskandar 2 1 ariefkeliknugroho@gmail.com 2 dadangiskandar83@gmail.com

Lebih terperinci

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA IMPLEMENTATION OF DATA MINING WITH C4.5 ALGORITHM TO PREDICT STUDENT ACHIEVEMENT Oleh: SITI MUHIMATUL KHOIROH NPM

Lebih terperinci

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal) 1 KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal) Budi Utami Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131

Lebih terperinci