Implementasi Hypergraph Partitioning untuk Ekstraksi Topik

Ukuran: px
Mulai penontonan dengan halaman:

Download "Implementasi Hypergraph Partitioning untuk Ekstraksi Topik"

Transkripsi

1 Implementasi Hypergraph Partitioning untuk Ekstraksi Topik Gestyana Ari Restanti 1, Diana Purwitasari 2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember 1 scratch_me@cs.its.ac.id 2 diana@if.its-sby.edu Abstract Pengelompokkan dan pengklasifikasian dokumen merupakan metode yang digunakan pengguna untuk mengorganisir koleksi dokumen yang dimiliki. Salah satu metode pengelompokan atau klasifikasi yang digunakan adalah berdasarkan topik yang dibicarakan. Ada kalanya dalam suatu koleksi dokumen tidak diketahui topik yang sedang dibicarakan atau pengguna ingin mengelompokkan dokumen dengan kelompok ketegori topik yang baru. Untuk itu diperlukan identifikasi topik dengan menggunakan kata kunci (keyword). Ekstraksi topik bertujuan untuk mengumpulkan kata kata kunci yang ada pada suatu koleksi dokumen sehingga dapat digunakan untuk mengenali topik. Hubungan antar kata dalam koleksi dokumen dimodelkan menjadi suatu hyper(graph) dengan kata kata sebagai vertex dan kekuatan hubungan antar kata sebagai edge yang memiliki bobot (weighted edge). Partisi dilakukan menggunakan metode hypergraph partitioning dengan memotong graph yang ada menjadi sub-sub graph yang berisi kata kata kunci (keyword) untuk mengenali topik. Metode hypergraph partitioning yang digunakan adalah Fiduccia-Mattheyesse dan k-way Spectral Clustering. Algoritma Fiduccia-Mattheyesse menggunkan pertukaran node antar partisi secara berulang untuk menghasilkan partisi yang diinginkan. Sedangkan k-way spectral clustering menggunakan konsep pengelompokkan menggunakan matriks eigenvector yang dihasilkan oleh graph. Pada uji coba yang dilakukan, kedua algoritma telah berhasil menghasilkan partisi kata kata kunci. Dan pada tiap partisi dapat dikenali topik apa yang sedang dibicarakan. Namun, algoritma k-way spectral clustering menunjukkan performa yang lebih baik dari pada Fiduccia-Mattheyses dengan nilai presisi mencapai 72,99% dan recall 43,90%. Keywords ekstraksi topik, hypergraph partitioning, Fiduccia- Mattheyesse, spectral clustering I. PENDAHULUAN Dasar dari proses pengenalan topik adalah adanya kelompok kata-kata yang umum digunakan (frequent itemsets) untuk setiap topik. Untuk mendapatkan kelompok kata kata tersebut digunakanlah metode ekstraksi topik. Permasalahan yang timbul adalah bagaimana dari kata kata yang terdapat dalam dokumen dapat dikelompokan sehingga dari setiap kelompok kata diharapkan mewakili topik yang dibicarakan. Dalam tugas akhir ini digunakan metode berbasis graph untuk menyelesaikan permasalahan pengelompokan kata. Frequent itemsets dalam koleksi dokumen akan dipetakan kedalam hyper(graph) dimana verteks verteksnya mewakili kata dan edge mewakili kekuatan hubungan antar kata. Untuk mengekstrak topik sama halnya dengan mempartisi hyper(graph) kedalam sub-sub graph. Dimana sub-graph tersebut berisi daftar kata yang diharapkan merupakan penggambaran dari suatu topik. Hypergraph adalah suatu bentuk graph dimana edgenya dapat menghubungkan lebih dari dua verteks, yang disebut juga hyperedge. Sedangkan hypergraph partitioning adalah suatu proses untuk membagi - bagi hypergraph ke dalam sub sub hypergraph atau graph. Permasalahan yang timbul adalah bagaimana membagi hypergraph sedemikian hingga sehingga jumlah hyperedge yang dihilangkan tetap minimal dan sesuai dengan batasan yang diberikan. Aplikasi hmetis (Karypis & Kumar, Universitas Minnesota), MLPart (Caldwell, Kahng, & Markov, UCLA), Mondriaan (Bisseling & Meesen, Ultrecth University), Parkway, PaToH, serta Zoltan-PHG merupakan beberapa aplikasi untuk hypergraph partitioning. Namun, aplikasi aplikasi tersebut hanya didapat dalam bentuk binary (.exe), sehingga tidak diketahui secara jelas prosesnya. Dan dalam penggunaannya memiliki beberapa batasan yang harus dipenuhi, seperti format masukan. Dalam hmetis format masukan berupa file text, sedangkan MLPart menggunakan Bookshelf Benchmark (format yang digunakan dalam VLSI). Untuk lebih memahami cara kerja hypergraph partitioning yang ada serta mengimplementasikannya dalam ekstraksi topik, dalam paper ini digunakan algoritma Fiduccia-Mattheyses (FM) serta k-way Spectral Clustering dalam implementasi hypergraph partitioning. Dalam implementasi ini, artikel artikel dalam koleksi dokumen akan melalui prapemrosesan (preprocessing) untuk menemukan frequent itemsets kemudian dicari 2-frequent itemsets yang akan digunakan untuk membangitkan graph sebagai bentuk masukan dalam proses partitioning. Dan akhirnya akan dihasilkan beberapa kelompok kata yang merupakan hasil proses partitioning. II. HYPERGRAPH PARTITIONING Hypergraph adalah suatu bentuk graph yang dimana edge-nya dapat menghubungkan dua atau lebih verteks yang disebut juga hyperedges. Pada suatu hypergraph H, ketika dilakukan partisi sebanyak k partitioning, yang dimaksud adalah membagi verteks - verteks dari H ke k bagian yang terpisah [1]. Permasalahan k-way partitioning adalah bagaimana meminimalisir jumlah hyperedges yang terpotong atau pada hyperedge yang berbobot adalah jumlah bobot dari edge-edge yang terpotong. 1

2 A. Algoritma Fiduccia-Mattheyeses Algoritma Fiduccia-Mattheyeses [2] (selanjutnya disebut algoritma FM) adalah algoritma bisection partitioning yang bersifat heuristic. Dikembangkan oleh C.M.Fiduccia & R.M. Mattheyses pada tahun Algoritma ini menerapkan konsep menukar per-satu node pada setiap iterasinya. Hal ini berbeda dengan algoritma Kernighan-Lin [3] yang menukar sepasang nodes pada setiap iterasinya. FM dimulai dengan random solusi yang memungkinkan (initial partitioning, verteks verteks secara random dibagi menjadi dua partisi) dan merubah solusi tersebut dengan pergerakan terus-menerus yang disebut sebagai passes. Pada awal pass, semua verteks bebas untuk bergerak (unlocked), dan setiap kemungkinan pergerakan ditandai dengan gain (gain yang bertanda positif akan mengurangi cost sedangkan bertanda negative akan meningkatkan cost). Secara berulang, pergerakan yangg memiliki gain terbesar akan dipilih dan dieksekusi (dengan kata lain, verteks yang memiliki gain terbesar akan dipindah posisi partisinya) kemudian verteks yang bergerak akan dikunci (tidak diperbolehkan untuk berpindah lagi). Karena pergerakan tersebut menimbukan perubahan gain pada verteks - verteks yang lainnya, maka gain akan kembali dihitung. Pemilihan dan pengeksekusian pergerakan gain yang terbaik dilanjutkan dengan update gain dilakukan secara berulang sampai semua vertex terkunci. Solusi terbaik adalah partisi yang memiliki cost yang paling rendah. B. K-way spectral Clustering Bila terdapat satu set data points x1,... xn dan nilai kesamaan s ij >= 0 diantara semua data points xi dan xj, tujuan dari clustering adalah membagi datapoints tersebut kedalam beberapa kelompok sehingga data - data yang terdapat dalam satu kelompok adalah mirip dan data - data yang berada di kelompok - kelompok yang berbeda, tidak memiliki kemiripan satu sama lain. Data points dan nilai kemiripannya dapat digambarkan dengan similarity graph G = (V,E). Verteks vi pada graph mewakili data points xi. Dua verteks berhubungan bila nilai kemiripan sij antara data points yang berhubungan xi dan xj > 0. Nilai kemiripan tersebut merupakan perwakilan dari bobot edge. Dari penjelasan tersebut permasalahan dari pengelompokan (clustering) sekarang dapat diformulasikan dengan menggunakan similarity graph: yang diinginkan adalah menemukan partisi dari graph dimana edge diantara kelompok yang berbeda memiliki bobot yang rendah (mengindikasikan ketidakmiripan antar kelompok) dan edgeedge dalam satu kelompok memiliki bobot yang tinggi. Pada Gambar 1 adalah algoritma k-way spectral clustering [4]. Algoritma K-way Spectral Clustering Input : Similarity Graph, Jumlah cluster yang ingin dibentuk (k). Buat adjacency matrix (A) berdasarkan similarity graph. Hitung Matrix Degree (D) Hitung Matrix Laplacian (L = D - A) Hitung k-pertama dari eigenvector. (Eigenvalues akan selalu diurutkan dari terkecil sampai terbesar. k-pertama eigenvector diartikan sebagai eigenvector yang berhubungan dengan k- terkecil eigenvalue). menjadi matrix yang berisi vektor v 1,...v k sebagai kolom. Untuk i = 1,...,n menjadi vektor yang berhubungan dengan baris ke i pada. Cluster points pada dalam dengan algoritma k-means kedalam cluster C1,.., Ck. Output : C i,..., C k Gambar 1 Algoritma K-way Spectral Clustering III. PEMBENTUKAN HYPERGRAPH A. Proses Identifikasi Node dari Koleksi Dokumen Metode pembobotan tf-idf dilakukan untuk mengidentifikasi node darei koleksi dokumen. Yang dengan kata lain; menentukan kata apa saja yang dianggap penting dalam artikel dari daftar kata yang diperoleh dari pendataan kata. Kata-kata penting ini yang nantinya digunakan dalam untuk mencari frequent 2-itemsets. Bobot nilai tf.idf untuk semua daftar kata kemudian diurutkan dari yang paling tinggi hingga yang paling rendah. Dari bobot tf.idf yang telah urut, diambil 30 % bobot teratas. Bobot terendah dalam 30% teratas tersebut yang digunakan sebagai nilai bobot minimal sebuah kata dianggap sebagai kata penting. Dan berikut pada Gambar 2 akan digambarkan alurnya.. B. Penentuan Frequent 2-itemsets Proses identifikasi relasi antar node [5] dimulai dengan mendata kemungkinan seluruh pasangan kata. Kemudian dicari nilai kemungkinan berapa banyak dokumen munculnya pasangan kata tersebut diseluruh koleksi dokumen. Dari nilai probabilitas tersebut diurutkan dan 30% nilai probabilitas teratas. Dan nilai terendah dari 30% bobot teratas merupakan nilai batas untuk filter support. Pasangan kata yang lolos merupakan pasangan dengan relasi terkuat. 2

3 Setelah itu dilakukan pencarian nilai kemungkinan terdapat berapa banyak dokumen munculnya suatu term. Kemudian dilakukan penghitungan dengan rumus : Setelah mendapatkan nilai confidence 30% dari nilai tertinggi kemudian diurutkan dan nilai terendah dari 30% teratas tersebut merupakan batas minimum. Hasilnya dikenali dengan nama frequent 2-itemsets yang merupakan dasar pembentukan hyper(graph). Dengan pasangan kata kata sebagai verteks. Dan nilai relasi antar kata sebagai bobot edge. Alur prose digambarkan pada Gambar 3. Gambar 2 Identifikasi Node dari Koleksi Dokumen Gambar 3 Identifikasi Relasi antar Node A. Desain Sistem IV. DESAIN DAN IMPLEMENTASI Masukan awal sistem berupa artikel dokumen yang tersimpan dalam database sistem. Selanjutnya isi dari artikel ini akan Masukan awal berupa artikel dokumen yang tersimpan dalam database sistem. Selanjutnya isi dari artikel ini akan melalui proses preprocessing (pengidexan, penhapusan stopword, stemming) kemudian dicari kata-kata pentingnya dengan metode pembobotan tf-idf (Identifikasi kandiat node). Setelah itu didaftar pasangan kata yang memungkinkan. Dilakukan proses filter yang memenuhi kriteria support dan confidence untuk menentukan pasangan kata dengan relasi terkuat (identifikasi relasi antar node). Dari proses tersebut didapat frequent 2-itemsets sebagai dasar pembangkitan hyper(graph). Frequent 2-itemsets merupkan data masukan untuk proses partitioning. Untuk metode pertama adalah menggunakan algoritma fiduccia mattheyes (FM). Dan metode kedua adalah k-ay Spectral Clustering. Untuk alur proses akan dijelaskan lebih lanjut pada sub-bab berikutnya. Dan berikut ini pada Gambar 4 adalah alur secara umum proses dalam implementasi hypergraph partitioning untuk ekstraksi topik. B. Implementasi dengan FM Frequent 2-itemsets yang dihasilkan pada proses sebelumnya merupakan hyper(graph) yang akan dipartisi. Langkah pertama adalah membagi verteks verteks tersebut menjadi dua partisi secara random. Langkah selanjutnya adalah mencari nilai gain dan menentukan nilai gain terbesar. Verteks yang mempunyai nilai gain terbesar akan dipindahkan dari lokasi partisi yang ada saat ini dan statusnya menjadi terkunci, dengan kata lain tidak dapat lagi berpindah. Setelah itu menghitung minimal cost. Ulangi lagi mulai dari langkah kedua sampai semua verteks statusnya menjadi locked. Diagram Alir dapat dilihat pada Gambar 5. 3

4 C. Implementasi dengan k-way spectral clustering Untuk metode partitioning k-way spectral clustering, hal yang pertama dilakukan adalah mengubah data menjadi bentuk matrix Adjacency. Kemudian dicari matriks Degree dan hitung Matrix Laplacian. Setelah menemukan Matrix Laplacian hitung nilai eigenvalue. Ambil k pertama nilai eigenvalue dan ketahui eigenvector yang berkorespondensi dengannya. Setelah didapat nxk eigenvector, lakukan clustering dengan algoritma k-means dengan cluster sebanyak k cluster. Pada tahapan clustering dengan k-means hal yang pertama dilakukan adalah mengubah matrix nxk yang didapat dari eigenvector menjadi matrix nx2 termvector. Proses mengubahnya menggunakanmetide SVD dengan library lingpipe,jar. Setelah mendapatkan termvector lakukan proses k Clustering dengan k-meansdiagram Alir dapat dilihat pada Gambar 6. Gambar 4 Proses Implementasi Hypergraph Partitioning untuk Ekstraksi Topik Gambar 5 Proses Fiduccia-Mattheyses Gambar 6 Proses K-way Spectral Clustering 4

5 V. UJI COBA SISTEM Uji coba dilakukan dengan mengukur tingkat presisi dan recall masing masing algoritma. Masing masing algoritma di uji coba menggunakan dataset berasal dari 20news group yang memiliki 4 topik uatama yaitu (A) computer, (B) sport, (C) science, dan (D) politics. Masing masing topik utama tersebut memiliki dua subtopik yaitu; (A1) computer.operating system, (A2) computer.graphics, (B1) sport.baseball, (B2) sport.hockey (C1) science.electronics, (C2) science.medicine, (D1) politics.gun, dan (D2) politics.mideast. Uji coba untuk masing masing algoritma dilakukan dengan 4 dan 8 partisi. Dengan tujuan, pada 4 partisi penentuan kerelevanan partisi dapat dilihat dari kecenderungan partisi tersebut mengarah pada 4 topik utama. Demikian juga pada 8 partisi, penentuan relevansi dapat dilihat dari kecenderungan partisi terhadap 8 sub topik. Pada uji coba partitioning dengan algoritma Fiduccia-Mattheyses dengan empat (4) partisi didapat 4 partisi dengan kecenderungan pada partisi (1) topik computers dengan presisi 41,43% (2) topik politics dengan presisi 45% (3) topik science dengan presisi 60,98% dan (4) topik sport dengan presisi 14,29%. Rata rata tingkat presisi pada uji coba partitioning dengan Fiduccia-Mattheyses adalah 40,42% dan rata rata recall = 23,48%. Sedangkan dengan delapan (8) partisi didapat 8 partisi dengan kecenderungan pada partisi ; (1) topik politics.mideast dengan presisi 53,85% (2) topik computer.graphics dengan presisi 25% (3) topik sport.hockey dengan presisi 12,50% (4) topik sport.baseball dengan presisi 10,71%. (5) topik computer.operating system dengan presisi 42,42% (6) topik science.electronics dengan presisi 48% (7) topik politics.guns dengan presisi 45,83% (8) topik science.medis dengan presisi 54,55%. Rata - rata tingkat presisi pada uji coba partitioning dengan Fiduccia-Mattheyses adalah 36,61% dengan recall 20,30%. Pada uji coba partitioning dengan algoritma k-way spectral clustering dengan empat (4) partisi didapat 4 partisi dengan kecenderungan pada partisi (1) topik computers dengan presisi 61,36% (2) topik science dengan presisi 75% (3) topik politics dengan presisi 80,60% dan (4) topik sport dengan presisi 75%. Rata rata tingkat presisi pada uji coba partitioning dengan k-way spectral clustering adalah 72,99%. Untuk uji recall didapat nilai 43,90%. Pada uji coba dengan delapan (8) partisi didapat 8 partisi dengan kecenderungan pada partisi ; (1) topik science.electronics dengan presisi 20% (2) topik science.medicine dengan presisi 100% (3) topik computer.operating system dengan presisi 25% (4) topik sport.hockey dengan presisi 71%. (5) topik politics.guns dengan presisi 50% (6) topik politics.mideast dengan presisi 54% (7) topik sports.baseball dengan presisi 85% (8) topik computer.graphics dengan presisi 53%. Rata - rata tingkat presisi pada uji coba partitioning dengan k- way spectral clustering adalah 57,28% dengan nilai recall = 36,61%. VI. SIMPULAN Dari hasil uji coba yang telah dilakukan dapat dilihat bahwa ekstraksi topik dengan menggunakan hypergraph partitioning metode k-way spectral clustering menghasilkan nilai presisi (72,99% dan 57,28%) yang lebih tinggi daripada partitioning dengan metode fiduccia-mattheyses (40,42% dan 36,61%). Pada uji recall metode k-way spectral clustering juga mendapatkan hasil yang lebih baik (43,90% dan 31,11%). Dari pada metode FM yang memiliki nilai recall rata rata 23,48% dan 20,30%. Terdapat beberapa alasan yang memungkinkan terjadinya partitioning yang tidak sempurna, antara lain adalah terlalu tingginya kriteria support dan confidence. Sehingga terdapat beberapa dokumen yang tidak terwakili. Namun, bila nilai kriteria support dan confidence terlalu rendah, dikhawatirkan kata kata yang ada bukanlah kata yang mewakili koleksi dokumen. Pada metode fiduccia-mattheyses kemungkinan penyebab tingkat presisi rendah terjadi karena, pada metode ini batasan partisi selain dari minimal cut edge juga dari keseimbangan jumlah partisi. Dengan kata lain metode FM ini memaksakan agar pada tiap partisi anggotanya berjumlah hampir sama (seimbang). Hal ini menjadi permasalahan karena ada kalanya terjadi kata yang seharusnya berada di partisi A terpaksa berada di partisi B untuk memenuhi batasan keseimbangan. Namun, metode k-way spectral clustering juga bukanlah metode yang sempurna. Bila melihat analisa A5 pada halaman lampiran, masih terdapat partisi yang hanya memiliki 2 anggota, yang tentunya sulit untuk diketahui topik apa yang dibicarakan pada partisi tersebut. Walaupun sudah terlihat perbedaan topik antar tiap partisi. Hal ini terjadi karena beberapa alasan salah satu kemungkinanya adalah; iterasi yang digunakan dalam clustering k-means belum mencapai tingkat konvergen (pada uji coba digunakan iterasi = 100). [1] Papa, David A. & Markov, Igor L Hypergraph Partitioning and Clustering. University of Michigan. [2] Fiduccia, C.M. & Mattheyses, R. M. A Linear-Time Heuristic for Improving Network Partitions. [3] B. W. Kernighan and S. Lin An Efficient Heuristic Procedure for Partitioning Graphs. Bell System Tech. Journal, pp References [4] Luxburg, Ulrike von. Technical Report No. TR-149 : A Tutorial on Spectral Clustering. Max Planck Institute for Biological Cybernetics. [5] Purwitasari, D., & Okazaki, Y., & Watanabe, K. Content-based Navigation in Webbased Learning Application. In ICCE '08: Proc. of the 16th International Conference on Computer Education, pp

IDENTIFIKASI TOPIK PADA KOLEKSI DOKUMEN MENGGUNAKAN ALGORITMA PENGKLASTERAN HYPERGRAPH PARTITIONING

IDENTIFIKASI TOPIK PADA KOLEKSI DOKUMEN MENGGUNAKAN ALGORITMA PENGKLASTERAN HYPERGRAPH PARTITIONING IDENTIFIKASI TOPIK PADA KOLEKSI DOKUMEN MENGGUNAKAN ALGORITMA PENGKLASTERAN HYPERGRAPH PARTITIONING Diana Purwitasari dan Gestyana Ari Restanti Jurusan Teknik Informatika, Fakultas Teknologi Informasi,

Lebih terperinci

Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor

Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor Murni dan Tri Handhika Pusat Studi Komputasi Matematika Universitas Gunadarma, Depok {murnipskm, trihandika}@staff.gunadarma.ac.id

Lebih terperinci

Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor

Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor Implementasi Hypergraph Partitioning pada Paralelisasi Perkalian Matriks-Vektor 1 Murni dan 2 Tri Handhika 1,2 Pusat Studi Komputasi Matematika Universitas Gunadarma, Depok 1 murnipskm@sta.gunadarma.ac.id,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,

Lebih terperinci

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN IMPLEMENTATION OF COMPLETE AND AVERAGE LINKAGE TO THE FORMATION FACULTY RESEARCH GROUP Oleh: DEVY SURYANINGTYAS 12.1.03.02.0366

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( )

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( ) Sidang Tugas Akhir September 2009 Implementasi Metode Ant Colony Optimization untuk Pemilihan Fitur pada Kategorisasi Dokumen Teks DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS Halimatus Sa dyah, Nurissaidah Ulinnuha Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Pengembangan Perangkat Lunak Prediktor Nilai Mahasiswa Menggunakan Metode Spectral Clustering dan Bagging Regresi Linier

Pengembangan Perangkat Lunak Prediktor Nilai Mahasiswa Menggunakan Metode Spectral Clustering dan Bagging Regresi Linier JURNAL TEKNIK ITS Vol. 1, (Sept, 01) ISSN: 301-971 A-46 Pengembangan Perangkat Lunak Prediktor Nilai Mahasiswa Menggunakan Metode Spectral Clustering dan Bagging Regresi Linier Ahmad Yusuf, Hari Ginardi

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik

Lebih terperinci

ANALISIS KLASTERING LIRIK LAGU INDONESIA

ANALISIS KLASTERING LIRIK LAGU INDONESIA ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,

Lebih terperinci

Aplikasi Algoritma Dijkstra dalam Pencarian Lintasan Terpendek Graf

Aplikasi Algoritma Dijkstra dalam Pencarian Lintasan Terpendek Graf Aplikasi Algoritma Dijkstra dalam Pencarian Lintasan Terpendek Graf Nur Fajriah Rachmah - 0609 Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION

PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION Ahmad Yusuf 1*), Handayani Tandrasa 1) 1) Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB 3 ANALISA SISTEM

BAB 3 ANALISA SISTEM BAB 3 ANALISA SISTEM Pada perancangan suatu sistem diperlakukan analisa yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti yang diinginkan. Setelah dilakukan analisis

Lebih terperinci

HYPERGRAPH-PARTITIONING PADA CO-AUTHORSHIP GRAPH UNTUK PENGELOMPOKAN PENULIS BERDASARKAN TOPIK PENELITIAN

HYPERGRAPH-PARTITIONING PADA CO-AUTHORSHIP GRAPH UNTUK PENGELOMPOKAN PENULIS BERDASARKAN TOPIK PENELITIAN pissn: 2442-3386 eissn: 2442-4293 Vol 1 No 1 January 2015, 61-72 HYPERGRAPH-PARTITIONING PADA CO-AUTHORSHIP GRAPH UNTUK PENGELOMPOKAN PENULIS BERDASARKAN TOPIK PENELITIAN Daniel Swanjaya 1, Chastine Fatichah

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI

Lebih terperinci

Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian

Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian Wiji Lestari, Singgih Purnomo STMIK Duta Bangsa Surakarta ABSTRAK Clustering adalah suatu metode

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Clustering Analysis Clustering analysis merupakan metode pengelompokkan setiap objek ke dalam satu atau lebih dari satu kelompok,sehingga tiap objek yang berada dalam satu kelompok

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI)

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) CLASSIFICATION OF THESIS USING SELF ORGANIZING MAPS CLUSTERING

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI Pada bab ini akan dibahas mengenai beberapa landasan teori yang digunakan untuk perancangan dan pembuatan aplikasi rekomendasi informasi yang bisa dijadikan sebagai acuan. 3.1 Media

Lebih terperinci

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1), Edi Winarko 2) 1) Jurusan Teknik Informatika, Universitas Sebelas Maret E-mail : wir@uns.ac.id 2) Program Studi Ilmu

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1, Edi Winarko 2 1 Jurusan Teknik Informatika, Universitas Sebelas Maret 2 Program Studi Ilmu Komputer, Universitas Gajah

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching Analisis dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma GIndex Analysis and Implementation of Graph Indexing for Graph Database Using GIndex Algorithm Hadyan Arif 1, Kemas Rahmat

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI.. Definisi Graf Secara matematis, graf G didefinisikan sebagai pasangan himpunan (V,E) ditulis dengan notasi G = (V, E), yang dalam hal ini: V = himpunan tidak-kosong dari simpul-simpul

Lebih terperinci

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen 3 METODE Metode penelitian metafile penyusun struktur digraf menggunakan algoritme Document Index Graph (DIG) terdiri atas beberapa tahapan yaitu tahap analisis masalah dan studi literatur dari penelitian

Lebih terperinci

Aplikasi Graf pada Deskripsi Sistem Lokalisasi Robot Humanoid dengan Metode Monte Carlo Localization dan K Means Clustering

Aplikasi Graf pada Deskripsi Sistem Lokalisasi Robot Humanoid dengan Metode Monte Carlo Localization dan K Means Clustering Aplikasi Graf pada Deskripsi Sistem Lokalisasi Robot Humanoid dengan Metode Monte Carlo Localization dan K Means Clustering Miftahul Mahfuzh (13513017) Program Studi Teknik Informatika Sekolah Teknik Elektro

Lebih terperinci

PERINGKASAN TEKS MODEL GRAF PADA SINGLE DOKUMEN DENGAN METODE SPARSE NON NEGATIVE MATRIX FACTORIZATION

PERINGKASAN TEKS MODEL GRAF PADA SINGLE DOKUMEN DENGAN METODE SPARSE NON NEGATIVE MATRIX FACTORIZATION PERINGKASAN TEKS MODEL GRAF PADA SINGLE DOKUMEN DENGAN METODE SPARSE NON NEGATIVE MATRIX FACTORIZATION Irwan Darmawan *1, Reddy Alexandro Harianto 2, Hendrawan Armanto 3 1,2,3 Sekolah Tinggi Teknik Surabaya

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Dyah Herawatie Prodi Sistem Informasi Fakultas Sains dan Teknologi Universitas Airlangga Surabaya, Indonesia dy4h_h3r4@yahoo.com

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-430 VISUALISASI SIMILARITAS TOPIK PENELITIAN DENGAN PENDEKATAN KARTOGRAFI MENGGUNAKAN SELF- ORGANIZING MAPS (SOM) Budi Pangestu,

Lebih terperinci

3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi

3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi 3. METODOLOGI A. Kerangka Pemikiran Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi dan Pembuatan Prototipe Sistem (Gambar 3.1). Tahap Persiapan terdiri dari pengumpulan dokumen, input

Lebih terperinci

Analisis dan Implementasi Graph Clustering pada Berita Online Menggunakan Algoritma Chinese Whispers

Analisis dan Implementasi Graph Clustering pada Berita Online Menggunakan Algoritma Chinese Whispers Analisis dan Implementasi Graph Clustering pada Berita Online Menggunakan Algoritma Chinese Whispers Moch. Fitrah Eka P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik

Lebih terperinci

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN 1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data

Lebih terperinci

PRESENTASI TUGAS AKHIR KI091391

PRESENTASI TUGAS AKHIR KI091391 PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)

Lebih terperinci

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola)

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) PRESENTASI TUGAS AKHIR KI091391 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) Penyusun Tugas Akhir : Kartika Wijayati

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ Klasik 12749

Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ Klasik 12749 JURNAL TEKNIK POMITS Vol. 2, No. 1, (2014) ISSN: 2337-3539 (2301-9271 Print) 1 Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

Pemanfaatan Algoritma Hybrid Ant Colony Optimization dalam Menyelesaikan Permasalahan Capacitated Minimum Spanning Tree. Tamam Asrori ( )

Pemanfaatan Algoritma Hybrid Ant Colony Optimization dalam Menyelesaikan Permasalahan Capacitated Minimum Spanning Tree. Tamam Asrori ( ) Pemanfaatan Algoritma Hybrid Ant Colony Optimization dalam Menyelesaikan Permasalahan Capacitated Minimum Spanning Tree Tamam Asrori (5104 100 146) Pendahuluan Latar Belakang Tujuan Dan Manfaat Rumusan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing.

Lebih terperinci

BAB IV ANALISIS DAN PERANCANGAN

BAB IV ANALISIS DAN PERANCANGAN BAB IV ANALISIS DAN PERANCANGAN 4.1. Analisa 4.1.1 Analisis Data Pada tahap analisa data ini akan dibahas mengenai citra CT Scan yang akan dilakukan proses segmentasi atau pengelompokan data. Data citra

Lebih terperinci

BAB 3 ANALISA DAN PERANCANGAN

BAB 3 ANALISA DAN PERANCANGAN BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Konsep Dasar Graph Sebelum sampai pada pendefenisian masalah lintasan terpendek, terlebih dahulu pada bagian ini akan diuraikan mengenai konsep-konsep dasar dari model graph dan

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner JITE, Vol. 1(1) Juli (2017) p-issn : 2549-6247 e-issn : 2549-6255 Journal of Informatics and Telecommunication Engineering Available online http://ojs.uma.ac.id/index.php/jite Analisa Algoritma Data Mining

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

Aplikasi Pewarnaan Graf untuk Sistem Penjadwalan On-Air Stasiun Radio

Aplikasi Pewarnaan Graf untuk Sistem Penjadwalan On-Air Stasiun Radio Aplikasi Pewarnaan Graf untuk Sistem Penjadwalan On-Air Stasiun Radio Muhamad Irfan Maulana - 13515037 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra

Lebih terperinci

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR Achmad Thoriq B, Nelly Indriani W Abstract News aggregator is one type of aggregator system (collector) which collects

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Teori Graf 2.1.1 Defenisi Graf Graf G didefenisikan sebagai pasangan himpunan (V,E), ditulis dengan notasi G = (V,E), yang dalam hal ini V adalah himpunan tidak kosong dari simpul-simpul

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB LANDASAN TEORI. Teori Graf Teori graf merupakan pokok bahasan yang sudah tua usianya namun memiliki banyak terapan sampai saat ini. Graf digunakan untuk merepresentasikan objek-objek diskrit dan hubungan

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU PROYEK TUGAS AKHIR IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU (Studi Kasus : SMK Pembangunan Nasional Purwodadi) Disusun oleh: Novian Hari Pratama 10411 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #9 Text Clustering (Ch.16 & 17) Clustering Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memiliki sifat sama.

Lebih terperinci

KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN

KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN Catur Supriyanto 1, Affandy 2 1,2 Fakulti Teknologi Maklumat dan Komunikasi, Universiti Teknikal

Lebih terperinci

Optimasi Permasalahan Penugasan Dokter Menggunakan Representasi Graf Bipartit Berbobot

Optimasi Permasalahan Penugasan Dokter Menggunakan Representasi Graf Bipartit Berbobot JURNAL TEKNIK POMITS Vol., No., (0) ISSN: 7-9 (0-97 Print) Optimasi Permasalahan Penugasan Menggunakan Representasi Graf Bipartit Berbobot Laili Rochmah, Ahmad Saikhu, dan Rully Soelaiman Jurusan Teknik

Lebih terperinci

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 13 23 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER

Lebih terperinci

BAB 2 OPTIMISASI KOMBINATORIAL. Masalah optimisasi merupakan suatu proses pencarian varibel bebas yang

BAB 2 OPTIMISASI KOMBINATORIAL. Masalah optimisasi merupakan suatu proses pencarian varibel bebas yang BAB 2 OPTIMISASI KOMBINATORIAL 2.1 Masalah Model Optimisasi Kombinatorial Masalah optimisasi merupakan suatu proses pencarian varibel bebas yang memenuhi kondisi atau batasan yang disebut kendala dari

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian

Lebih terperinci

Reduksi Pola Pemotongan Kertas pada Cutting Stock Problem (CSP) Satu Dimensi

Reduksi Pola Pemotongan Kertas pada Cutting Stock Problem (CSP) Satu Dimensi Reduksi Pola Kertas pada Cutting Stock Problem (CSP) Satu Dimensi Sisca Octarina, Putra BJ Bangun, Miranda Avifana Jurusan Matematika Fakultas MIPA Universitas Sriwijaya Indralaya, Indonesia e-mail: s.octarina@gmail.com

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN

PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN Mufti Ari Bianto 1), Siti Rahayu 2), Miftahul Huda 3) ), Kusrini 4) 1), 2),3),4)

Lebih terperinci

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas

Lebih terperinci