Analisis dan Implementasi Kesamaan Semantik Antar Kata Menggunakan Pengukuran Berbasis Path

Ukuran: px
Mulai penontonan dengan halaman:

Download "Analisis dan Implementasi Kesamaan Semantik Antar Kata Menggunakan Pengukuran Berbasis Path"

Transkripsi

1 OPEN ACCESS ISSN socj.telkomuniversity.ac.id/indosc Ind. Symposium on Computing Sept pp doi: /indosc Analisis dan Implementasi Kesamaan Semantik Antar Kata Menggunakan Pengukuran Berbasis Path Paskalis Dias Adhyaksa 1, M. Syahrul Mubarok 2, Moch Arif Bijaksana 3 # School of Computing, Telkom University Bandung (40247) Indonesia 1 paskalisdias@gmail.com 2 msyahrulmubarok@gmail. 3 arifbijaksana@gmail.com Abstrak Pengukuran semantic similarity memiliki peran penting dalam beberapa task natural language processing. Pengukuran ini dilatarbelakangi oleh suatu masalah di mana saat ini komputer belum dapat menyamakan persepsi manusia terkait penilaian kesamaan antar kata. Penggunaan knowledge bases sebagai sumber informasi telah banyak diimplementasikan menggunakan metode tertentu untuk melakukan perhitungan kesamaan semantik antar kata. Salah satu diantaranya adalah pengukuran berbasis path yang cukup populer digunakan dengan memanfaatkan bentuk struktur taksonomi secara utuh. Penelitian ini mengimplementasikan pengukuran berbasis path dengan pendekatan Wang & Hirst measure untuk melakukan perhitungan kesamaan semantik antar kata menggunakan WordNet sebagai knowledge base. Sistem melakukan perhitungan skor terhadap semua kombinasi sense kata dengan bobot parameter alpha yang diatur pada skala 0-5. Hasil pengujian menunjukkan pengukuran Wang & Hirst mampu menghasilkan nilai korelasi cukup tinggi pada kedua dataset uji, yaitu sebesar 0,59 untuk dataset SimLex999 dan 0,65 untuk dataset WordSim353 dengan bobot parameter alpha 0. Hasil korelasi tersebut termasuk ke dalam kategori korelasi positif sedang untuk dataset SimLex999 dan korelasi positif kuat untuk dataset WordSim353. Kata Kunci: semantic similarity, path based measure, Wang & Hirst measure, WordNet, SimLex999, WordSim353 com Abstract Measurement of semantic similarity has an important role in natural language processing task. The background of this measurement is an issue in which the current computer cannot equate the human perception of semantic similarity measure between words. The use of knowledge bases as a source of information has been implemented using several method for calculating the semantic similarity between words. One of them is path based measurement that is popularly used by fully using the structure of taxonomy. This study was implemented path based measurement with Wang & Hirst measure for calculating the semantic similarity between words using WordNet as a knowledge base. The system performs calculations score in any combination of sense words with alpha parameter weights are set on a scale 0-5. Based on the observation which is indicated that the measurement by Wang & Hirst can be able to measure a high enough correlation value in both of dataset, it is 0.59 in SimLex999 dataset and 0.65 for WordSim353 dataset with weight alpha parameter is 0. The result of those correlation include to the moderate positive correlation in SimLex999 dataset and the strong positive correlation in WordSim353 dataset. Keywords: semantic similarity, path based measure, Wang & Hirst measure, WordNet, SimLex999, WordSim353 Received on August Accepted on Sept 2016

2 Paskalis Dias Adhyaksa et.al. Analisis dan Implementasi Kesamaan I. PENDAHULUAN Semantic similarity merupakan suatu angka yang menyatakan tingkat kesamaan atau kedekatan secara semantik antar kata, kalimat atau teks. Sepasang kata dinyatakan memiliki kesamaan semantik jika pasangan kata tersebut memiliki kesamaan dari sisi makna atau konsep. Pengukuran kesamaan semantik ini dilatarbelakangi pada suatu masalah di mana saat ini komputer belum dapat menyamakan persepsi manusia terkait penilaian kesamaan semantik antar kata. Implementasi dari semantic similarity sudah sejak lama diterapkan pada aplikasi pemrosesan bahasa alami (natural languange processing) dan beberapa bidang terkait seperti: text classification, document clustering, text summarization, dan lain sebagainya [1]. Salah satu metode yang diimplementasikan adalah menggunakan pengukuran berbasis knowledge (knowledge base). Knowledge bases merupakan sumber informasi berupa kamus yang digunakan sebagai manajemen pengetahuan seperti: Ensiklopedia, Thesaurus, Wikipedia, atau WordNet. Knowledge bases inilah yang dijadikan sebagai acuan dalam menentukan kesamaan semantik antar kata dengan menggunakan metode pengukuran tertentu [2]. Salah satu pengukuran berbasis knowledge yang cukup populer digunakan adalah pengukuran berbasis path. Kesamaan semantik antar konsep pada pengukuran berbasis path dapat ditentukan berdasarkan jarak, panjang path yang menghubungkan antar konsep, hingga kedalaman konsep tersebut dalam taksonomi [3]. Penggunaan kedalaman dan panjang path telah dikembangkan secara luas untuk meningkatkan keakuratan hasil korelasi yang didapat melalui pengukuran berbasis path. Pengukuran Wang & Hirst adalah salah satu metode pengukuran berbasis path yang menggunakan kedalaman dan panjang path terpendek dalam menghitung kesamaan semantik antar kata. Pengukuran ini mempertimbangkan nilai kumulatif kedalaman konsep terhadap keseluruhan jumlah node dalam taksonomi WordNet. Pada penelitian ini, pengukuran Wang & Hirst diobservasi menggunakan sejumlah pasangan kata dalam dua dataset yang berbeda. Sistem yang dibangun diharapkan dapat menghasilkan performansi yang lebih baik dibandingkan pengukuran sebelumnya di mana evaluasi dilakukan dengan membandingkan hasil korelasi pengukuran Wang & Hirst dengan pengukuran berbasis knowledge lainnya, meliputi pengukuran berbasis path dan pengukuran berbasis konten informasi berdasarkan nilai korelasi yang dihitung menggunakan acuan data SimLex999 dan WordSim353 sebagai gold standard. II. DASAR TEORI Beberapa dasar teori yang digunakan dalam penelitian guna mendukung proses perancangan dan analisis sistem adalah sebagai berikut: A. Path based Measure Path based measure atau pengukuran berbasis path merupakan salah satu metode yang digunakan untuk menghitung kesamaan semantik berdasarkan jarak atau panjang lintasan yang menghubungkan antar node dalam taksonomi. Pengukuran berbasis path disebut juga sebagai edge-based method. Panjang path dihitung berdasarkan edge atau node yang berada di sepanjang lintasan [3]. Edge merupakan ujung-ujung dari setiap node yang dibangkitkan. Sementara node merupakan kumpulan titik yang memiliki makna dan saling berhubungan satu sama lain [2]. Pada pengukuran berbasis path, semakin pendek atau kecil panjang path antar konsep pada taksonomi maka kesamaan antar konsep tersebut semakin tinggi. Pengukuran berbasis path melibatkan bentuk struktur taksonomi secara utuh, dapat dilihat taksonomi relasi hipernim (is-a) pada Gambar 1.

3 Ind. Symposium on Computing Sept keseluru taksonom persama conveyance vehicle public transport wheleed vehicle bus bicycle self-propelled vehicle motor vehicle car

4 0,59 0,79 1,00 Paskalis Dias Adhyaksa et.al. Analisis dan Implementasi Kesamaan Berdasarkan persamaan (1) tersebut: dep( lcs) = dep u (c) = c ЄWN { c : dep(c ) dep(c)} WN (1) 1. Nilai kedalaman lowest common subsummer ( dep u ( c)) didapatkan dari jumlah node berdasarkan nilai kumulatif depth -nya yang kurang dari sama dengan depth lcs dihitung dari root dibagi dengan keseluruhan jumlah node dalam taksonomi (WN). 2. Nilai dep u (c) akan digunakan untuk menghitung nilai kesamaan semantik antar kata. Sedangkan untuk menghitung nilai kesamaan semantik antar kata, pengukuran Wang & Hirst mengimplementasikannya ke dalam pengukuran Wu & Palmer dengan sedikit perubahan. Pengukuran Wu & Palmer merupakan pengukuran berbasis path length yang memiliki performansi cukup baik dalam hal relevansi antar term [6]. Berikut perhitungan kesamaan semantik menggunakan pengukuran Wang & Hirst [4], dapat dilihat pada persamaan (2): sim(c 1,c 2 ) Berdasarkan persamaan (2) tersebut: 2. dep α (c) len (c 1, c)+len(c2,c)+2.dep α (c) (2) 1. Nilai similaritas c 1 dan c 2 didapatkan dari hasil pembagian dua kali nilai depth(lcs) dengan penjumlahan panjang path antara c 1 dan c 2 dengan lcs dan dua kali nilai depth(lcs). 2. len( c 1, c) adalah panjang path dari c 1 ke lcs dan len( c 2, c) adalah panjang path dari c 2 ke lcs. 3. α merupakan suatu parameter dengan rentang (0,5) dengan selisih Nilai similaritas dari kedua konsep sim(c 1, c 2 ) berada pada rentang (0,10). C. Correlation Correlation atau korelasi merupakan suatu istilah statistik berupa nilai yang menyatakan hubungan linier antara kedua variabel atau perubah acak. Besarnya nilai korelasi berada pada rentang [ 1,1] atau - 1 <= x <= 1 di mana dikelompokkan ke dalam tiga jenis [7], yaitu: 1. Korelasi positif (positive correlation) menyatakan bahwa kedua variabel mempunyai hubungan yang searah. Kedua variabel dinyatakan memiliki korelasi positif jika nilai korelasinya berada pada rentang ( 0,1]. 2. Korelasi negatif (negative correlation) menyatakan bahwa kedua variabel memiliki hubunga n yang tidak searah (terbalik). Kedua variabel dinyatakan memiliki korelasi negatif jika nilai korelasinya berada pada rentang [ 1,0). 3. Tidak ada korelasi (no correlation) menyatakan kedua variabel memiliki hubungan yang tidak beraturan (acak). Nilai korela sinya adalah 0. Sedangkan tingkat kekuatan nilai korelasi dapat diukur berdasarkan T abel 1. Tabel 1. Tingkat Kekuatan Korelasi [7] Rentang Tingkat Kekuatan Korelasi 0,00-0,19 sangat lemah 0,20-0,39 lemah - 0,40 s edang - 0,60 kuat - 0,80 sangat kuat Pada penelitian ini metode perhitungan korelasi yang digunakan adalah pearson s correlation. Penggunaan korelasi ditujukan untuk mengetahui hubungan antara kedua variabel, dalam hal ini nilai korelasi yang dihasilkan sistem akan dibandingkan dengan skor acuan gold standard. Korelasi menunjukkan tren yang terbentuk dari kedua skor tersebut. Selain itu, untuk pengukuran performansi juga digunakannya euclidean distance untuk mengetahui seberapa dekat kedua garis tren yang terbentuk secara lebih akurat. Euclidean distance antara dua titik dapat didefinisikan seperti pada persamaan (3) [8] :

5 Analisis Ind. Symposium on Computing Sept n d = (x i y i ) 2 i=1 d merupakan distance atau jarak antar vektor, x adalah vektor pertama, sedangkan y adalah vektor kedua, i merupakan indeks elemen vektor, dan n merupakan dimensi dari kedua vektor. Tentunya semakin kecil nilai distance antara kedua vektor maka kesamaan kedua vektor tersebut semakin tinggi, dan berlaku sebaliknya di mana kesamaan kedua vektor semakin rendah jika nilai distance semakin tinggi. III. METODOLOGI PENELITIAN Pada penelitian ini, pengukuran Wang & Hirst akan diimplementasikan untuk melakukan perhitungan kesamaan semantik antar pasangan kata berbahasa Inggris. Sistem akan menerima masukkan berupa sejumlah pasangan kata benda (nouns) dari dataset SimLex999 dan WordSim353 lalu melakukan perhitungan skor kesamaan semantik pasangan kata tersebut. Hasil perhitungan berupa skor kesamaan dengan skala Hasil korelasi akan menjadi keluaran sistem untuk mengetahui performansi sistem yang dibangun, di mana nilai korelasi akan dihitung dengan membandingkan nilai kesamaan semantik yang dihasilkan oleh sistem dengan acuan dataset SimLex999 dan WordSim353 sebagai gold standard. menggunakan pearson correlation akan dilakukan untuk mengetahui faktor -faktor yang dapat mempengaruhi hasil nilai korelasi yang didapat. Hasil korelasi tersebut juga akan dibandingkan dengan hasil korelasi menggunakan pengukuran berbasis path lainnya dan pengukuran berbasis konten informasi, yaitu dengan tujuan untuk mengetahui pengukuran mana yang lebih baik berdasarkan nilai korelasi ya ng dihasilkan. (3) p s t m s m s m b s A. Gambaran Umum Sistem Gambaran umum dari sistem yang dibangun dapat dilihat pada Gambar 3. Mulai WordNet Pasangan Kata, Gold Standard Filtering Lemmatisasi Pencarian Sense Kata Perhitungan Skor Kesamaan Semantik Pencarian LCS Pencarian Depth Kata Perhitungan Panjang Path Skor Kesamaan Semantik Perhitungan Performansi Performansi Selesai

6 Perhitungan Paskalis Dias Adhyaksa et.al. Analisis dan Implementasi Kesamaan IV. HASIL DAN DISKUSI Pengujian dilakukan pada kedua dataset uji, yaitu SimLex999 berupa 666 pasangan kata nouns dan WordSim353 berupa 200 pasangan kata nouns. hasil korelasi dan distance dilakukan dengan mengkombinasikan semua sense terhadap seluruh bobot parameter alpha berdasarkan semua parameter pencarian skor. Hal ini ditujukan untuk mengetahui parameter pencarian skor mana yang paling baik sekaligus mengetahui bobot parameter alpha terbaik berdasarkan nilai korelasi yang dihasilkan. Hasil korelasi yang didapat akan dibandingkan dengan pengukuran pembanding lainnya untuk mengetahui pengukuran mana yang lebih unggul menggunakan dataset uji yang sama. Hasil pengujian pada kedua dataset uji dapat dilihat pada Tabel 2 dan Tabel 3. Tabel 2. Hasil pengujian berupa nilai korelasi terhadap keseluruhan data pada dataset SimLex999 α Skor Min Skor Max Skor Depth Min Korelasi Wang & Hirst Skor Depth Max Skor by Path Min Skor by Path Max Skor (ideal) 0 0,20 0,59 0,37 0,31 0,59 0,21 0,77 1 0,14 0,47 0,30 0,27 0,48 0,14 0,51 2 0,13 0,42 0,25 0,24 0,42 0,13 0,44 3 0,13 0,40 0,22 0,23 0,40 0,13 0,41 4 0,12 0,38 0,22 0,22 0,38 0,12 0,39 5 0,11 0,37 0,21 0,21 0,37 0,11 0,38 Tabel 3. Hasil pengujian berupa nilai korelasi terhadap keseluruhan data pada dataset WordSim353 Skor Min Skor Max Skor Depth Min Korelasi Wang & Hirst Skor Depth Max Skor by Path Min Skor by Path Max Skor (ideal) 0 0,20 0,59 0,37 0,31 0,59 0,21 0,77 1 0,14 0,47 0,30 0,27 0,48 0,14 0,51 2 0,13 0,42 0,25 0,24 0,42 0,13 0,44 3 0,13 0,40 0,22 0,23 0,40 0,13 0,41 4 0,12 0,38 0,22 0,22 0,38 0,12 0,39 5 0,11 0,37 0,21 0,21 0,37 0,11 0,38 Berdasarkan hasil pengujian menggunakan kedua dataset uji pada Tabel 2 dan Tabel 3, dapat diketahui pengukuran Wang & Hirst berdasarkan skor maksimum dan panjang path minimum dengan bobot alpha 0 atau tanpa bobot mampu menghasilkan nilai korelasi tertinggi pada kedua dataset uji. Korelasi yang dihasilkan keduanya sama. Hal ini menunjukkan bahwa dari semua kombinasi sense, skor maksimum merupakan skor dengan sense yang memiliki panjang path minimum. Bobot parameter alpha 0 menunjukkan bahwa melalui persamaan (2), kedalaman LCS ( dep(lcs)) tidak mempengaruhi hasil skor kesamaan semantik dan nilai korelasi yang dihasilkan. Meskipun demikian, untuk setiap perubahan bobot alpha, hasil korelasi berdasarkan skor maksimum masih lebih baik jika dibandingkan dengan hasil korelasi berdasarkan panjang path minimum. Untuk tingkat kekuatan korelasi, hasil korelasi pada dataset SimLex999 dikategorikan ke dalam korelasi positif sedang, sedangkan hasil korelasi pada dataset WordSim353 dikategorikan ke dalam korelasi positif kuat, dapat dilihat pada Tabel 1. Selain itu, penambahan bobot pada parameter alpha tidak berbanding lurus dengan nilai korelasi yang dihasilkan. Dapat dibuktikan bahwa semakin besar bobot alpha, nilai korelasi yang dihasilkan semakin menurun. Hasil korelasi pada dataset WordSim353 menunjukkan hasil yang lebih baik jika dibandingkan pada dataset SimLex999, walaupun dengan selisih yang tidak begitu signifikan yaitu 0,6. Selain penggunaan bobot parameter alpha, perbedaan korelasi yang dihasilkan dapat disebabkan oleh beberapa faktor yaitu perbedaan kuantitas data pada kedua dataset uji dan bentuk struktur taksonomi yang belum sempurna. A. Perbedaan Kuantitas Data pada Kedua Dataset Uji WordSim353 memuat 200 pasangan kata dan SimLex999 memuat 666 pasangan kata. Perbedaan kuantitas data pada kedua dataset tersebut cukup jauh, yaitu 466 pasangan kata. Hal ini dicurigai dapat mempengaruhi hasil korelasi yang dihasilkan. Untuk membuktikan hal tersebut, dilakukan pengujian pada dataset SimLex999 dengan menyamakan kuantitas datanya melalui pengambilan sampel secara acak

7 Ind. Symposium on Computing Sept sejumlah 200 pasangan kata sebanyak 30 kali. Tujuannya adalah untuk mendapatkan hasil korelasi dengan kuantitas data yang seimbang. Rata-rata hasil korelasi yang dihasilkan dari keseluruhan pengambilan sampel adalah sebesar 0,61. Hal ini menunjukkan bahwa perbedaan kuantitas dapat mempengaruhi hasil korelasi yang didapat walaupun tidak berdampak besar. Meskipun demikian, hasil korelasi pada WordSim353 masih SimLex999. jauh lebih baik dibandingkan hasil korelasi B. Bentuk Struktur WordNet yang Belum Sempurna Beberapa pasangan kata pada dataset SimLex999 menghasilkan skor yang berbeda jauh dengan skor acuan gold standard. Sistem menghasilkan skor kesamaan yang rendah sedangkan acuan gold standard tinggi, padahal secara makna keduanya memiliki kesamaan yang tinggi, representasi pasangan kata tersebut. dalam taksonomi dapat dilihat pada Gambar 4 abstraction measure psyhoclogical feature fundamental quantity cognition time _period information day evening (ii & iii) datum evening (i) reading time time of day dusk

8 Paskalis Dias Adhyaksa et.al. Analisis dan Implementasi Kesamaan Berdasarkan informasi pada Gambar 4 dan Gambar 5, dapat diketahui bahwa adanya kesalahan pada bentuk struktur WordNet, di mana belum secara sempurna dapat mengkategorikan suatu konsep sesuai dengan pemahaman manusia. Besar kecilnya panjang path juga secara relatif menghasilkan skor yang tidak selalu mendekati gold standard. Untuk mengetahui pengaruh bentuk struktur taksonomi yang belum sempurna terhadap hasil korelasi yang didapat, dilakukan pengabaian terhadap beberapa pasangan kata yang memiliki skor dengan selisih jauh dengan gold standard. Dari keseluruhan skor pasangan kata yang didapat pada pengujian dataset SimLex999, pasangan kata evening dan dusk memiliki selisih yang paling jauh dengan gold standard, yaitu sebesar 6,35. Pengujian pertama dilakukan dengan mengabaikan 25% pasangan kata yang memiliki selisih paling jauh dengan gold standard berupa 500 pasangan kata pada dataset SimLex999 yang akan diuji. Sedangkan pengujian kedua dilakukan dengan mengabaikan 50 % pasangan kata yang memiliki selisih paling jauh dengan gold standard berupa 333 pasangan kata. Hal ini ditujukan untuk mengetahui pengaruh pasangan kata tersebut terhadap hasil korelasi yang didapat. Dari pengujian yang dilakukan, hasil korelasi yang didapat dengan mengabaikan 25% pasangan kata yang memiliki selisih paling jauh dengan gold standard adalah 0,84. Hasil korelasi tersebut meningkat tajam dibandingkan hasil korelasi menggunakan keseluruhan data dengan perbedaan yang cukup signifikan sebesar 0,25. Sedangkan hasil korelasi yang didapat dengan mengabaikan 50% pasangan kata yang memiliki selisih terjauh dengan gold standard adalah 0,93 dengan kenaikan yang tidak begitu besar, yaitu 0,09 dari hasil korelasi dengan mengabaikan 25% pasangan kata. Hal ini menunjukkan bahwa 25% pasangan kata yang memiliki selisih skor terjauh dengan gold standard memiliki pengaruh yang sangat besar terhadap hasil korelasi yang didapat. Dapat disimpulkan bahwa bentuk struktur WordNet yang kurang tepat merupakan faktor yang paling mempengaruhi hasil korelasi dibandingkan dengan penggunaan parameter alpha dan perbedaan kuantitas pada kedua dataset uji. Untuk itu, diperlukannya adanya perbaikan terhadap struktur WordNet yang telah ada guna mendapatkan hasil korelasi yang lebih baik pada penelitian selanjutnya.berdasarkan hal tersebut, dapat disimpulkan pengukuran berbasis path dengan pendekatan Wang & Hirst sangat bergantung pada bentuk struktur taksonomi. C. Perbandingan Korelasi Wang & Hirst dengan Pengukuran Pembanding Korelasi yang dihasilkan menggunakan pengukuran Wang & Hirst mampu menghasilkan nilai korelasi tertinggi dibandingkan dengan pengukuran pembanding lainnya, yaitu pengukuran berbasis path dan pengukuran berbasis konten informasi, dapat dilihat pada Tabel 4 dan Tabel 5. Tabel 4. Perbandingan Hasil Korelasi Pengukuran Wang & Hirst dengan Pengukuran Pembanding Path based measure Information content based measure Tabel 5. Perbandingan Nilai Distance Pengukuran Wang & Hirst dengan Pengukuran Pembanding Path based measure Information content based measure Knowledge based measure Knowledge based measure Hasil Korelasi SimLex999 Hasil Korelasi SimLex999 Hasil Korelasi WordSim353 Wang & Hirst (our measure) 0,59 0,65 Wu & Palmer 0,45 0,54 Leacock & Chodorow 0,58 0,63 Path 0,53 0,59 Jiang & Conrath 0,53 0,49 Lin 0,58 0,50 Resnik 0,51 0,63 Hasil Korelasi WordSim353 Wang & Hirst (our measure) 54,32 35,62 Wu & Palmer 108,52 42,47 Leacock & Chodorow 51,32 31,16 Path 70,03 47,59 Jiang & Conrath 81,14 58,59 Lin 69,25 45,92 Resnik 66,12 35,71

9 a Ind. Symposium on Computing Sept Berdasarkan Tabel 4, pengukuran Wang & Hirst mampu menghasilkan nilai korelasi tertinggi dibandingkan dengan pengukuran pembanding lainnya baik pengukuran berbasis path maupun pengukuran berbasis konten informasi pada kedua dataset uji. Namun jika melihat perbandingan nilai distance pada Tabel 5, pengukuran Wang & Hirst memiliki distance yang lebih tinggi jika dibandingkan pengukuran Leacock & Chodorow yang memilki distance terkecil terhadap acuan gold standard, dengan selisih yang tidak begitu besar, yaitu 4,46 pada dataset WordSim353 dan 3,00 pada dataset SimLex999. V. KESIMPULAN Berdasarkan hasil pengujian dan analisis yang telah dilakukan pada penelitian ini, dapat disimpulkan bahwa: 1. Implementasi pengukuran berbasis path menggunakan pengukuran Wang & Hirst mampu menghasilkan korelasi sebesar 0,59 pada dataset uji SimLex999 berupa 666 pasang kata dan 0,65 pada dataset uji WordSim353 berupa 200 pasang kata. 2. Pengukuran Wang & Hirst terhadap skor berdasarkan path length minimum dan skor maksimum mampu menghasilkan nilai korelasi tertinggi dengan bobot parameter alpha 0. Penambahan bobot parameter alpha menghasilkan korelasi yang lebih rendah dengan tren yang semakin menurun ketajamannya. 3. Perbedaan hasil korelasi antara kedua dataset uji dipengaruhi oleh beberapa faktor seperti: pengaruh bobot parameter alpha, perbedaan kuantitas data, dan bentuk struktur taksonomi WordNet yang belum sempurna. Bentuk struktur WordNet yang belum sempurna memiliki pengaruh paling besar pada hasil korelasi yang didapat dengan kenaikan hasil korelasi sebesar 0,25 dibandingkan hasil korelasi terhadap keseluruhan data melalui pengabaian 25 % pasangan kata yang memiliki selisih skor terjauh dengan gold standard. 4. Pengukuran Wang & Hirst terbukti menghasilkan nilai korelasi yang lebih tinggi jika dibandingkan dengan pengukuran berbasis path lainnya dan pengukuran berbasis konten informasi. Namun berdasarkan distance, pengukuran Wang & Hirst menghasilkan nilai distance kedua terkecil setelah pengukuran Leacock & Chodorow. UCAPAN TERIMAKASIH Penulis berterimakasih kepada semua pihak yang terlibat baik secara langsung maupun tidak dalam penelitian atas dukungan yang telah diberikan, khususnya: E. Gabrilovich, Felix Hill, Roi Reichart, Anna Korhonen selaku penyedia data penelitian serta Prodi S1 Teknik Informatika Telkom University. REFERENSI [1] R. Mihalcea, C. Corley and C. Strapparava, "Corpus- based and Knowledge-based Measures of Text Semantic Similarity," in In Proceedings of the 21st National Conference on Artificial Intelligence (AAAI 06), North Texas, [2] M. F. Razandi, Implementasi dan Analisis Semantic Relatedness Dengan Menggunakan Hybrid Method (Path -based Method dan Gloss- based Method), Bandung: S1 Teknik Informatika. Universitas Telkom, [3] Z. Zhang, A. L. Gentile and F. Ciravegna, "Recent advances in methods of lexical semantic relatedness survey," Cambridge University, vol. 19, no. 04, pp , [4] T. Wang and G. Hirst, "Refining the Notions of Depth and Density in WordNet-based Semantic Similatiy Measures," in Departement of Computer Science University of Toronto, [5] P. University, "WordNet : A lexical database for English," Princeton University, 17 March [Online]. Available: [Accessed 5 November 2015]. [6] A. K. Durga and A. Govardhan, "Estimation of Word Net-Based Lexical Semantic Similarity Measure for Telugu Documents," IOSR Journal of Computer Engineering, vol. 1, no. 2, pp , [7] S. "Pearson's correlation," Creative Commons Licence, [Online]. Available: [Accessed 2015 November 7]. [8] pbarrett.net, "Euclidean Distance raw, normalized, and double- scaled coefficients," September [Online]. Available: [Accessed 15 July 2016].

10 306

Prodi S1 Teknik Informatika, Fakultas Teknik, Universitas Telkom.

Prodi S1 Teknik Informatika, Fakultas Teknik, Universitas Telkom. Implementasi dan Analisis Keterkaitan Semantik Antar Kata Menggunakan Pointwise Mutual Informationmax dengan Estimasi dari Kata Polisemi Implementation and Analysis of Semantic Relatedness to Words Pair

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.3, No.3 December 2016 Page 5256

ISSN : e-proceeding of Engineering : Vol.3, No.3 December 2016 Page 5256 ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.3 December 2016 Page 5256 Implementasi dan Analisis Kesamaan Semantik Antar Kata Berbahasa Inggris dengan Metode Second Order Co-occurrence Pointwise

Lebih terperinci

Implementasi dan Analisis Pengukuran Semantic Relatedness menggunakan Random Walks berbasis WordNet

Implementasi dan Analisis Pengukuran Semantic Relatedness menggunakan Random Walks berbasis WordNet Implementasi dan Analisis Pengukuran Semantic Relatedness menggunakan Random Walks berbasis WordNet Semantic Relatedness Measurement Implementation and Analysis using WordNet-based Random Walks Abstrak

Lebih terperinci

QUERY REWRITING BERBASIS SEMANTIK MENGGUNAKAN WORDNET DAN LCh PADA SEARCH ENGINE GOOGLE

QUERY REWRITING BERBASIS SEMANTIK MENGGUNAKAN WORDNET DAN LCh PADA SEARCH ENGINE GOOGLE sss Makalah Nomor: KNSI-469 QUERY REWRITING BERBASIS SEMANTIK MENGGUNAKAN WORDNET DAN LCh PADA SEARCH ENGINE GOOGLE Ahmad M. Thantawi, I Wayan Simri Wicaksana 2, Lily Wulandari 3 Teknik Informatika, 2

Lebih terperinci

IMPLEMENTASI DAN ANALISIS SEMANTIC RELATION ANTAR KATA DALAM BAHASA INGGRIS MENGGUNAKAN PENDEKATAN PATH BASE

IMPLEMENTASI DAN ANALISIS SEMANTIC RELATION ANTAR KATA DALAM BAHASA INGGRIS MENGGUNAKAN PENDEKATAN PATH BASE IMPLEMENTASI DAN ANALISIS SEMANTIC RELATION ANTAR KATA DALAM BAHASA INGGRIS MENGGUNAKAN PENDEKATAN PATH BASE Eldita Febrian Selfiendi 1 & Moch. Arif Bijaksana. 2 1 Mahasiswa Teknik Informatika, Universitas

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6665

ISSN : e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6665 ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6665 Analisis Efektifitas Pengukuran Keterkaitan Antar Teks Menggunakan Metode Salient Semantic Analysis Dengan TextRank for

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1012

ISSN : e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1012 ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1012 Analisis dan Implementasi Keterkaitan Semantik dengan Metode berbasis Vektor Analysis and Implementation of Semantic Relatedness

Lebih terperinci

Implementasi Generalized Vector Space Model Menggunakan WordNet

Implementasi Generalized Vector Space Model Menggunakan WordNet Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:

Lebih terperinci

khazanah Efektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia informatika

khazanah Efektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia informatika 7 khazanah informatika Jurnal Ilmu Komputer dan Informatika Efektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia Husni Thamrin 1*, Atiqa Sabardilla 2 1

Lebih terperinci

Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker

Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker 1 Aslihatul Millah, 2 Siti Nurazizah 1,2 Program Studi Sistem Informasi, Fakultas Sains dan

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097 Perancangan Sistem Pemeringkatan Jawaban Pada Forum Tanya Jawab Menggunakan Textual Feature dan Semantic Similarity Answer

Lebih terperinci

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL

Lebih terperinci

Analisis dan Implementasi Pengukuran Semantic Relatedness Menggunakan Salient Semantic Analysis dengan Keyword Extraction Sebagai Preprocessing

Analisis dan Implementasi Pengukuran Semantic Relatedness Menggunakan Salient Semantic Analysis dengan Keyword Extraction Sebagai Preprocessing Analisis dan Implementasi Pengukuran Semantic Relatedness Menggunakan Salient Semantic Analysis dengan Keyword Extraction Sebagai Preprocessing Moch. Arif Bijaksana, Ir., M.Tech Fakultas Teknik Universitas

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

@UKDW BAB 1 PENDAHULUAN Latar Belakang

@UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pada saat ini, sangatlah mudah untuk mendapatkan informasi, baik melalui media cetak maupun media elektronik. Akan tetapi, banyaknya informasi yang ada belum tentu

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teks naratif menurut kamus besar bahasa Indonesia adalah teks yang berisikan deretan sejarah, peristiwa atau kejadian dan sebagainya. Kata naratif sendiri berasal

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

UJI KORELASI HASIL EVALUASI USABILITY DAN HASIL EVALUASI ACCESSIBILITY

UJI KORELASI HASIL EVALUASI USABILITY DAN HASIL EVALUASI ACCESSIBILITY 101 UJI KORELASI HASIL EVALUASI USABILITY DAN HASIL EVALUASI ACCESSIBILITY Abstract Both usability and accessibility evaluations result two groups of score based on their parameters. These score then had

Lebih terperinci

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika HALAMAN JUDU L PENGUKURAN TINGKAT KEMIRIPAN DOKUMEN MENGGUNAKAN ALGORITMA JARO-WINKLER DAN ENHANCED CONFIX STRIPPING STEMMER SKRIPSI Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di

Lebih terperinci

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,

Lebih terperinci

Penerapan Algoritma A* (A Star) Sebagai Solusi Pencarian Rute Terpendek Pada Maze

Penerapan Algoritma A* (A Star) Sebagai Solusi Pencarian Rute Terpendek Pada Maze Penerapan Algoritma A* (A Star) Sebagai Solusi Pencarian Rute Terpendek Pada Maze 1 Rakhmat Kurniawan. R., ST, M.Kom, 2 Yusuf Ramadhan Nasution, M.Kom Program Studi Ilmu Komputer, Fakultas Sains dan Teknologi

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES

IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4978 IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES Bayu Indrawarman Julianto 1, Adiwijaya 3, Mohamad Syahrul

Lebih terperinci

ABSTRAK. Kata Kunci : Algoritma Genetika, Pemrosesan Bahasa Alami, Twiter, Tweet, Semantic Relatedness. Universitas Kristen Maranatha

ABSTRAK. Kata Kunci : Algoritma Genetika, Pemrosesan Bahasa Alami, Twiter, Tweet, Semantic Relatedness. Universitas Kristen Maranatha ABSTRAK Dengan munculnya berbagai media sosial, banyak orang yang menuliskan bermacam-macam hal, salah satunya memberikan menuliskan motivasi. Dengan demikian, dibuatlah penelitian untuk membuat sebuah

Lebih terperinci

Pentingnya Peranan Bahasa dalam Interoperabilitas Informasi berbasiskan Komputer karena Keragaman Semantik

Pentingnya Peranan Bahasa dalam Interoperabilitas Informasi berbasiskan Komputer karena Keragaman Semantik Pentingnya Peranan Bahasa dalam Interoperabilitas Informasi berbasiskan Komputer karena Keragaman Semantik I Wayan Simri Wicaksana, Lintang Yuniar Banowosari, Lily Wulandari, Setia Wirawan Mahasiswa Doktoral

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii ABSTRAK Untuk mendapatkan sebuah informasi pada saat ini sangatlah mudah. Dengan adanya internet orang dengan mudah untuk berbagi informasi. Informasi yang dibagikan biasanya dalam bentuk dokumen, artikel,

Lebih terperinci

RANCANG BANGUN APLIKASI DOKUMEN CLUSTERING DENGAN METODE K-MEANS BERDASARKAN WINNOWING FINGERPRINT SIMILARITY TUGAS AKHIR

RANCANG BANGUN APLIKASI DOKUMEN CLUSTERING DENGAN METODE K-MEANS BERDASARKAN WINNOWING FINGERPRINT SIMILARITY TUGAS AKHIR RANCANG BANGUN APLIKASI DOKUMEN CLUSTERING DENGAN METODE K-MEANS BERDASARKAN WINNOWING FINGERPRINT SIMILARITY TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Natural Language Processing (NLP) adalah area penelitian dan pengaplikasan yang mengekplorasi bagaimana caranya sebuah komputer dapat digunakan dan memanipulasi berupa

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

IDENTIFIKASI NOMOR POLISI KENDARAAN BERMOTOR MENGGUNAKAN JARINGAN SYARAF TIRUAN SELF ORGANIZING MAPS (SOMS)

IDENTIFIKASI NOMOR POLISI KENDARAAN BERMOTOR MENGGUNAKAN JARINGAN SYARAF TIRUAN SELF ORGANIZING MAPS (SOMS) Powered by TCPDF (www.tcpdf.org) IDENTIFIKASI NOMOR POLISI KENDARAAN BERMOTOR MENGGUNAKAN JARINGAN SYARAF TIRUAN SELF ORGANIZING MAPS (SOMS) Inung Wijayanto¹, Iwan Iwut Tritoasmoro², Koredianto Usman³

Lebih terperinci

# Fakultas Informatika, Universitas Telkom Jl. Telekomunikasi no. 1 Ters. Buah Batu Badung Indonesia 1

# Fakultas Informatika, Universitas Telkom Jl. Telekomunikasi no. 1 Ters. Buah Batu Badung Indonesia 1 OPEN ACCESS ISSN 2460-3295 socj.telkomuniversity.ac.id/indosc Ind. Symposium on Computing Sept 2016. pp. 207-218 doi:10.21108/indosc.2016.144 Identifikasi Parafrasa pada Dokumen Teks Bahasa Indonesia Menggunakan

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.

Lebih terperinci

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE Widodo Muda Saputra, Helmie Arif Wibawa, S.Si, M.Cs, dan Nurdin Bahtiar, S.Si, M.T Fakultas Sains dan Matematika, Jurusan Ilmu Komputer

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,

Lebih terperinci

APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM

APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM Silvia Rostianingsih 1), Sendy Andrian Sugianto 2), Liliana 3) 1, 2, 3) Program Studi Teknik Informatika Fakultas Teknologi Industri Universitas

Lebih terperinci

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching Analisis dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma GIndex Analysis and Implementation of Graph Indexing for Graph Database Using GIndex Algorithm Hadyan Arif 1, Kemas Rahmat

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( )

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( ) Sidang Tugas Akhir September 2009 Implementasi Metode Ant Colony Optimization untuk Pemilihan Fitur pada Kategorisasi Dokumen Teks DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara

Lebih terperinci

Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use Case Diagram)

Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use Case Diagram) JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-71 Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use

Lebih terperinci

PENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA

PENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA PENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA Dina Indarti Pusat Studi Komputasi Matematika, Universitas Gunadarma Jl. Margonda Raya no. 100, Depok 16424, Jawa Barat

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4641

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4641 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4641 Implementasi dan Analisis Kesamaan Semantik pada Bahasa Indonesia dengan Metode berbasis Vektor Implementation and Analysis

Lebih terperinci

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha

Lebih terperinci

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK MENDETEKSI UANG LOGAM DENGAN METODE EUCLIDEAN

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK MENDETEKSI UANG LOGAM DENGAN METODE EUCLIDEAN Jurnal Teknik Informatika Vol. 1 September 2012 1 PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK MENDETEKSI UANG LOGAM DENGAN METODE EUCLIDEAN Wahyu Saputra Wibawa 1, Juni Nurma Sari 2, Ananda 3 Program Studi

Lebih terperinci

ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED FOR

ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED FOR ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6490 ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

PENERAPAN SEMANTIC SIMILARITY PADA KRIPTOGRAFI SUATU DOKUMEN TEKS DALAM BAHASA INDONESIA

PENERAPAN SEMANTIC SIMILARITY PADA KRIPTOGRAFI SUATU DOKUMEN TEKS DALAM BAHASA INDONESIA PENERAPAN SEMANTIC SIMILARITY PADA KRIPTOGRAFI SUATU DOKUMEN TEKS DALAM BAHASA INDONESIA Detty Purnamasari 1 I Wayan Simri Wicaksana 2 Anissa Lintang R. 3 Anneke Annassia P.S. 4 Hendry Gustin 5 1 Jurusan

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING

PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING 1 Arrummaisha Adrifina 2 Juwita Utami Putri 3 I Wayan Simri W 1 arroem@student.gunadarma.ac.id 2 nony_juwita@student.gunadarma.ac.id 3 iwayan@staff.gunadarma.ac.id

Lebih terperinci

PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN

PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN Prosiding Seminar Nasional Matematika dan Terapannya 016 p-issn : 550-0384; e-issn : 550-039 PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN 009-013 MENGGUNAKAN

Lebih terperinci

Information Retrieval

Information Retrieval Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

MENENTUKAN KEPADATAN LALU LINTAS DENGAN PENGHITUNGAN JUMLAH KENDARAAN BERBASIS VIDEO PROCESSING

MENENTUKAN KEPADATAN LALU LINTAS DENGAN PENGHITUNGAN JUMLAH KENDARAAN BERBASIS VIDEO PROCESSING Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2009 MENENTUKAN KEPADATAN LALU LINTAS DENGAN PENGHITUNGAN JUMLAH KENDARAAN BERBASIS VIDEO PROCESSING Muahamd Syukur¹, Iwan Iwut Tritoasmoro², Koredianto Usman³

Lebih terperinci

BAB I PENDAHULUAN. dihasilkan alat ucap manusia. Bahasa terdiri atas kata-kata atau kumpulan kata.

BAB I PENDAHULUAN. dihasilkan alat ucap manusia. Bahasa terdiri atas kata-kata atau kumpulan kata. BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa merupakan alat komunikasi berupa sistem lambang bunyi yang dihasilkan alat ucap manusia. Bahasa terdiri atas kata-kata atau kumpulan kata. Kumpulan kata mempunyai

Lebih terperinci

PENENTUAN RUTE TERPENDEK DENGAN METODE FLOYD WARSHALL PADA PETA DIGITAL UNIVERSITAS SUMATERA UTARA SKRIPSI DHYMAS EKO PRASETYO

PENENTUAN RUTE TERPENDEK DENGAN METODE FLOYD WARSHALL PADA PETA DIGITAL UNIVERSITAS SUMATERA UTARA SKRIPSI DHYMAS EKO PRASETYO PENENTUAN RUTE TERPENDEK DENGAN METODE FLOYD WARSHALL PADA PETA DIGITAL UNIVERSITAS SUMATERA UTARA SKRIPSI DHYMAS EKO PRASETYO 091402023 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI

Lebih terperinci

1 Pendahuluan. Jalan Telekomunikasi No. 1, Dayeuh Kolot, Bandung

1 Pendahuluan. Jalan Telekomunikasi No. 1, Dayeuh Kolot, Bandung Klasifikasi Jawaban dengan Menggunakan Multiple Features Extraction pada Community Question Answering Answer Classification using Multiple Features Extraction in Community Question Answering Bhudi Jati

Lebih terperinci

MODEL HIBRIDA RUNTUN WAKTU FUZZY TERBOBOT-DERET FOURIER UNTUK PERAMALAN CURAH HUJAN DI DAERAH ALIRAN SUNGAI BENGAWAN SOLO

MODEL HIBRIDA RUNTUN WAKTU FUZZY TERBOBOT-DERET FOURIER UNTUK PERAMALAN CURAH HUJAN DI DAERAH ALIRAN SUNGAI BENGAWAN SOLO MODEL HIBRIDA RUNTUN WAKTU FUZZY TERBOBOT-DERET FOURIER UNTUK PERAMALAN CURAH HUJAN DI DAERAH ALIRAN SUNGAI BENGAWAN SOLO oleh INDIAWATI AYIK IMAYA M0111045 SKRIPSI ditulis dan diajukan untuk memenuhi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA)

Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA) Tugas Akhir Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA) Oleh: Danang Wahyu Wicaksono (1210100027) Pembimbing: 1. Prof. DR. Mohammad Isa

Lebih terperinci

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Pengukuran Kemiripan Dokumen dengan Menggunakan Tools Gensim (Sekarwati dkk.) PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Kemal Ade Sekarwati 1*, Lintang Yuniar Banowosari 2, I Made Wiryana

Lebih terperinci

Panduan Penulisan dan Template untuk Jurnal Online Informatika (JOIN)

Panduan Penulisan dan Template untuk Jurnal Online Informatika (JOIN) JOIN (Jurnal Online Informatika) Volume 2 No. 2 Desember 2017 : 1-2 DOI: 10.15575/join. xxxxx.xx Panduan Penulisan dan Template untuk Jurnal Online Informatika (JOIN) Penulis ke-1 1, Penulis ke-2 2, Penulis

Lebih terperinci

Efek Penggunaan Keterkaitan Kata pada Algoritma Similaritas Semantik Terhadap Kinerja Proses Klasifikasi Teks dengan K-Nearest Neighbour

Efek Penggunaan Keterkaitan Kata pada Algoritma Similaritas Semantik Terhadap Kinerja Proses Klasifikasi Teks dengan K-Nearest Neighbour 104 KomuniTi, Vol. VI, No. September 014 Efek Penggunaan Keterkaitan Kata pada Algoritma Similaritas Semantik Terhadap Kinera Proses Klasifikasi Teks dengan K-Nearest Neighbour Husni Thamrin 1), Atiqa

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

SEMANTIC CLUSTERING DAN PEMILIHAN KALIMAT REPRESENTATIF UNTUK PERINGKASAN MULTI DOKUMEN

SEMANTIC CLUSTERING DAN PEMILIHAN KALIMAT REPRESENTATIF UNTUK PERINGKASAN MULTI DOKUMEN Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 1, No. 2, Oktober 2014 hlm. 91-97 SEMANTIC CLUSTERING DAN PEMILIHAN KALIMAT REPRESENTATIF UNTUK PERINGKASAN MULTI DOKUMEN Pasnur 1, Putu Praba

Lebih terperinci

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB 2 LANDASAN TEORI Sistem Rekomendasi

BAB 2 LANDASAN TEORI Sistem Rekomendasi 6 BAB 2 LANDASAN TEORI 2.1. Sistem Rekomendasi Sistem rekomendasi merupakan sebuah perangkat lunak yang bertujuan untuk membantu pengguna dengan cara memberikan rekomendasi kepada pengguna ketika pengguna

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

Membandingkan Pendekatan Latent Semantic terhadap WordNet untuk Semantic Similarity

Membandingkan Pendekatan Latent Semantic terhadap WordNet untuk Semantic Similarity Membandingkan Pendekatan Latent Semantic terhadap WordNet untuk Semantic Similarity I Wayan Simri Wicaksana Universitas Gunadarma E-mail: iwayan@staff.gunadarma.ac.id ABSTRAK Pertukaran informasi antar

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk

Lebih terperinci

PERANCANGAN SISTEM INFORMASI PELAYANAN PENUMPANG ANGKUTAN UMUM

PERANCANGAN SISTEM INFORMASI PELAYANAN PENUMPANG ANGKUTAN UMUM PERANCANGAN SISTEM INFORMASI PELAYANAN PENUMPANG ANGKUTAN UMUM (Studi Kasus di PERUM DAMRI Cabang Kota Bandung) TUGAS AKHIR Disusun sebagai salah satu syarat untuk kelulusan Program Strata 1, di Program

Lebih terperinci

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA Optimization Techniques Modi ed k Nearest Neighbor Classi cation Using Genetic Algorithm Siti Mutro n 1, Abidatul

Lebih terperinci

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING A-99 PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING Rachmad Zaini Alberto 1, Winda Kurnia Sari 2, Samsuryadi 3, Anggina Primanita 4 1,2,3,4 Fakultas

Lebih terperinci

SIMULASI PENGENALAN TULISAN MENGGUNAKAN LVQ (LEARNING VECTOR QUANTIZATION )

SIMULASI PENGENALAN TULISAN MENGGUNAKAN LVQ (LEARNING VECTOR QUANTIZATION ) SIMULASI PENGENALAN TULISAN MENGGUNAKAN LVQ (LEARNING VECTOR QUANTIZATION ) Fachrul Kurniawan, Hani Nurhayati Jurusan Teknik Informatika, Sains dan Teknologi Universitas Islam Negeri (UIN) Maulana Malik

Lebih terperinci

PRESENTASI TUGAS AKHIR KI091391

PRESENTASI TUGAS AKHIR KI091391 PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)

Lebih terperinci

Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari)

Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari) Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari) Amalfi Yusri Darusman Jurusan Teknik Informatika Institut Teknologi Bandung, jalan Ganesha 10 Bandung, email : if17023@students.if.itb.a.c.id

Lebih terperinci

ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX

ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX Mohammad imron (1), Yuliana Melita (2), Megister Teknologi Informasi Institusi

Lebih terperinci

Pengumpulan Korpus Paralel Bahasa Indonesia-Sunda dari Wikipedia Menggunakan Metode Pointwise Mutual Information

Pengumpulan Korpus Paralel Bahasa Indonesia-Sunda dari Wikipedia Menggunakan Metode Pointwise Mutual Information Pengumpulan Korpus Paralel Bahasa Indonesia-Sunda dari Wikipedia Metode Pointwise Mutual Information Indonesian-Sundanese Parallel Corpus Retrieval from Wikipedia Using Pointwise Mutual Information Method

Lebih terperinci

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,

Lebih terperinci

Perancangan Semantic Similarity based on Word Thesaurus Menggunakan Pengukuran Omiotis Untuk Pencarian Aplikasi pada I-GRACIAS

Perancangan Semantic Similarity based on Word Thesaurus Menggunakan Pengukuran Omiotis Untuk Pencarian Aplikasi pada I-GRACIAS OPEN ACCESS ISSN 2460-3295 socj.telkomuniversity.ac.id/indosc Ind. Symposium on Computing Sept 2016. pp. 23-34 doi:10.21108/indosc.2016.114 Perancangan Semantic Similarity based on Word Thesaurus Menggunakan

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

Pemodelan Pengukuran Tingkat Kematangan Kerangka Kerja COBIT Menggunakan Ontology

Pemodelan Pengukuran Tingkat Kematangan Kerangka Kerja COBIT Menggunakan Ontology Pemodelan Pengukuran Tingkat Kematangan Kerangka Kerja COBIT Menggunakan Ontology BATASAN MASALAH Hanya melakukan perhitungan kemiripan antara dokumen perusahaan dengan dokumen COBIT Dokumen yang digunakan,

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

Jurnal Pendidikan Fisika Indonesia 7 (2011) RANCANG BANGUN SISTEM PENGENALAN POLA SIDIK JARI MENGGUNAKAN METODE MINUTIAE

Jurnal Pendidikan Fisika Indonesia 7 (2011) RANCANG BANGUN SISTEM PENGENALAN POLA SIDIK JARI MENGGUNAKAN METODE MINUTIAE ISSN: 1693-1246 Januari 2011 Jurnal Pendidikan Fisika Indonesia 7 (2011) 47-51 J P F I http://journal.unnes.ac.id RANCANG BANGUN SISTEM PENGENALAN POLA SIDIK JARI MENGGUNAKAN METODE MINUTIAE Sudartono*,

Lebih terperinci

PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA

PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA Candra Triawati 1, M. Arif Bijaksana 2, Nur Indrawati 3, Widyanto Adi Saputro 4 1,2,3,4 Departemen Teknik Informatika, Institut

Lebih terperinci

KLASIFIKASI OPINI PADA FITUR PRODUK BERBASIS GRAPH OPINION CLASSIFICATION FOR PRODUCT FEATURE BASED ON GRAPH

KLASIFIKASI OPINI PADA FITUR PRODUK BERBASIS GRAPH OPINION CLASSIFICATION FOR PRODUCT FEATURE BASED ON GRAPH ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 3148 KLASIFIKASI OPINI PADA FITUR PRODUK BERBASIS GRAPH OPINION CLASSIFICATION FOR PRODUCT FEATURE BASED ON GRAPH I Kadek Bayu

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun

Lebih terperinci

PENYUSUNAN JADWAL PRAKTIKUM MAHASISWA MENGGUNAKAN METODE BEST FIRST SEARCH ABSTRAK

PENYUSUNAN JADWAL PRAKTIKUM MAHASISWA MENGGUNAKAN METODE BEST FIRST SEARCH ABSTRAK PENYUSUNAN JADWAL PRAKTIKUM MAHASISWA MENGGUNAKAN METODE BEST FIRST SEARCH Jerry Wiyono (0827003) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. drg. Suria Sumantri, MPH. No 65 Bandung 40164, Indonesia

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci