BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 7 BAB II LANDASAN TEORI 2.1. Plagiarisme Plagiarisme merupakan salah satu bentuk pencurian hak cipta dan menyatakan hal tersebut sebagai miliknya sendiri.beberapa bentuk plagiarisme berdasarkan metode pengambilan data terbagi menjadi dua, yaitu offline plagiarism dan online plagiarism.offline plagiarism merupakan bentuk plagiarisme dimana pengambilan data dilakukan dari sumber yang berupa hardcopy.sedangkan, online plagiarism merupakan bentuk plagiarisme dimana pengambilan data dilakukan dari sumber yang berupa softcopy dan telah beredar di media internet.(ercegovac & Richardson Jr., 2004) Beberapa bentuk plagiarisme berdasarkan metode dalam melakukan plagiat dibedakan menjadi 2, yaitu Intrinsic Plagiarism dan External Plagiarism.External plagiarism merupakan bentuk plagiarisme dimana metode plagiat yang dilakukan berupa copy-paste atau mengkutip secara langsung dari sumber tanpa adanya perubahan dan tidak menyertakan bentuk umum dari pengkutipan yang seharusnya.intrinsic Plagiarism merupakan bentuk plagiarisme dimana metode plagiat yang dilakukan berupa mengkutip secara tidak langsung dengan dilakukan perubahaan struktur maupun perubahan kata namun masih memiliki arti dan makna yang sangat dekat dengan sumber yang dikutip. Ada 4 bentuk plagiarisme berdasarkan bentuk plagiarisme yang dilakukan khususnya Intrinsic Plagiarism, yakni Near Copies Plagiarism, Disguised Plagiarism,Translated Plagiarism dan Idea Plagiarism. Near Copiesmerupakan penyebutan untuk bentuk plagiarisme yang melakukan penyalinan hampir sama persis dengan sumber namun dilakukan penambahan dan perubahan sedikit pada struktur kalimat.disguised 7

2 8 merupakan penyebutan untuk bentuk plagiarisme yang melakukan penyalinan disertai dengan adanya perubahan struktur kalimat dan pertukaran kata dengan sinonim kata dari sumber yang diambil dalam kadar yang hampir menyeluruh. Translated Plagiarism merupakan bentuk plagiarisme dimana kutipan dilakukan dengan mengkutip namun hasil kutipan diterjemahkan ke bahasa yang berbeda biasanya teknik ini disertai dengan adanya perubahan struktur pada pola kalimat sumber yang dikutip. Sedangkan, Idea Plagiarism merupakan bentuk plagiarisme dimana hasil kutipan mengambil ide dari sumber dengan ide yang persis sama namun dijelaskan kembali dengan kata-kata yang berbeda.(meuschke & Gipp, 2013) Ada 3 bentuk plagiarisme yang merupakan penjabaran lebih lanjut dilihat dari Disguised Plagiarism, yakni :(Meuschke & Gipp, 2013) Shake and Paste, merupakan bentuk plagiarisme dimana pengkutipan yang dilakukan mengubah struktur kalimat namun pengubahan yang berlangsung hanya berfokus pada perubahan struktur kata. Paraphrasing, merupakan bentuk plagiarisme dimana pengkutipan yang dilakukan mengubah struktur kalimat serta mengubah kata kata yang digunakan dengan kata kata yang bermakna sama untuk menyampaikan makna yang sama. Technical Disguised, merupakan bentuk plagiarisme dimana metode ini menganalisa kelemahan dari metode pendeteksi palgiarisme dan membuat plagiarisme dengan pola yang tidak dapat dideteksi oleh mesin tersebut Tata Bahasa (Grammar) Tata bahasa atau Grammar merupakan pola penyusunan kalimat baku yang mengikuti standarisasi dalam hal ini khususnya bahasa Inggris. Pola penyusunan kalimat menentukan sebuah kalimat merupakan valid atau tidak.valid disini mengartikan bahwa

3 9 kalimat tersebut tidak memiliki makna ganda atau ambigu.dengan demikian dapat diperoleh kalimat yang valid dengan makna yang jelas.hal ini diperlihatkan dari komponen penyusun kalimat tersebut. Dimana kalimat ini terdiri atas beberapa komponen sebagai berikut, subjek (subject), kata kerja atau predikat (verb), objek (object), komplemen (complement), dan kata keterangan (adverbial). Subjek (Subject) merupakan kata atau kelompok kata (phrase) yang mencerminkan pihak yang memberikan aksi. Kata kerja atau predikat (Verb) merupakan kata kerja yang menunjukkan proses atau tindakan yang dinyatakan dalam kalimat tersebut. Objek (Object) merupakan kata atau kelompok kata (phrase) yang mencerminkan pihak yang menerima akibat dari tindakan yang dilakukan oleh subjek.komplemen (complement)merupakan frase dari sebuah baik kata sifat maupun kata benda.kata keterangan (adverbial) merupakan sebuah frase yang membentuk sebuah keterangan baik waktu, sifat, dan tempat.beberapa pola pembentukan kata akan dijabarkan dibawah ini : 1. Subject + Verb + Adverbial The car is leaving shortly 2. Subject + Verb + Complement The rain is too heavy 3. Subject + Verb + Object I am shooting the duck 4. Subject + Verb + Object + Adverbial The airplane leaving Jakarta at 8 o clock Beberapa contoh diatas merupakan penggambaran beberapa pola dalam pembentukan sebuah kalimat.unsur dasar yang perlu diperhatikan adalah subjek dan

4 10 predikat.sebuah kumpulan kata baru dapat dikatakan kalimat apabila mengandung kedua unsur ini.(eastwood, 2002; Thompson & Martinet, 1986) Frase (Phrase) Frase (Phrase) merupakan kumpulan kata yang tidak mengandung subject dan predikat tapi membentuk sebuah makna. Frase dibagi menjadi 5 macam, yakni Verb Phrase, Noun Phrase, Adjective Phrase, Adverb Phrase, dan Prepositional Phrase.(Eastwood, 2002; Thompson & Martinet, 1986). Dimana : Verb Phrase, merupakan frase yang terbentuk dari kata kerja (verb) yang dilengkapi dengan kata kerja bantu (auxiliary verb). Misal :will be climbing. Noun Phrase, merupakan frase yang terbentuk dari kata benda (noun) yang dilengkapi dengan kata sifat (adjective). Misal :a good fight. Adjective Phrase, merupakan frase yang terbentuk dari kata sifat (adjective) yang dilengkapi dengan kata keterangan ukuran (adverb of degree). Misal :too late. Adverb Phrase, merupakan frase yang terbentuk dari kata keterangan yang dilengkapi dengan kata keterangan ukuran. Misal :almost certainly. Prepositional Phrase, merupakan frase yang terbentuk dari kata depan (preposition) dan dilengkapi dengan noun phrase. Misal :after lunch, on the aircraft Klausa (Clause)

5 11 Klausa (Clause) merupakan pembentukan anak kalimat atau kalimat dasar yang hanya terdiri dari subjek dan predikat yang nantinya akan dipakai dan terhubung dengan induk kalimat dengan menggunakan kalimat sambung.klausa memiliki dua sifat utama, yakni ada yang tergantung dengan klausa utama (dependent tomain clause) dan ada yang tidak bergantung pada kalimat utama (independent to main clause).(eastwood, 2002) Sinonim (Synonym) Sinonim (Synonym) merupakan padanan kata yang berbeda namun memiliki makna dan arti yang sama.biasa padanan kata ini digunakan dalam memadukan kata yang sesuai dengan kalimat sehingga diperoleh makna yang lebih sesuai dengan bahasan penelitian. Seperti halnya pembuatan penelitian kedokteran akan cenderung menggunakan padanan kata yang lebih sesuai dan menggambarkan makna yang sesuai dengan bahasa kedokteran.(eastwood, 2002) Bentuk Pasif (Passive Voice) Bentuk pasif merupakan pembentukan sebuah kalimat dari kalimat aktif yang memiliki makna yang sama dari sebuah kalimat asalnya lainnya.pada penelitian ini, pembentukan kalimat pasif difokuskan terhadap bentuk pasif dari kalimat pada bahasa inggris. Pembentukan kalimat pasif pada bahasa Inggris akan melakukan perubahaan pada jenis kata ganti orang yang digunakan (Promoun), bentuk kata kerja asal (Passive Verb), dan penambahan kata kerja bantu (Auxiliary / Helping Verb). Pada pembentukan kalimat pasif perlu diperhatikan tenses (bentuk waktu) yang digunakan. Dikarenakan pada bahasa Inggris, tiap kalimat perlu diperhatikan bentuk waktu yang digunakan. Namun, struktur inti dari kalimat tetaplah sama, yakni subjek, kata kerja, objek, komplemen, dan kata keterangan.(thompson & Martinet, 1986)

6 Junction Grammar (Grammar Tree) Junction Grammar (Grammar Tree) merupakan metode yang digunakan dalam pemecahan struktur dari unsur unsur penyusun sebuah kalimat ke dalam bentuk pohon. Unsur unsur tersebut nantinya akan dipecah pecah lagi secara mendalam untuk diketahui unsur dasar penyusunnya.dari adanya penerapan Junction Grammar ditemukan bahwa struktur dasar dari sebuah kalimat bersumber dari potongan potongan kata yang saling terhubung dalam bentuk frase dengan adanya aturan penulisan. Perkembangan dari Junction Grammar (JG) berupa Tree Adjoining Grammar (TAG). TAG merupakan penerapan dari Junction Grammar yang diterapkan dengan menggunakan metode Natural Language Processing (NLP)dengan penerapancontext Free Grammar (CFG). TAG merupakan metode pengecekan grammar yang digunakan untuk menentukan benar tidaknya penulisan sebuah kalimat.(millett & Lonsdale, 2004) Gambar 2.1.Salah Satu Bentuk Grammar Tree.(Cohn, Blunsom, & Goldwater, 2010) 2.3. Natural Language Processing (NLP) Natural Language Processing (NLP) merupakan teknik pemrosesan untuk mengolah kalimat ke dalam bentuk sebuah penjabaran unsur penyusun kalimat yang diproses per kata.salah satu bentuk proses pengolahan kata adalah metode Chomsky

7 13 Normal Form (CNF). Metode ini mengolah kalimat per kata dimana masing masing kata akan di analisa jenis katanya serta dilakukan fragmentasi hingga di dapat hasil berupa unsur inti dari kalimat tersebut. Hasil tersebut dapat digambarkan melalui Grammar Tree dimana unsur unsur kalimat akan terpecah pecah dan akan terlihat struktur inti dari kalimat. Penerapan NLP dapat dilihat pada metode metode yang digunakan oleh mesin deteksi plagiarisme dimana metode yang digunakan berupa semantic analysis dan lexical analysis.(mihalcea, Liu, & Lieberman, 2006) Context Free Grammar (CFG) atau Right Linear Grammar merupakan salah satu bentuk penerapan dari Natural Language Processing (NLP) yang merupakan bentuk pengembangan dari Chomsky Normal Form (CNF) dimana setiap tokennon-terminal dapat diturunkan lagi.dalam hal ini token non-terminal dapat digambarkan sebagai variabel dan token terminal sebagai konstan dalam perumpamaan bentuk persamaan aljabar.(krulee, 1991; Collobert, Weston, Bottou, Karlen, Kavukcuoglu, & Kuksa, 2011) 2.4. Algoritma Deteksi Plagiarisme Dengan Penerapan Natural Language Processing Algoritma Deteksi Plagiarisme Berbasis Semantic Analysis Algoritma deteksi plagiarisme berbasis semantic analysis merupakan bentuk penerapan natural language processing (NLP) dalam memproses pengolahan kata untuk deteksi plagiarisme dimana kalimat yang didapat diolah menjadi token token yang memiliki sinonim diwujudkan sebagai token terminal yang bercabang untuk menunjukkan ada tidaknya kata yang memiliki makna yang sama atau sinonim dari kata tersebut. Salah satu metode yang paling terkenal dengan penerapan semantic analysis dalam mendeteksi plagiarisme adalah Latent Semantic Analysis (LSA). LSA memiliki beberapa karakteristik dalam melakukan proses pendeteksian dimana metode tersebut dilakukan dengan penurunan sinonim kata untuk melihat kemiripan plagiarisme.lsa

8 14 melakukan pengukuran kemiripan antara 2 kata dilakukan dengan mengukur nilai kosinus dari penggambaran dua buah vector yang merupakan pencerminan dari kata kata yang dibandingkan.(stamatatos, 2009; Mozgovoy, Kakkonen, & Cosma, Automatic Student Plagiarism Detection: Future Perpectives, 2010) Gambar 2.2.Contoh penggambaran tiga kata kata dalam vector oleh LSA. (Botana, Leon, Olmos, & Escudero, 2010) Pada Gambar 2.2. digambarkan bahwa kata kata yang memiliki makna yang cenderung mirip akan diletakkan pada satu kuadran yang sama dan kata yang memiliki makna sangat berbeda akan diletakkan pada kuadran yang berbeda. Semakin tinggi tingkat kemiripan makna dari kata kata yang ada, maka semakin dekat garis vektor tersebut berada. Prosedur atau tahapan kerja dari algoritma LSA adalah sebagai berikut : (1) Menganalisa isi dokumen dan membangun matriks dimensional dimana setiap baris merepresentasikan kata kata yang unik dan setiap kolom mewakili sebuah dokumen, sebuah paragraph, sebuah kalimat, dsb. Perbandingan berdasarkan kolom bergantung pada kontex dari proses pengecekan yang akan dilakukan.

9 15 (2) Setelah pengukuran linguistik dari kata kata tersebut berupa pengukuran bobot dari istilah istilah kata yang terkait dengan kata tersebut, proses selanjutnya adalah penguraian matriks awal dengan Singular Vector Decomposition (SVD), teknik matematika untuk mengurai matriks X menjadi tiga matriks lainnya (diuraikan sebanyak dimensi k yang disesuaikan dengan konsep yang diberikan). Matriks vektor dari istilah istilah digambarkan sebagai U, sebuah matriks singular digambarkan sebagai S, dan matriks vektor dari dokumen digambarkan sebagai V maka persamaan yang diberikan berupa X = USV T dimana matriks U-V dan S-V. Hal ini memungkinkan untuk melakukan perbandingan satu kata dengan kata lainnya (baik dari kumpulan kata, kalimat, paragraf, esai, dan ringkasan) dimana perbandingan kata kata dilakukan dengan penggambaran vektor yang terletak berdampingan (Adjoining Vector) akan menyatakan kata dengan makna yang mirip. Bentuk rumus pendekatan dalam melakukan perbandingan kosinus antara dua vektor tersebut diberikan dalam bentuk persamaan (1), dimana Vw1 merupakan representasi vektor dari kalimat yang ingin dibandingkan, Vw2 merupakan representasi vektor dari kumpulan kalimat atau dokumen yang akan dibandingkan serta k merupakan dimensi dari jumlah dokumen yang akan dibandingkan terhadap dokumen yang ada.sedangkan, bentuk rumus pendekatan dalam melakukan pengukuran jarak antara dua vektor tersebut, diberikan dalam bentuk persamaan (2).

10 16 Gambar 2.2. Grafik Proporsional Cek Sinonim Dengan LSA. (Landauer, Foltz, & Laham, 1998) Dari Gambar 2.2. dapat dilihat pola proporsional hasil dari penggunaan LSA dalam melakukan pengecekan sinonim kata dengan beragam jumlah. Hasil signifikan diberikan pada level dimensional dimensi.namun, pada pola kalimat yang telah diubah strukturnya LSA tidak dapat memberikan hasil yang akurat.(botana, Leon, Olmos, & Escudero, 2010; Landauer, Foltz, & Laham, 1998) Algoritma Deteksi Plagiarisme Berbasis Lexical Analysis Algoritma deteksi plagiarisme berbasis lexical analysismerupakan bentuk penerapan dari natural language processing (NLP) dalam memproses pengolahan kata untuk deteksi plagiarisme dimana kalimat yang didapat diolah menjadi token token yang nantinya akan dilakukan pengecekan secara per tahap dengan mencocokkan kata per kata untuk melihat kata tersebut merupakan kata yang valid atau tidak dan merupakan kata yang sama dengan kata yang dikutip atau tidak.(sebesta, 2006; Micol, Munoz,

11 17 &Ferrandez, 2011). Salah satu algoritma deteksi yang sering digunakan adalah character n-grams.metode ini tahan terhadap gangguan berupa noise (karakter karakter penyusun kata yang berupa latah yang mengganggu pola struktur kalimat). Dikarenakan metode ini biasa digunakan untuk menentukan konsistensi gaya penulisan kalimat yang beragam.namun metode ini memiliki kelemahan dalam menentukan konsistensi plagiarisme pada kalimat pendek.teknik ini melakukan perbandingan berdasarkan pemotongan kalimat menjadi potongan potongan kata yang panjangnya disesuaikan pada kalimat dan dimulai dari awal karakter pada kalimat tersebut. Posisi pemotongan kata dari n-gram berikutnya akan dimulai dari posisi n-gram terakhir bergeser pada indeks terakhir yang dipotong sesuai dengan offset value. Parameter nbergantung pada divisi yang akan digunakan oleh metode n-gram.sebagai contoh, jika n-gram dibuat dari penggabungan kata kata maka offset merupakan nilai dari kata kata yang dilewati ketika dibuat n-gramberikutnya. Jika n-gram dibuat dengan menggabungkan beberapa huruf tanpa memperhitungkan akhir dari kata maka offsetakan mewakili nilai dari huruf huruf yang dilewati ketika n-gram berikutnya dibuat. Nilai divisi dari n-gram sangat beragam dibanding metode deteksi plagiarisme lainnya yang juga melakukan pendekatan terhadap pemotongan teks menjadi kumpulan n-gram, yang mana cara pemotongan dari n-gram terbagi menjadi 2,yakni : Overlapping n-grams, setiap n-gram dimulai pada posisi dimana potongan tersebut memiliki kesamaan potongan kata (substring) dengan n-gram sebelumnya. Sebagai contoh, pemotongan kata ABCDEBHAAC menjadi n- grams dengan nilai n = 3 dan offset = 1 (nilai yang menentukan huruf yang akan dilewati). Dari pemotongan tersebut didapat kumpulan n-gram sebagai berikut : ABC, BCD, CDE, DEB, EBH, BHA, HAA, dan AAC.

12 18 Non Overlapping n-grams, Tidak ada n-gram yang dibuat dari huruf penyusun atau potongan kata dari n-gram sebelumnya pada posisi yang sama. Persamaan 3 dibawah ini akan mewujudkan cara kerja perbandingan untuk melakukan pendeteksian menggunakan metode n-gram. Dimana A menggambar dokumen yang akan dibandingkan terhadap dokumen B yang dicurigai sebagai dokumen yang merupakan plagiat yang bentuk plagiarisme bersifat dikaburkan (intrinsic plagiarism). Namun, metode n-gram tidak bekerja dengan baik pada kalimat yang pendek. Hal ini dikarenakan kedua kalimat akan dilakukan perbandingan antara segmentasi dari dua buah kalimat dan untuk mengidentifikasikan apakah paragraf yang dibandingkan memiliki gaya penulisan (style) yang berbeda atau tidak. (Chong & Specia, 2011; Stamatatos, 2009; Kucecka, 2011) Algoritma Deteksi Plagiarisme Berbasis Syntactic Analysis. Algoritma deteksi plagiarisme berbasis syntactic analysis merupakan bentuk penerapan dari natural language processing (NLP) dalam memproses pengolahan kata untuk deteksi plagiarisme dimana kalimat didapat diolah menjaditoken tokenyang manatoken token tersebut berupa potongan potongan kata dari kalimat yang kemudian akan dilakukan pengecekan terhadap struktural dari pola penyusunan kalimat tersebut.hal ini biasa digambarkan dengan penerapan context-free grammar (CFG). Hasil lebih lanjut dari proses ini digambarkan oleh context free grammar parse tree. Context free grammar parse tree memperlihatkan hasil pemotongan kalimat dalam bentuk pohon struktur tata

13 19 bahasa (Grammar Tree).Perbandingan kalimat ini dilakukan dengan menganalisa kemiripan makna kalimat dengan memproses pohon sintaks (syntactic dependency trees) antara dua dokumen yang dibandingkan.(bose, 2004; Micol, Munoz, & Ferrandez, 2011; Stamatatos, 2009). Beberapa metode dibawah ini merupakan metode yang paling umum dalam melakukan penguraian kalimat (parsing) : Top Down Parsing, proses penguraian kalimat yang dilakukan pada sebuah parse tree dengan dimulai dari node S (sentence) dan diuraikan hingga ke tahapan terujung melalui pemecahan NP (Noun Phrase) dan VP (Verb Phrase). Bottom Up Parsing, proses penguraian dimulai dari kata pertama pada kalimat yang dibandingkan dan membangun sebuah tree yang bersumber dari kalimat dengan menggunakan aturan dari grammar yang diterapkan per kata. Depth First Parsing, proses penguraian dilakukan dari tree yang telah ada yang diuraikan secara mendalam hingga perlu dilakukan penambahan secara bertahap. Repeated Parse Subtrees, proses penguraian dirancang untuk memecahkan permasalahan ambiguitas dan untuk meningkatkan efisiensi dari algoritma penguraian lainnya. Proses penguraian dilakukan sebaliknya untuk mengecek kesalahan yang ada pada proses penguraian sebelumnya. Dynamic Programming Parsing Algorithms, menggunakan algoritma penguraian secara sebagian untuk memecahkan masalah ambiguitas. Salah satu bentuk algoritma yang merupakan penerapan dari metode ini adalah Part-Of-Speech (POS).Part-Of-Speech (POS) merupakan algoritma yang memecahmecah atau menguraikan kalimat yang akan dibandingkan menjadi kata kata yang dicerminkan oleh token token dan akan dilihat dan disesuaikan berdasarkan polanya. Hal ini sangat diperlukan dalam menentukan ada tidaknya plagiarisme yang dilakukan

14 20 dengan merubah kalimat aktif menjadi pasif.bentuk persamaan dari algoritma ini dapat digambarkan pada persamaan 4, yakni : Pada persamaan tersebut terlihat bahwa kata yang mempunyai makna yang sama (sinonim) berdasarkan kode identik yang diberikan akan dibandingkan terhadap kata yang memiliki makna yang sama pada dokumen sumber. Hal ini juga berlaku sebaliknya apabila yang dilakukan adalah parafrase dengan cara merubah pola kata dan mengambil antonim dari kata tersebut. Tabel 2.1.Tabel Contoh Perbandingan Antara Dua Kalimat yang Dilakukan Plagiarisme Parafrase. Sentence 1 (S1) : The manlikes the woman Sentence 2 (S2) : The woman is like by the man Word S1 : Tag S2 : Tag S1 : Phrase S2 : Phrase man NN NN NP PP like VBZ VBZ VP PP woman NN NN VP NP Pada tabel 2.1.digambarkan bentuk sederhana dari proses perbandingan yang dilakukan dengan penerapan dari algoritma Part-Of-Speech (POS) antara dua kalimat. Kalimat pertama (S1) merupakan kalimat asli pada dokumen sumber, sedangkan kalimat 2 (S2) merupakan bentuk kalimat yang dilakukan plagiarisme parafrase dengan mengubah bentuknya menjadi pasif.terlihat bahwa tiap unsur penyusun inti dari kalimat tersebut dipecah pecah dan dianalisa tipe dari kata tersebut (tag) untuk kemudian dilakukan analisa deteksi plagiarisme.

15 21 Namun, metode ini masih memiliki kekurangan jika plagiarisme yang dilakukan dalam bentuk parafrase. Dikarenakan dokumen yang melakukan parafrase cenderung akan memiliki struktur kalimat yang benar, namun dikarenakan penggunaan kata yang berbeda disertai dengan adanya perubahan struktur pola kalimat sehingga menyamarkan tindakan plagiarisme yang dilakukan. Untuk memperoleh hasil yang lebih akurat, penggunaan metode ini dapat didukung dengan penerapan metode semantic analysis.hal ini membantu menemukan hasil plagiarisme meskipun telah dilakukan perubahan pola aktif ke pasif maupun sebaliknya yang disertai adanya parafrase.(l & R, 2013; Lin, Peng, Yen, & Lin, 2012) Algoritma Deteksi Plagiarisme Berbasis Grammar Analysis. Algoritma deteksi plagiarisme berbasis grammar analysis merupakan bentuk pengembangan dari metodesyntacticanalysis.algoritma ini menggunakan penerapan context free grammar (CFG) dalam melakukan proses analisa deteksinya.metode ini bertujuan untuk menganalisa jenis plagiarisme yang telah dikaburkan (bersifat parafrase).beberapa bentuk algoritma yang menerapkan metode ini adalah algoritma Plag-Inn dan APL2.(Cebrián, Alfonseca, & Orte, 2009; Tschuggnall & Specht, 2013). Plag-Inn merupakan algoritma deteksi plagiarisme dimana pendekatan terhadap plagiarisme dilakukan dengan pengecekan grammardari penulis. Hal ini dilakukan untuk menganalisa kemungkinan terjadi plagiarisme. Proses algoritma Plag-Inndilakukan tanpa melakukan perbandingan dengan sebuah dokumen lain sebagai pembanding diawalnya hingga ditemukan kata yang dicurigai maka proses perbandingan dengan dokumen sumber dilakukan. Tahapan proses kerja dari algoritma ini adalah sebagai berikut :

16 22 (1) Awalnya, dokumen yang dilakukan proses pengecekan akan diuraikan menjadi kalimat kalimat independen dengan menggunakan Sentence Boundary Detection Algorithm. (2) Kemudian dari kalimat kalimat yang telah diurah tersebut, akan dilakukan penguraian lagi dari kalimat terhadap grammar. (3) Hasil dari penguraian kalimat berdasarkan grammar yang digunakan akan digambarkan ke dalam sebuah triangular distance matrix. Dimana, distance d i,j mencerminkan jarak antara kalimat satu dengan kalimat lainnya atau dengan kata lain, setiap baris dari matriks tersebut merupakan perwujudan dari kalimat yang diparsing. Jarak (Distance) antar kalimat tersebut dihitung menggunakan pq-gram distance methods. Persamaan 5 merupakan bentuk persamaan yang menunjukkan perhitungan untuk memperoleh distance dengan menggunakan metode pq-gram dari kata yang dibandingkan. Dimana T1 merupakan tree hasil parser kata yang dibandingkan terhadap T2 merupakan tree hasil parser dari kumpulan kata kata dalam bahasa inggris. Dari perbandingan tersebut akan dilihat irisan dari kemiripan kata dalam kalimat tersebut yang dibandingkan terhadap gabungan kata. Hasil perbandingan tersebut nantinya akan dikalikan dengan 2 dan dikurangi dengan 1. Jika nilai yang diperoleh adalah 1 maka tidak terjadi

17 23 plagiat.selain itu, menentukan keeretan hubungan kata dalam kalimat untuk memprediksi adanya plagiat. Misal, kata yang dibandingkan adalah abcde terhadap defghij maka nilai distance yang diperoleh adalah 1 2 ( 2 / 12 ) = dimana huruf yang sama ada 2 dan total huruf ada 12. Hal ini memperlihatkan semakin tinggi nilai jaraknya maka semakin rendah tingkat plagiat yang dilakukan.contoh tersebut diwujudkan dalam bentuk perbandingan kata.(augsten, Bohlen, & Gamper, 2005; Tschuggnall & Specht, 2013) (4) Untuk memperkirakan terjadinya plagiarisme pada dokumen tersebut maka akan dilihat dari pola yang diberikan pada matriks D dengan perhitungan tiap baris untuk menghitung jarak median (median distance) pada kalimat tersebut. Hasil dari perhitungan tersebut akan dilanjutkan dengan perhitungan dari sebaran normal menggunakan metode Gaussian untuk memperoleh nilai mean (µ) dan standar deviasinya ( ). Penentuan kalimat yang dicurigai sebagai plagiat akan dilihat berdasarkan nilai standar deviasi yang diberikan oleh kalimat tersebut apabila μ.

18 24 Gambar 2.4.Contoh hasil penguraian dari Plag-Inn.(Tschuggnall & Specht, 2013) Pada gambar 2.4.diperlihatkan proses penguraian dengan menggunakan algoritma dari Plag-Inn dimana kata yang diuraikan berasal dari kalimat Today, Officials said that the strongest indian rain which was ever recorded forced Mumbai s financial hub to shut down. Dari parsing tree diatas terlihat perbedaan yang jelas antara context free grammar umum dengan context free grammar yang telah dimodifikasi oleh Plag-Inn. Pada Plag-Inn parsing tree terlihat bahwa semua token yang merupakan penguraian dari kalimat akan diproses, sebandingnya pada CFG umumnya hanya unsur inti dari kalimat yang akan diproses. Namun, Algoritma Plag-Inn memiliki kelemahan, dikarenakan proses pendeteksian dilakukan berdasarkan grammar maka perbandingan terhadap dokumen sumber (reference corpus) hanya ketika ditemukan ada keganjilan pada grammar dalam dokumen tersebut. Hal ini menyebabkan proses pendeteksian menjadi tidak akurat apabila dilangsungkan terhadap dokumen yang melakukan plagiarisme namun memiliki struktur tata bahasa yang benar. Dikarenakan algoritma ini berfokus pada gaya penulisan dari

19 25 penulis untuk membentuk sebuah pola dalam menganalisa jika terjadi adanya plagiat.(tschuggnall & Specht, 2013) APL2 merupakan salah satu algoritma yang menganalisa plagiarisme berdasarkan grammarnamun memiliki pola analisa context free grammar(ditunjukkan pada gambar 2.5.) yang berbeda serta hasil dari penguraian tersebut akan digambarkan menggunakan Minimum Spanning Trees (MSTs). Algoritma ini melakukan proses pendeteksian dengan menghitung nilai rata rata (means) dari kalimat tersebut berdasarkan pola grammar dari kalimat tersebut. Perbedaannya adalah pada algoritma ini dilakukan perbandingan dengan dokumen sumber (reference corpus). Gambar 2.5.Pola Context Free Grammar pada Algoritma APL2. (Cebrián, Alfonseca, & Orte, 2009)

20 26 Gambar 2.6. Bentuk hasil proses penguraian dan pendeteksian yang digambarkan kedalam MST. (Cebrián, Alfonseca, & Orte, 2009) Pada gambar 2.6.bentuk bulat mewakili perwujudan dokumen sumber, kotak mewakili perwujudan dokumen plagiat yang bersumber pada satu sumber, jajargenjang mewakili perwujudan dokumen plagiat yang bersumber pada lebih dari satu dokumen dan kurang dari empat, dan segienam mewakili perwujudan dokumen plagiat yang bersumber pada lebih dari empat sumber.sedangkan garis merupakan bentuk perwujudan keeratan plagiat yang dilakukan, semakin solid garis yang ditunjukkan maka semakin mirip plagiat yang terjadi dihadapkan pada dokumen sumber.namun kekurangan dari metode deteksi ini adalah keterbatasan penggunaan dimana algoritma ini cenderung digunakan dalam mendeteksi source code dari aplikasi yang ada.(cebrián, Alfonseca, & Orte, 2009)

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pemrosesan Bahasa Alami (Natural Language Processing) Pemrosesan bahasa alami (Natual Language Processing - NLP) merupakan salah satu bidang ilmu Kecerdasan Buatan (Artificial

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

Penentuan Pola Kalimat Bahasa Inggris Pada Simple Present Tense Menggunakan Metode Bottom Up Parsing

Penentuan Pola Kalimat Bahasa Inggris Pada Simple Present Tense Menggunakan Metode Bottom Up Parsing Meilani, Penentuan Pola Kalimat Bahasa Inggris Pada Simple Present Tense. 9 Penentuan Pola Kalimat Bahasa Inggris Pada Simple Present Tense Menggunakan Metode Bottom Up Parsing Budanis Dwi Meilani 1, Muhamad

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan BAB I PENDAHULUAN 1.1 Latar Belakang Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan sebuah sistem penilaian atau evaluasi. Penilaian adalah suatu proses untuk mengambil keputusan dengan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teks naratif menurut kamus besar bahasa Indonesia adalah teks yang berisikan deretan sejarah, peristiwa atau kejadian dan sebagainya. Kata naratif sendiri berasal

Lebih terperinci

Natural Language Processing

Natural Language Processing Disiplin ilmu NPL Natural Language Processing By: Uro Abdulrohim, S.Kom, MT Fonetik / fonologi Morfologi Sintaksis Semantik Pragmatik Discource knowledge World knowledge 1 3 Apa itu NLP Proses pembuatan

Lebih terperinci

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER Hanif Al Fatta Abstraksi Aplikasi konsep AI terus berkembang. Salah satunya adalah bagaimana membuat komputer memahami perintah yang diberikan

Lebih terperinci

BAB I PENDAHULUAN. sendiri, menyatakan makna yang lengkap dan mengungkapkan suatu

BAB I PENDAHULUAN. sendiri, menyatakan makna yang lengkap dan mengungkapkan suatu BAB I PENDAHULUAN 1.1 Latar Belakang Kalimat adalah gabungan dari beberapa kata yang dapat berdiri sendiri, menyatakan makna yang lengkap dan mengungkapkan suatu maksud dari pembicara. Secara tertulis,

Lebih terperinci

Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA)

Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA) Tugas Akhir Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA) Oleh: Danang Wahyu Wicaksono (1210100027) Pembimbing: 1. Prof. DR. Mohammad Isa

Lebih terperinci

APLIKASI PROGRAM DINAMIS DALAM ALGORITMA COCKE- YOUNGER -KASAMI (CYK)

APLIKASI PROGRAM DINAMIS DALAM ALGORITMA COCKE- YOUNGER -KASAMI (CYK) APLIKASI PROGRAM DINAMIS DALAM ALGORITMA COCKE- YOUNGER -KASAMI (CYK) Inas Luthfi 1) NIM 13506019 1) Jurusan Teknik Informatika ITB, Jalan Ganesha 10 Bandung Indonesia 40132 email: if16019@students.if.itb.ac.id

Lebih terperinci

Outline. IKI 40931: Topik Khusus: NLP Kuliah 7: Parsing CFG. Parsing. Contoh parsing. Ruli Manurung. 10 Maret (Bab Jurafsky & Martin)

Outline. IKI 40931: Topik Khusus: NLP Kuliah 7: Parsing CFG. Parsing. Contoh parsing. Ruli Manurung. 10 Maret (Bab Jurafsky & Martin) Outline IKI 40931: Topik Khusus: NLP Kuliah 7: Parsing CFG (Bab 10.1-10.4 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 10 Maret 2008 1 2 3 4 Parsing Contoh parsing CFG

Lebih terperinci

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai

Lebih terperinci

(3) (6) MINGGU KE. BAHAN KAJIAN (materi ajar)

(3) (6) MINGGU KE. BAHAN KAJIAN (materi ajar) RENCANA PEMBELAJARAN SEMESTER Mata Kuliah English For Business Semester Satu Kode Prodi Manajemen Dosen Fetty Poerwita Sary SKS 4 Capaian Pembelajaran Mahasiswa mampu memahami tata bahasa Inggris yang

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa merupakan alat komunikasi lingual manusia baik secara lisan maupun tulisan. Dalam membuat suatu karya ilmiah, penggunaan Bahasa Indonesia harus sesuai

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa Inggris merupakan salah satu bahasa yang sering digunakan baik pada percakapan sehari-hari maupun pada dunia akademik. Penelitian mengenai pemeriksaan

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

Pemodelan CNF Parser dengan Memanfaatkan Pohon Biner

Pemodelan CNF Parser dengan Memanfaatkan Pohon Biner Pemodelan CNF Parser dengan Memanfaatkan Pohon Biner Jansen 13510611 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia. Perbandingan metode..., Heninggar Septiantri, FASILKOM UI, 2009

BAB 1 PENDAHULUAN. Universitas Indonesia. Perbandingan metode..., Heninggar Septiantri, FASILKOM UI, 2009 1 BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang penelitian beserta perumusan masalah, tujuan, dan ruang lingkup penelitian, yang dilanjutkan dengan penjelasan tahapan penelitian dan sistematika

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Di dalam dunia pemrograman komputer, kode program (source code) adalah kumpulan deklarasi atau pernyataan dari bahasa pemrograman computer yang di tulis dan bisa dibaca

Lebih terperinci

BAB II SINTAKS 2.1. SINTAKS

BAB II SINTAKS 2.1. SINTAKS BAB II SINTAKS 2.1. SINTAKS merupakan kumpulan aturan yang mendefinisikan suatu bentuk bahasa. mendefinisikan bagaimana suatu kalimat dibentuk sebagai barisan/urutan dari pemilihan suatu kata dasar. Kata

Lebih terperinci

KUTIPAN DAN PARAPRASI (Quoting and Paraphrasing)

KUTIPAN DAN PARAPRASI (Quoting and Paraphrasing) KUTIPAN DAN PARAPRASI (Quoting and Paraphrasing) www.rudifebriamansyah.webege.com KUTIPAN DAN PARAPRASI (Quoting and Paraphrasing) When you QUOTE, you are borrowing from another text by copying information

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : 2089-9033 Analisis Perbandingan Algoritma LCP (Left-Corner-Parsing) Dan Algoritma CYK (Cocke-Younger-Kasami) Untuk Memeriksa

Lebih terperinci

2.5 Context-Free Grammar (CFG) LALR Parser Bab 3 Metodologi Penelitian Studi Literatur Desain Sistem P

2.5 Context-Free Grammar (CFG) LALR Parser Bab 3 Metodologi Penelitian Studi Literatur Desain Sistem P Daftar Isi Lembar Pengesahan Pembimbing... i Lembar Pengesahan Penguji... ii Abstrak... iii Abstract... iv Pernyataan Keaslian Tulisan... v Publikasi Selama Masa Studi... vi Kontribusi Yang Diberikan Oleh

Lebih terperinci

SINTAKS. Sintaks dari bahasa pemrograman di defenisikan dengan 2 kumpulan aturan, yaitu:

SINTAKS. Sintaks dari bahasa pemrograman di defenisikan dengan 2 kumpulan aturan, yaitu: SINTAKS Bahasa mesin adalah bentuk terendah komputer. Kita dapat berhubungan langsung dengan bagian-bagian yang ada di dalam komputer seperti bits, register. Bahasa mesin terdiri dari bit-bit 0 dan 1.

Lebih terperinci

BAB II TINJAUAN PUSTAKA. seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil

BAB II TINJAUAN PUSTAKA. seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Plagiarisme Ada beberapa definisi menurut para ahli lainnya (dalam Novanta, 2009), yaitu : 1. Menurut Ir. Balza Achmad, M.Sc.E, plagiarisme adalah berbuat

Lebih terperinci

DESKRIPSI LEARNING OUTCOME MATA KULIAH BAHASA INGGRIS TPB 108 PROGRAM MATA KULIAH DASAR UMUM ( MKDU ) INSTITUT PERTANIAN BOGOR 2012

DESKRIPSI LEARNING OUTCOME MATA KULIAH BAHASA INGGRIS TPB 108 PROGRAM MATA KULIAH DASAR UMUM ( MKDU ) INSTITUT PERTANIAN BOGOR 2012 DESKRIPSI LEARNING OUTCOME MATA KULIAH BAHASA INGGRIS TPB 108 PROGRAM MATA KULIAH DASAR UMUM ( MKDU ) INSTITUT PERTANIAN BOGOR 2012 PERTEMUAN I OVERVIEW Sub bahasan mata kuliah ini mengingatkan mahasiswa

Lebih terperinci

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun Vol. 1, No. 2, Tahun 2012 15 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : http://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Aplikasi Pendeteksi Plagiat dengan

Lebih terperinci

Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA)

Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA) JURNAL SAINS DAN SENI POMITS Vol. 3, No. 2, (2014) ISSN: 2337-3539 (2301-9271 Print) A-41 Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari negara Indonesia. Bahasa Indonesia memiliki sekitar 23 juta penutur asli pada tahun 2010, dan lebih dari 140.000.000 penutur

Lebih terperinci

SINTAKS. Sintaks dari bahasa pemrograman di defenisikan dengan 2 kumpulan aturan, yaitu:

SINTAKS. Sintaks dari bahasa pemrograman di defenisikan dengan 2 kumpulan aturan, yaitu: SINTAKS Bahasa mesin adalah bentuk terendah komputer. Kita dapat berhubungan langsung dengan bagian-bagian yang ada di dalam komputer seperti bits, register. Bahasa mesin terdiri dari bit-bit 0 dan 1.

Lebih terperinci

Teknik Kompiler 6. oleh: antonius rachmat c, s.kom

Teknik Kompiler 6. oleh: antonius rachmat c, s.kom Teknik Kompiler 6 oleh: antonius rachmat c, s.kom Analisis Sintaks (Parser) Analisis Sintaks bergantung pada bahasa pemrograman masing-masing. Karena masing-masing bahasa pemrograman memiliki bentuk sintaks

Lebih terperinci

BAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi

BAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi BAB I PENDAHULUAN 1. 1 Latar Belakang Masalah Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi dengan sesamanya memerlukan sarana untuk menyampaikan kehendaknya. Salah satu sarana komunikasi

Lebih terperinci

BAB I PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN. I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Pola tata bahasa memiliki manfaat dalam pemrosesan bahasa alami. Pemrosesan bahasa alami berawal dari keinginan manusia untuk berkomunikasi dengan komputer menggunakan

Lebih terperinci

Aplikasi Rekursif dalam Analisis Sintaks Program

Aplikasi Rekursif dalam Analisis Sintaks Program Aplikasi Rekursif dalam Analisis Sintaks Program Albertus Kelvin / 13514100 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132,

Lebih terperinci

REPRESENTASI PENGETAHUAN

REPRESENTASI PENGETAHUAN REPRESENTASI PENGETAHUAN Pengetahuan (Knowledge) : Definisi umum : fakta atau kondisi sesuatu atau keadaan yang timbul karena suatu pengalaman. Cabang ilmu filsafat, yaitu Epistemology, berkenaan dengan

Lebih terperinci

Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis. Menggunakan simbol persegi panjang untuk non terminal

Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis. Menggunakan simbol persegi panjang untuk non terminal Diagram Syntax Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis Menggunakan simbol persegi panjang untuk non terminal Lingkaran untuk simbol terminal Misalnya E T T+E T-E E T + - BNF:

Lebih terperinci

SEMANTIK Syntax mendefinisikan suatu bentuk program yang benar dari suatu bahasa.

SEMANTIK Syntax mendefinisikan suatu bentuk program yang benar dari suatu bahasa. SEMANTIK Syntax mendefinisikan suatu bentuk program yang benar dari suatu bahasa. Semantik mendefinisikan arti dari program yang benar secara syntax dari bahasa tersebut. Semantik suatu bahasa membutuhkan

Lebih terperinci

Universitas Bina Nusantara. Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Ganjil 2007 / 2008

Universitas Bina Nusantara. Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Ganjil 2007 / 2008 Universitas Bina Nusantara Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Ganjil 2007 / 2008 ANALISIS DAN PERANCANGAN APLIKASI PENERJEMAH BAHASA INDONESIA KE DALAM

Lebih terperinci

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH...iii. DAFTAR ISI... vi. DAFTAR TABEL... ix. DAFTAR GAMBAR...x

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH...iii. DAFTAR ISI... vi. DAFTAR TABEL... ix. DAFTAR GAMBAR...x DAFTAR ISI ABSTRAK... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH...iii DAFTAR ISI... vi DAFTAR TABEL... ix DAFTAR GAMBAR...x DAFTAR LAMBANG DAN SINGKATAN..xi DAFTAR LAMPIRAN... xii BAB I PENDAHULUAN...1

Lebih terperinci

MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA DOSEN:

MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA DOSEN: MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA DOSEN: Mira Kania S.,ST.,MT Utami Dewi W.,S.Kom IF I. PENDAHULUAN PENDAHULUAN Komputer digunakan sebagai alat bantu untuk menyelesaikan pekerjaan(task). Dua pertanyaan

Lebih terperinci

ALGORITMA PEMROGRAMAN 1C SINTAKS

ALGORITMA PEMROGRAMAN 1C SINTAKS ALGORITMA PEMROGRAMAN 1C SINTAKS Indah Wahyuni PENDAHULUAN Bahasa mesin adalah bentuk terendah komputer. Kita dapat berhubungan langsung dengan bagianbagian yang ada didalam komputer seperti bits, register.

Lebih terperinci

ANALISIS SINTAKTIS DAN SEMANTIS MOTO IKLAN ROKOK BERBAHASA INGGRIS SKRIPSI

ANALISIS SINTAKTIS DAN SEMANTIS MOTO IKLAN ROKOK BERBAHASA INGGRIS SKRIPSI ANALISIS SINTAKTIS DAN SEMANTIS MOTO IKLAN ROKOK BERBAHASA INGGRIS SKRIPSI diajukan untuk memenuhi Ujian Sarjana pada Program Studi Bahasa Inggris Fakultas Bahasa Universitas Widyatama Oleh: R. Harisma

Lebih terperinci

BAB I PENDAHULUAN. memiliki tata bahasa dan aturan yang lebih luas dan luwes, sehingga tidak

BAB I PENDAHULUAN. memiliki tata bahasa dan aturan yang lebih luas dan luwes, sehingga tidak BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa alami atau bahasa non formal adalah bahasa komunikasi yang digunakan oleh manusia, yaitu bahasa ucap seperti bahasa Indonesia, bahasa Inggris, bahasa Arab. Sintaks

Lebih terperinci

LANGUAGES AND TRANSLATOR

LANGUAGES AND TRANSLATOR Algoritma dan Pemrograman 1C Konsep Bahasa Pemrograman LANGUAGES AND TRANSLATOR Disusun kembali oleh : Henny Medyawati, Universitas Gunadarma Sumber: Pittman, Thomas dan James Petters, 1992 The Art of

Lebih terperinci

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Pengukuran Kemiripan Dokumen dengan Menggunakan Tools Gensim (Sekarwati dkk.) PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Kemal Ade Sekarwati 1*, Lintang Yuniar Banowosari 2, I Made Wiryana

Lebih terperinci

SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR. Devi Dwi Purwanto

SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR. Devi Dwi Purwanto SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR Devi Dwi Purwanto Sistem Informasi Sekolah Tinggi Teknik Surabaya E-mail: devi@stts.edu Abstract Plagiarism can

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Salah satu cabang dari ilmu komputer yang mulai populer adalah Artificial Intelligence atau kecerdasan buatan. Kecerdasan buatan merupakan sub-bidang dari

Lebih terperinci

RENCANA PELAKSANAAN PEMBELAJARAN (RPP)

RENCANA PELAKSANAAN PEMBELAJARAN (RPP) RENCANA PELAKSANAAN PEMAN (RPP) Nama Dosen : Dra. Dewi Nurnani Fakultas : Seni Pertunjukan NIP : 196610021995122001 Program Studi : Seni Pedalangan Mata Kuliah/ Blok Mata Kuliah : Bahasa Inggris/Teori

Lebih terperinci

TEKNIK KOMPILASI. Dosen : Dwi Retno Wahyuningsih, S. Kom. Jurusan : Teknik Informatika Semester Genap 2007/2008

TEKNIK KOMPILASI. Dosen : Dwi Retno Wahyuningsih, S. Kom. Jurusan : Teknik Informatika Semester Genap 2007/2008 TEKNIK KOMPILASI Dosen : Dwi Retno Wahyuningsih, S. Kom Jurusan : Semester Genap 2007/2008 SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER (STMIK) DARMAJAYA BANDAR LAMPUNG 2008 GARIS-GARIS BESAR PROGRAM

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Bahasa menurut kamus Websters adalah the body of words and methods of

BAB II TINJAUAN PUSTAKA. Bahasa menurut kamus Websters adalah the body of words and methods of BAB II TINJAUAN PUSTAKA 2.1 Bahasa Alami dan Bahasa Formal Bahasa menurut kamus Websters adalah the body of words and methods of combining words used and understood by a considerable community, sedangkan

Lebih terperinci

Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA)

Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA) 1 Sistem Deteksi Kemiripan Antar Dokumen Teks Menggunakan Model Bayesian Pada Term Latent Semantic Analysis (LSA) Danang Wahyu Wicaksono, Mohammad Isa Irawan, dan Alvida Mustika Rukmi Matematika, Fakultas

Lebih terperinci

Komponen sebuah Kompilator

Komponen sebuah Kompilator Komponen sebuah Kompilator Program Subjek Program Objek ANALISIS SINTESIS Penganalisis Leksikal (Scanner) Penganalisis Sintaks (Parser) Penganalisis Semantik Pembentuk Kode Pengoptimal Kode TABEL 1 Scanning

Lebih terperinci

Hirarki Comsky. Unrestricted. Context Sensitive Context free Regular

Hirarki Comsky. Unrestricted. Context Sensitive Context free Regular Hirarki Comsky Unrestricted Context Sensitive Context free Regular Contoh Tata Bahasa Sederhana BEGIN END ;

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi informasi, maka proses dan media penyimpanan data pun semakin berkembang. Dengan adanya personal computer (PC), orang dapat menyimpan,

Lebih terperinci

IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI

IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI BERRY SAFAAT HARAHAP 091401015 PROGRAM STUDI (S-1) ILMU KOMPUTER FAKULTAS

Lebih terperinci

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1 Bahasa Alami 1 Peranan Pengetahuan dalam Bahasa Masalah Bahasa Alami Proses Sintaksis Grammar dan Parser Automated Transition Network Referensi Luger & Stubblefield : bab-3 Rich & Knight : bab 15 Bahasa

Lebih terperinci

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

MODEL KOMPILATOR FUNGSI UMUM BAGIAN KOMPILATOR. Dosen Pengampu: Utami Dewi Widianti,S.Kom

MODEL KOMPILATOR FUNGSI UMUM BAGIAN KOMPILATOR. Dosen Pengampu: Utami Dewi Widianti,S.Kom MODEL KOMPILATOR FUNGSI UMUM BAGIAN KOMPILATOR Dosen Pengampu: Utami Dewi Widianti,S.Kom (1) Program Sumber Deretan simbol berupa huruf, digit, atau simbol tertentu seperti +, -, dan, Program sumber memuat

Lebih terperinci

IMPLEMENTASI LEFT CORNER PARSING UNTUK PEMBELAJARAN GRAMMAR BAHASA INGGRIS PADA GAME 3D ADVENTURE GO TO LONDON

IMPLEMENTASI LEFT CORNER PARSING UNTUK PEMBELAJARAN GRAMMAR BAHASA INGGRIS PADA GAME 3D ADVENTURE GO TO LONDON IMPLEMENTASI LEFT CORNER PARSING UNTUK PEMBELAJARAN GRAMMAR BAHASA INGGRIS PADA GAME 3D ADVENTURE GO TO LONDON Fachry Khusaini, Fachrul Kurniawan Jurusan teknik Informatika 1,2, Fakultas Sains dan Teknologi,

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : A22.53107 / Bahasa Inggris 1 Revisi ke : 3 Satuan Kredit Semester : 2 SKS Tgl revisi : 2 Januari 2014 Jml Jam kuliah dalam

Lebih terperinci

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING 1 Nurzaenab dan 2 Purnawansyah 1 nurzaenab16@yahoo.co.id, 2 purnawansyah@gmail.com 12 Teknik Informatika, Fakultas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Basis data merupakan kumpulan data yang berisi informasi yang sesuai bagi sebuah institusi/perusahaan (Silberschatz, 2002). Data-data yang disimpan dalam basis data

Lebih terperinci

UKDW BAB I PENDAHULUAN Latar Belakang Masalah

UKDW BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Kemajuan teknologi informasi memberikan kemudahan akses atas berbagai informasi termasuk hasil karya intelektual dalam bentuk dokumen, seperti karya penulisan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di

Lebih terperinci

IMPLEMENTASI PENGGUNAAN SISTEM APLIKASI WEB PDF PARSER UNTUK MENAMPILKAN INFORMASI ISI DOKUMEN

IMPLEMENTASI PENGGUNAAN SISTEM APLIKASI WEB PDF PARSER UNTUK MENAMPILKAN INFORMASI ISI DOKUMEN IMPLEMENTASI PENGGUNAAN SISTEM APLIKASI WEB PDF PARSER UNTUK MENAMPILKAN INFORMASI ISI DOKUMEN Yulianto1), Fifit Alfiah2), Andy Nova Wijaya3), Muh. Rizal Ramadhan4), Leo Kumoro Sakti5), Mubtasir6), Abdul

Lebih terperinci

DEFINISI. Pohon adalah graf tak-berarah terhubung yang tidak mengandung sirkuit. pohon pohon bukan pohon bukan pohon 2

DEFINISI. Pohon adalah graf tak-berarah terhubung yang tidak mengandung sirkuit. pohon pohon bukan pohon bukan pohon 2 1 POHON DEFINISI Pohon adalah graf tak-berarah terhubung yang tidak mengandung sirkuit a b a b a b a b c d c d c d c d e f e f e f e f pohon pohon bukan pohon bukan pohon 2 Hutan (forest) adalah - kumpulan

Lebih terperinci

GARIS-GARIS BESAR PROGRAM PENGAJARAN PROGRAM STUDI : DIII KOMPUTERISASI PERKANTORAN DAN KESEKRETARIATAN Semester : 1

GARIS-GARIS BESAR PROGRAM PENGAJARAN PROGRAM STUDI : DIII KOMPUTERISASI PERKANTORAN DAN KESEKRETARIATAN Semester : 1 GARIS-GARIS BESAR PROGRAM PENGAJARAN PROGRAM STUDI : DIII KOMPUTERISASI PERKANTORAN DAN SEKRETARIATAN Semester : 1 MATA KULIAH : BAHASA INGGRIS I KODE MATA KULIAH / SKS : 390152037 / 2 SKS MATA KULIAH

Lebih terperinci

Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp

Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp Fadhil Imam Kurnia - 13515146 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

TEORI BAHASA DAN AUTOMATA

TEORI BAHASA DAN AUTOMATA MODUL I TEORI BAHASA DAN AUTOMATA Tujuan : Mahasiswa memahami pengertian dan kedudukan Teori Bahasa dan Otomata (TBO) pada ilmu komputer Definisi dan Pengertian Teori Bahasa dan Otomata Teori bahasa dan

Lebih terperinci

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa BAB II TINJAUAN PUSTAKA Bab ini membahas hal-hal apa saja yang pernah dilakukan sebelumnya mengenai model-model pola tata bahasa, pengurai (parser) untuk bahasa lain, dan pembangkitan pola tata bahasa

Lebih terperinci

BAB V CONTEXT FREE GRAMMAR DAN PUSH DOWN AUTOMATA

BAB V CONTEXT FREE GRAMMAR DAN PUSH DOWN AUTOMATA Bab V Context Free Grammar dan Push Down Automata 26 BAB V CONTEXT FREE GRAMMAR DAN PUSH DOWN AUTOMATA TUJUAN PRAKTIKUM 1. Memahami CFG dan PDA 2. Memahami Context Free Grammar 3. Memahami Push Down Automata

Lebih terperinci

Bab 1 Pendahuluan 1.1 Latar Belakang

Bab 1 Pendahuluan 1.1 Latar Belakang Bab 1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan salah satu aspek penting dalam kehidupan manusia karena bahasa adalah alat untuk berkomunikasi dengan manusia lain. Bahasa dapat disajikan dalam bentuk

Lebih terperinci

Analisis Sintaksis (syntactic analyzer atau parser)

Analisis Sintaksis (syntactic analyzer atau parser) Analisis Sintaksis (syntactic analyzer atau parser) pohon (tree) suatu graph terhubung yang tidak sirkuler, memiliki satu buah simpul (atau vertex / node) yaitu akar (root) dan dari akar ini memiliki lintasan

Lebih terperinci

ABSTRAK. Kata Kunci : Algoritma Genetika, Pemrosesan Bahasa Alami, Twiter, Tweet, Semantic Relatedness. Universitas Kristen Maranatha

ABSTRAK. Kata Kunci : Algoritma Genetika, Pemrosesan Bahasa Alami, Twiter, Tweet, Semantic Relatedness. Universitas Kristen Maranatha ABSTRAK Dengan munculnya berbagai media sosial, banyak orang yang menuliskan bermacam-macam hal, salah satunya memberikan menuliskan motivasi. Dengan demikian, dibuatlah penelitian untuk membuat sebuah

Lebih terperinci

RENCANA PEMBELAJARANSEMESTER (RPS) MATA KULIAH: BAHASA INGGRIS

RENCANA PEMBELAJARANSEMESTER (RPS) MATA KULIAH: BAHASA INGGRIS RENCANA PEMBELAJARANSEMESTER (RPS) MATA KULIAH: BAHASA INGGRIS PROGRAM STUDI D-III KEUANGAN DAN PERBANKAN 2015 1 9 Nama Mata Kuliah : Basic English for Business Kode Mata Kuliah/sks : DK20-020 / 2 sks

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.

Lebih terperinci

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

UNIVERSITAS NEGERI YOGYAKARTA

UNIVERSITAS NEGERI YOGYAKARTA DEPARTEMEN PENDIDIKAN NASIONAL UNIVERSITAS NEGERI YOGYAKARTA FAKULTAS BAHASA DAN SENI JURUSAN PENDIDIKAN SENI TARI Alamat: Karangmalang, Yogyakarta 55281 (0274) 550843, 548207 Fax. (0274) 548207 http:

Lebih terperinci

BAB I PENDAHULUAN. penelitian, manfaat penelitian, dan kerangka teori yang digunakan.

BAB I PENDAHULUAN. penelitian, manfaat penelitian, dan kerangka teori yang digunakan. BAB I PENDAHULUAN Bab ini menjelaskan latar belakang penelitian, rumusan masalah, tujuan penelitian, manfaat penelitian, dan kerangka teori yang digunakan. 1.1 Latar Belakang Penelitian Masyarakat yang

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : E124105 / Bahasa Inggris 1 Revisi ke : 4 Satuan Kredit Semester : 2 SKS Tgl revisi : 16 Juli 2015 Jml Jam kuliah dalam seminggu

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE

DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Abdul Najib 1), Karyo Budi Utomo 2) 1), 2) Jurusan Teknologi Informasi, Politeknik Negeri Samarinda Email: abdulnajib@polnes.ac.id

Lebih terperinci

Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia

Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia Jody 1, Agung Toto Wibowo 2, Anditya Arifianto 3 1.2.3 Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. klausa bukanlah kalimat karena klausa harus tergabung dengan klausa lainnya

BAB I PENDAHULUAN. klausa bukanlah kalimat karena klausa harus tergabung dengan klausa lainnya BAB I PENDAHULUAN 1.1 Latar Belakang Klausa merupakan satuan sintaksis yang memiliki ciri seperti kalimat, tapi klausa bukanlah kalimat karena klausa harus tergabung dengan klausa lainnya agar dapat membentuk

Lebih terperinci

PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP

PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP Ade Mirza Surahman Program Studi Teknik Informatika Fakultas Teknik Universitas Tanjungpura

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : D22.5104 / Bahasa Inggris 1 Revisi ke : 2 Satuan Kredit Semester : 2 SKS Tgl revisi : 6 September 2011 Jml Jam kuliah dalam

Lebih terperinci

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus BAB I PENDAHULUAN 1. LATAR BELAKANG MASALAH llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI Pada bab ini akan dibahas mengenai beberapa landasan teori yang digunakan untuk perancangan dan pembuatan aplikasi rekomendasi informasi yang bisa dijadikan sebagai acuan. 3.1 Media

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB V PENUTUP. dapat ditarik beberapa simpulan sebagai berikut.

BAB V PENUTUP. dapat ditarik beberapa simpulan sebagai berikut. BAB V PENUTUP 5.1 Simpulan Berdasarkan penelitian dan pembahasan pada bab-bab sebelumnya, maka dapat ditarik beberapa simpulan sebagai berikut. Secara garis besar kalimat imperatif bahasa Indonesia dapat

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1. Kompresi Data Kompresi adalah mengecilkan/ memampatkan ukuran. Kompresi Data adalah teknik untuk mengecilkan data sehingga dapat diperoleh file dengan ukuran yang lebih kecil

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 3 BAB II TINJAUAN PUSTAKA Pada bab ini diberikan beberapa penjelasan yang akan digunakan pada bab-bab selanjutnya. 1. Kelas Kata Semantik (Yunani : semanein = berarti, bermaksud; semanticos = makna) adalah

Lebih terperinci

SEMANTIK. Int vector[10];

SEMANTIK. Int vector[10]; SEMANTIK Sintaks mendefinisikan suatu bentuk program yang benar dari suatu bahasa. Semantik mendefinisikan arti dari program yang benar secara sintaks dari bahasan tersebut. Sebagai contoh adalah deklarasi

Lebih terperinci