Gambar 4 Ilustrasi bagian dokumen yang digunakan untuk pemrosesan.
|
|
- Handoko Lie
- 7 tahun lalu
- Tontonan:
Transkripsi
1 6 pada akhir, seperti newsipb txt yang berarti data berasal dari berita IPB dan diterbitkan pada tanggal 11 bulan Januari tahun 211 urutan ke-2. Dokumen memiliki ukuran terkecil 1 KB dan terbesar 9 KB. Masingmasing dokumen uji berekstensi teks (*.txt) dengan struktur XML di dalamnya. Berikut adalah contoh struktur dokumen pengujian: <DOC> <DOCNO> newsipb </DOCNO> <TITLE> President of the BEM-KM IPB Talk about Human Rights </TITLE> <AUTHOR> admin ipb </AUTHOR> <DATE> January </DATE> <TEXT> Commemorating Human Rights Day (HAM) on December 1, the RRI Dialog (14/12) presented the President of BEM-KM (Student Executive Body) IPB, Moh. Reza Pahlevi. We know that it is the students that most frequently and diligently call on human rights, especially after the death of a human rights defender, Munir. "Our demonstrations are of pure calls for the rights of the many people who want to benefit from the facilities provided by the government without having to distinguish between the rich and the poor. We've tweaked (criticized) the local government of West Java by growing catfish on Jalan Baru (a street s name), so that the government would promptly fix the damaged road with holes on it," said Reza (mtd) </TEXT> </DOC> Pada tahap indexing, pemrosesan dokumen hanya diambil bagian yang diapit oleh tag <TITLE> dan <TEXT>, sedangkan untuk pembentukan passages, yang digunakan hanya bagian dokumen yang diapit oleh tag <TEXT>. Gambar 4 menunjukkan ilustrasi bagian dokumen yang diproses. Gambar 4 Ilustrasi bagian dokumen yang digunakan untuk pemrosesan. Pemrosesan Dokumen Tahap pertama yang dilakukan pada pemrosesan dokumen adalah penamaan entitas (named entity) atau biasa dikenal dengan sebutan tagging. Proses tagging ini dilakukan secara manual untuk mendapatkan koleksi dokumen yang baik sehingga nantinya dapat dijadikan acuan untuk penelitian berikutnya. Aplikasi untuk melakukan tagging secara otomatis baik sistem yang komersial maupun yang open source untuk bahasa Inggris sebenarnya sudah banyak dikembangkan, misalnya LingPipe, BOEMIE, FreeLing, dan OpenEyes. Namun karena pertimbangan waktu penelitian, penggunaan aplikasi tersebut tidak dilakukan. Penamaan entitas ditujukan untuk proses perolehan kandidat jawaban sesuai dengan jenis pertanyaannya. Adapun named entity yang digunakan terdiri atas NAME, ORGANIZATION, NUMBER, CURRENCY, DATE, dan LOCATION. Semua dokumen hasil tagging kemudian disimpan dalam direktori korpus. Berikut adalah contoh hasil tagging untuk dokumen newsipb txt. Commemorating Human Rights Day (HAM) on <DATE>December 1</DATE>, the <ORGANIZATION>RRI</ORGANIZATION> Dialog <DATE>(14/12)</DATE> presented the <ORGANIZATION>President of BEM- KM(Student Executive Body) IPB </ORGANIZATION>, <NAME> Moh. Reza Pahlevi</NAME>. We know that it is the students that most frequently and diligently call on human rights, especially after the death of a human rights defender, <NAME>Munir</NAME>. "Our demonstrations are of pure calls for the rights of the many people who want to benefit from the facilities provided by the government without having to distinguish between the rich and the poor. We've tweaked (criticized) the local government of <LOCATION>West Java</LOCATION> by growing catfish on <LOCATION>Jalan Baru (a street s name)</location>, so that the government would promptly fix the damaged road with holes on it," said <NAME>Reza</NAME> Tahap kedua melakukan pembacaan terhadap isi file yang ada pada direktori korpus. Proses ini dilakukan hanya pada isi dokumen dengan tag <TITLE> dan <TEXT>. Isi file tersebut kemudian dilakukan parsing dengan pemisah kata yang tersimpan dalam variabel $pemisahkata yang terdiri atas tanda baca dalam ekspresi regular /[\s\- +\/,.\"\];()\':=`?\[!@>]+/. Semua hasil parsing disimpan kecuali kata-kata yang berada dalam daftar stopwords atau kata buangan yang merupakan daftar kata umum 6
2 7 yang mempunyai fungsi tapi tidak dapat dijadikan sebagai penciri dokumen. Daftar ini tersimpan dalam file stopwords-en.txt yang terdiri atas 57 kata yang dipisahkan dengan karakter enter. Contoh kata-kata tersebut, antara lain a,about,above dan lain-lain. Perhitungan tf-idf Tahap pertama pada proses perhitungan tfidf ialah memperoleh informasi term frequency (tf) dengan memanfaatkan hasil dari tahap sebelumnya yaitu pemrosesan dokumen. Term frequency merupakan pasangan dari dokumen dan hasil parsing (token-token) dari tiap-tiap file yang disimpan dalam suatu array pada variabel $tf. Variabel ini digunakan untuk menghitung nilai df, idf, dan tf-idf setiap kata. Tahap selanjutnya yaitu mendapatkan document frequency (df). Pada hasil tersebut, kemudian dilakukan perhitungan nilai invers document frequency (idf). Penelitian ini menggunakan kata dengan nilai idf yang lebih besar dan sama dengan.5 karena terdapat beberapa kata penting seperti IPB dan Bogor yang muncul hampir di semua dokumen. Oleh sebab itu, setelah dilakukan percobaan aka nilai.5 enjadi nilai yang ideal untuk penelitian ini. Hasilnya disimpan dalam filegenerate/ipb/idf-en.txt dengan enggunakan tanda >> sebagai pemisah antara kata dan nilai idf-nya. Nilai idf kemudian dikalikan dengan tf untuk mendapatkan nilai tf-idf. Nilai hasil perhitungan tf-idf disimpan pada file filegenerate/ipb/tfidf-en.txt dengan enggunakan tanda >> sebagai pe isah antara kata dan nilai tf-idf-nya. Pembentukan Passages Pembentukan kalimat untuk setiap dokumen didasarkan pada tanda pemisah antar kalimat yaitu [.?!]. Setiap passage dibentuk dari dua kalimat yang berurutan dan saling overlap. Hasilnya disimpan dalam satu file filegenerate/ipb/passages-en.txt. Isi dari file tersebut adalah id passage, nama dokumen, dan passage. Masing-masing variabel dipisahkan dengan tanda >>. Pemrosesan Query Query yang digunakan berupa kalimat tanya yang diawali dengan kata tanya SIAPA, KAPAN, DI MANA, dan BERAPA. Pertama dilakukan proses parsing terhadap kalimat tanya dengan pemisah kata yang tersimpan dalam variabel $pemisahkata. Query kemudian diterjemahkan ke dalam bahasa Inggris dengan menggunakan kamus Indonesia-Inggris. Semua kata dalam query diterjemahkan, kecuali kata tanya karena kata tanya hanya digunakan untuk menentukan kandidat jawaban. Proses penerjemahan ini dilakukan per dua kata yang saling overlap. Apabila tidak ditemukan terjemahannya maka akan diterjemahkan per satu kata saja. Kemudian, apabila satu kata juga tidak ditemukan terjemahannya, maka kata tersebut tetap akan digunakan tanpa diterjemahkan. Kata yang memiliki terjemahan lebih dari satu, akan dicari terjemahan kata yang memiliki idf tertingi. Proses case folding kemudian dilakukan terhadap query yaitu mengubah query menjadi huruf kecil. Setelah itu, dilakukan proses tokenisasi untuk mendapatkan kata-kata penyusun query berupa kata tanya dan kata kunci atau keyword. Variabel array $query akan menyimpan hasil tokenisasi tersebut sehingga nantinya dapat dilakukan proses identifikasi kata tanya dari query berupa array dengan indeks ke- atau query[]. Tabel 2 menunjukkan daftar pasangan kata tanya dan named entity yang menjadi acuan dari jawaban yang akan dikembalikan. Tabel 2 Daftar pasangan kata tanya dan named entity Kata Tanya Siapa Kapan Di mana Berapa Tag Entitas NAME, ORGANIZATION DATE LOCATION Perolehan Dokumen Teratas NUMBER, CURRENCY Pembobotan cosine dilakukan untuk memperoleh 1 dokumen teratas. Dengan memanfaatkan nilai idf dan tf-idf dapat dilakukan perolehan norm dari query dan dokumen. Query dimasukkan secara manual, kemudian dilakukan perhitungan terhadap norm query, tf-idf query, dan norm untuk setiap dokumen. Nilai norm query kemudian dipasangkan dengan query setiap dokumen untuk menghasilkan nilai dot product dan cosine. Nilai cosine inilah yang kemudian diurutkan untuk memperoleh 1 dokumen teratas. Perolehan Top Passages Perolehan top passages pada kamus passage kemudian dilakukan berdasarkan 1 dokumen teratas yang ditemukembalikan. Hasilnya 7
3 8 disimpan dalam variabel $passagesdoctop untuk kemudian digunakan pada tahap perolehan top passages. Passages yang akan digunakan dalam proses pembobotan adalah passages yang mengandung tag named entity yang dibutuhkan, yang disebut arraytag. ArrayTag merupakan hasil dari identifikasi kata tanya terhadap named entity. Passage disimpan pada variabel $passagesdoctop untuk kemudian disaring guna mendapatkan passages yang memiliki tag sesuai dengan kata tanya. Pembobotan heuristic dan rule-based kemudian diterapkan pada passage tersebut. Pembobotan Tahapan yang terdapat dalam jurnal Ballesteros dan Li (27) serta penelitian Cidhy (29) digunakan sebagai acuan dalam penelitian ini. Tahap pembobotan passages terdiri atas: 1 Pembobotan passages berdasarkan hasil dari proses wordmatch sesuai threshold. Hasilnya disimpan dalam variabel $count_match. 2 Pembobotan passages berdasarkan urutan nilai dari $arraywordquestion (katakata selain kata tanya pada query) dalam passages. Hasilnya bernilai boolean, disimpan dalam variabel $Ord. 3 Pembobotan passages berdasarkan nilai dari $arraywordquestion dalam passages. Hasilnya bernilai Boolean dan disimpan dalam variabel $Sm. 4 Pembobotan berdasarkan hasil dari proses wordmatch sesuai threshold berbanding ukuran passage (jumlah kata dalam satu passage). Nilai dari keempat variabel di atas kemudian dihitung skor heuristic setiap passage yaitu: heuristic_score = count_match + count_match/w + Sm*.5 + Ord*.5. Pembobotan Rule based Rule yang terdapat pada penelitian Riloff dan Thelen (2) serta penelitian Sanur (211) digunakan sebagai acuan dalam penelitian ini. Tahap pembobotan passages terdiri atas: 1 Fungsi WordMatch. WordMatch adalah nilai perbandingan antara kalimat query dengan kalimat pada dokumen. Algoritme WordMatch dilakukan dengan cara membandingkan token-token pada setiap passages dengan token-token pada kalimat query. Setiap token yang sama akan menambahkan nilai pada passages tersebut. Hasilnya disimpan dalam variabel $WordMatch. 2 Algoritme Rule. Penelitian ini membuat algoritme rule dengan melakukan beberapa modifikasi yang digunakan dalam pembobotan passages. Algoritme rules yang digunakan sebagai acuan dalam penelitian ini: 1 SIAPA If contains(q,human) && (S,Human) Algoritme rule untuk query pertanyaan dengan kata tanya SIAPA mengikuti algoritme yang sudah diimplementasikan Sanur (211). Perbedaannya ialah pada bahasa yang digunakan yaitu bahasa Inggris. Maksudnya aturan yang telah ada sebelumnya diterjemahkan ke dalam bahasa Inggris dan ditambahkan beberapa penyesuaian. 2 KAPAN If contains(s, {time, when, time, since, since, time, after, before, after, during, on, in, at}) and contains(s,time) If contains(s,time) and contains(q,time) Score(S) += confident If contains(s, {time, when, time, since, since, time, after, before, after, during, on, in, at}) or contains(s,time) Score(S) += good_clue Algoritme rule untuk query pertanyaan dengan kata tanya KAPAN yang dibangun pada penelitian ini menikuti algoritme rule yang telah diimplementasikan oleh Sanur (211) hanya berbeda pada bahasa yang digunakan yaitu bahasa Inggris dan ditambahkan beberapa penyesuaian. 3 DI MANA If contains(s, {in, on, from}) and contains(s,location) If contains(s,location) Score(S) += good_clue If contains(s, {in, on, from}) Score(S) += clue 8
4 9 Algoritme rule yang digunakan sesuai dengan algoritme yang diimplementasikan oleh Sanur (211) hanya berbeda pada bahasa yang digunakan yaitu bahasa Inggris dan ditambahkan beberapa penyesuaian. 4 BERAPA If contains(q,number) and contains(s,number) If contains(s,number) Score(S) += confident Algoritme rule yang digunakan sesuai dengan algoritme yang diterapkan oleh Sanur (211) hanya berbeda pada bahasa yang digunakan yaitu bahasa Inggris dan ditambahkan beberapa penyesuaian. Fungsi dan notasi yang digunakan dalam rules tersebut adalah sebagai berikut : 1 Notasi S = sentence (kalimat dokumen). 2 Notasi Q = query (kalimat query). 3 Fungsi contains adalah fungsi untuk memeriksa kalimat dokumen dan kalimat query pertanyaan, apakah mengandung kata yang telah ditentukan. 4 Fungsi WordMatch adalah fungsi untuk memeriksa kesamaan kata. 5 Fungsi score adalah fungsi pemberian nilai pada kalimat dokumen. Setelah diperoleh nilai dari Wordmatch dan rule, dihitung skor setiap passage. Ekstraksi Jawaban Jawaban yang nantinya akan diekstrak berasal dari passage dengan nilai tertinggi pada pembobotan passages. Passages tersebuat kemudian akan menjadi top passage. Kata atau kalimat yang menjadi kandidat jawaban adalah yang memiliki entitas nama sesuai dengan kata tanya pada query pertanyaan. Perolehan entitas jawaban pada top passage dapat terdiri atas satu atau lebih passage dan setiap passage dapat memiliki satu atau lebih kandidat jawaban. Jawaban akhir setiap passage diperoleh dengan cara menghitung jarak antara kandidat jawaban pada setiap passage dengan masing-masing kata pada $arraywordmatch dibagi jumlah $arraywordmatch yang merupakan kumpulan kata hasil pencocokan antara keyword dengan kata-kata pada passage. Kandidat jawaban yang memiliki jarak terpendek yang kemudian akan dikembalikan sebagai jawaban dari query. Hasil Percobaan Percobaan dilakukan dengan cara membandingkan hasil dari pembobotan passage heuristic dan rule based. Perbandingan dilakukan dengan melihat perolehan top passage dan ketepatan jawaban dari kedua jenis pembobotan passage tersebut. Jumlah koleksi dokumen yang digunakan pada penelitian ini ialah 151 dengan query pertanyaan. Pasangan query dan jawaban dibuat sendiri oleh penulis. Proses evaluasi berdasarkan pada perolehan top passage dan ketepatan jawaban. Berdasarkan kesesuaian pasangan jawaban dan dokumen, penilaian dibedakan menjadi 4 jenis yaitu right, wrong, unsupported, dan null. 1 Perbandingan Hasil Percobaan Untuk Kata Tanya SIAPA Pada percobaan ini misalkan dari 1 query diambil 1 contoh pertanyaan Siapa kepala PPSHB IPB?. Pembobotan heuristic dan rule based mengembalikan top passage yang berbeda. Pembobotan heuristic mengembalikan passage berikut : As this study will end in <DATE>October 211</DATE>, he suggested further research with other funding schemes. In the discussion, <ORGANIZATION>Head of PPSHB IPB</ORGANIZATION>, Dr. <NAME>Suharsono</NAME>, proposed a specific funding scheme to complement the laboratory equipment in <ORGANIZATION>IPB</ORGANIZATION>, especially in <ORGANIZATION>PPSHB</ORGANIZATION>. newsipb txt, sedangkan rule based mengembalikan passage berikut : The <ORGANIZATION> Women Study Program (PSW) of IPB </ORGANIZATION> is considered to have sufficiently long assistance to separate from the <ORGANIZATION>Center for Agricultural and Rural Development Studies (PSP3) Institute for Research and Community Service (LPPM) IPB </ORGANIZATION>. This assessment was delivered by the <ORGANIZATION>Head of LPPM IPB</ORGANIZATION>, Prof. Dr. <NAME> Bambang Pramudya </NAME> in the discussion on the formulation of Strategic Plan of <ORGANIZATION> PSW IPB </ORGANIZATION>, <DATE>Friday (22/1) </DATE> in <LOCATION>Baranangsiang</LOCATION> Campus of <ORGANIZATION>IPB </ORGANIZATION>. newsipb txt. 9
5 1 Jawaban yang diperoleh dengan pembobotan heuristic menghasilkan passage yang mengandung kandidat jawaban yang benar dengan nilai bobot dan jawaban Suharsono, sedangkan pembobotan rule based mengembalikan passage dengan kandidat jawaban salah dengan nilai bobot 26 dan jawaban Bambang Pramudya. Pembobotan heuristic untuk kata tanya SIAPA menghasilkan persentase ketepatan jawaban untuk kriteria right sebesar, unsupported, wrong 2, null, sedangkan rule based menghasilkan kriteria right 7, unsupproted, wrong 3, dan null. Grafik hasil percobaan untuk kata tanya SIAPA dapat dilihat pada Gambar 5. Daftar query dan evaluasinya dapat dilihat pada Lampiran 2. 2 Gambar 5 Grafik hasil percobaan untuk kata tanya SIAPA. 2 Perbandingan Hasil Percobaan Untuk Kata Tanya KAPAN Pada kata tanya KAPAN misalkan diambil pertanyaan sebagai contoh Kapan Agrinex Expo 211?. Pembobotan heuristic dan rule based juga mengembalikan top passage yang berbeda namun dari dokumen yang sama yaitu newsipb txt. Metode heuristic mengembalikan passage sebagai berikut: The government should provide Integrated Plant Clinical Car to help farmers in the field in overcoming crop failure due to pests and diseases. This was stated by <ORGANIZATION>Coordinating Minister for Economic Affairs</ORGANIZATION>, <NAME>Hatta Radjasa</NAME> when he visited the <ORGANIZATION>Clinical Car for Integrated Plant of the Faculty of Agriculture - Bogor Agricultural University</ORGANIZATION>, at the the University stand at the Agrinex Expo <DATE>211</DATE>, <DATE> Friday, 4 March 211 </DATE>, at the <LOCATION> Jakarta Convention Center </LOCATION> (JCC). Sedangkan rule based mengembalikan passage berikut : This was stated by <ORGANIZATION>Coordinating Minister for Economic Affairs</ORGANIZATION>, <NAME>Hatta Radjasa</NAME> when he visited the <ORGANIZATION>Clinical Car for Integrated Plant of the Faculty of Agriculture - Bogor Agricultural University</ORGANIZATION>, at the the University stand at the Agrinex Expo <DATE>211</DATE>, <DATE> Friday, 4 March 211 </DATE>, at the <LOCATION> Jakarta Convention Center </LOCATION> (JCC). "Farmers experienced crop failure due to pests and diseases several times already, the existence of an integrated plant clinical car is expected to help farmers overcome contraints they encountered in the field," said <NAME>Hatta</NAME>. Pembobotan heuristic menghasilkan passage yang mengandung kandidat jawaban yang benar dengan nilai bobot 5.48 sedangkan pembobotan rule based mengembalikan passage dengan kandidat jawaban yang juga benar dengan nilai bobot 8 yang keduanya menghasilkan jawaban yang sama Friday, 4 March 211. Pembobotan heuristic dan rule based untuk kata tanya KAPAN menghasilkan persentase ketepatan jawaban yang sama untuk kriteria right sebesar, unsupported, wrong, null. Hasil percobaan untuk kata tanya KAPAN dapat dilihat pada Gambar 6. Daftar query dan evaluasinya dapat dilihat pada Lampiran 3. 2 Gambar 6 Grafik hasil percobaan untuk kata tanya KAPAN. 3 Perbandingan Hasil Percobaan Untuk Kata Tanya DI MANA Query Di mana seminar sagu IPB? diambil sebagai contoh untuk kata tanya DI MANA. Pembobotan heuristic dan rule based mengembalikan passage sama sebagai top passage sebagai berikut: 1
6 11 We should now have enjoyed the development of sago; the satire tone was expressed by an agricultural industry scholar of <ORGANIZATION>Bogor Agricultural University</ORGANIZATION> (IPB), <NAME>Dr. Tajuddin Bantacut</NAME> when speaking at the Seminar and Workshop on Sago held by IPB, (<DATE>14-1</DATE>) at <LOCATION> IPB International Convention Center</LOCATION> (IICC). In the country, sago grows lot in various areas such as <LOCATION>Papua </LOCATION>, <LOCATION>Maluku </LOCATION>, <LOCATION>North Maluku</LOCATION>, <LOCATION>Southeast Sulawesi</LOCATION>, <LOCATION>West Kalimantan</LOCATION> and <LOCATION>Riau Islands</LOCATION>. yang sama yaitu newsipb txt. Pembobotan heuristic menghasilkan passage yang mengandung kandidat jawaban yang benar dengan nilai bobot 7.75 sedangkan pembobotan rule based mengembalikan passage dengan kandidat jawaban yang juga benar dengan nilai bobot 1 yang keduanya menghasilkan jawaban sama yang benar, yaitu IPB International Convention Center. Pembobotan heuristic dan rule based untuk kata tanya DI MANA menghasilkan persentase ketepatan jawaban yang sama untuk kriteria right sebesar, unsupported, wrong, dan null. Hasil percobaan untuk kata tanya DI MANA dapat dilihat pada Gambar 7. Daftar query dan evaluasinya dapat dilihat pada Lampiran 4. 2 Gambar 7 Grafik hasil percobaan untuk kata tanya DI MANA. 4 Perbandingan Hasil Percobaan Untuk Kata Tanya BERAPA Query pertanyaan Berapa beasiswa Bank Mandiri pada mahasiswa IPB? diambil sebagai contoh untuk kata tanya BERAPA. Pembobotan heuristic dan rule based mengembalikan top passage yang sama sebagai berikut: <ORGANIZATION>Director of Commercial and Business of Bank Mandiri</ORGANIZATION> <NAME> Sunarso </NAME> who is also a graduate of the <ORGANIZATION>Department of Agronomy and Horticulture</ORGANIZATION> <ORGANIZATION>IPB</ORGANIZATION>, said that this is an annual routine program of <ORGANIZATION>Bank Mandiri</ORGANIZATION> and now it is the <NUMBER>3</NUMBER> rd year held by <ORGANIZATION>Bank Mandiri</ORGANIZATION>. This program will be an effective media for <ORGANIZATION>Bank Mandiri</ORGANIZATION> to share their experiences with future leaders of our nation about the characteristics of leaders who are able to create success and the importance of creativity for a business entity in seizing market opportunities, he concluded. newsipb txt. Jawaban yang diperoleh dengan pembobotan heuristic menghasilkan passage yang mengandung kandidat jawaban yang salah dengan nilai bobot 9.93 dan pembobotan rule based mengembalikan passage dengan kandidat jawaban yang juga salah dengan nilai bobot 13 dan keduanya juga menghasilkan jawaban yang sama yaitu 3. Pembobotan heuristic dan rule based untuk kata tanya BERAPA menghasilkan persentase ketepatan jawaban yang sama untuk kriteria right sebesar 9, unsupported, wrong 1, dan null. Hasil percobaan untuk kata tanya BERAPA dapat dilihat pada Gambar 8. Daftar query dan evaluasinya dapat dilihat pada Lampiran 5. 2 Gambar 8 Grafik hasil percobaan untuk kata tanya BERAPA. Perbandingan Hasil Percobaan untuk Semua Kata Tanya Persentase ketepatan jawaban pada pembobotan heuristic dan rule based secara keseluruhan untuk semua kata tanya dapat dilihat pada Gambar 9. Berdasarkan Gambar 9, pembobotan passage heuristic menghasilkan 11
2. Ketepatan untuk setiap jawaban.
dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek
Lebih terperinciHASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.
4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai
Lebih terperinciPEMILIHAN DEPARTEMEN FAKULTAS
PEMILIHAN PASSAGES DALAM QUESTION ANSWEING SYSTEM UNTUK DOKUMEN BEBAHASA INDONESIA SUCI AMELIA SANU DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIANN BOGO BOGO 2011
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciLingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query
5 Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian ialah: Sistem Operasi Windows 7. Sphinx Search. XAMPP versi 1.7.3. Named Entity Tagger bahasa Indonesia. Perangkat keras yang digunakan
Lebih terperinciANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA
ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 1 ANALISIS
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciIdentifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN
5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret
Lebih terperinciQUESTION ANSWERING SYSTEM MENGGUNAKAN N-GRAM TERM WEIGHT MODEL DEBBY PUSPA BAHRI
QUESTION ANSWEING SYSTEM MENGGUNAKAN N-GAM TEM WEIGHT MODEL DEBBY PUSPA BAHI DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO BOGO 2013 QUESTION ANSWEING SYSTEM
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN MULTIDOKUMEN FADILA ANDRE MULYANTO
COSS LANGUAGE QUESTION ANSWEING SYSTEM MENGGUNAKAN PEMBOBOTAN HEUISTIC DAN MULTIDOKUMEN FADILA ANDE MULYANTO DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciPEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI
PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN
IMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciContoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor
Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciHASIL DAN PEMBAHASAN
10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Parametric dan zone Index Sebuah dokumen, selain tersusun dari deretan term, juga
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciVECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model index berdasar pada bobot untuk binary retrieval model Memahami
Lebih terperinciAbstract. Keywords : Banker, Bank system, Bank secrecy,
Abstract Banking system in many country become the core of nation economic. It provide a service that help people easily get a founding to open a new bussines or provide a moneytary service to help bussines
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciSISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak
SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas
Lebih terperinciABSTRAK. Universitas Kristen Maranatha
ABSTRAK Pada tahun 1945 sejak Indonesia merdeka dari penjajahan, Indonesia telah mengalami krisis ekonomi seperti krisis moneter yang mengakibatkan perekonomian di Indonesia menjadi tidak stabil. Krisis
Lebih terperinciPERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL
PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE
Lebih terperinciSMP kelas 8 - BAHASA INGGRIS CHAPTER 9LATIHAN SOAL CHAPTER 9
SMP kelas 8 - BAHASA INGGRIS CHAPTER 9LATIHAN SOAL CHAPTER 9 1. Text for questions 1 and 2 To : Fahmi (The chair student of 8 B) 06/01/2017 Please forward to your classmates. During the long holiday, all
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 MODEL IR Konsep IR Model IR Konsep Boolean Model Pemodelan IR Model IR Konsep Boolean Model Model IR didefinisikan sebagai empat komponen, yaitu:
Lebih terperinciABSTRAK. iii. Kata kunci : pengelolaan, wedding event organizer, vendor. Universitas Kristen Maranatha
ABSTRAK Wedding Event Organizer merupakan pengelolaan pada suatu acara pernikahan. Pada jaman sekarang orang ingin menikah tanpa bersusah payah mencari satu per satu vendor yang ada. Event Organizer merupakan
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
Lebih terperinciTeknik Kreatif Menyajikan Presentasi Memukau (Indonesian Edition)
Teknik Kreatif Menyajikan Presentasi Memukau (Indonesian Edition) Muhammad Noer Click here if your download doesn"t start automatically Teknik Kreatif Menyajikan Presentasi Memukau (Indonesian Edition)
Lebih terperinciABSTRAK. Kata Kunci : Sistem Pakar, Jeruk, Hama dan Penyakit,GIS. iii Universitas Kristen Maranatha
ABSTRAK Pertanian jeruk dikembangkan hampir di seluruh wilayah Indonesia, semakin luasnya pertanian jeruk membuat semakin besar pula ancamanpenyakit maupun hama yang menyerang tanaman jeruk, seperti hama
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
Lebih terperinciImplementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciKEMAMPUAN MENDENGARKAN LAGU BERBAHASA INGGRIS PADA SISWA KELAS X SMA ISLAMIC CENTRE DEMAK PADA TAHUN AJARAN 2006/2007
KEMAMPUAN MENDENGARKAN LAGU BERBAHASA INGGRIS PADA SISWA KELAS X SMA ISLAMIC CENTRE DEMAK PADA TAHUN AJARAN 2006/2007 Oleh SRI SUMARMI NIM: 2000-32-104 FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN JURUSAN PENDIDIKAN
Lebih terperinciSISTEM PENILAIAN OTOMATIS JAWABAN ESAI PADA ELEARNING BELAJARDISINI.COM
Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-issn: 2355-7699 Vol. 3, No. 4, Desember 2016, hlm. 248-252 e-issn: 2528-6579 SISTEM PENILAIAN OTOMATIS JAWABAN ESAI PADA ELEARNING BELAJARDISINI.COM
Lebih terperinciABSTRAK. Kata kunci: Parkir, Sisa Parkir, Aplikasi Parkir, Analisis Parkir. vii
ABSTRAK Parkir merupakan salah satu bagian yang cukup sering digunakan di dunia transportasi. Dimana orang-orang, zaman sekarang ini, banyak mencari tempat parkir untuk menyimpan kendaraannya. Tentunya
Lebih terperinciIMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciABSTRAK. Kata kunci: Pencarian, resep masakan. Universitas Kristen Maranatha
ABSTRAK Indonesia merupakan negara dengan keragaman budaya, salah satunya dalam hal masakan tradisional. Setiap daerah yang tersebar di sepanjang kepulauan Indonesia memiliki ciri khas masakan tradisionalnya
Lebih terperincicommit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
Lebih terperinciText Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta
Text Mining Budi Susanto Materi Pengertian Text Mining Pemrosesan Text Tokenisasi Lemmatization Vector Document Pengertian Text Mining Text mining merupakan penerapan konsep dan teknik data mining untuk
Lebih terperinciSISTEM PENGENALAN PENGUCAPAN HURUF VOKAL DENGAN METODA PENGUKURAN SUDUT BIBIR PADA CITRA 2 DIMENSI ABSTRAK
SISTEM PENGENALAN PENGUCAPAN HURUF VOKAL DENGAN METODA PENGUKURAN SUDUT BIBIR PADA CITRA 2 DIMENSI Adhi Fajar Sakti Wahyudi (0722062) Jurusan Teknik Elektro Email: afsakti@gmail.com ABSTRAK Teknologi pengenalan
Lebih terperinciManual Prosedur Self Access Centre
Manual Prosedur Self Access Centre Jurusan Akuntansi Fakultas Ekonomi Dan Bisnis Universitas Brawijaya Malang 2011 Manual Prosedur Self Access Centre Kode Dokumen : 00203 06014 Revisi : 2 Tanggal : 1 Juni
Lebih terperinciSCALING SOLUTION OF LAND USE CHALLENGES. Musdhalifah Machmud Deputy to Coordinating Minister for Food and Agriculture
SCALING SOLUTION OF LAND USE CHALLENGES Musdhalifah Machmud Deputy to Coordinating Minister for Food and Agriculture 1 INDONESIA IS AN ARCHIPELAGIC COUNTRY 2 PERCENTAGE OF INDONESIA AREA 3 INDONESIA IS
Lebih terperinciAPPENDICES. Appendix A. Data 1 (Student A)
APPENDICES Appendix A Data 1 (Student A) 48 No Sentence 1. *There so many place they can visiting. *There so many place they can visiting. Tidak mengerti struktur yang sebenarnya, mengira bahwa are atau
Lebih terperinciTEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK
F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA ROMAIDA DOLAROSA SIANTURI
IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA ROMAIDA DOLAROSA SIANTURI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB 3 METODE PENELITIAN
19 BAB 3 METODE PENELITIAN 3.1. Tahap Pembentukan Knowledge Graph Sekumpulan kata-kata dalam suatu dokumen tidak akan terepresentasi sepenuhnya ke dalam graf. Bagian inti dokumen yang akan menyebabkan
Lebih terperinciSKRIPSI PENGARUH KREDIT PERTANIAN TERHADAP KESEJAHTERAAN PETANI KELAPA SAWIT DI KABUPATEN LABUHAN BATU UTARA OLEH. Mardiana Lumbanraja
SKRIPSI PENGARUH KREDIT PERTANIAN TERHADAP KESEJAHTERAAN PETANI KELAPA SAWIT DI KABUPATEN LABUHAN BATU UTARA OLEH Mardiana Lumbanraja 110523003 PROGRAM STUDI EKONOMI PEMBANGUNAN DEPARTEMEN EKONOMI PEMBANGUNAN
Lebih terperinciANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM
ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciBAB 3 PERANCANGAN. Tabel 3.1 Daftar Kategori dan Jumlah Dokumen Teks. Dokumen Bulutangkis 155 Basket 59 Otomotif 160 Sepakbola 767 Tenis 159
23 BAB 3 PERANCANGAN Bab ini menjelaskan tentang perancangan yang digunakan untuk melakukan eksperimen klasifikasi dokumen teks. Bab perancangan klasifikasi dokumen teks ini meliputi data (subbab 3.1),
Lebih terperinciRahasia Cermat & Mahir Menguasai Akuntansi Keuangan Menengah (Indonesian Edition)
Rahasia Cermat & Mahir Menguasai Akuntansi Keuangan Menengah (Indonesian Edition) Hery Hery Click here if your download doesn"t start automatically Rahasia Cermat & Mahir Menguasai Akuntansi Keuangan Menengah
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciBAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI
BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat
Lebih terperinciDAFTAR ISI. BAB 3 PERANCANGAN PERANGKAT LUNAK 3.1 Diagram Alir Utama Kamera Web iii
Aplikasi Kamera Web Untuk Mengidentifikasi Plat Nomor Mobil Jemmy / 0322042 E-mail : kaiser_jemmy@yahoo.com Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha Jalan Prof. Drg. Suria
Lebih terperinciHASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciABSTRAK Program Magister Psikologi Februari Gianti Gunawan
Gianti Gunawan 0432012 ABSTRAK Program Magister Psikologi Februari 2007 Judul Tesis : Pelatihan Masa Persiapan Pensiun Dan Signifikansinya Terhadap Perubahan Sikap Menghadapi Pensiun Pada Pegawai Negeri
Lebih terperinciSTUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR
STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciTATA CARA TINDAK LANJUT TERHADAP PERMINTAAN PERTUKARAN INFORMASI DARI NEGARA MITRA P3B
Lampiran I TATA CARA TINDAK LANJUT TERHADAP PERMINTAAN PERTUKARAN INFORMASI DARI NEGARA MITRA P3B 1. Dalam hal informasi/data yang terdapat dalam surat permintaan informasi dari Negara Mitra P3B telah
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard
Lebih terperinciAPLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA
APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas
Lebih terperinciJurnal Pustakawan Indonesia Volume 10 No. 1 VISUALISASI KETERHUBUNGAN ANTARISTILAH SUBJEK PADA METADATA TESIS IPB MENGGUNAKAN PELUANG BERSYARAT
VISUALISASI KETERHUBUNGAN ANTARISTILAH SUBJEK PADA METADATA TESIS IPB MENGGUNAKAN PELUANG BERSYARAT Reza Risky 1, Firman Ardiansyah 2 1 Mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan IPA,
Lebih terperinciAPLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
Lebih terperinciAPLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Lebih terperinciPIRANTI LUNAK UNTUK MENDESAIN PROGRAM DALAM BAHASA PEMROGRAMAN C BERDASARKAN HOARE LOGIC
PIRANTI LUNAK UNTUK MENDESAIN PROGRAM DALAM BAHASA PEMROGRAMAN C BERDASARKAN HOARE LOGIC Arnold Aribowo 1), Pujianto Yugopuspito 2), Julian Fetriandhy Altanijah 3) 1) Jurusan Teknik Komputer, Fakultas
Lebih terperinciMODEL PENGANGKATAN TENAGA HONORER MENJADI CPNS ( Studi tentang Implementasi PP Nomor 56 Tahun 2012 di Kabupaten Klaten )
MODEL PENGANGKATAN TENAGA HONORER MENJADI CPNS ( Studi tentang Implementasi PP Nomor 56 Tahun 2012 di Kabupaten Klaten ) TESIS Diajukan Kepada Program Studi Magister Ilmu Hukum Sekolah Pasca Sarjana Universitas
Lebih terperinciImplementasi Metode Document Oriented Index Pruning pada Information Retrieval System
Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,
Lebih terperinciBAB III PERANCANGAN. Tabel 3.1 Detil Tabel mpage
BAB III PERANCANGAN Bab ini menjelaskan mengenai perancangan sistem peringkas berita otomatis pada media massa online berbasis GVSM. Perancangan dibagi dalam beberapa bagian antara lain perancangan database,
Lebih terperinciMODULE 1 GRADE XI VARIATION OF EXPRESSIONS
MODULE 1 GRADE XI VARIATION OF EXPRESSIONS Compiled by: Theresia Riya Vernalita H., S.Pd. Kompetensi Dasar 3.1 Menganalisis fungsi sosial, struktur teks, dan unsur kebahasaan pada ungkapan memberi saran
Lebih terperinciABSTRAK. Kata kunci : Program Wajib Belajar 12 Tahun, Kampanye. vii Universitas Kristen Maranatha
ABSTRAK Pendidikan adalah salah satu cara untuk meningkatkan kualitas sumber daya manusia. Pendidikan sangat penting untuk anak sebagai bekal dimasa depan agar menjadi masyarakat yang beriman, bertaqwa,
Lebih terperinciCHAPTER III RESULT OF THE STUDY. 1. The problems faced by the tenth grade students of SMK YP SEI. PALANGKA RAYA in using letter s/es as plural nouns
54 CHAPTER III RESULT OF THE STUDY A. The Result of Test 1. The problems faced by the tenth grade students of SMK YP SEI PALANGKA RAYA in using letter s/es as plural nouns Analyzing was used as the basic
Lebih terperinciPENERJEMAH KALIMAT INGGRIS INDONESIA MENGGUNAKAN SMS GATEWAY
PENERJEMAH KALIMAT INGGRIS INDONESIA MENGGUNAKAN SMS GATEWAY Delityan Dananjaya 1, Yuliana Setyowati, S.Kom 2, Setiawardhana, S.Kom, M.Kom 3 Mahasiswa Jurusan Teknologi Informasi 1, Dosen Pembimbing 2,
Lebih terperinciRANCANGAN STRATEGI BISNIS BERTAHAN BANK DASA GANESHA SUATU USULAN ALTERNATIF
RANCANGAN STRATEGI BISNIS BERTAHAN BANK DASA GANESHA SUATU USULAN ALTERNATIF BANK DASA GANESHA adalah Bank BUMN yang pada awal mulanya pada tahun 1948 adalah Bank pengalihan dari BUREAU HERSTEL FINANCIERING
Lebih terperinciStudents Understanding on Corporate Social Responsibility (CSR)
Students Understanding on Corporate Social Responsibility (CSR) Suwirman Nuryadin a State University of Jakarta, Jakarta, Indonesia *Corresponding author:mr_nuryadin@yahoo.com Abstract Corporate Social
Lebih terperinciTESIS PEMBANGUNAN PERANGKAT LUNAK PERINGKAS DOKUMEN DARI BANYAK SUMBER BERBASIS WEB MENGGUNAKAN SENTENCE SCORING DENGAN METODE TF-IDF
TESIS PEMBANGUNAN PERANGKAT LUNAK PERINGKAS DOKUMEN DARI BANYAK SUMBER BERBASIS WEB MENGGUNAKAN SENTENCE SCORING DENGAN METODE TF-IDF FABIANUS HENDY EVAN No. Mhs.: 125301915/PS/MTF PROGRAM STUDI MAGISTER
Lebih terperinciTINJAUAN YURIDIS PELAKSANAAN ASURANSI PERTANIAN DIHUBUNGKAN DENGAN UNDANG-UNDANG NOMOR 19 TAHUN 2013 TENTANG PERLINDUNGAN DAN PEMBERDAYAAN PETANI
TINJAUAN YURIDIS PELAKSANAAN ASURANSI PERTANIAN DIHUBUNGKAN DENGAN UNDANG-UNDANG NOMOR 19 TAHUN 2013 TENTANG PERLINDUNGAN DAN PEMBERDAYAAN PETANI RIZKY GELAR PANGESTU 1087016 Indonesia merupakan negara
Lebih terperinciPemanfaatan Aljabar Vektor Pada Mesin Pencari
Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
Lebih terperinciBAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi
BAB II LANDASAN TEORI 2.1 Perpustakaan Perpustakaan adalah institusi pengelola karya tulis, karya cetak, atau karya rekam secara profesional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,
Lebih terperinciE VA D A E L U M M A H K H O I R, M. A B. P E R T E M U A N 2 A N A
HANDLING TAMU E VA D A E L U M M A H K H O I R, M. A B. P E R T E M U A N 2 A N A CARA PENERIMAAN TAMU Menanyakan nama dan keperluan (RESEPSIONIS) Good Morning. What can I do for you? Good morning, can
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Sumatera Utara
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinci1/5. while and do Loops The remaining types of loops are while and do. As with for loops, while and do loops Praktikum Alpro Modul 3.
Judul TIU TIK Materi Modul Perulangan Ganjil 204/205 Mahasiswa memahami Konsep Perulangan. Mahasiswa mampu menggunakan perintah perulangan For, While do, do While 2. Mahasiswa mampu menggunakan perintah
Lebih terperinciANALISIS CAPAIAN OPTIMASI NILAI SUKU BUNGA BANK SENTRAL INDONESIA: SUATU PENGENALAN METODE BARU DALAM MENGANALISIS 47 VARIABEL EKONOMI UNTU
ANALISIS CAPAIAN OPTIMASI NILAI SUKU BUNGA BANK SENTRAL INDONESIA: SUATU PENGENALAN METODE BARU DALAM MENGANALISIS 47 VARIABEL EKONOMI UNTU READ ONLINE AND DOWNLOAD EBOOK : ANALISIS CAPAIAN OPTIMASI NILAI
Lebih terperinciTELKOM EDUCATION PARK Jl. Telekomunikasi No 1 Bandung Technoplex Indonesia. The Most Comprehensive Education Park in Indonesia
TELKOM EDUCATION PARK Jl. Telekomunikasi No 1 Bandung Technoplex Indonesia The Most Comprehensive Education Park in Indonesia Dean of Telkom Creative Industry School Nama : Agus Achmad Suhendra Education
Lebih terperinciPENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI
18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,
Lebih terperinciImplementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita
Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,
Lebih terperinciPEMBELAJARAN KEMAMPUAN GERAK DASAR
PEMBELAJARAN KEMAMPUAN GERAK DASAR State of Victoria, Department of Education (1996). Fundamental motor skills: A manual for classroom teacher. Melbourne: Community Information Service. (4-8) Back Next
Lebih terperinci