Prediksi Tren Kurs Dollar Dari Berita Finansial Amerika Serikat Berbahasa Indonesia Menggunakan Support Vector Machine

Ukuran: px
Mulai penontonan dengan halaman:

Download "Prediksi Tren Kurs Dollar Dari Berita Finansial Amerika Serikat Berbahasa Indonesia Menggunakan Support Vector Machine"

Transkripsi

1 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Vol. 2, No. 3, Januari 2018, hlm Prediksi Tren Kurs Dollar Dari Berita Finansial Amerika Serikat Berbahasa Indonesia Menggunakan Support Vector Machine Ade Kurniawan 1, Putra Pandu Adikara 2, Yuita Arum Sari 3 Program Studi Teknik Informatika, @mail.ub.ac.id 1, adikara.putra@ub.ac.id 2, yuita@ub.ac.id 3 Abstrak Dolar Amerika Serikat (USD) merupakan mata uang yang paling sering digunakan dalam transaksi internasional dengan sirkulasi harian terbesar dibandingkan mata uang negara lain. Rilis data finansial Amerika Serikat tidak hanya berdampak terhadap perekonomian negara itu sendiri tetapi juga akan memberikan dampak terhadap perekonomian negara-negara lain. Fokus utama dari penelitian ini adalah prediksi tren kurs USD dengan cara klasifikasi berita finansial Amerika Serikat berbahasa Indonesia menggunakan algoritme Support Vector Machine (SVM). Kernel yang digunakan pada penelitian ini adalah polynomial degree d, dengan rasio data terbaik 80% untuk data training dan 20% untuk data testing. Output yang dihasilkan dibagi menjadi 2 kelas yakni berdampak melemahkan (down) atau yang berdampak menguatkan (up) kurs USD terhadap mata uang rival. Adapun pengujian terbaik diperoleh dengan kombinasi parameter DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1, CLR=0.01, C=1, epsilon= , dan iterasi maksimal =100. Dari hasil pengujian dihasilkan akurasi rata-rata sebesar 76.66%, nilai sensitivitas 80% dan spesifisitas 73.33%. Kata kunci: Forex, Klasifikasi, Support Vector Machine Abstract United States Dollar (USD) is the most used currency for international transaction, its daily circulation is bigger than the other currency in the world. America's financial data not only give an impact in America itself but also directly effecting the other country. The main focus of this research is to predict USD's trend from America's Financial News in Bahasa Indonesia Using Support Vector Machine Algorithm. Kernel that used in this research is polynomial degree d, the best data ratio is 80% for training data and 20% for testing data. The output generated into 2 class to weaken USD price (Down) and on the other hand to strengthen USD price (Up) to rival's currency. The best parameter combination that give best average accuracy are using under DF threshold = 15%, upper DF threshold = 85%, λ=0.1, CLR=0.01, C=1, epsilon= , maximum iteration=100 and generated average accuracy=76.66%, sensitivity=80% and specificity=73.33%. Keywords: Forex, Classification, Support Vector Machine 1. PENDAHULUAN Pasar Foreign Exchange (Forex) atau di Indonesia lebih dikenal dengan istilah valuta asing merupakan sebuah transaksi yang di dalamnya terdapat kegiatan jual beli (barter) mata uang suatu negara dengan mata uang negara lain (Berlianta, 2006). Perdagangan seperti ini dapat terjadi dikarenakan adanya pergerakan naik turun harga antar pasangan mata uang yang diperjualbelikan. Kemampuan untuk memrediksi kurs forex sangatlah penting untuk menentukan keputusan dalam melakukan sebuah transaksi trading. Terdapat dua jenis analisis untuk dapat mengetahui pergerakan pasar, yakni dinamakan dengan analisis teknikal dan analisis fundamental (Nassirtoussi, et al., 2015) Alasan utama kenapa memilih mata uang USD dikarenakan mata uang USD merupakan mata uang yang paling sering digunakan dalam transaksi internasional dengan sirkulasi harian terbesar daripada mata uang negara lain dan secara langsung rilis data finansial Amerika Serikat juga akan berdampak terhadap negara lain. Indikator berita fundamental memiliki pengaruh kuat terhadap arah pergerakan pasar forex (Ehrmann & Fratzscher, 2005). Berdasarkan penelitian yang pernah Fakultas Ilmu Komputer Universitas Brawijaya 1008

2 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1009 dilakukan oleh Kumar et al., pada tahun 2012 menggunakan algoritme SVM untuk prediksi harga stock. Data masukan berasal dari berita finansial suatu perusahaan yang diperoleh dari internet. Seleksi fitur yang digunakan yakni pendekatan term dictionary dengan cara membuat kamus terlebih dahulu term apa saja yang akan digunakan untuk proses selanjutnya. Dari penelitian tersebut diperoleh hasil akurasi terbaik sebesar 83%. Fokus utama dari penelitian ini adalah prediksi tren kurs USD dengan cara klasifikasi berita finansial Amerika Serikat berbahasa Indonesia menggunakan algoritme Support Vector Machine (SVM). 2. LANDASAN KEPUSTAKAAN 2.1 Text Mining Text mining memiliki arti penemuan atau penambangan informasi baru berkualitas dan tersembunyi yang tidak diketahui sebelumnya dengan cara mengekstrak informasi dari berbagai sumber yang berbeda secara otomatis yang dilakukan oleh komputer (Joachims, 1998). Informasi berkualitas tersebut didapatkan melalui proses pengenalan pola dan kecenderungan melalui sarana pembelajaran pola statistik. Dasar text mining yakni melibatkan tahap text pre-processing, pattern discovery, dan akhirnya dilanjutkan dengan interpretasi dan evaluasi output. Proses text mining yang sering dilakukan yakni meliputi klasifikasi teks, klastering teks, ekstraksi entitas, analisis sentimen, penyederhanaan dokumen, dan lain-lain. 2.2 Text Preprocessing Karena data yang digunakan berupa data tekstual yang tidak terstruktur oleh karena itu dilakukanlah tahap text preprocessing guna mengubah data yang tidak terstruktur tersebut menjadi data yang lebih terstruktur dan dapat diolah lebih lanjut untuk proses klasifikasi. Adapun yang akan dilakukan pada tahap ini yakni tokenizing, filtering, stemming, feature selection, dan term weighting. A. Tokenizing Tokenizing atau tokenisasi merupakan proses pemisahan string input berdasarkan setiap kata penyusun di dalam sebuah dokumen. Secara sederhana proses ini bertujuan untuk memisahkan tiap kata yang ada menjadi token. Pada proses tokenizing ini juga dilakukan penghilangan angka, tanda baca, serta karakter lain yang bukan huruf dikarenakan setiap karakter tersebut dianggap sebagai delimiter atau pemisah kata yang tidak memberikan pengaruh signifikan dalam text mining. B. Filtering Filtering adalah tahap di mana hasil dari proses tokenizing tersebut disaring kembali untuk memilih membuang kata-kata yang tidak penting dan mempertahankan kata-kata penting untuk mewakili dokumen. Terdapat dua acara dalam melakukan filtering, yang pertama yakni menggunakan pendekatan stopword removal dengan cara membuang kata tidak penting dan yang kedua yakni pendekatan wordlist dengan cara melihat kecocokan token dengan kumpulan kata penting yang ada pada database. C. Stemming Setelah melewati tahap filtering, selanjutnya dilakukan stemming yakni proses untuk merubah bentuk suatu kata menjadi bentuk dasar. dengan dilakukan proses ini maka setiap kata berimbuhan pada token akan diubah menjadi kata dasar untuk memudahkan proses selanjutnya. Pada penelitian ini metode stemming yang digunakan adalah stemming porter. D. Feature Selection Feature selection atau seleksi fitur dilakukan untuk memilih subset fitur yang relevan guna membentuk model data yang baik. Data yang dipilih adalah data yang benar-benar berguna untuk dilakukan analisis. Pada penelitian ini seleksi fitur dilakukan dengan melihat pemilihan kata yang benar-benar merepresentasikan keterkaitan antar dokumen dengan menggunakan metode Document Frequency (DF) Thresholding. Dengan ini setiap fitur yang memiliki jumlah kemunculan di dalam dokumen kurang dari batas bawah DF Thresholding atau kurang dari batas atas DF Thresholding akan dihilangkan. E. Term Weighting Term Frequency Inverse Document Frequency (TF-IDF) adalah sebuah metode yang digunakan untuk memberikan bobot terhadap kemunculan term dalam sebuah dokumen teks.

3 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1010 Term tersebut dapat berbentuk kata, frasa atau unit dari hasil indexing lainnya dalam suatu dokumen yang bisa dipakai untuk mencari tahu konteks dari dokumen tersebut dikarenakan setiap term mempunyai level kepentingan yang berbeda maka setiap term ditandai dengan bobot atau term weight (Liliana, et al., 2011). Persamaan untuk mendapatkan nilai TF-IDF adalah sebagai berikut: TF = 1 + log10 (tf) Keterangan: IDF = log (N/df) (1) w = TF x IDF w= Bobot term t terhadap dokumen d tf= Jumlah kemunculan term dalam suatu dokumen d df= Jumlah dokumen yang mengandung term t. N= Jumlah semua dokumen dalam data training. 2.3 Support Vector Machine Support Vector Machine (SVM) merupakan sebuah metode yang bekerja menggunakan nonlinear mapping yang berguna untuk transformasi data training awal ke dalam dimensi baru yang lebih tinggi. Dengan melakukan nonlinear mapping, data training akan dipetakan dan diantara kumpulan data tersebut akan dipisahkan oleh hyperplane atau garis pemisah. Tujuan utama metode SVM ini adalah untuk menemukan hyperplane terbaik pada dimensi baru yang dapat memisahkan kelas tersebut secara optimal (Christianini & Taylor, 2000). Gambar 1 Ilustrasi Sederhana SVM Dalam Gambar 1 terdapat dua kelas yang dipisahkan oleh dua bidang pembatas secara linier. Kelas pertama yakni +1 dan kelas kedua -1. Data pada kelas pertama disimbolkan dengan lingkaran berwarna hitam, sedangkan data pada kelas kedua disimbolkan dengan lingkaran berwarna putih. H 1 adalah bidang pembatas pertama membatasi kelas pertama. H 2 adalah bidang pembatas kedua membatasi kelas kedua. Persamaan diperoleh : x i.w+b +1, untuk y i =+1 x i.w+b -1, untuk y i =-1 (2) Dengan menggabungkan kedua persamaan diatas, maka dihasilkan: y i (x i. w) + b 1 (3) Hyperplane yang optimal dapat ditemukan dengan cara merumuskan ke dalam quadratic problem yang diselesaikan dengan analisis numerik. Metode sequential training SVM dikembangkan pada tahun 1999, adapun rincian metode ini adalah sebagai berikut (Vijayakumar & Wu, 1999): 1. Pada penelitian ini kernel yang digunakan adalah polynomial degree dengan nilai d=2, adapun persamaan yang digunakan untuk menghitung nilai kernel polynomial degree d adalah sebagai berikut: K(x i, x j ) = (x i x j ) d, γ > 0 (4) 2. Kemudian lakukan perhitungan matriks hessian (D ij ) menggunakan persamaan berikut: D ij = y i y j (K(x i x j )) + λ 2 (5) Dengan rincian, notasi λ adalah variabel lambda, notasi y adalah kelas dari data ke-i dan data ke-j, K(x i x j ) adalah fungsi kernel yang digunakan, dan notasi x adalah nilai dari data ke-i dan data ke-j. 3. Kemudian hitung nilai learning rate.yang dinotasikan dengan simbol γ. Nilai γ dapat dihitung dengan cara membagi nilai Constanta Learning Rate (CLR) dengan nilai maksimal dari matriks hessian (D ij ). Adapun persamaan untuk menghitung nilai γ adalah sebagai berikut: CLR γ = (6) max(dij) 4. Setelah nilai γ diperoleh, maka dilanjut dengan mencari nilai α i, menggunakan persamaan 2.18, 2.19 dan E i = n j=1 α id ij (7) δα i = min ( max (γ(1-e i ), -α i ), C-α i ) (8) α i = α i + δα i (9) Ulangi langkah ke-4 ini selama nilai max(δα i ) lebih besar dari nilai ε (epsilon) dan masih belum mencapai jumlah iterasi maksimal.

4 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Mendapatkan nilai support vector dapat diketahui dengan menggunakan persamaan. SV = (α i > Threshold) (10) Setelah diperoleh nilai α i optimal, maka dapat dilanjutkan untuk mencari nilai bobot w dan bias menggunakan persamaan berikut: n w = i=1 α i y i x i (11) b= (w.x+ + w.x - ) (12) Keterangan: α i = alpha (nilai bobot untuk setiap titik data) δα i = delta alpha E i = variabel slack (eror) γ= learning rate CLR= konstanta learning rate C=kompleksitas (untuk meminimalkan eror) λ= konstanta lambda D ij = matriks Hessian 3. METODOLOGI 3.1 Desain Penelitian Desain dari penelitian dibagi menjadi beberapa tahap seperti yang ditunjukkan pada Gambar 2. Gambar 2 Desain Penelitian Pertama data yang berupa teks masuk menuju tahap text preprocessing terlebih dahulu untuk merubah data teks yang tidak terstruktur menjadi data yang lebih terstruktur. Di dalam text proprocessing terdapat beberapa proses yang harus dilaksanakan antara lain tokenizing, filtering, stemming, seleksi fitur dan term weighting. Hasil dari term weighting nantinya akan digunakan untuk tahap klasifikasi, dalam tahap klasifikasi dibagi menjadi 2 proses besar yakni training SVM dan testing SVM yang pada akhirnya akan menghasilkan output berupa prediksi tren kurs USD. 3.2 Pengumpulan Data Data atau dokumen yang diperlukan yakni berita ekonomi Amerika Serikat berbahasa Indonesia yang diperoleh melalui website foreximf.com dengan filter USD pada kurun waktu tertentu. Tidak semua berita ekonomi Amerika Serikat yang akan digunakan, namun terfokus pada beberapa berita ekonomi yang termasuk dalam kategori high impact atau memiliki pengaruh besar dalam pergerakan mata uang, adapun berita yang digunakan berhubungan dengan kategori berikut ini: 1. Non-farm Payrolls 2. Suku Bunga 3. Penjualan Ritel 4. ISM Manufacturing 5. Inflasi (CPI dan PPI) 6. Unemployment Rate 7. Building Permits 8. Crude oil inventories 9. US Treasury 10. Neraca Perdagangan 4. PENGUJIAN DAN ANALISIS Pengujian yang dilakukan pada penelitian ini adalah pengujian pengaruh jumlah data training yang digunakan nilai lambda, constanta learning rate, complexity, epsilon, dan iterasi maksimal. 4.1 Pengujian Pengaruh Jumlah Data Training Dari total 150 data yang digunakan dalam objek penelitian, dilakukan beberapa kali percobaan menggunakan rasio data training dan data testing. Setiap percobaan terdapat tiga skenario menggunakan data yang berbeda. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1, CLR = 0.01, C=1, epsilon= , dan iterasi maksimal =100. Hasil dari pengujian jumlah data training ditunjukkan pada Tabel 1. Tabel 1 Hasil Pengujian Rasio Data Training dan Data Testing Rasio Rerata 80% : 20% % : 30% % : 40% % : 50%

5 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer % : 60% % : 70% % : 80 % % : 80% % : 70% % : 70% % : 60% % : 60% Gambar 3 Hasil Pengujian Rasio Data Training dan Data Testing Gambar 3 memperlihatkan jika proses training menggunakan rasio 80% : 20% untuk data training dan data testing menghasilkan ratarata akurasi lebih baik yakni sebesar 76.66% dengan akurasi terbaik sebesar 80% dan yang terburuk 73.33%. Dengan pengujian ini dapat dilihat penggunaan jumlah data training yang semakin banyak akan semakin meningkatkan kualitas dari klasifikasi yang dilakukan dan menjadikan program menjadi semakin cerdas serta dapat mengenali lebih banyak pola data, begitupun sebaliknya apabila data training yang digunakan terlampau sedikit maka kualitas yang dihasilkan pun juga akan menurun. Rasio 80% : 20% akan digunakan sebagai dasar untuk pengujian parameter lain. 4.2 Pengujian Pengaruh DF Thresholding tahu pengaruh DF thresholding terhadap tingkat akurasi hasil klasifikasi. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain λ=0.1, CLR = 0.01, C=1, epsilon= , dan iterasi maksimal =100. Hasil dari pengujian nilai parameter lambda ditunjukkan pada Tabel 2. Tabel 2 Hasil Pengujian DF Thresholding Threshold bawah : atas 0% : 100% % : 100% % : 90% % : 90% % : 80% Gambar 4 Hasil Pengujian DF Thresholding Gambar 4 menunjukkan penggunakan DF threshold untuk seleksi fitur dengan threshold bawah 15% dari jumlah data training dan threshold atas 85% dari jumlah data training menghasilkan nilai akurasi rata-rata tertinggi dibandingkan dengan pengujian threshold lain yang telah dilakukan. Hal ini membuktikan bahwa penggunaan dimensi data terlalu besar atau bahkan dimensi data yang terlalu kecil tidak baik untuk proses klasifikasi, sehingga dapat menurunkan kualitas data yang akan diolah. 4.3 Pengujian Pengaruh Nilai Lambda tahu pengaruh nilai lambda terhadap tingkat akurasi hasil klasifikasi yang akan dilakukan. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold atas = 85%, DF threshold bawah = 15%, CLR = 0.01, C=1, epsilon= , dan iterasi maksimal =100. Hasil dari pengujian nilai parameter lambda ditunjukkan pada Tabel 3. Lambda Tabel 3 Hasil Pengujian Nilai Lambda

6 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Gambar 5 Hasil Pengujian Nilai Lambda Grafik pada Gambar 5 menunjukkan dimana paramater lambda dengan nilai 0.001, , dan 1 menghasilkan akurasi yang lebih baik dibandingkan dengan parameter lambda dengan nilai besar. Dimana semakin tinggi nilai lambda maka akan cenderung menurunkan nilai akurasi yang dihasilkan dikarenakan nilai lambda sangat berpengaruh ketika perhitungan matriks Hessian (D ij ) yang secara langsung juga akan berpengaruh terhadap nilai support vector yang dihasilkan. Sebagai contoh pengaruh lambda yakni pada perhitungan matriks Hessian pada Persamaan 5, dapat dilihat jika nilai lambda semakin besar maka nilai dari matriks Hessian pun juga ikut semakin besar yang akan mengakibatkan hasil dari perhitungan learning rate pada Persamaan 6 menjadi semakin kecil sehingga dengan jumlah iterasi yang sama tidak akan memberikan hasil yang optimal. Hal itupun juga terjadi apabila nilai lambda yang terlampau kecil yang akan mengakibatkan nilai learning rate menjadi semakin besar yang akan mengakibatkan proses iterasi berhenti tidak pada waktunya. 4.4 Pengujian Pengaruh Nilai Constanta Learning Rate tahu pengaruh nilai constanta learning rate terhadap tingkat akurasi hasil klasifikasi yang akan dilakukan. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold bawah = 15%, DF threshold atas = 15%, λ=0.1, C=1, epsilon= , dan iterasi maksimal =100. Hasil dari pengujian nilai parameter constanta learning rate ditunjukkan pada Tabel 4. Tabel 4 Hasil Pengujian Nilai Constanta Learning Rate CLR Gambar 6 Hasil Pengujian CLR Pada Gambar 6 dapat diketahui jika parameter CLR dengan nilai 0.01 memperoleh rata-rata akurasi tertinggi dengan 76.66%. Dari hasil pengujian tersebut dapat diperhatikan nilai parameter CLR akan memberikan kualitas klasifikasi buruk apabila nilai yang digunakan terlalu besar begitupun jika nilai yang digunakan terlalu kecil. Parameter CLR memberikan dampak secara langsung terhadap laju nilai learning rate seperti yang ditunjukkan pada Persamaan 6. Proses pembelajaran akan berlangsung terlalu cepat dan kurang teliti apabila nilai learning rate terlalu besar, sebaliknya apabila nilai learning rate terlalu kecil maka proses pembelajaran akan berlangsung terlalu lama. 4.5 Pengujian Pengaruh Nilai Complexity tahu pengaruh nilai complexity terhadap tingkat akurasi hasil klasifikasi yang akan dilakukan. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1,

7 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1014 CLR=0.01, epsilon= , dan iterasi maksimal =100. Hasil dari pengujian nilai parameter complexity ditunjukkan pada Tabel 5. Tabel 5 Hasil Pengujian Nilai Complexity C Tabel 6 Hasil Pengujian Nilai Epsilon Epsilon Gambar 8 Hasil Pengujian Nilai Epsilon Gambar 7 Pengujian Nilai Complexity Grafik pada Gambar 7 menunjukkan kompleksitas dengan nilai besar seperti 0.05, 0.1, 0.5, 1, 5, dan 10 memberikan hasil akurasi 76.66% lebih baik dibandingkan kompleksitas dengan nilai yang lebih kecil. Nilai parameter C berdampak langsung pada saat perhitungan nilai delta alpha seperti yang ditunjukkan pada Persamaan Pengujian Pengaruh Nilai Epsilon tahu pengaruh nilai epsilon terhadap tingkat akurasi hasil klasifikasi yang akan dilakukan. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1, CLR=0.01, C=1, dan iterasi maksimal =100. Hasil dari pengujian nilai parameter epsilon ditunjukkan pada Tabel 6. Grafik pada Gambar 8 dapat diketahui jika epsilon dengan nilai kecil menghasilkan nilai akurasi 76.66% lebih tinggi dibandingkan dengan epsilon dengan nilai yang lebih besar. Parameter epsilon ini erat hubungannya dengan parameter iterasi maksimal untuk kondisi berhenti saat mencari nilai alpha. Apabila nilai epsilon kecil maka program dapat berjalan hingga batas iterasi maksimal yang ditentukan, sebaliknya apabila nilai iterasi besar program akan berhenti sebelum menyentuh batas iterasi maksimal. 4.7 Pengujian Pengaruh Nilai Iterasi Maksimal tahu pengaruh nilai iterasi maksimal terhadap tingkat akurasi hasil klasifikasi yang akan dilakukan. Adapun nilai parameter lain yang digunakan untuk pengujian ini antara lain DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1, CLR=0.01, Complexity=1, dan epsilon= Hasil dari pengujian nilai parameter iterasi maksimal ditunjukkan pada Tabel 7.

8 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1015 Tabel 7 Hasil Pengujian Nilai Iterasi Maksimal Iterasi Rerata Gambar 9 Hasil Pengujian Nilai Iterasi Maksimal Grafik pada Gambar 9 memperlihatkan jika pengujian dengan batas iterasi maksimal besar menghasilkan akurasi klasifikasi 76.66% lebih baik dibandingkan pengujian dengan batas iterasi maksimal yang lebih kecil. Parameter batas iterasi maksimal ini erat hubungannya dengan parameter epsilon yang digunakan untuk kondisi berhenti saat mencari nilai alpha. 4.8 Evaluasi Dari hasil pengujian menggunakan rasio 80% untuk data training dan 20% untuk data testing dari total 150 data yang digunakan sebagai objek penelitian menghasilkan nilai akurasi-rata terbaik 76.66% yang diperoleh dengan kombinasi parameter yakni DF threshold bawah = 15%, DF threshold atas = 85%, λ=0.1, CLR=0.01, C=1, epsilon= , dan iterasi maksimal =100. Selain itu untuk evaluasi dilakukan perhitungan lainnya yakni sensitivity dan specificity dengan menggunakan Persamaan 14, dan Persamaan 15. Adapun hasil perhitungan sensitivity, specificity, dan akurasi seperti yang ditunjukkan pada Tabel 8. Sensitivity = Specificity = Akurasi = True Positive True Positive+False Positive True Negative TrueNegative+False Negative True Positive+True Negative Semua Populasi Tabel 8 Sensitivity, Specificity, dan Akurasi Hasil Klasifikasi Hasil Sebenarnya Down Up Down 12 4 Up 3 11 Sensitivity 12/(12+3)= 80% Specificity 11/(11+4)=73.33% Akurasi 12+11/30=76.66% (13) (14) (15) Berdasarkan studi kasus pada penelitian ini sensitivity adalah data yang murni kelas Down dari seluruh data yang berhasil diklasifikasi kedalam kelas Down. Sebaliknya specificity adalah data yang murni bukan kelas Down dari seluruh data yang berhasil diklasifikasi bukan kelas Down. Sedangkan akurasi adalah data yang berhasil diklasifikasi dengan benar dari seluruh jumlah populasi yang ada. Jadi hasil klasifikasi akan semakin baik apabila nilai sensitivity, specificity, dan akurasi bernilai tinggi. 5. KESIMPULAN Implementasi prediksi tren kurs dollar dari berita finansial Amerika Serikat berbahasa Indonesia menggunakan Support Vector Machine dilakukan melalui beberapa langkah yang pertama dengan melakukan tahap preprocessing yakni mengubah data yang berupa teks yang tidak terstruktur menjadi data numerik yang lebih terstruktur dan siap untuk diklasifikasi. Kedua yakni tahap training SVM yang bertujuan untuk mencari bidang pemisah optimal (hyperplane) dan yang terakhir dilanjutkan dengan tahap testing SVM dimana data test diklasifikasi berdasarkan hyperplane yang merupakan hasil dari training yang sebelumnya telah dilakukan. Kualitas dokumen untuk proses training sangat berpengaruh terhadap akurasi klasifikasi yang dihasilkan, kualitas dokumen yang bagus berbanding lurus dengan nilai akurasi yang tentunya akan bagus juga. Dari beberapa percobaan terhadap jumlah data yang digunakan untuk proses training, diperoleh rata-rata akurasi

9 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1016 terbaik ketika menggunakan rasio 80% untuk data training dan 20% untuk data testing. Akurasi terbaik dalam pengujian ini didapatkan dengan menggunakan nilai parameter DF threshold bawah= 15%, DF threshold atas=85%, λ=0.1, CLR=0.01, C=1, epsilon= , dan iterasi maksimal =100 yang menghasilkan nilai akurasi sebesar 76.66%, nilai sensitivity sebesar 80%, dan nilai specificity sebesar 73.33%. 6. DAFTAR PUSTAKA Berlianta, H. C., Mengenal Valuta Asing. Yogyakarta: Gajah Mada University Press. Christianini, N. & Taylor, J. S., An Introduction to Support Vector Machines. Cambridge: Cambridge University Press. Ehrmann, M. & Fratzscher, M., Exchange rates and fundamentals: new evidence from real-time data. Journal of International Money and Finance, 24(2), pp Joachims, T., Text Categorizaton with Support Vector Machine: Learning with Many Relevant Features. Proceedings of the 10th European Confrence on Machine Learning, pp Kumar, R. B., Kumar, B. S. & Sai, R. S., Financial News Classification using SVM. International Journal of Scientific and Research Publication, Volume 2. Liliana, D. Y., Hardianto, A. & Ridok, M., Indonesian News Classification using Support Vector Machine. International Journal of COmputer, Electrical, Automation, Control and Information Engineering, 5(9). Nassirtoussi, A. K., Aghabozorgi, S., Wah, T. Y. & Ngo, D. C. L., Text Mining of news-headlines for FOREX market prediction. Expert Systems with Application: An International Journal, 42(1), pp Vijayakumar, S. & Wu, S., Sequential Support Vector Classifiers and Regression. International Confrence on Soft Computing, pp

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

ANALISIS SUPPORT VECTOR REGRESSION

ANALISIS SUPPORT VECTOR REGRESSION ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT SKRIPSI Oleh : RISKY AMANDA NIM. 24010210141027 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS Halimatus Sa dyah, Nurissaidah Ulinnuha Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

Penerapan Sentimen Analisis Acara Televisi Pada Twitter Menggunakan Support Vector Machine dan Algoritma Genetika sebagai Metode Seleksi Fitur

Penerapan Sentimen Analisis Acara Televisi Pada Twitter Menggunakan Support Vector Machine dan Algoritma Genetika sebagai Metode Seleksi Fitur Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 3, Januari 2018, hlm. 998-1007 http://j-ptiik.ub.ac.id Penerapan Sentimen Analisis Acara Televisi Pada Twitter Menggunakan

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1725-1732 http://j-ptiik.ub.ac.id Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM BAB 3 ANALISIS DAN PERANCANGAN SISEM 3.1 Analisis Masalah Pelaksanaan skripsi pada program studi eknik Informatika UNIKOM setiap tahunnya, berdampak pada laporan skripsi yang semakin bertambah dan mengakibatkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

Online News Classification Using Multinomial Naive Bayes

Online News Classification Using Multinomial Naive Bayes Online News Classification Using Multinomial Naive Bayes Amelia Rahman Informatika, Fakultas MIPA Universitas Sebelas Maret Jalan Ir. Sutami 36A Surakarta amelia.rahman@student.uns.ac.id Wiranto Informatika,

Lebih terperinci

ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT

ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 849-857 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

Prediksi Pergerakan Harga Harian Nilai Tukar Rupiah (IDR) Terhadap Dollar Amerika (USD) Menggunakan Metode Jaringan Saraf Tiruan Backpropagation

Prediksi Pergerakan Harga Harian Nilai Tukar Rupiah (IDR) Terhadap Dollar Amerika (USD) Menggunakan Metode Jaringan Saraf Tiruan Backpropagation 1 Prediksi Pergerakan Harga Harian Nilai Tukar Rupiah (IDR) Terhadap Dollar Amerika (USD) Menggunakan Metode Jaringan Saraf Tiruan Backpropagation Reza Subintara Teknik Informatika, Ilmu Komputer, Universitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 811-820 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

Pengantar Support Vector Machine

Pengantar Support Vector Machine Pengantar Support Vector Machine Anto Satriyo Nugroho February 8, 2007 1 Pengantar Pattern Recognition (PR) didefinisikan sebagai proses pemetaan suatu data ke dalam konsep tertentu yang telah didefinisikan

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

SISTEM PENGENALAN KARAKTER DENGAN JARINGAN SYARAF TIRUAN ALGORITMA PERCEPTRON

SISTEM PENGENALAN KARAKTER DENGAN JARINGAN SYARAF TIRUAN ALGORITMA PERCEPTRON Jurnal Informatika Mulawarman Vol. 7 No. 3 Edisi September 2012 105 SISTEM PENGENALAN KARAKTER DENGAN JARINGAN SYARAF TIRUAN ALGORITMA PERCEPTRON Anindita Septiarini Program Studi Ilmu Komputer FMIPA,

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN I.1. Latar Belakang Masalah BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Pada bab ini menjelaskan topik taksonomi yang merupakan pengorganisasian informasi yang penting karena merupakan dasar dalam memahami suatu informasi. Taksonomi membantu memahami

Lebih terperinci

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM)

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM) Scientific Journal of Informatics Vol. 3, No. 1, Mei 20xx p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa

Lebih terperinci

Text Pre-Processing. M. Ali Fauzi

Text Pre-Processing. M. Ali Fauzi Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan Scientific Journal of Informatics Vol. 2, No. 2, November 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Implementasi Vector Space Model dalam Pembangkitan Frequently

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 Klasifikasi Informasi, Anjuran dan Larangan pada Hadits Shahih Bukhari menggunakan Metode Support Vector Machine. Andina

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki

BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki intensitas yang berbeda. Faktor penyebabnya dapat terjadi

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

Seleksi Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode Information Gain

Seleksi Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode Information Gain IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 Seleksi Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode Information Gain Indah Maulida 1, Addy Suyatno 2, Heliza Rahmania Hatta

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas

Lebih terperinci

Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor dan Features Selection Berbasis Categorical Proportional Difference

Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor dan Features Selection Berbasis Categorical Proportional Difference Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 8, Agustus 2018, hlm. 2449-2454 http://j-ptiik.ub.ac.id Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest

Lebih terperinci

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH SKRIPSI Disusun Oleh : LUTFIA SEPTININGRUM 240 102 111 400 73 JURUSAN STATISTIKA FAKULTAS SAINS DAN

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas

Lebih terperinci

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA (Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara) SKRIPSI

Lebih terperinci

Klasifikasi Tweets Pada Twitter Dengan Menggunakan Metode Fuzzy K- Nearest Neighbour (Fuzzy K-NN) dan Query Expansion Berbasis Apriori

Klasifikasi Tweets Pada Twitter Dengan Menggunakan Metode Fuzzy K- Nearest Neighbour (Fuzzy K-NN) dan Query Expansion Berbasis Apriori Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 5, Mei 2017, hlm. 405-414 http://j-ptiik.ub.ac.id Klasifikasi Tweets Pada Twitter Dengan Menggunakan Metode Fuzzy

Lebih terperinci

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan

Lebih terperinci

Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour. Information Retrieval Document Classified with K-Nearest Neighbor

Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour. Information Retrieval Document Classified with K-Nearest Neighbor Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour Information Retrieval Document Classified with K-Nearest Neighbor Endah Purwanti 1 Fakultas Sains dan Teknologi Universitas Airlangga

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB

INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB Dika R. Yunianto dikarizky66@gmail.com Septyawan R. Wardhana rossywardhana@gmail.com Rizka W. Sholikah rizkaws@gmail.com

Lebih terperinci

ISSN: Akhmad Pandhu Wijaya 1, Heru Agus Santoso 2

ISSN: Akhmad Pandhu Wijaya 1, Heru Agus Santoso 2 48 ISSN: 1978-1520 Naive Bayes Classification pada Klasifikasi Dokumen Untuk Identifikasi Konten E-Government Naïve Bayes Classification on Document Classification to Identify E-Government Content Akhmad

Lebih terperinci

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA Suprianto 1), Sunardi 2), Abdul Fadlil 3) 1 Sistem Informasi STMIK PPKIA Tarakanita Rahmawati 2,3 Magister Teknik Informatika Universitas

Lebih terperinci

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen 3 METODE Metode penelitian metafile penyusun struktur digraf menggunakan algoritme Document Index Graph (DIG) terdiri atas beberapa tahapan yaitu tahap analisis masalah dan studi literatur dari penelitian

Lebih terperinci

SVM untuk Regresi Ordinal

SVM untuk Regresi Ordinal MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

Metode Kernel. Machine Learning

Metode Kernel. Machine Learning MMA10991 Topik Khusus Machine Learning Metode Kernel Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

TF-IDF-ENHANCED GENETIC ALGORITHM UNTUK EXTRACTIVE AUTOMATIC TEXT SUMMARIZATION

TF-IDF-ENHANCED GENETIC ALGORITHM UNTUK EXTRACTIVE AUTOMATIC TEXT SUMMARIZATION Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 3, No. 3, September 2016, hlm. 208-215 TF-IDF-ENHANCED GENETIC ALGORITHM UNTUK EXTRACTIVE AUTOMATIC TEXT SUMMARIZATION Dhimas Anjar Prabowo 1,

Lebih terperinci

Text Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta

Text Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta Text Mining Budi Susanto Materi Pengertian Text Mining Pemrosesan Text Tokenisasi Lemmatization Vector Document Pengertian Text Mining Text mining merupakan penerapan konsep dan teknik data mining untuk

Lebih terperinci

BAB 1 PENDAHULUAN. Pada masa sekarang ini, banyak jenis-jenis usaha dan bisnis yang mulai

BAB 1 PENDAHULUAN. Pada masa sekarang ini, banyak jenis-jenis usaha dan bisnis yang mulai 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada masa sekarang ini, banyak jenis-jenis usaha dan bisnis yang mulai dikembangkan oleh banyak orang terutama dalam hal bisnis investasi. Salah satu bisnis

Lebih terperinci

IMPLEMENTASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI DOKUMEN DEALIS HENDRA PRATAMA

IMPLEMENTASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI DOKUMEN DEALIS HENDRA PRATAMA IMPLEMENTASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI DOKUMEN DEALIS HENDRA PRATAMA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

Penerapan Metode Support Vector Machine (SVM) Pada Klasifikasi Penyimpangan Tumbuh Kembang Anak

Penerapan Metode Support Vector Machine (SVM) Pada Klasifikasi Penyimpangan Tumbuh Kembang Anak Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3163-3169 http://j-ptiik.ub.ac.id Penerapan Metode Support Vector Machine (SVM) Pada Klasifikasi

Lebih terperinci