ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF A B S T R A K

dokumen-dokumen yang mirip
POLA KEMAMPUAN ANAK BERDASARKAN RAPOR MENGGUNAKAN TEXT MINING DAN KLASIFIKASI NEAREST NEIGHBOR

BAB II LANDASAN TEORI

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

PENGEMBANGAN MODEL SISTEM BERBASIS PENGETAHUAN PADA LEMBAGA KONSULTASI MANAJEMEN USAHA MIKRO KECIL DAN MENENGAH (UMKM)

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

BAB I PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

BAB 3 LANDASAN TEORI

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

PEMANFAATAN ALGORITMA TF/IDF UNTUK SISTEM INFORMASI e-complaint HANDLING

BAB II LANDASAN TEORI

Text Pre-Processing. M. Ali Fauzi

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB III LANDASAN TEORI

KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL

DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW

BAB IV ANALISA DAN PERANCANGAN

BAB 1 PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB 1 PENDAHULUAN UKDW

BAB II LANDASAN TEORI

Prosiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN:

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

@UKDW BAB 1 PENDAHULUAN Latar Belakang

KNOWLEDGE MANAGEMENT SYSTEM PADA KERUSAKAN MESIN COMPUTER NUMERICALLY CONTROLLED

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB III ANALISIS DAN PERANCANGAN

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

BAB II LANDASAN TEORI

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Pengujian Kerelevanan Sistem Temu Kembali Informasi

SISTEM PENILAIAN ESAI OTOMATIS PADA E-LEARNING DENGAN METODE COSINE SIMILARITY

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

1.5 Metode Penelitian

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS

Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Sistem Deteksi Kemiripan Identitas...

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker

Jurnal Informatika dan Komputer PENS

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)

BAB III METODE PENELITIAN

BAB I PENDAHULUAN Latar Belakang

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

Preprocessing Text Mining Pada Box Berbahasa Indonesia

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

Rancang Bangun Sistem Pengelolaan Dokumen-dokumen Penting Menggunakan Text Mining

BAB III ANALISIS DAN PERANCANGAN SISTEM

Gambar 1.1 Proses Text Mining [7]

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

BAB I PENDAHULUAN 1.1 Latar Belakang

dimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2.

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430

BAB II TINJAUAN PUSTAKA

Transkripsi:

ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF Oleh : Tacbir Hendro Pudjiantoro A B S T R A K Kompetensi dosen adalah salah satu bagian yang utama dalam penunjukan dosen pengampu matakuliah. Kompetensi dosen dalam mengampu satu matakuliah tercermin dari daftar riwayat hidupnya. Dalam daftar riwayat hidup tersebut tertulis, riwayat pendidikan formal dan non formal, pelatihan, workshop, penelitian dan pengalaman kerja. Dalam penelitian ini akan dibangun sebuah sistem yang dapat menganalisa kompetensi dosen berdasarkan daftar riwayat hidupnya, dimana daftar riwayat hidup tersebut disimpan dalam format dokumen (doc atau txt). Dalam prosesnya, digunakan metode CF-IDF untuk menghitung setiap kata yang bersangkutan dengan matakuliah yang dicari. Hasil akhir dari sistem ini adalah daftar dosen yang dapat ditunjuk sebagai dosen pengampu matakuliah yang dicari sesuai dengan bobot daftar riwayat hidupnya masing-masing. Hal ini memudahkan pihak jurusan untuk menentukan penunjukan dosen pengampu. Kata Kunci : Kompetensi, Daftar Riwayat Hidup, Algoritma CF-IDF 1. PENDAHULUAN Penunjukan dosen pengampu matakuliah di suatu jurusan, biasanya karena senioritas seseorang di jurusan tersebut, tidak berdasarkan kompetensi dari seseorang. Hal ini menyebabkan kurangnya kesempatan bagi orang yang mempunyai kemampuan lebih baik dari seniornya, namun demikian, untuk menganalisa dan menghitung seberapa kompetennya seorang dosen untuk mengampu suatu matakuliah tidak mudah dilakukan. Beberapa aspek yang perlu dilihat dalam menentukan kompetensi seseorang untuk dikatakan layak mengampu satu matakuliah adalah Pendidikan minimum S2 yang berkesuaian, syarat selanjutnya ada empat. Pertama, kompetensi pedagogik, yaitu kemampuan dosen mengelola pembelajaran peserta didik. Dosen harus bisa memberi pemahaman peserta didik, membuat perencanaan pembelajaran, mengevaluasi hasil belajar, dan mampu mengembangkan potensi yang dimiliki mahasiswa. Kedua, pengabdian, yaitu menyangkut kemampuan kepribadian yang mantap, stabil, dewasa, berwibawa, dan menjadi teladan bagi peserta didik. Ketiga, Profesional. menyangkut kemampuan pengurusan materi pembelajaran secara luar dan mendalam. "Yang memungkinkan membimbing peserta didik sesuai dengan standar kompetensi yang di tetapkan," ujarnya. Keempat, yaitu kompetensi sosial, meliputi kemampuan pendidik sebagai bagian dari masyarakat untuk berkomunikasi dan bergaul dengan mahasiswa maupun elemen pendidikan, maupun PENILAIAN KOMPETENSI DOSEN (Tacbir Hendro P.) 1

masyarakat umum. Dalam menilai seluruh kompetensi tersebut, diperlukan ketelitian, sehingga seluruh daftar riwayat hidup harus dibaca secara mendetil. Untuk membaca sekian banyak daftar riwayat hidup secara mendetil diperlukan sistem yang cerdas dan sekaligus cermat. 1.1 Rumusan Masalah Masalah dalam penelitian ini adalah menentukan kompetensi seorang dosen sehingga dikatakan layak untuk mengampu satu matakuliah tertentu berdasarkan daftar riwayat hidup secara otomatis. 1.2 Batasan Masalah Acuan penilaian kompetensi hanya berdasarkan pada serangkaian kata kunci yang di-input-kan (nama matakuliah dan persyaratan pendidikan formal dan non formal) yang dibandingkan dengan daftar riwayat hidup yang dituliskan oleh calon dosen yang bersangkutan. Format penulisan isi daftar riwayat hidup menggunakan format yang telah ditentukan. Format dokumen yang digunakan.doc /.docx,.txt. Output berupa daftar dosen yang memepunyai nilai terbesar pada setiap matakuliah yang dicari. 1.3 Tujuan Penelitian Tujuan dari penelitian ini membuat perangkat lunak yang dapat membantu pihak jurusan untuk menganalisa kompetensi seorang dosen sehingga menghasilkan informasi nilai kelayakan seorang calon dosen dalam mengampu suatu matakuliah berdasarkan riwayat hidupnya. 2. METODE PENELITIAN Dalam melalukan penelitian ini beberapa metoda, istilah dan tahapan yang dilakukan dijelaskan di bawah ini. 2.1 Knowledge Management System Menurut Alavi dan Leidner, Knowledge Management System adalah sistem yang diciptakan untuk memfasilitasi penangkapan, penyimpanan, pencarian, transfer dan penggunaan kembali pengetahuan. Berdasarkan definisi di atas dapat disimpulkan bahwa Knowledge Management System adalah sistem yang digunakan untuk melakukan penangkapan, penyimpanan, pencarian, transfer dan pengelolaan pengetahuan untuk memudahkan kembali penggunaan pengetahuan tersebut. 2.2 Konsep Text Mining Text mining adalah salah satu bidang khusus dari data mining. Sesuai dengan buku The Text Mining Handbook, text mining dapat didefinisikan sebagai suatu proses menggali informasi dimana seorang user berinteraksi dengan sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-komponen dalam data mining yang salah satunya adalah kategorisasi [Feldman 2007]. Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks (text categorization) dan pengelompokan teks (text clustering). Text mining juga dapat didefinisikan sebagai usaha menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan ARISTOTELES VOL. 10 NO. 1, OKTOBER 2012 : HAL. 1 8 2

tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen. Text mining bisa dianggap subjek riset yang tergolong baru. Text mining dapat memberikan solusi dari permasalahan seperti pemrosesan, pengorganisasian / pengelompokkan dan menganalisa unstructured text dalam jumlah besar. Dalam memberikan solusi, text mining mengadopsi dan mengembangkan banyak teknik dari bidang lain, seperti Data mining, Information Retrieval, Statistik dan Matematik, Machine Learning, Linguistic, Natural Languange Processing, dan Visualization. Kegiatan riset untuk text mining antara lain ekstraksi dan penyimpanan text, preprocessing akan konten text, pengumpulan data statistik dan indexing, dan analisa konten. Permasalahan yang dihadapi pada text mining sama dengan permasalahan yang terdapat pada data mining, yaitu jumlah data yang besar, dimensi yang tinggi, data dan struktur yang terus berubah, dan data noise. Perbedaan di antara keduanya adalah pada data yang digunakan. Pada data mining, data yang digunakan adalah structured data, sedangkan pada text mining, data yang digunakan pada umumnya adalah unstructured data, atau minimal semistructured. Hal ini menyebabkan adanya tantangan tambahan pada text mining yaitu struktur text yang complex dan tidak lengkap, arti yang tidak jelas dan tidak standard, dan bahasa yang berbeda ditambah translasi yang tidak akurat. 2.3 Tahapan dalam Text Mining Teks yang akan dilakukan proses text mining, pada umumnya memiliki beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen. Sebelum menentukan fitur fitur yang mewakili, diperlukan tahap pre-processing yang dilakukan secara umum dalam text mining pada dokumen. Tahapan dalam Text Mining yaitu : 1. Case Folding Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan. Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh dari tahap ini adalah seperti pada gambar 2.1. Gambar 2.1. Case Folding 2. Tokenizing Tahap tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh dari tahap ini adalah seperti pada gambar 2.2. berikut ini PENILAIAN KOMPETENSI DOSEN (Tacbir Hendro P.) 3

baku yang permanen. Contoh dari tahapan ini pada teks berbahasa Inggris adalah seperti pada gambar 2.4. Gambar 2.2. Tokenizing 3. Filtering Tahap filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist / stopword adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bagof-words. Contoh stopwords adalah yang, dan, di, dari dan seterusnya. Contoh dari tahap ini adalah seperti pada gambar 2.3. Gambar 2. 3. Filtering 4. Stemming Tahap stemming adalah tahap mencari akar (root) kata dari tiap kata hasil fitering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam suatu representasi yang sama. Tahap ini kebanyakan dipakai untuk teks berbahasa inggris dan lebih sulit diterapkan pada teks berbahasa Indonesia. Hal ini dikarenakan bahasa Indonesia tidak memiliki rumus bentuk Gambar 2.4. Stemming untuk bahasa inggris Contoh dari tahapan ini pada teks berbahasa Indonesia adalah seperti pada gambar 2.5 Gambar 2.5. Stemming untuk bahasa Indonesia 2.4 CF-IDF (Concept Frequency- Inverse Document Frequency) Untuk menentukan nilai kecocokan antara dokumen pengetahuan dan keyword diperlukan pembobotan. Pembobotan atau disebut juga weighting merupakan pemberian bobot terhadap kata/frase yang telah dihasilkan dari tahap sebelumnya. Model pembobotan tersebut dapat dengan pembobotan global, lokal atau pun kombinasi dari keduanya. Salah satu pembobotan kombinasi tersebut adalah CF-IDF (Concept Frequency- Inverse Document Frequency). Metode ini merupakan pengembangan dari metode TF-IDF (Term Frequency- Inverse Document Frequency) yang lebih dahulu populer. Pada metode ini ARISTOTELES VOL. 10 NO. 1, OKTOBER 2012 : HAL. 1 8 4

tidak dilakukan perhitungan terhadap term (seperti pada TF-IDF) namun dengan menghitung key concept yang ditemukan dalam teks. Pada CF-IDF, dilakukan pendekatan representasi isi dokumen dengan menggunakan jaringan semantik yang disebut dokumen inti semantik. Dokumen tersebut kemudian dipetakan dalam jaringan semantik yang disebut Wordnet dan dikonversikan dari sekumpulan terms menjadi sekumpulan konsep (concept). Pendekatan ini membuat konsep dari CF-IDF terlihat lebih cerdas dibandingkan TF-IDF. Concept yang dimaksud dalam metode ini adalah kata atau pun istilah majemuk yang kombinasi katanya dapat memiliki banyak arti dan menimbulkan ambiguitas dalam pembacaannya. Dalam mendeteksi concept dari dokumen dapat dilakukan dengan dua cara yaitu dengan memproyeksikan ontologi ke dalam dokumen dengan mengekstrak semua kata dan frase (istilah majemuk) dari ontologi kemudian mengidentifikasikan kemunculanya dalam dokumen. Cara yang kedua adalah dengan memproyeksikan dokumen ke dalam ontology, untuk setiap calon frase yang terbentuk (yang dideteksi dari kedekatan kata atau adjacent). Untuk membentuk concept, terlebih dahulu harus dibentuk kandidat-kandidat concept dari dokumen. Kandidat-kandidat dibedakan menjadi kata (mono word) dan frase (multi words). Frase atau multi words merupakan gabungan dari beberapa kata yang memiliki arti. Pada penelitian ini, pembentukan frase maksimal adalah terdiri dari gabungan dua kata. Pembentukan kandidat kata berdasarkan kemunculan setiap kata di dalam dokumen sementara pembentukan kandidat frase dilakukan berdasarkan kedekatan kata berurutan dari kiri ke kanan. Contoh pembentukan frase dari teks. Kata Dosen terlambat mengajar akan dibentuk menjadi tiga buah kandidat yaitu Dosen terlambat mengajar, Dosen terlambat dan terlambat mengajar. Pada tabel 2.1 dapat dilihat contoh pembentukan kandidat dari tiga buah dokumen. Dokumen 1, Dosen terlambat datang di kelas. Dokumen 2, Mahasiswa demonstrasi dalam kampus dan dokumen 3, Perkuliahan terlambat dilaksanakan. Setelah melalui tahapan pre prosesing, selanjutnya proses CF-IDF berlangsung. Tabel 2.1 Contoh Kandidat Semua kandidat, baik itu kata maupun frase akan dicari concept-nya di dalam wordnet. Setiap kandidat akan menjadi sebuah concept jika kandidat concept tersebut ada dalam wordnet. Pada Tabel 2.2 dapat dilihat contoh pemetaan concept ke dalam wordnet. Tabel 2.2 Contoh Pemetaan Concept PENILAIAN KOMPETENSI DOSEN (Tacbir Hendro P.) 5

Setelah itu, dilakukan pembobotan dengan menghitung CF (Concept Frequency) menggunakan rumus : Terakhir, nilai Cf dikalikan dengan nilai IDF. Setelah itu, dilakukan perhitungan nilai IDF dengan membagi jumlah total dokumen dengan jumlah dokumen yang terdapat kemunculan konsep (Ci) Dimisalkan terdapat teks masukan sebagai berikut: Kata Kunci (kk) = mahasiswa terlambat Dokumen 1 (D1) = mahasiswa terlambat masuk kelas Dokumen 2 (D2) = mahasiswa melakukan demonstrasi di dalam kampus Dokumen 3 (D3) = perkuliahan terlambat dilaksanakan Tabel 2.3 Contoh Perhitungan CF-IDF ARISTOTELES VOL. 10 NO. 1, OKTOBER 2012 : HAL. 1 8 6

Bobot dari masing-masing dokumen dengan kata kunci mahasiswa terlambat : Bobot Dokumen 1 = 0.044 + 0.044 = 0.088 Bobot Dokumen 2 = 0.058 + 0 = 0.058 Bobot Dokumen 1 = 0 + 0.058 = 0.058 Dari perhitungan bobot ketiga dokumen tersebut, terlihat bahwa dokumen 1 memiliki bobot yang lebih tinggi dibanding kedua dokumen lainnya. Urutan dokumen dengan similaritas tertinggi adalah dokumen 1, dokumen 2 dan terakhir dokumen 3. 3. ANALISA DAN HASIL PENELITIAN Data utama dari sistem ini adalah berupa Daftar Riwayat Hidup (DRH). Format penulisan DRH berisi tentang informasi identitas, pendidikan formal, penelitian, pangabdian masyarakat, Penulisan artikel ilmiah, pemakalah dalam workshop / seminar / Call For Paper, buku diktat / modul praktikum, kursus / pelatihan, perumusan kebijakan, penghargaan yang pernah diperoleh. Masing-masing bagian informasi dipisahkan menggunakan simbol khusus untuk menandainya (menggunakan simbol // ). Penulisan DRH disimpan dalam bentuk dokumen (.doc/x atau txt). Setiap bagian informasi dalam dokumen DRH dihitung menggunakan CF-IDF untuk kemudian disimpan dalam satu tabel yang menggambarkan tingkat similaritas dokumen DRH dengan kata kuncinya. Sistem mandapatkan input kata kunci berupa nama matakuliah dan persyaratannya. Kata kunci tersebut kemudian dibandingkan dengan tabel hasil perhitungan CF-IDF. Pada bagian pemrosesan, dokumen dibaca untuk kemudian di analisa sesuai dengan persyaratan kompetensi dosen pengampun matakuliah yang diinginkan. Permintaan tampilan dosen pengampu matakuliah disesuaikan dengan pemasukan data matakuliah dan persyaratannya. Apabila yang dimasukan 10 matakuliah dan pesyaratannya, maka hasilnya akan menampilkan 10 matakuliah dengan daftar dosen pengampunya menurut rangking perhitungan. Masing-masing matakuliah maksimum 3 dosen pengampu. Input data apabila banyak dapat dilakukan melalui upload dokumen. Gambar sistem secara umum dapat digambarka seperti pada gambar 3.1 berikut ini Gambar 3.1 Sistem Analisa Kompetensi Dosen Hasil dari penelitian ini adalah perangkat lunak yang dapat membantu pihak administrasi jurusan untuk menentukan dosen mana yang sesuai untuk mengampu satu matakuliah dengan kompetensi yang dimilikinya. Untuk mendapatkan hasil yang maksimal, data dalam dokumen diisi sesuai dengan aturan yang ditentukan. Setiap kata yang digunakan dalam satu bidang ilmu yang mempunyai arti yanga sama diharapkan seluruhnya digunakan dan dimasukan dalam data yang telah ditentukan. PENILAIAN KOMPETENSI DOSEN (Tacbir Hendro P.) 7

4. DAFTAR PUSTAKA [1]. Alavi, M., Leidner, D.E. Review: Knowledge Management and Knowledge Management Systems: Conceptual Foundations and Research Issues. MIS Quarterly. 2001. [2]. Feldman, Ronan The Text Mining Hand Book : Advance Approaches in Analyzing Unstructured Data, Hebrew University of Jerussalem Jamer Sanger, ABS Ventress, Boston, Massachusetts. 2007. [3]. Nugraha, Asep Rahmat S.Kom., Implementasi KMS untuk membantu Auditor dalam proses pengolahan data elektronik menggunakan TF-IDF dan Tabel Keputusan. [Skripsi:2012] [4]. Prilaharja, Kitty S.Kom., Analisa Kompetensi Pegawai menggunakan Metode Fuzzy MADM dengan Algoritma SAW.[Skripsi:2012] [5]. Pudjiantoro, Tacbir Hendro, Faiza Renaldi, Aceng Nursamsudin, Pengembangan Model Sistem Berbasis Pengetahuan pada Lembaga Konsultasi Manajemen Usaha Mikro Kecil Menengah (UMKM). Proceeding Seminar Nasional Teknologi Informasi Komunikasi dan Industri (SNKTIKI 3, 2011). [6]. Zahra, Nisa S.Kom, Pengembangan Model Sistem Berbasis Pengetahuan untuk Pengelolaan Perguruan Tinggi Swasta menggunakan Metode CF-IDF [Skripsi:2012] BIODATA PENULIS H. Tacbir Hendro Pudjiantoro S.Si., M.T. Dosen Biasa Pada Program Studi Informatika / Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jenderal Achmad Yani Cimahi email : tacbir23501027@yahoo.com --------- oo0oo --------- ARISTOTELES VOL. 10 NO. 1, OKTOBER 2012 : HAL. 1 8 8