BAB I PENDAHULUAN 1. LATAR BELAKANG MASALAH llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi yang meliputi piranti keras dan piranti lunak, khususnya penerapan rancangan dan teori. Secara teoritis ilmu komputer diawali dari sejumlah disiplin ilmu yang berbeda, ahli biologi mempelajari neural network, ahli elektro mengembangkan switching sebagai alat untuk mendesain piranti keras, ahli matematika bekerja berdasarkan logika, dan ahli bahasa menyelidiki bahasa untuk natural language [Utdirartatmo, 20011. Dalam teknologi komputer, telah dikenal ada teknologi komputer analog dan teknologi komputer digital. Saat ini teknologi komputer telah mampu memanfaatkan keduanya sehingga menjadi teknologi handal, yang mampu menggantikan sebagian pekerjaan manusia atau bahkan pekerjaan yang tidak mampu dilakukan oleh manusia. Dalam konteks penggolongan generasi komputer, diprediksi akan lahir komputer berbasis masa depan yang memiliki memori tanpa batas, kompatibel dengan teknologi lain, memiliki kemampuan analisis dan teknis yang luar biasa yang memberikan kemudahan dan kenyamanan bagi manusia. Salah satu ciri komputer masa depan adalah memiliki kemampuan berinteraksi secara lisan dengan pemakainya dengan menggunakan ucapan seharihari dalam bahasa alami (natural language), bukan bahasa yang rumit'. Pertanyaannya sekarang, mampukah teknologi komputer masa depan melakukan ha1 tersebut? Jika melihat perkembangan teknologi piranti lunak yang pesat, ha1 tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan mengolah bahasa, dimana sebagian koinponen piranti lunaknya akan bersifat language dependent, yaitu piranti lunak yang melakukan pemrosesan bahasa 2004 I Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus
alami secara lisan. Dalam ilmu komputer dikenal ada dua bahasa, yaitu bahasa alami2 dan bahasa buatan3. Chomsky adalah orang yang pertama kali merepresentasikan bahasa dalam rangkaian simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat direpresentasikan dalam bentuk yang universal. Pemikiran Chomsky yang merepresentasikan bahasa sebagai kumpulan simbol-simbol dan aturan yang mengatur susunan simbol-simbol tersebut telah membuka peluang untuk melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer, sehingga melahirkan bidang ilmu Natural Language Processing (NLP) dalam cabang ilmu bahasa komputasi (computational linguistic) [Arman, 20041. Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tulisan (teks). Beberapa di antara berbagai kategori aplikasi NLP adalah [Arman, 20041: 1. Natural Language Translator, yaitu translator dari bahasa alami ke bahasa alami lainnya. 2. Translator dari bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dilakukan oleh mesin atau komputer. 3. Text Summarization, yaitu sistem yang dapat "membuat ringkasan" hal- ha1 yang penting dari suatu wacana yang diberikan. Text Summarization menarik untuk diteliti lebih lanjut karena sangat berkaitan erat dengan proses analisis teks dalam ilmu computational linguistic. Text Summerization adalah suatu sistern yang akan melakukan ringkasan atau kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang ada. 2 Bahasa alami adalah suatu bentuk representasi dari pesan yang ingin dikomunikasikan antar manusia Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu misalnya bahasa pemodelan atau bahasa pemrograman tertentu.
Menganalisis teks menjadi sebuah persoalan tersendiri bagi setiap orang, karena bisa jadi masing-masing akan memiliki pemahaman sendiri terhadap teks tersebut, sehingga bisa jadi akan muncul ambiguitashalam mengartikan kalimat5. Suatu masalah akan mudah dipahami apabila kita mampu membahasakannya dalam format redaksi penulisan dengan bahasa jelas. Penulisan redaksi tentu akan bersifat subjektif tergantung dari masing-masing orang yang menulis dan menganalisisnya. Titik pandang masalah sangat subjektif bagi setiap individu, orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam konsep yang berbeda pula [Zhang, 20021. Dengan kata lain, konsep dengan bahasa yang sama bisa jadi akan diinterpretasikan dengan arti yang berbeda-beda. Hal ini akan melahirkan beragam konsep, yang kemudian akan direlasikan dengan masalah-masalah yang ada, sehingga melahirkan sebuah pengetahuan. Menurut Suriasumantri [1995], pengetahuan mampu dikembangkan manusia disebabkan dua ha1 yaitu, manusia mempunyai bahasa yang mampu mengkomunikasikan informasi, dan jalan pikiran yang melatarbelakangi informasi tersebut. Pada beberapa penelitian sebelumnya banyak dibahas tentang ekstraksi teks, antara lain bagaimana melakukan pemangkasan teks yang panjang dalam satu paragraf sehingga menjadi lebih sederhana, tanpa menghilangkan informasi yang terkandung di dalamnya. Hasil penelitian ini sangat berarti bagi pengguna dalam memahami sebuah teks. Jika ingin merangkum banyak teks yang ada sehingga menjadi sederhana dan mudah dipahami perlu dilakukan penelitian lanjutan. Metode Knowledge Graph (KG) adalah suatu metode baru dari NLP yang merupakan sebuah tinjauan untuk menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru [Zhang,2002]. Pengembangan metode KG yang akan diteliti lebih lanjut apakah dia mampu menjawab persoalan-persoalan tersebut. Untuk itu, penulis melakukan penelitian untuk menganalisis dan mengembangkan metode KG dalam membaca suatu teks untuk mendapatkan 4 keraguan dalam mengartikan sesuatu, memiliki kemiripan arti Dalam natural language, terdapat beberapa kasus yang memiliki ambiguitas dalam arti sebuah kalimat (Lei Zhang, h.37)
sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus dengan cara menganalisis teks-teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas). Hal ini karena pendidikan sangat erat kaitannya dengan sumber daya manusia (SDM). SDM yang berkualitas menjadi suatu yang harus dimiliki sebagai aset negara jika tidak ingin menjadi tamu di rumah sendiri di era globalisasi ini. 1.2. IDENTIFIKASI MASALAH Metode KG bertujuan agar mampu merepresentasikan seluruh pengetahuan yang dapat diekspresikan ke dalam bahasa alami. Dalam ha1 ini penulis akan mengumpulkan data berupa teks yang berkaitan dengan Sisdiknas. Teks-teks tersebut memiliki konsep-konsep dan link yang merelasikan antar konsep. Proses mendapatkan konsep dan relasi dilakukan dengan cara menganalisis teks sesuai aturan main dari metode tersebut. Dengan cara demikian akan didapat sebuah graf sederhana yang mampu memberikan informasi penting yang menjadi sebuah pengetahuan. 1.3. BATASAN MASALAH Batasan masalah dari penelitian ini adalah menganalisis teks-teks yang dipilih6 yang berkaitan dengan sisdiknas di Indonesia untuk menentukan konsep dan link-nya, menentukan relasi yang sesuai dengan aturan (rule) dari metode KG dalam bentuk graf berarah. Kemudian graf tersebut diolah menjadi combined graph sampai didapatkan graf yang sederhana (simpl?fied graph). 1.4. PERUMUSAN MASALAH Penelitian ini melakukan pemetaan masalah pendidikan yang ada di Indonesia dengan menjelaskan relasi antara konsep dengan simbol dan obyeknya (triangle meaning), serta menguraikan keterkaitan konsep tersebut dengan konsep lainnya. Dengan kata lain, pemetaan tersebut memposisikan sebuah konsep umum (generale concepts) untuk dianalisis menjadi beberapa konsep turunan (sub Teks-teks yang dipilih terlampir
concepts) dalam satu bagian, serta menunjukkan hubungan konsep turunan tersebut dengan konsep turunan yang lain dalam bagian lain sehingga muncul pengertian baru. Perumusan masalah pada penelitian adalah: 1. Dapatkah metode KG digunakan sebagai instrumen untuk menganalisis bagaimana memahami banyak teks sehingga mampu memberikan suatu informasi baru? 2. Bagaimana metode KG mampu menyederhanakan masalah yang ada dalam bentuk graf? 1.5. TUJUAN DAN MANFAAT PENELITIAN Tujuan penelitian ini adalah mengembangkan metode KG sebagai instrumen yang berdayaguna untuk menganalisis teks-teks dengan tema yang sama dalam jumlah yang besar yang kemudian hasilnya menjadi sederhana dalam bentuk graf sehingga dapat dijadikan sebagai pengetahuan baru. Kegunaan penelitian ini adalah dapat mensosialisasikan dan menunjukkan bahwa metode KG mampu memberikan tambahan pengetahuan sebagai informasi penting yang dapat digunakan dalam pengambilan keputusan. 1.6. METODOLOGI PENELITIAN Metodologi penelitian ini meliputi: 1. Identifikasi Konsep (concept ident~jcation). Pada tahapan ini dilakukan pengumpulan data yang berupa teks dengan mengkombinasikan konsep-konsep yang mirip, kemudian konsep-konsep tersebut didefinisikan untuk mencari konsep mana yang lebih penting dan layak untuk dipilih. 2. Integrasi Link (link integration). Tahapan ini digunakan untuk melakukan penambahan atau penggandaan relasi-relasi dari hasil kombinasi dari hubungan antar konsep. 3. Penggabungan graf (Merging of Graphs).
Tahapan ini melakukan pemetaan masalah-masalah dengan acuan aturan yang ada pada metode KG. Apabila ada dua atau lebih kombinasi graf, dapat dijadikan satu graf baru (combined graph). 4. Pembagian graf menjadi subgraph. Tahapan ini melakukan penajaman dari graf yang paling penting untuk mendapatkan graf yang sederhana (simplified graph) agar lebih mudah untuk diinterpretasikan. 1.7. SISTEMATIKA PENULISAN Tulisan sebagai dokumentasi pada penelitian in dibagi ke dalam beberapa bagian dengan susunan sebagai berikut: Bab I, membahas hal-ha1 yang menjadi latar belakang sampai pada tujuan yang diinginkan pada penelitian ini. Bab 11, berisi landasan teori yang menjadi rujukan untuk melakukan penelitian ini. Bab 111, menguraikan metodologi yang dilakukan dalam penelitian ini. Bab IV, berisi tentang pembahasan proses analisis teks, studi kasus analisis teks dengan tema sistem pendidikan nasional. Bab V, berisi tentang penjabaran perancangan sistem dan implementasinya. Bab V1, berisi kesimpulan dari penelitian yang merupakan jawaban dari hasil pembahasan dan saran.