[20/Mar/2006:00:25: ] "GET /ipb-bhmn HTTP/1.1"

dokumen-dokumen yang mirip
Sistem Rekomendasi Penambahan Link pada Website berdasarkan Data Log Website

SISTEM REKOMENDASI PENAMBAHAN LINK PADA WEBSITE BERDASARKAN DATA LOG WEBSITE KURNIAWAN AJI SAPUTRA

PENDAHULUAN. Latar Belakang

PENDAHULUAN TINJAUAN PUSTAKA

REKOMENDASI PENAMBAHAN LINK PADA WEB BERDASARKAN POLA AKSES PENGGUNA NURDIAN SETYAWAN

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN

BAB 4 IMPLEMENTASI DAN EVALUASI

METODE PENELITIAN. Proses Dasar Sistem

BAB II ANALISIS DAN PERANCANGAN SISTEM. dari objek yang dibangun. Komponen tersebut antara lain : sistem

BAB IV HASIL DAN UJI COBA

BAB V IMPLEMENTASI SISTEM

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB II ANALISIS DAN PERANCANGAN. (user) dan fungsinya, diagram alir sistem, perancangan basis data,

BAB III IDENTIFIKASI DAN KLASIFIKASI WEB LOG

BAB IV HASIL DAN UJI COBA

HASIL DAN PEMBAHASAN. kelompok cluster yang sama. Halaman rekomendasi tampak seperti pada Gambar 2.

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB IV HASIL DAN PEMBAHASAN

BAB V PEMBAHASAN DAN IMPLEMENTASI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Rancangan Layar Insert Berita Gambar 4.81 Rancangan Layar Insert Berita

BAB IV IMPLEMENTASI DAN PENGUJIAN

Implementasi Identifikasi Kendala Sistem Identifikasi Pengguna Administrator Pengujian Sistem Member Pengunjung atau umum HASIL DAN PEMBAHASAN

1.1 Latar Belakang Masalah

BAB V IMPLEMENTASI DAN PENGUJIAN. Tahap implementasi akan dipersiapkan bagaimana RANCANG BANGUN PERANGKAT LUNAK BANTU PENDAFTARAN

BAB 3 METODOLOGI PENELITIAN. Desain penelitian untuk Sistem Optimalisasi Produksi ini menggunakan

APLIKASI WEB DATA SPASIAL KEPENDUDUKAN INDONESIA DENGAN SCALABLE VECTOR GRAPHICS (SVG)

E-trik Ajax. Database MySQL. Dedi Alnas

BAB II ANALISIS DAN PERANCANGAN

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL RANCANGAN Hardware 1. Processor : Intel Dual Core CPU 2.0GHz 2. Memory (RAM) : 1 GB 3. Hardisk : 80 GB

BAB IV IMPLEMENTASI DAN PENGUJIAN. siap untuk dioperasikan. Dalam implementasi pembuatan website Anbiyapedia ini

BAB IV HASIL DAN UJI COBA

BAB 4 IMPLEMENTASI DAN EVALUASI. Penerapan aspek Teknologi Informasi dalam bentuk sebuah website merupakan

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN EVALUASI. a. Spesifikasi piranti keras pada local server: Processor : Intel Pentium IV 1.8 Ghz

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB II ANALISIS DAN PERANCANGAN

BAB 5 IMPLEMENTASI DAN EVALUASI. Dalam menjalankan aplikasi target letter ini dibutuhkan perangkat keras yang

BAB V PEMBAHASAN DAN IMPLEMENTASI

BAB V IMPLEMENTASI DAN PENGUJIAN

Sistem Informasi Penjualan Handphone Pada Toko Ok Cell Pangandaran Berbasis Website

BAB IV IMPLEMENTASI DAN EVALUASI

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN EVALUASI. Berikut ini merupakan spesifikasi perangkat keras dan perangkat lunak yang

BAB IV IMPLEMENTASI DAN PENGUJIAN

I.1 Latar Belakang Masalah

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

PHP & MYSQL. Ingat, PC anda tidak memerlukan tambahan khusus atau apapun untuk melihat hasil eksekusi kode PHP anda. Mengapa?

BAB III ANALISA MASALAH DAN SISTEM

BAB II ANALISA DAN PERANCANGAN. basis data, struktur tabel, serta desain input dan output program.

Gambar Rancangan Layar Halaman Kuis Guru (Langkah Dua)

BAB V IMPLEMENTASI DAN PENGUJIAN. lingkungan perangkat lunak, implementasi database beserta struktur program dan

1 BAB III METODE PENELITIAN

BAB 4 IMPLEMENTASI DAN EVALUASI Perangkat keras yang di butuhkan. optimal pada server dan client sebagai berikut.

1.1 Latar Belakang. 1 Universitas Kristen Maranatha

BAB IV IMPLEMENTASI DAN PENGUJIAN. lingkungan implementasi, pengkodean, dan interface dari aplikasi sistem tersebut.

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB IV HASIL DAN PEMBAHASAN

BAB III METODE PENELITIAN. Berikut adalah tahapan penelitian yang dilakukan : Menentukan kebutuhan data yang digunakan, seperti data makanan, data

BAB II ANALISIS DAN PERANCANGAN

c. Rancangan Menu News

BAB I PENDAHULUAN. lingkungan. Untuk mendukung kegiatan perlindungan dan. pencegahan terhadap pengrusakan serta usaha pelestarian yang

BAB I PENDAHULUAN. 1.1 Pengantar

Step by Step PHP Membuat Laporan PDF dengan FPDF Tutorial ini dibuat oleh Achmad Solichin,

database server. PHP bersifat terbuka dalam pengembangan, dan gratis. Meskipun demikian PHP memiliki dukungan fungsi yang variatif (Achour, 2000).

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN UJI COBA

BAB IV HASIL DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA. Sistem adalah jaringan kerja dari prosedur-prosedur yang saling berhubungan,

BAB 4 IMPLEMENTASI DAN EVALUASI. telah di identifikasi pada bab 3, saatnya untuk melakukan implementasi dan Kebutuhan Sumberdaya Aplikasi

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB III METODE PENELITIAN. peneltian, dibutuhkan desain penelitian. Berikut adalah tahapan penelitian yang dilakukan:

BAB II ANALISIS DAN PERANCANGAN. pembuatan sebuah web. Langkah ini sebagai gambaran apa saja yang

BAB IV IMPLEMENTASI DAN PENGUJIAN APLIKASI. Sistem pengolahan data merupakan satu kesatuan kegiatan pengolahan

4. BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI SISTEM. analisis dan perancangan dijadikan acuan dalam pembuatan kode program. Pada

BAB IV HASIL DAN PEMBAHASAN

1 BAB III METODOLOGI PENELITIAN. collaborative filtering ini digambarkan pada gambar 3.1

Teknologi Aplikasi Web Server. Pemrograman Web Dinamis ; RPL XI-1 Guru Mapel : Hendri Winarto, S.T.

BAB IV IMPLEMENTASI DAN PENGUJIAN

KBKF53110 WEB PROGRAMMING

BAB III METODOLOGI PENELITIAN

BAB V IMPLEMENTASI SISTEM

BAB I PENDAHULUAN. menjadi informasi dan didistribusikan untuk pemakai. apapun seiring dengan perkembangan teknologi. Semakin tingginya wawasan

BAB 3 PERANCANGAN SISTEM

BAB IV IMPLEMENTASI DAN PENGUJIAN. Tahap implementasi dan pengujian sistem dilakukan setelah tahap analisis dan

BAB IV IMPLEMENTASI SISTEM DAN PENGUJIAN

BAB 2 TINJAUAN PUSTAKA. : Multi sistem operasi, bisa Windows, Linux, Mac OS, maupun Solaris

BAB IV IMPLEMENTASI. dan perancangan selesai dilakukan. Pada sub bab ini akan dijelaskan implementasi

BAB IV IMPLEMENTASI DAN EVALUASI. keras dan perangkat lunak untuk sistem ini adalah sebagai berikut :

(User Manual) Sistem Informasi Manajemen Kependudukan dan Aset Desa Desaku. Buku Petunjuk Penggunaan Aplikasi

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB IV HASIL DAN UJI COBA

BAB V IMPLEMENTASI SISTEM

BAB 2 LANDASAN TEORI

BAB IV HASIL DAN UJI COBA

BAB II ANALISIS DAN PERANCANGAN. Komponen-komponen yang diperlukan untuk menganalisis kebutuhan dari objek

PENGEMBANGAN PROGRAM PENYARINGAN DATA WEBLOG UNTUK ANALISIS POLA AKSES PENGUNJUNG WEBSERVER TESIS BENNY NIXON

Transkripsi:

Proses visualisasi akan menggunakan gambar dengan format SVG (Scalable Vector Graphic) yang berbasis XML sehingga visualiasasi ini akan bersifat dinamis mengikuti data log website yang dimasukkan ke dalam sistem. Agar visualisasi ini mudah dipahami oleh pengunjung maka akan dibedakan struktur awal website dan halaman yang ditambahkan oleh sistem. Lingkungan Pengembangan Sistem Spesifikasi perangkat keras yang digunakan dalam pengembangan sistem dapat berpengaruh pada kinerja algoritme yang digunakan. Perangkat lunak pada komputer yang akan berpengaruh pada cara kerja sistem secara keseluruhan. Maka sistem akan berkerja dengan baik apabila digunakan pada perangkat lunak yang sama saat sistem ini dikembangkan. Perangkat keras dan perangkat lunak yang digunakan pada penelitian ini adalah : 1. Perangkat Keras Processor : Intel Pentium Dual CPU T2390 1,86GHz Memory : 1GB Harddisk : 120 GB Keyboard dan Mouse 2. Perangkat Lunak Sistem Operasi Microsoft Windows Vista Ultimate Apache 5.0.51a sebagai web server Notepad++ sebagai editor halaman web dan pemrogramannya MySQL 5.0.51a sebagai database management server PHPMyAdmin 2.11.4 sebagai tool database MySQL Adobe Photoshop CS2 untuk membuat desain grafis Opera version 9.64 sebagai browser. Batasan Sistem Batasan-batasan sistem dibutuhkan agar sistem dapat bekerja sesuai dengan tujuan pengembangannya. Batasan-batasan ini yang nantinya akan digunakan untuk pengembangan sistem menjadi lebih kompleks. Batasanbatasan sistem rekomendasi penambahan link pada website berdasarkan data log website yang sedang dikembangkan saat ini antara lain : 1. Data log yang digunakan sebagai input masih data log dari apache-server. Belum mendukung data log lainnya. 2. Format data log harus sesuai dengan CLF (Common Log Format) yaitu : 172.17.1.146- - [20/Mar/2006:00:25:12 +0700] "GET /ipb-bhmn HTTP/1.1" 301 324 3. Data log harus berupa file teks. Belum mendukung file hasil kompresi seperti.gz atau.zip. 4. Sistem tidak dapat digunakan secara bersamaan oleh 2 pengguna atau lebih. HASIL DAN PEMBAHASAN Penambahan Tabel Database Pada penelitian yang menggunakan data log asli dari website ini membutuhkan penambahan tabel pada database. Namun ada beberapa tabel database yang digunakan pada penelitian sebelumnya oleh Nurdian Setyawan (2008) masih tetap akan digunakan pada penelitian kali ini. Database yang masih tetap akan digunakan antara lain : tb_exp_locations, tb_hsl_firstonly dan, tb_hsl_optbenefit. Penambahan tabel yang dilakukan dapat dilihat pada Tabel 1. Tabel 1 Tabel database tambahan Nama Tabel Keterangan data_cleaning Tabel untuk menyimpan data log hasil tahap data cleaning. session_identifcation Tabel untuk menyimpan hasil tahap session identification yaitu sesi kunjungan dari masing-masing pengunjung. path_completion Tabel untuk menyimpan hasil dari proses path completion. transaction_identification Tabel untuk menyimpan hasil transaction identification. 8

Tabel 1 Tabel database tambahan lanjutan Nama Tabel Keterangan path_url Tabel untuk menyimpan jenisjenis halaman yang diminta oleh pengunjung dan jumlah total kunjungan terhadap halaman tersebut struktur_web Tabel untuk menyimpan struktur awal website yang akan digunakan untuk visualisasi. Atribut-atribut tabel tersebut dapat dilihat pada Lampiran 1. Sehingga total dari tabel database yang digunakan dalam pengembangan sistem ini adalah 9 (sembilan) buah tabel. Namun dari kesembilan tabel tersebut saling berdiri sendiri atau tidak mempunyai relationship antar tabel. Pengambilan Data Log asli Website 1. Proses input data Pada penelitian ini data log yang digunakan adalah data log website www.eramuslim.com. Data log ini merupakan data log hasil penyimpanan pada apache-server bulan januari 2009. Jumlah record yang ada pada data log ini adalah 112.219 baris. Jumlah data yang akan digunakan sebagai record di dalam ini dibatasi hanya 10.000 baris. Hal ini dikarenakan keterbatasan perangkat keras dalam pengembangan sehingga untuk data yang lebih besar dari itu akan membutuhkan waktu untuk data processing yang sangat lama. Selanjutnya dilakukan partisi sesuai kebutuhan yaitu 10.000 baris per file yang akan digunakan sebagai data input. Dengan demikian, rata-rata besarnya ukuran file input data tersebut adalah 1MB. Untuk penelitian ini hanya akan diambil 5 file pertama hasil partisi. Contoh dari baris yang ada di dalam data log dapat dilihat pada Lampiran 2. Sistem untuk pertama kali akan meminta user untuk memasukkan file atau data tersebut untuk di-upload ke dalam sistem. Setelah proses input data berhasil kemudian akan dilakukan parsing terhadap data tersebut. Pada proses parsing ini hanya beberapa informasi saja yang akan diambil yaitu alamat IP, path atau halaman dan waktu. Kode yang digunakan untuk parsing yaitu sebagai berikut : //menghapus tabel data_cleaning drop_table(data_cleaning); //membuat tabel data cleaning create_table(data_cleaning); //lokasi file datalog $log_file = 'datalog/datalog.log'; //pattern untuk format data log apache server $pattern = '/^([^ ]+) ([^ ]+) ([^ ]+) (\[[^\]]+\]) "(.*) (.*) (.*)" ([0-9\- ]+) ([0-9\-]+)$/'; $patterngambar = array( 1 => "/jpg$/",2 => "/gif$/",3 => "/jpeg$/",4 => "/JPG$/",5 => "/GIF\$$/",6 => "/JPEG$/",7 => "/ico$/",8 => "/png$/",9 => "/js$/",10 => "/\.css$/"); $fh = fopen($log_file,'r') or die ($php_errormsg); $i = 1; $requests = array(); $ip = array(); while (! feof($fh)) { // read each line and trim off leading/trailing whitespace if ($s = trim(fgets($fh,1024))) { if (preg_match($pattern,$s,$matches)) { list($whole_match,$remote_host,$logname, $user,$time,$method,$request,$protocol,$ status,$bytes,$referer,$user_agent) = $matches; $jumlahraw++; $time = converttime($time); for($j=1;$j<=14;$j++){ if(preg_match($patterngambar[$j],$request,$a)){ $status = 'del'; if($status!= 'del'){ $query = "INSERT INTO data_cleaning VALUES ('$remote_host','$time','$request') "; $hasil = mysql_query($query) or die (mysql_error()); $msg = "<a4 id='main'>berhasil PARSING DATA</a4><br /><br /><br /> <p id='main'><a href='index.php?page=dat&sub=view'>l ihat Data Log</a> <a href='index.php?page=pra&sub=cle'>pr aprocessing</a></p>"; if($jumlahraw == 20000 ){ echo $msg; return (1); else{ $request =''; 9

else { error_log("can't parse line $i: $s"); echo "<a3 id='main'>format DATA LOG TIDAK SESUAI</a3><br /><br />"; echo " <p id='main'><a href='index.php?page=dat&sub=inpu t'><< Input Data Baru</a></p>"; return (1); $i++; fclose($fh) or die($php_errormsg); 2. Penentuan Halaman Target Dalam penelitian ini untuk menentukan halaman menggunakan asumsi bahwa halaman target itu adalah leaf dari struktur website tersebut dan hanya diambil 15 halaman target yang paling banyak dikunjungi oleh pengunjung. Untuk itu harus dilakukan penghitungan terhadap kunjungan website untuk masing-masing halaman website. Kode php yang digunakan untuk penghitungan ini adalah $query = "SELECT request from data_cleaning"; $result = mysql_query($query) or die (mysql_error()); while($row=mysql_fetch_array($result)){ extract($row); $path[$request] +=1; arsort($path); foreach ($path as $pathurl => $hits){ if($i<50){ mysql_query("update path_url SET hits = '$hits' where request = '$pathurl'"); $i++; Dari tahap ini dihasilkan 15 halaman yang akan digunakan sebagai halaman target. Halaman target yang dihasilkan untuk file partisi 1 (satu) dapat dilihat pada Lampiran 3. Dari hasil penentuan halaman target tersebut dapat dilihat dari 10.000 baris halaman yang paling banyak diminta oleh pengguna adalah /berita/palestina/hamas-hancurkan-tujuh-tankzionis.htm dengan nilai kunjungan sebanyak 313 kali. Halaman yang paling banyak dikunjungi kedua adalah /berita/palestina/israel-gencatan-senjatasepihak-gagal-tumbangkan-hamas.htm dengan kunjungan sebanyak 253 kali. Begitu juga untuk 15 halaman target yang lainnya. Data Preprocessing 1. Data Cleaning Untuk tahap data cleaning ini sudah dilakukan secara sekaligus saat proses parsing data. Sehingga sampai tahap ini data sudah dianggap bersih dari path yang diminta pengunjung yang formatnya bukan format halaman. Contoh data hasil data cleaning yang disimpan di dalam tabel database dapat dilihat pada Lampiran 4. 2. User Identification Alamat IP dari data log yang diproses sudah mengalami proses pengkodean / enkripsi, sehingga alamat IP yang ditunjukkan bukan alamat IP yang sebenarnya dari pengunjung. Hal ini untuk menjaga kerahasiaan dari pengunjung website itu sendiri. Untuk melakukan simulasi percobaan pada sistem ini digunakan 5 bagian dari data log. Untuk bagian 1 terdapat 5.748 pengunjung yang berbeda. Sedangkan untuk bagian 2 terdapat 5.719 pengunjung. 5.722 pengunjung untuk bagian 3, 5.599 pengunjung untuk bagian 4 dan untuk bagian 5 terdapat 5.835 pengunjung yang mempunyai alamat IP berbeda. Contoh alamat IP yang sudah dikodekan dan disimpan di dalam database dapat dilihat seperti pada Lampiran 5. 3. Session Identification Tahap session identification dilakukan dengan cara menghitung. Contoh session dan pengguna yang disimpan di dalam database dapat dilihat pada Lampiran 6. Satu pengunjung dapat memiliki lebih dari satu session, Namun satu session hanya dimiliki oleh satu pengunjung. Seperti dapat dilihat pengguna dengan alamat IP 1022457008 mempunyai 2 session yaitu 1232266477 dan 1232266267. Sedangkan untuk session 1231140272 hanya dimiliki oleh pengguna dengan alamat IP 1023754728. Tidak ada selain pengguna tersebut yang mempunyai session 1231140272 walaupun pengguna tersebut mempunyai banyak session. 4. Path Completion Urutan halaman yang diminta oleh pengunjung setiap session-nya berbeda-beda. Dari tabel data_cleaning kemudian dikelompokkan berdasarkan session dan urutanurutan yang dihasilkan dipisahkan dengan menggunakan tanda koma (,) dan selanjutnya akan disimpan dalam tabel path_completion. 10

Kode php untuk mengelompokkan ini adalah sebagai berikut : //menghapus tabel session_identification drop_table(path_completion); //membuat tabel session_identification create_table(path_completion); $query = "SELECT * from session_identification order by session"; $result = mysql_query($query) or die (mysql_query(error)); while($row= mysql_fetch_array($result)){ extract($row); if(empty($sessionnow)){ $sessionnow = $session; $pathnow = $request; else{ if($sessionnow == $session){ $pathnow = "$pathnow,$request"; else{ mysql_query("insert INTO path_completion VALUES ('$user','$sessionnow','$pathnow')"); $sessionnow = $session; $pathnow = $request; Hasil dari path completion dapat dilihat pada Lampiran 7. Dari hasil tersebut dapat dilihat bahwa pengguna dengan alamat IP 2085692385 dengan session 1231140062 hanya membuka 1 (satu) saja pada website ini yaitu halaman /berita/dakwahmancanegara/amira-mayorga-yesus-bahkantidak-menyuruh-umatnya-untuk-menyembahdirinya.htm. Sementara untuk pengguna dengan alamat IP 2107713143 dan session 1231140066 membuka lebih dari satu halaman. Halaman yang dibuka yaitu /berita/dunia/mahasiswa-indonesia-di-mesirgelar-aksi-solidaritas.htm kemudian pengguna melanjutkan kunjungannya dengan membuka /manhaj-dakwah/hujatan-terhadap-dakwah-albanna.htm dan berita/palestina/hamashancurkan-tujuh-tank-zionis.htm. 5. Transaction Identification Data dari hasil path completion akan diproses pada tahap selanjutnya yaitu tahap transaction identification. Dari urutan-urutan tingkah laku pengunjung pada path completion akan dilihat halaman target pada urutan tersebut. Jika pengunjung sudah menemukan halaman target maka kemudian proses akan mulai dari awal namun proses pembacaan data hasil path completion tetap akan diteruskan. Hasil dari tahap transaction identification ini selanjutnya akan disimpan ke dalam tabel transaction_identification yang nantinya akan menjadi data input untuk tahap processing menggunakan algoritme optimasi. Contoh data yang disimpan di dalam database dapat dilihat pada Lampiran 8. Dari tabel ini dapat dilihat setiap transaksi yang terjadi begitu pendek. Pengunjung tidak perlu bersusah payah untuk menemukan halaman target yang dicarinya. Bahkan sering kali pengunjung dapat langsung menemukan halaman target tersebut. Hal ini dapat sebagai indikator awal bahwa struktur dari website ini sudah cukup baik yaitu dengan menempatkan hyperlink ke halaman target pada halaman utama atau halaman pertama pengunjung mengunjungi website tersebut. Pengguna dengan alamat IP 1009985486 membuka halaman /berita/palestina/hari-ke- 21-22-pertemuan-doha-dunia-arab-bekukanhubungan-dengan-israel.htm. Halaman tersebut oleh sistem diidentifikasi sebagai halaman target. Maka pengguna ini sudah langsung dapat menemukan halaman target dengan mudah dan dengan satu kunjungan saja. Kemudian pengguna langsung meninggalkan website. Berbeda dengan pengguna dengan alamat IP 1039598537. Pengguna ini membuka 5 (lima) halaman pada kunjungannya. Halaman pertama yang diminta adalah /berita/dunia/yusuf-qardawi-teruslah-turun-kejalan.htm. halaman berikutnya adalah //nasihat-ulama/israel-harus-dihapus-duniaislam-perlu-direformasi.htm, /konsultasi/konspirasi/kontroversi-natal-25- desember-2.htm, /berita/dunia/yahudimenentang-yahudi.htm dan /berita/dunia/yordania-akan-bekukan-hubungandiplomatik-dengan-israel.htm karena akhir dari ketiganya tersebut adalah halaman target maka pengguna ini dapat dikatakan telah melakukan 3 (tiga) kali transaksi. Data Processing 1. Pencarian Lokasi Harapan Langkah pertama dari tahapan data processing adalah pencarian lokasi harapan. Lokasi harapan sebagai indikator awal ada atau tidaknya pengunjung yang tersesat di dalam website untuk pencarian halaman targetnya. 11

Semakin banyak lokasi harapan yang dihasilkan maka semakin banyak pula pengunjung yang tersesat. Hal ini berarti struktur dari website tersebut masih kurang baik. Sebaliknya jika lokasi harapan yang dihasilkan sedikit atau tidak ada sama sekali maka artinya semakin sedikit pula pengunjung yang tersesat yang berarti ada indikasi bahwa struktur website tersebut sudah baik. Pada penelitian ini ditemukan beberapa halaman lokasi harapan. Contoh lokasi harapan dapat dilihat pada Lampiran 9. Pada baris pertama dapat dilihat bahwa halaman target adalah /berita/dunia/iran-bantu-gaza-bentukpasukan-islam-dan-hentikan-ekspor-minyak-keas.htm dan kolom E1 yaitu /konsultasi/sehat/alergi-kulit.htm. Sedangkan pada kolom aktual adalah /konsultasi/sehat/dima-klinik-bekam-yangbaik.htm. Hal ini berarti ada pengguna yang mengharapkan halaman target /berita/dunia/iran-bantu-gaza-bentuk-pasukanislam-dan-hentikan-ekspor-minyak-ke-as.htm pada lokasi harapan /konsultasi/sehat/alergikulit.htm sedangkan hyperlink halaman target tersebut berada pada lokasi aktual /konsultasi/sehat/dima-klinik-bekam-yangbaik.htm. Begitu juga seterusnya untuk barisbaris yang lain dalam tabel tb_exp_locations. 2. Penentuan Halaman Rekomendasi Penelitian ini tidak menemukan halaman rekomendasi walaupun ditemukan lokasi harapan. Hal ini dikarenakan perbedaan karakteristik data yang digunakan pada penelitian ini dengan data dummy pada penelitiaan sebelumnya. Karakteristik data yang digunakan pada saat ini masih susah membedakan halaman indeks dan halaman target. Sehingga untuk menentukan halaman target harus menggunakan asumsi bahwa halaman tersebut berada pada leaf struktur website dan mempunyai jumlah kunjungan halaman paling banyak. Jika dilihat dari website aslinya ternyata memang pada halaman awal sudah terdapat hyperlink menuju ke halaman target, sehingga pengunjung tidak perlu bersusah payah mencari halaman targetnya. Apabila sistem tidak menghasilkan halaman rekomendasi hal ini dapat berarti struktur website tersebut sudah baik atau bisa juga disebabkan oleh perbedaan karakteristik data pada algoritme Find expectation Location dan algoritme optimasi. Faktor lain yang dapat mempengaruhi halaman rekomendasi adalah panjang pendeknya path completion. Jika terlalu pendek kemungkinan sistem tidak akan menghasilkan halaman rekomendasi. Kemudian faktor yang berikutnya adalah kemungkinan sudah ada hyperlink ke halaman target pada halaman utama. Visualisasi Sistem ini merupakan sebuah sistem yang berbasis web, sehingga tampilan atau visualisasi dari sistem ini juga berupa website yang di dalamnya menunjukkan proses-proses yang akan dilakukan terhadap data yang dimasukkan. Pertama kali pengguna sistem ini akan memasukkan data log website berupa file teks. Tahap selanjutnya adalah tahap data preprocessing. Di dalam tahapan ini terdapat banyak sub tahap data preprocessing. Pada tahapan visualisasi struktur website digunakan gambar dengan format SVG (Scalable Vector Graphic) sebagai salah satu format gambar yang bersifat dinamis. Visualisasi struktur website hanya dapat memperlihatkan struktur awal dari website tanpa adanya penambahan hasil rekomendasi. Hal ini dikarenakan data pada penelitian ini tidak menghasilkan halaman rekomendasi. Visualisasi ini menggunakan simbol lingkaran (circle) untuk mewakili path atau halaman. Untuk hubungan keterkaitan atau hyperlink antarhalaman disimbolkan dengan menggunakan lurus berwarna biru. Nama-nama halaman website disimbolkan dengan angka. Angka yang digunakan tergantung dari banyaknya halaman yang divisualisasikan. Sedangkan untuk hyperlink hasil rekomendasi akan digambarkan dengan garis putus-putus dengan warna merah. Karena penelitian ini tidak menghasilkan halaman rekomendasi maka visualisasi hasil penelitian data log hanya menampilkan struktur awal website tanpa halaman rekomendasi seperti dapat dilihat pada Lampiran 10. Untuk menguji visualisasi struktur website awal dan struktur website yang sudah ditambahkan hyperlink rekomendasi maka kemudian digunakan data dari hasil penelitian sebelumnya oleh Nurdian Setyawan (2008) yang menggunakan data dummy. Hasil dari kedua algoritme optimasi (FirstOnly, OptimizeTime) akan diambil untuk menguji visualisasi. Pada hasil algoritme FirstOnly nilai maksimal dari threshold adalah 44 dengan nilai maksimal dari minsup adalah 10%. Sedangkan untuk algoritme OptimizeBenefit nilai maksimal threshold adalah 52 dengan nilai maksimal minsup juga 10%. Parameter yang digunakan adalah threshold 37 dan minsup 7%. 12

Visualisasi hasil algoritme FirstOnly dapat dilihat seperti pada Lampiran 11. Nilai threshold 37 dan minsup 7% menghasilkan 5 halaman rekomendasi. Sedangkan pada algoritme OptimizeBenefit menghasilkan 20 halaman rekomendasi. Visualisasi hasil algoritme Optimizebenefit dapat dilihat pada Lampiran 12. Hasil kedua algoritme ini menunjukkan halaman rekomendasi yang berbeda-beda sehingga menghasilkan struktur website yang berbeda juga. Perbedaan pada algoritme ini diantaranya adalah pada algorirme FirstOnly lokasi harapan yang dilibatkan hanya 1 (satu) lokasi harapan yaitu E1. Sedangkan pada algoritme OptimizeBenefit melibatkan 4 (empat) lokasi harapan yaitu E1, E2, E3, dan E4. Sehingga waktu yang dibutuhkan oleh kedua algoritme sangat berbeda. Kesimpulan KESIMPULAN DAN SARAN Penelitian ini telah berhasil melakukan tahapan data preprocessing dengan menggunakan data log asli dari website yang disimpan dalam bentuk database mysql, sehingga data yang nantinya akan diproses menggunakan algoritme optimasi (FirstOnly, OptimizeBenefit) harus melalui tahapan data preprocessing terlebih dahulu. Penelitian ini juga sudah dapat menampilkan struktur dari website, baik struktur awal website maupun struktur yang sudah ditambahkan dengan halaman rekomendasi pada website tersebut. Visualisasi menggunakan SVG (Scalable Vector Graphic ) membuat visualisasi lebih dapat dimengerti oleh pengguna sistem dan lebih dinamis. Dengan demikian, jika dilakukan percobaan terhadap data log dari website lain, visualisasi ini tetap dapat digunakan. Saran Pada penelitian ini hanya digunakan data log dari satu website. Untuk itu perlu dicoba menggunakan data dari beberapa website yang lain (dinamis maupun statis) yang sudah dapat dibedakan halaman target dan halaman indeks dari website tersebut. DAFTAR PUSTAKA Castellano G, Fanelli A M, Torsello M A. 2007. Log Data Preparation For Mining Web Usage Patterns. maya.cs.depaul.edu/~classes/ect584/papers/ cms-kais.pdf [27 Maret 2009]. Catledge L, Pitkow JE. 1995. Characterizing Browsing Strategies in the World-Wide Web. http://smartech.library.gatech.edu/dspace/bit stream/1853/3558/1/95-13.pdf [8 April 2008] Cooley R, Mobasher B, Srivastava J. 1999. Data Preparation for Mining World Wide Web Browsing Pattern. http://citeseerx.ist.psu.edu/viewdoc/downloa d;jsessionid=ecf66fec62532cf4833fie2 AC36C5C93?doi=10.1.1.33.2792&rep=rep1 &type=pdf[8 April 2008] Ivancy R, Vajk I. 2006. Frequent Pattern Mining in Web Log Data. Acta Polytechnica Hungarica, Vol. 3, No. 1. Setyawan N. 2008. Rekomendasi Penambahan Link Pada Web Berdasarkan Pola Akses Pengguna [Skripsi]. Bogor. Program Studi Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam. Srikant R, Yang Y. 2001. Mining Web Log to Improve Website Organization. http://www.almaden.ibm.com/quest/papers/ www10_weblog.pdf [22 September 2007]. Veer EV et al. 2004. Creating Web Pages All- In-One Desk Reference for Dummies Edisi Ke-2. Indianapolis; Wiley Publishing, Inc. 13