BAB I PENDAHULUAN. Teknologi Informasi saat ini mengalami perkembangan yang signifikan.

dokumen-dokumen yang mirip
BAB III METODE PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

Perbandingan Algoritma Breadth First Search dan Depth First Search Sebagai Focused Crawler

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Penerapan Graf dalam Algoritma PageRank Mesin Pencari Google

OPTIMASI SITUS WEB UNTUK MENINGKATKAN URUTAN DI SERP MENGGUNAKAN METODE SEO

BAB I PENDAHULUAN. Perkembangan teknologi web dan internet yang ada saat ini. memungkinkan seseorang membuat website yang diinginkan menjadi lebih

EXPERT SYSTEM SEARCH ENGINE OPTIMIZATION (SEO) DALAM MENGOPTIMALKAN WEBSITE

IMPLEMENTASI SEARCH ENGINE OPTIMIZATION (SEO) UNTUK MENINGKATKAN PERINGKAT DI SERP PADA GOOGLE HUMMINGBIRD

1 BAB III METODOLOGI PENELITIAN. collaborative filtering ini digambarkan pada gambar 3.1

Ahmad Royani, S.Kom. Ahmad Royani, S.Kom SMK NEGERI 3 DEPOK JUDUL MATERI EVALUASI PENUGASAN KELUAR

Search Engine. Adri Priadana ilkomadri.com

Search Engine Optimization

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

HASIL DAN PEMBAHASAN. untuk langkah berikutnya hingga tercapai hasil maksimal.

David Odang dan

1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN. dibutuhkan desain penelitian. Berikut adalah tahapan-tahapan dalam desain

Pengelolaan Web. Ali Tarmuji, S.T., M.Cs. Urusan Web & Reportase Web. Biro Sistem Informasi dan Komunikasi

BAB 3 METODE PENELITIAN. dalam melakukan penelitian untuk memudahkan penyusun dalam

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

1.1 Latar Belakang Masalah

BAB 3 METODOLOGI PENELITIAN. Desain penelitian untuk Sistem Optimalisasi Produksi ini menggunakan

BAB 3 METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. Metode yang diterapkan dalam pembuatan skripsi ini, antara lain: dengan topik baik berupa textbook atau paper.

BAB 1 PENDAHULUAN. Internet, dalam (28 April 2006)

BAB I Pendahuluan. 1 Launching Business on the Web, David Cook and Deborah Sellers, QUE, 1995, hal 12.

Berikut langkah-langkah penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

Gambar 3.1 Desain penelitian

BAB III METODOLOGI PENELITIAN. melakukan penelitian yang bertujuan untuk memudahkan peneliti dalam

E-MARKETING. On Page SEO

UKDW BAB 1 PENDAHULUAN

BAB II TINJAUAN PUSTAKA

Wahyu Dwi Suryanto DKSI IPB Gd. Andi Hakim Nasoetion lt. 2 Darmaga IPB ALL ABOUT SEARCH ENGINE OPTIMIZATION (SEO)

1 BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB V IMPLEMENTASI SISTEM

BAB IV IMPLEMENTASI DAN EVALUASI. Tahap implementasi sistem adalah tahap penerapan dari hasil analisis dan

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 3. METODE PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

Faktor-Faktor Penentu Keberhasilan SEO

BAB 1. PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN. desain atau tahapan penelitian, model pengembangan sistem serta alat dan bahan

BAB 4 IMPLEMENTASI DAN EVALUASI. aplikasi. Proses implementasi basis data dilakukan dengan menggunakan DDL dari

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

SEARCH ENGINE OPTIMIZATION

BAB IV HASIL DAN UJI COBA

BAB IV HASIL DAN UJI COBA

1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Sebagaimana diketahui, Sistem Informasi Geografis merupakan Sistem. yang dapat menjelaskan situasi dan keadaan tempat tersebut.

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN UKDW

internet. Alhasil, informasi tersebut menjadi tak berguna karena tak berhasil

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Setiap manusia selalu menginginkan kemudahan, kecepatan dan sistem

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN 1.1 Latar belakang

BAB I PENDAHULUAN. dengan perusahaan-perusahaan lainnya. Untuk itu diperlukan adanya metode

Internet Marketing. Generate Traffic

BAB 1 PENDAHULUAN. menjual berbagai jenis pakaian. Seiring dengan perkembangan fashion pakaian ini

BAB IV HASIL DAN UJI COBA

BAB IV IMPLEMENTASI DAN PENGUJIAN. Tahap implementasi sistem ini merupakan tahap penerapan sistem supaya siap

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. menjadi informasi dan didistribusikan untuk pemakai. apapun seiring dengan perkembangan teknologi. Semakin tingginya wawasan

BAB II LANDASAN TEORI

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN. pesat terutama perkembangan internet. Dengan adanya internet dapat

BAB III METODOLOGI PENELITIAN

dapat diakses melalui salah satu menu yang berkaitan dengan komponen pada halaman administrator.

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Semakin cepat waktu yang ditempuh maka semakin pendek pula jalur yang

UKDW BAB 1 PENDAHULUAN

BAB V IMPLEMENTASI SISTEM

ANALISIS DAN PERANCANGAN STRATEGI OPTIMALISASI MESIN PENCARI GOOGLE PADA THEROCKLINE.COM NASKAH PUBLIKASI. diajukan oleh Arief Dwi Laksono

1.1 Latar Belakang Masalah

BAB IV HASIL DAN UJI COBA

BAB IV IMPLEMENTASI DAN EVALUASI SISTEM

Bab 3 Metode dan Perancangan Sistem

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV HASIL DAN UJI COBA

BAB V IMPLEMENTASI SISTEM

1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Perkembangan teknologi sekarang ini telah menciptakan aplikasi-aplikasi

BAB IV IMPLEMENTASI DAN PENGUJIAN

PEMBUATAN WEBSITE INFORMASI MUSEUM DI JAKARTA DENGAN MENGGUNAKAN MACROMEDIA DREAMWEAVER 8, PHP DAN MYSQL

BAB 3 METODOLOGI PENELITIAN. Pada penelitian ini menggunakan beberapa perangkat keras dan perangkat

Bab 4 Implementasi dan Evaluasi

1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN

BAB V IMPLEMENTASI SISTEM

1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN

PERAN SEO DALAM BERBISNIS ONLINE

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teknologi Informasi saat ini mengalami perkembangan yang signifikan. Beragam aspek kehidupan sangat terbantu dengan perkembangan teknologi informasi ini. Hal ini dirasakan oleh berbagai pihak yang mulai merasa bahwa teknologi informasi adalah hal yang sulit dipisahkan dari pekerjaan sehari-hari. Semakin menjamurnya teknologi internet ternyata justru memberikan berbagai dampak positif maupun negatif pada penggunanya. Hal ini disebabkan informasi mudah didapat dan juga mudah pula disebar. Internet yang menjadi salah satu idola baru dalam pencarian dan penyebaran informasi inipun memang sangat menjanjikan, karena teknologi ini secara statistik perkembangannya sangat mengagumkan. Pada akhir tahun 2011, Uni Telekomunikasi Internasional mengumumkan bahwa pengguna internet di dunia secara global menembus angka 2.095.006.005. (internetworldstats.com, 2011) Jumlah website yang berisikan data dan informasi jumlahnya selalu meningkat setiap harinya dikarenakan faktor jumlah pengguna yang aktif sangatlah banyak. Terbukti menurut data stastistik yang dikeluarkan pihak netcraft bahwa pada akhir tahun 2010 jumlah website di internet mencapai 255.287.546 website. Dengan banyaknya jumlah website ini para pengguna internet pun membutuhkan bantuan dari search engine untuk mencari informasi website yang diinginkan. (netcraft.com, 2010) 1

Contoh kasus yang sering muncul misalnya saat pengguna internet ingin mengakses informasi tentang office. Office yang dimaksud disini adalah tentang perkantoran. Masalah yang muncul adalah halaman website yang mengandung kata office berjumlah 1.960.000.000, dengan halaman pertama hasil pencarian bukanlah tentang perkantoran akan tetapi justru perangkat lunak Microsoft Office. Kondisi yang terjadi sangat wajar karena Microsoft Office adalah produk yang paling banyak digunakan dan dicari. Oleh karena itu, berdasarkan banyaknya halaman website yang mengandung keyword office, pengguna pasti kebingungan mencari informasi yang sesuai dengan kebutuhannya. (google.com, 2011) Search engine Google pada kasus ini melakukan pengurutan hasil pencarian dari halaman sebuah website untuk mengukur tingkat relevansi sebuah halaman dengan suatu keyword tertentu dengan cara memperhatikan beberapa faktor yang diperhatikan dalam formula algoritma Page Rank yang digunakan oleh Google. Berikut adalah formula perhitungan Page Rank yang diterbitkan oleh Sergey Brin dan Lawrence Page dalam jurnalnya yang berjudul The Anatomy of a Large-Scale Hypertextual Web Search Engine : PR(A) = (1-d) / N + d ( ( PR(T1) / C(T1) )+ +( PR(Tn) / C(Tn))) Faktor-faktor yang diperhatikan oleh Google terhadap pengurutan hasil pencarian dari sebuah keyword terdiri dari : a. PR(A) yaitu Pagerank halaman A (halaman yang saat ini sedang dikunjungi). b. PR(T1) yaitu Pagerank halaman T1 (halaman lain) yang mengacu ke halaman A(halaman yang saat ini sedang dikunjungi). 2

c. C(T1) yaitu jumlah link keluar (outbound link) pada halaman T1. d. d yaitu Damping factor yang bisa diberi nilai antara 0 dan 1. Damping factor dapat diartikan juga sebagai peluang link tersebut akan dikunjungi atau diikuti oleh pengunjung web tersebut. e. N yaitu jumlah keseluruhan halaman web (yang terindex google). Untuk membantu pengguna dalam mencari informasi yang relevan, search engine tentu terlebih dahulu harus memiliki database tentang halaman website yang ada di internet. Ada dua cara search engine untuk mengumpulkan data halaman website di internet. Pertama dengan cara konvensional yakni search engine melakukan pengunjungan halaman-halaman website yang ada di internet menggunakan web crawler, dan cara yang kedua dengan menyediakan tools optimisasi untuk para webmaster memasukan informasi tentang websitenya. Cara yang pertama mempunyai tahapan-tahapan sebagai berikut : 1. Web Crawler sebagai mesin yang mempunyai tugas akan menelusuri setiap website yang ada di internet. 2. Saat mengunjungi halaman website Web Crawler akan mengumpulkan semua link yang ada dengan cara melakukan filtering konten menggunakan url recognizer. 3. Setelah itu Web Crawler akan menyimpan atribut yang ada pada title dan meta tag yang berfungsi untuk menentukan relevansi keyword dengan konten. 3

4. Tahap terakhir Web Crawler akan mengunjungi halaman lainnya dari link yang telah didapatkan sebelumnya untuk kemudian datanya disimpan kedalam database mesin pencari. Cara yang kedua adalah search engine menyediakan fasilitas yang dapat digunakan oleh para webmaster untuk memasukan informasi websitenya. Cara kedua ini dapat mempercepat dikenalinya sebuah website atau halaman website oleh search engine karena beberapa informasinya akan dibantu dipenuhi oleh para pemilik website tersebut, sehingga beban search engine hanya tinggal melakukan crawling informasi dari website tanpa harus mencarinya satu persatu. Pada search engine Google, fasilitas ini dinamakan Google Webmaster Tools. Google Webmaster Tools memfasilitasi agar para webmaster dapat memasukkan informasi websitenya seperti keyword, sitemap, dan lain sebagainya. Tools ini biasanya digunakan oleh webmaster untuk melakukan optimisasi websitenya agar mudah dikenali search engine atau dikenal dengan metode Search Engine Optimization (SEO). Dewasa ini para webmaster berlomba-lomba untuk menerapkan metode Search Engine Optimization (SEO) untuk mendapatkan traffic website yang berasal dari search engine. Selain itu, dengan menerapkan SEO maka website tersebut akan disenangi dan diprioritaskan oleh Web Crawler dari search engine untuk dikenali dan dikunjungi dan peluang dari suatu website berada pada indeks teratas dari search engine akan semakin besar. Hal ini berbanding lurus dengan kemungkinan bahwa website yang berada pada indeks teratas akan semakin sering dikunjungi oleh pengguna search engine. 4

Dalam buku The Art of SEO: Mastering Search Engine Optimization (Theory in Practice) ada 11 aspek yang secara umum dapat mempercepat pengenalan search engine terhadap suatu website. Aspek-aspek ini dimanfaatkan dalam metode SEO sebagai komponen yang digunakan untuk membuat sebuah website lebih cepat dikenali oleh search engine. Aspek-aspek tersebut adalah sebagai berikut : 1. Keunikan alamat atau url 2. Kata kunci yang terselip pada meta tag 3. Kesesuaian antara kata kunci dengan konten 4. Judul halaman yang unik dan tepat dengan deskripsi yang jelas 5. Kontekstualisasi 6. Sitemap 7. Backlink 8. Lama loading halaman 9. Pengoptimalan gambar yang ada pada halaman 10. Update konten secara berkesinambungan 11. Originalitas konten Salah satu komponen dari metode SEO diatas adalah sitemap. Ada dua jenis sitemap, yaitu sitemap dengan bentuk HTML yang berisi kumpulan link pada website dan sitemap yang berbentuk XML. Sitemap dengan bentuk HTML dapat dengan mudah dikenali oleh pengunjung website tersebut sehingga pengunjung dapat mengetahui semua konten yang ada pada website tersebut, sedangkan 5

sitemap dengan bentuk XML agak sulit dimengerti oleh pengunjung akan tetapi sangat mudah dikenali oleh crawler dari search engine. Pada implementasinya webmaster hanya perlu membuat sitemap dari website yang dimiliki kemudian mengunggahnya pada domain yang sama. Selain itu webmaster dapat mendaftarkan sitemap websitenya pada search engine dan dapat memberikan notifikasi kepada search engine tentang lokasi sitemap yang telah diunggah sehingga mempermudah search engine mengenali sitemap tersebut dan menjadikannya sebagai referensi penelusuran yang dapat mempercepat proses pengenalan sebuah website pada search engine. Sitemap dapat dibuat secara manual maupun otomatis. Secara manual dapat dicontohkan bahwa ketika sebuah website memiliki indeks berita atau artikel, webmaster dapat mengambil link dari database berita tersebut untuk dibentuk sesuai dengan format sitemap yang telah ditentukan oleh sitemaps.org. Permasalahan yang akan timbul adalah ketika pembuatan sitemap harus dilakukan secara otomatis, dengan trigger berupa url yang diinputkan oleh user yang bertujuan untuk memudahkan seorang webmaster membuat sebuah sitemap secara instan. Struktur dari setiap website mungkin saja berbeda, oleh karena itu dibutuhkan proses tertentu yang dapat mengambil url pada halaman website tersebut tanpa memperdulikan struktur sebuah website. Dalam pembuatan sitemap secara otomatis diperlukan beberapa proses yang dapat mengubah kumpulan url yang tersebar pada halaman sebuah website menjadi file sitemap yang dikenali search engine. Proses tersebut adalah alur dari penciptaan sitemap yaitu proses crawling informasi dengan menggunakan web 6

crawler yang mempunyai fungsi url recognizer dan url grouper serta proses pembentukan format sitemap dari link yang telah didapat dari proses crawling. Pada proses crawling dengan menggunakan web crawler dibutuhkan algoritma tertentu untuk menggerakkan crawler menuju url halaman website untuk mengambil informasi dari halaman tersebut. Menurut M.Najork dalam jurnalnya yang berjudul Breadth-First Search Crawling Yields High-Quality Pages, Algoritma Breadth-First Search adalah algoritma alami yang mudah digunakan untuk pencarian informasi pada halaman website terutama dapat membantu proses crawling informasi dengan mudah. Penggunaan algoritma ini didasari oleh kemudahan algoritma dan tingkat performansi yang cukup memuaskan. 1.2 Rumusan Masalah 1. Bagaimana implementasi algoritma Breadth-First Search dalam pembuatan Web Crawler? 2. Bagaimana pengenalan url dilakukan sehingga url dapat dikategorikan sebagai link, backlink, dan filelink? 3. Bagaimana menciptakan sitemap yang valid sehingga dapat diterima oleh search engine? 4. Bagaimana perbandingan waktu pengenalan mesin pencari Google terhadap sebuah website baru yang menggunakan sitemap dengan yang tidak menggunakan sitemap? 7

1.3 Batasan Masalah Untuk memfokuskan penelitian, ditetapkan batasan masalah, sebagai berikut: 1. Pembatasan kedalaman simpul yang dicari ditentukan oleh penulis yaitu 4 tingkat. 2. Sitemap yang digunakan menggunakan format XML. 1.4 Tujuan Penelitian Tujuan yang ingin dicapai dalam skripsi ini melakukan implementasi algoritma Breadth-First Search pada sistem Web Crawler yang bertujuan untuk pembuatan sitemap sebuah website dan melakukan implementasi metode Search Engine Optimization berbasis sitemap. Adapun detil tujuannya adalah sebagai berikut: 1. Melakukan implementasi algoritma Breadth-First Search pada engine Web Crawler. 2. Memahami proses pengenalan (recognizing) terhadap url pada sebuah halaman website. 3. Memahami dan melakukan implementasi grouping url menjadi link, backlink dan filelink. 4. Melakukan konversi data hasil crawling sesuai format sitemap yang valid sehingga tercipta sebuah alat bantu otomatis pembuatan sitemap. 5. Melakukan uji validitas sitemap yang dihasilkan dengan cara mendaftarkan sitemap tersebut ke search engine Google yang telah mengimplementasikan standar sitemaps.org. 8

6. Mengukur efisiensi waktu pengenalan metode Search Engine Optimization dengan menggunakan sitemap terhadap tingkat pengenalan sebuah website baru oleh mesin pencari Google berdasarkan perbandingan lama waktu pendeteksian. 1.5 Manfaat Penelitian Manfaat yang ingin diperoleh dari skripsi ini adalah: 1. Menyediakan sebuah layanan Online Sitemap Generator gratis yang valid dan mudah digunakan, sehingga pengguna dapat menerapkan metode Search Engine Optimization menggunakan sitemap secara optimal. 2. Menambah wawasan dan dapat menerapkan ilmu yang diperoleh pada waktu kuliah sehingga bermanfaat pada kehidupan nyata. 3. Sebagai bahan referensi bagi para peneliti lain yang ingin mengembangkan Web Crawler dan Sitemap Generator. 1.6 Metode Penelitian 1.6.1 Alat dan Bahan Pada penelitian ini digunakan alat penelitian berupa perangkat keras dan perangkat lunak sebagai berikut: 1. Perangkat keras a. Processor Intel Dual Core 2.20 GHz b. RAM 4 GB c. Hard disk 250 GB d. Monitor LED 19 e. Mouse dan keyboard 9

2. Perangkat lunak a. Notepad ++ b. XAMPP 1.7.4 (PHP & MySQL) Bahan penelitian yang digunakan adalah paper, textbook, dan dokumentasi lainnya yang didapat dari world wide web. 1.6.2 Metode Pengumpulan Data Untuk memperkuat Web Crawler beserta fungsi maka diperlukan metode penelitian pengumpulan data sebagai referensi dengan metode studi kepustakaan, yaitu dengan mempelajari literatur berupa artikel, paper maupun sumber lain yang berhubungan dengan objek penelitian. 1.6.3 Metode pengembangan Perangkat Lunak Metode pengembangan perangkat lunak yang digunakan untuk membangun perangkat lunak Sitemap Generator ini adalah Sequential Linear (Pressman, 2001. h.28). 1.7 Sistematika Penulisan Sistematika penulisan proposal ini disusun untuk memberikan gambaran umum tentang perangkat lunak yang akan dibuat. Sistematika penulisan tugas akhir ini adalah sebagai berikut : BAB I PENDAHULUAN Bab ini menguraikan tentang latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metode penelitian dan sistematika penulisan. 10

BAB II TINJAUAN PUSTAKA Bab ini menguraikan beberapa hal yaitu landasan teori berupa pengertian search engine, web crawler, sitemap, basis data, perancangan sistem, pengertian internet, pengertian world wide web, pengertian HTTP, bahasa pemrograman yang digunakan, algoritma Breadth-First Search, tinjauan perangkat lunak dan lain sebagainya. BAB III METODE PENELITIAN Bab ini memaparkan tentang rancangan penelitian, fokus penelitian, dan metode yang digunakan dalam penelitian. BAB IV IMPLEMENTASI Pada bab ini diuraikan tentang lingkungan implementasi, implementasi antar muka, pengujian perangkat lunak yang menggunakan pengujian Black Box. BAB V KESIMPULAN DAN SARAN Pada bab ini berisi tentang kesimpulan dari penelitian implementasi web crawler dengan algoritma Breadth-First Search sebagai sitemap generator dan saran yang diajukan penulis agar dapat menjadi bahan pertimbangan peneliti lain. 11