PENGANTAR ANALISIS JEJARING

dokumen-dokumen yang mirip
METODE ANALISIS JEJARING SOSIAL

Teknik Informatika UKDW Yogyakarta

ANALISIS LINK. Tujuan 4/23/13. Budi Susanto

Bab 1 PENDAHULUAN UKDW

BAB III IDENTIFIKASI DAN KLASIFIKASI WEB LOG

@UKDW 1 BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

PENDAHULUAN TINJAUAN PUSTAKA

Model Sistem Terdistribusi

Penerapan Social Network Analysis dalam Penentuan Centrality Studi Kasus Social Network Twitter

JEJARING KERJA DIKLAT KEPEMIMPINAN TK. III

Penggunaan Metode berbasis Graph untuk Mining Frequent Sequential Access Pattern Pada Studi Kasus : Website igracias Universitas Telkom

PENDAHULUAN TINJAUAN PUSTAKA

Teori Graf dalam Social Network Analysis dan Aplikasinya pada Situs Jejaring Sosial

Denny Setyo R. Masden18.wordpress.com

Analisis Jaringan Sosial Pariwisata di Kampung Pesisir Bulak Surabaya

[CMS Website Organisasi Kemahasiswaan FEB Unpad] Fakultas Ekonomi dan Bisnis Universitas Padjadjaran

BAB 2 LANDASAN TEORI

PENDAHULUAN. Latar Belakang

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta

BAB 3 ANALISIS DAN PERANCANGAN Analisis Sistem Yang Sedang Berjalan

Analisis Jaringan Sosial Pariwisata di Kampung Pesisir Bulak Surabaya

William Stallings Data and Computer Communications. BAB 2 Protokol dan Arsitektur

POLA INTERAKSI DAN AKTOR YANG PALING BERPERAN PADA EVENT JGTC 2013 MELALUI MEDIA SOSIAL TWITTER (STUDI MENG- GUNAKAN METODE SOCIAL NET- WORK ANALYSIS)

BAB IV STUDI KASUS. Pengujian perangkat lunak...,agung Widiyarto, FASILKOM UI, 2008

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta

ANALISIS DAN IMPLEMENTASI WEB USAGE MINING MENGGUNAKAN ALGORITMA SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES

TEKNIK INFORMATIKA. Teori Dasar Graf

Teknik Informatika S1

BAB III METODOLOGI PENELITIAN. Untuk memudahkan penyusun dalam melakukan penelitian, dibutuhkan

DATABASE LINGKUNGAN DATABASE

BAB 2 TINJAUAN PUSTAKA

M.K. Pemrograman Web (AK ) Konsep Pemrograman Web

PERANCANGAN DAN IMPLEMENTASI GOOGLE GEARS PADA WINDOWS MOBILE DENGAN STUDI KASUS WEB PENJUALAN BARANG PRANESTI NOVITASARI

Operating System. File System. Fak. Teknik Jurusan Teknik Informatika Universitas Pasundan. Dosen : Caca E. Supriana, S.Si

(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M

ISSN : e-proceeding of Management : Vol.3, No.1 April 2016 Page 77

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. komputer dengan skala yang besar (Stringer, 2005). Internet terbentuk dari. yang sangat besar yang kita sebut dengan Internet.

BAB I PENDAHULUAN. dalam penalaran logika, komputasi, analisis, terapan maupun statistik. Sampai saat ini

Tag dasar yang akan kita gunakan untuk membuat form di HTML adalah tag form, input, textarea, select dan option.

Tugas Bahasa Indonesia

Web Usage Mining dengan Google Analytics:

ANALISIS AVAILABILITAS LOAD BALANCING PADA WEB SERVER LOKAL

ANALISIS PERINGKAT BRAND PADA JEJARING SOSIAL PERCAKAPAN MENGGUNAKAN METODE SOCIAL NETWORK ANALYSIS

WWW (World Wide Web) Adalah salah satu bentuk layanan yang dapat diakses melalui internet. Biasa disingkat sebagai Web. Merupakan sekumpulan

BAB II LANDASAN TEORI

Muhammad Miftakul Amin

Dasar Pemrograman Web. Pemrograman Web. Adam Hendra Brata

BAB IV DESKRIPSI KERJA PRAKTEK. Pada bab ini akan dibahas mengenai tahap yang dilakukan dalam

MENGANALISA WEBSITE K E A M A N A N S I S T E M E R W I E N T J I P T A W I J A Y A, S T., M. K O M

Financial Fraud Detection using Social Network Analysis

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN

BAB II KAJIAN PUSTAKA. pembelian dan penjualan produk, jasa dan informasi yang dilakukan secara

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. pendidikan, bahkan di bidang bisnis sekalipun. Dimana banyak perusahaan yang

Aplikasi Teori Graf dalam Manajemen Sistem Basis Data Tersebar

BAB III METODE PENELITIAN. chatting harus di download dan diistall ke dalam handphone. Proses download

IP Address. Dedi Hermanto

Nama resource (untuk pemanggilan), Alamat (lokasi resource tsb), Rute (bagaimana mencapai lokasi tsb).

BAB I Pendahuluan. 1 Launching Business on the Web, David Cook and Deborah Sellers, QUE, 1995, hal 12.

BAB II LANDASAN TEORI. diperlukan dalam pembangunan website e-commerce Distro Baju MedanEtnic.

Pengantar E-Business dan E-Commerce

7 PERANCANGAN PORTAL MANAJEMEN PENGETAHUAN

BAB 1 PENDAHULUAN. barang, jaringan jalan raya, atau dalam masalah komputasi yaitu jaringan penjadwalan.

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM

Implementasi SSO ( SINGLE SIGN ON ) Menggunakan Autentikasi NCSA untuk Website. di Web Server. ¹Hendi Pangestu ² Periyadi, ST. ³ Prajna Deshanta, ST.

Sistem Pendeteksi dan Pencegah Serangan SQL Injection dengan Penghapusan Nilai Atribut Query SQL dan Honeypot

BAB 4 PERANCANGAN Perancangan Algoritma Algoritma shortest path (Haversine formula)

@UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Penguraian Naming Domains untuk mengakses resource dari URL URL Resolution via DNS.

WEB USAGE MINING DENGAN GOOGLE ANALYTICS: STUDI KASUS SITUS ACHMATIM.NET. Achmad Solichin Ferdiansyah Wahyu Pramusinto

HTTP Protocol Ketika sebuah alamat web (atau URL) yang diketik ke dalam web browser, web browser melakukan koneksi ke web service yang berjalan pada

BAB II TINJAUAN PUSTAKA. Pada bab ini diberikan definisi-definisi, istilah-istilah yang digunakan dalam

POLA ANALISIS JARINGAN SOSIAL DINAMIS

Konfigurasi Jaringan Hotspot Pada MikroTik RouterOS

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Soal Ujian Tengah Semester Mata Kuliah Jaringan Komputer

Soal Ujian Tengah Semester Mata Kuliah Jaringan Komputer

ANALISIS JEJARING SOSIAL DENGAN GRAF BERARAH DAN BERBOBOT PADA PT PRODUK REKREASI (KIDS FUN) BAGIAN OPERATOR

BAB IV ANALISIS WEBLOG DAN DATA WEBALIZER

Pemetaan dan Analisis Pola Interaksi Suatu Komunitas Menggunakan Analisis Jejaring Sosial

BAB III ANALISIS SISTEM

DNS Server Administrator

Keamanan Sistem World Wide Web. Pertemuan VI

BAB III ANALISIS PENYELESAIAN MASALAH

RISTEKDIKTI PANDUAN PENGISISAN FORM

ABSTRAK. Kata kunci : Silversight, Google Map API V3, Jejaring sosial, Berbasis lokasi, Rekomendasi teman, Data Mining, Clustering

Struktur. Bab 6: 4/29/2015. Kompetensi Dasar. Mahasiswa mendapatkan pemahaman mengenai cara kerja dan penyajian graph

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah. Kata informasi telah menjadi suatu topik yang cukup menarik untuk

Konfigurasi DNS & Web Server

Sistem Rekapitulasi Dokumen Perundang-Undangan Indonesia

PRAKTIKUM ADMINISTRASI JARINGAN KOMPUTER. SQUID (Proxy Server) Oleh : Idris Winarno

BAB II. 2.1 Model Data High Level Data Model (Conceptual Data Model)

The OSI Reference Model

PEMBUATAN DAN PERANCANGAN APLIKASI NILAI MATA PELAJARAN SISWA BERBASIS CLIENT SERVER PADA SMP N 1 SAWIT BOYOLALI

Dynamic Routing (OSPF) menggunakan Cisco Packet Tracer

Analisis dan Perancangan Alat Bantu untuk Menemukan Komunitas di Twitter Menggunakan Metode Sosial Network Analysis and Visualizations

MODUL 4 PHP PART 1 (PENGENALAN PHP + VARIABEL)

Transkripsi:

Text dan Web Mining - Budi Susanto 1 PENGANTAR ANALISIS JEJARING Budi Susanto (v.1.1)

Text dan Web Mining - Budi Susanto 2 Tujuan memahami metode centrality pada suatu graf untuk menemukan node yang paling berperan dalam jejaring.

Text dan Web Mining - Budi Susanto 3 Social Network Social network adalah studi terhadap entitas sosial (misalnya orang dalam suatu organisasi), dan interaksi serta relasi anar entitas tersebut. Interaksi dan hubungan dapat dinyatakan dengan suatu jaringan atau graf, di mana setiap vertex (node) menyatakan suatu hubungan. Dari jaringan tersebut, kita dapat mempelajari properti strukturnya, dan peran, posisi, dan martabat dari setiap aktor. Kita juga dapat menemukan berbagai macam bentuk subgraf, seperti komunitas yang terbentuk dari sekelompok aktor.

Text dan Web Mining - Budi Susanto 4 Social Network untuk Web Social network analysis (SNA) bermanfaat juga untuk web karena web pada prinsipnya juga merupakan komunitas virtual setiap halaman dapat diperlakukan sebagai aktor sosial dan setiap tautan sebagai sebuah hubungan antar aktor tersebut. Banyak hasil dari jejaring sosial dapat diadaptasi dan diperluas pemakaiannya dalam kontek Web.

Text dan Web Mining - Budi Susanto 5 Centrality Dalam kontek suatu organisasi, seseorang dengan hubungan atau komunikasi yang ekstensif dengan banyak orang lain dalam organisasi dinilai lebih penting daripada orang lain yang memiliki kontak lebih sedikit Tautan atau hubungan dapat juga disebut sebagai ikatan (ties). Seorang aktor pusat terlibat dalam banyak ikatan.

Text dan Web Mining - Budi Susanto 6 Centrality Degree centrality out-links in-links Closeness centrality Betweeness centrality Y X X Y Y X X Y indegree outdegree betweenness closeness

Text dan Web Mining - Budi Susanto 7 Degree Centrality dimisalkan total jumlah aktor dalam suatu jaringan adalah n. Dalam undirected graph: degree centrality dari seorang aktor i (dinyatakan sebagai C D (i)) adalah derajat (jumlah edge) dari node aktor, dinyatakan sebagai d(i), dinormalisasikan dengan nilai maksimum degree, n-1. Nilai dari pengukuran tersebut adalah 0 1, di mana n-1 adalah nilai maksimum dari d(i).

Text dan Web Mining - Budi Susanto 8 Directed Degree Centrality Terhadap Directed Graph: kita perlu membedakan antara aktor in-links i (tautan yang menunjuk ke i), dan aktor out-links (tautan yang menunjuk keluar dari i). Degree centrality didefinisikan berdasarkan hanya pada out-degree (jumlah edge out-links), yaitu d o (i).

Degree Centrality Text dan Web Mining - Budi Susanto 9

Text dan Web Mining - Budi Susanto 10 Degree Centrality Berapa banyak variasi yang ada dalam nilai centrality di antara node? Rumus Freeman terkait dengan sentralisasi : C D = g C D (n * ) C D (i) i=1[ ] [(N 1)(N 2)] maximum value in the network

Text dan Web Mining - Budi Susanto 11 Degree Centrality C D = 0.167 C D = 1.0 C D = 0.167

Text dan Web Mining - Budi Susanto 12 Closeness Centrality Closeness Centrality didasarkan pada jarak (kedekatan). Ide dasarnya bahwa seorang aktif x i dikatakan sebagai pusat jika aktor tersebut dapat berinteraksi dengan aktor lain secara mudah. yaitu, jarak dari aktor i ke aktor lain adalah terpendek. Kita dapat menggunakan shortest distance untuk menghitung pengukuran ini. Misalkan jarak terpendek dari aktor i ke aktor j adalah d(i,j) (diukur sebagai jumlah tautan dalam sebuah jalur terpendek).

Text dan Web Mining - Budi Susanto 13 Closeness Centrality A B C D E C c ' (A) = N j=1 d(a, j) N 1 1 = 1+ 2 + 3+ 4 4 1 = 10 4 1 = 0.4

Closeness Centrality Text dan Web Mining - Budi Susanto 14

Closeness Centrality Text dan Web Mining - Budi Susanto 15

Text dan Web Mining - Budi Susanto 16 Betweenness Centrality Jika ada dua aktor yang saling berdekatan, yaitu j dan k, ingin beriteraksi dan aktor i berada pada jalur hubungan antara j dan k, maka i memiliki kontrol terhadap interaksi keduanya. Betweenness mengukur kontrol tersebut. sehingga, jika i berada pada jalur dari beberapa interaksi, maka i adalah sebuah aktor penting.

Text dan Web Mining - Budi Susanto 17 Betweenness Centrality Misalkan p jk adalah jumlah jalur terpendek antara aktor j dan k. Betweenness seorang aktor i didefinisikan sebagai jumlah jalur terpendek yang melewati i (dinyatakan dengan p jk (i), j i dan k i), dinormalisasikan dengan total jumlah jalur terpendek dari semua pasangan aktor, kecuali i:

Text dan Web Mining - Budi Susanto 18 Betweenness Centrality mungkin ada beberapa jalur terpendek antara aktor j dan k. beberapa jalur tersebut melewati i, dan beberapa jalur lain tidak. Kita mengasumsikan bahwa semua jalur digunakan dengan cara yang serupa. C B (i) memiliki nilai minimum 0, yang menyatakan i tidak terletak pada sembarang jalur terpendek. C B (i) memiliki nilai maksimum (n-1)(n-2)/2, yang menunjukkan jumlah pasangan aktor yang tidak termasuk i di dalamnya.

Betweenness Centrality Text dan Web Mining - Budi Susanto 19

Text dan Web Mining - Budi Susanto 20 Betweenness Centrality C A B E D

Text dan Web Mining - Budi Susanto 21 Betweenness Centrality b a C d e f g h

Betweenness Centrality Text dan Web Mining - Budi Susanto 22 a b d e f k m l m g h j i j c d e f k m l m g h j i j a b c d e f g h i j k l m

Betweenness Centrality Text dan Web Mining - Budi Susanto 23

Text dan Web Mining - Budi Susanto 24 Contoh 1 4 6 3 5 2 7 http://www.sscnet.ucla.edu/soc/faculty/mcfarland/soc112/cent-ans.htm

Text dan Web Mining - Budi Susanto 25 Prestige Prestige (martabat/wibawa) merupakan suatu pengukuran yang lebih halus terhadap peran seorang aktor daripada pengukuran centrality. Kita perlu membedakan antara ikatan keluar (out-links) ikatan masuk (in-links). Seorang aktor bermartabat tinggi jika aktor tersebut memiliki ikatan sebagai penerima (in-links). Perbedaan utama antara konsep centrality dan prestige adalah centrality fokus pada out-links, sementara prestige fokus pada in-links.

Text dan Web Mining - Budi Susanto 26 Degree Prestige Seorang aktor dikatakan prestigious jika ia menerima banyak in-links atau nomasi. dimana d I (i) adalah in-degree dari i (jumlah in-links dari i) dan n adalah total jumlah aktor dalam jaringan.

Text dan Web Mining - Budi Susanto 27 TERIMA KASIH Budi Susanto

WEB USAGE MINING Budi Susanto

Web Mining Web mining adalah aplikasi teknik data mining untuk menyarikan pengetahuan dari data Web. Data web adalah web content text, image, records, dsb. web structure hyperlinks, tags, dsb. web usage log httpd, log app server, dsb.

Preprocessing Web Data Web Content menyarikan potongan dari sebuah dokumen Web Metode yang digunakan Information Retrieval, Klasifikasi, Clustering. Web Structure mengidentifikasikan pola-pola graf menarik tertentu bersama suatu metric Analisis hyperlink: PageRank, HITS, SNA Web Usage identifikasi user, pembuatan sesi, pendeteksian dan penyaringan robot, menyarikan pola pemakaian.

Web Usage Mining Sebuah web adalah sekumpulan inter-related file pada satu atau lebih web server Web Usage Mining Menemukan pola dari data yang dihasilkan oleh transaksi clientserver pada satu atau lebih web server Sumber data data yang dihasilkan otomatis oleh server dalam bentuk access log, referrer log, agent log, client-side cookie user profile meta data: atribut halaman, atribut content, usage data

Web Usage Mining Process

Arsitektur Preprocessing

Format Log NCSA Log yang dihasilkan web server yang mencatat what happened when by whom. Contoh:

Persoalan Usage Data Pengenalan terhadap Session Cookie, User Login, SessionID, IP+Agent, Client-side tracking Data CGI GET dan POST Caching Dynamic Page Deteksi Robot dan Penyaringan Pengenalan Transaksi mengenal user mengenal transaksi user

Masalah terhadap Caching Client dan proxy server menyimpan local copy secara lokal pemakaian tombol Back atau Forward pada browser, akan mengakses local copy daripada mengakses web server kembali.

Kesalahan Penyimpanan Waktu Akses

Kehilangan Page View di Server Contoh urutan waktu akses yang hilang karena adanya proxy

Deteksi Robot Robot Web adalah program yang secara otomatis menjelajah struktur hyperlink dari WWW dalam rangka untuk mendapatkan lokasi dan mengambil informasi. Motivasi adalah membedakan mana yang robot dan mana yang diakses dari user.

Identifikasi Transaksi Pertanyaan utama: bagaimana mengenal pemakai unik bagaimana mendefinisikan transaksi seorang user Masalah-masalah alamat IP komputer tunggal akan tersembunyikan dibalik proxy server client-side dan proxy caching membuat server log kurang handal user id biasanya disembunyikan terkait dengan keamanan Solusi standar registrasi pemakai client-side cookie cache busting

Identifikasi Transaksi Mengenal User Session menggunakan field IP, Agent, dan OS sebagai atribut kunci menggunakan client-side cookie dan user id unik (jika tersedia) menggunakan session time-out menggunakan sinkronisasi log dan timestamp untuk memperluas user path dari sebuah session memanfaatkan atribut halaman (ukuran, tipe), panjang reference

Analisis Transaksi Web Association Rule Sequential Pattern Clustering dan Classification

TERIMA KASIH