PENDAHULUAN. Motivasi : -. Pengolahan data numerik dalam jumlah yang sangat besar. -. Kebutuhan akan ketersediaan data yang senantiasa up to date.

dokumen-dokumen yang mirip
PENDAHULUAN. -. Pengolahan data numerik dalam jumlah yang sangat besar. -. Kebutuhan akan ketersediaan data yang senantiasa up to date.

PENGOLAHAN PARALEL. Kebutuhan akan Komputer Paralel PENDAHULUAN. Dahulu:

KEBUTUHAN KOMPUTER PARALEL

>> KLASIFIKASI ARSITEKTURAL

KLASIFIKASI ARSITEKTURAL

Kebutuhan pengolahan paralel

SATUAN ACARA PERKULIAHAN MATA KULIAH ALGORITMA PENGOLAHAN PARALEL (S1/ TEKNIK INFORMATIKA)

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

SATUAN ACARA PERKULIAHAN MATA KULIAH PENGOLAHAN PARALEL (S1/ TEKNIK KOMPUTER)

Organisasi & Arsitektur. Komputer. Org & Ars komp Klasifikasi Ars Komp Repr Data

ARSITEKTUR KOMPUTER. Satu CPU yang mengeksekusi instruksi satu persatu dan menjemput atau menyimpan data satu persatu.

Disusun Oleh: Agenda. Terminologi Klasifikasi Flynn Komputer MIMD. Time Sharing Kesimpulan

JARINGAN UNTUK MERGING

ORGANISASI KOMPUTER II AUB SURAKARTA

Arsitektur Komputer. Dua element utama pd sistem komputer konvensional: Memory Processor

PENGANTAR KOMPUTASI MODERN

OPERASI MATRIKS. a 11 a 12 a 13 a 14 A = a 21 a 22 a 23 a 24 a 31 a 32 a 33 a 34 a 41 a 42 a 43 a 44

BAB II LANDASAN TEORI

PERANCANGAN DAN ANALISIS JUMLAH PROSESOR MENGGUNAKAN MODEL CUBE-CONNECTED DAN TREE-CONNECTED DALAM ALGORITMA PARALEL.

KOMPUTASI PARALEL UNTUK PENGOLAHAN PRESTASI AKADEMIK MAHASISWA

Pertemuan Ke-11 MULTIPROSESOR

BAB IV PENGUJIAN DAN ANALISIS

BAB II LANDASAN TEORI. informasi menjadi sebuah teks yang tidak dapat dibaca (Ferguson dkk, 2010).

PAPER MULTIPROCESSOR

Thread, SMP, dan Microkernel (P ( e P rtemuan ua ke-6) 6 Agustus 2014


Ayi Purbasari

KONTRAK PEMBELAJARAN (KP) MATA KULIAH

Prio Handoko, S.Kom., M.T.I.

Pertemuan Ke-9 PIPELINING

Tugas Arsitektur Komputer Lanjut

ALGORITMA-ALGORITMA PARALLEL RANDOM ACCESS MACHINE (PRAM = pea ram)

Penggunakan lebih dari satu CPU untuk menjalankan sebuah program secara simultan. Tujuan Utama Untuk meningkatkan performa komputasi.

ANALISIS UNJUK KERJA KOMPUTASI DISTRIBUTED SHARED MEMORY PADA SISTEM CLUSTER KOMPUTER PERSONAL

Penerapan Algoritma Divide and Conquer Dalam Komputasi Paralel

FORMULIR Satuan Acara Pengajaran

SATUAN ACARA PERKULIAHAN MATA KULIAH ARSITEKTUR KOMPUTER (TK) KODE / SKS KK /4

BAB II TINJAUAN PUSTAKA

VIRTUAL PARALLEL ENVIRONMENT USING PVM CASE STUDY BUBBLE SORT ALGORITHM

SATUAN ACARA PERKULIAHAN

KOMPUTASI PARALEL PADA APLIKASI PAYROLL

SEKOLAH TINGGI MANAJEMEN INFORMATIKA & KOMPUTER JAKARTA STI&K SATUAN ACARA PERKULIAHAN

SATUAN ACARA PERKULIAHAN

Pengolahan Paralel PENGOLAHAN PARALEL. Ernastuti 1/58. Ernastuti

Hal-hal yang perlu dilakukan CPU adalah : 1. Fetch Instruction = mengambil instruksi 2. Interpret Instruction = Menterjemahkan instruksi 3.

Penerapan Algoritma Bucket Sort Untuk melakukan Pengurutan n buah Bilangan Mata Kuliah Pemrosesan Paralel

ANALISA KINERJA CLUSTER LINUX DENGAN PUSTAKA MPICH TERHADAP PERKALIAN MATRIKS

PENGOLAHAN PARALEL. Ernastuti

From M.R Zargham s book (Chapter 3.1)

10. PARALLEL PROCESSING

PENGENALAN ARSITEKTUR KOMPUTER

BAB 2 LANDASAN TEORI

2009/2010 Course Plan. SK-208 Arsitektur Komputer Ir. Syahrul, MT.

GARIS-GARIS BESAR PROGRAM PENGAJARAN (GBPP)

Soal terdiri dari 50 Pilihan Ganda Setiap soal pilihan ganda hanya satu jawaban yang benar

Pendeteksian Kemacetan Lalu Lintas dengan Compute Unified Device Architecture (CUDA)

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

Pertemuan Ke-3 Struktur Interkonesi (Bus System)

Prosiding Seminar Nasional Sains Antariksa Homepage: http//

INPUT / OUTPUT. Fungsi : Memindahkan informasi antara CPU atau memori utama dengan dunia luar

Central Processing Unit

Arsitektur Dan Organisasi Komputer. Pengantar Arsitektur Organisasi Komputer

SISTEM OPERASI. Belajar SO?

PAPER PIPELINE INSTRUKSI

Hanif Fakhrurroja, MT

BAB I PENDAHULUAN. Merancang aplikasi Paralel Processing yang diimplementasikan dengan penggunaan Computer-Unified-Device-Architecture (CUDA).

CHAPTER 16 INSTRUCTION-LEVEL PARALLELISM AND SUPERSCALAR PROCESSORS

BAB 03 Bus & Sistem Interkoneksi

PERTEMUAN. 1. Organisasi Processor. 2. Organisasi Register

PERANCANGAN ARSITEKTUR PEMARALELAN UNTUK MENCARI SHORTEST PATH DENGAN ALGORITMA DIJKSTRA

Struktur Dasar Komputer

Kompleksitas Algoritma Dalam Algoritma Pengurutan

Pengolahan Paralel. Kuliah#2 TSK205 Sistem Digital - TA 2011/2012. Eko Didik Widianto. Teknik Sistem Komputer - Universitas Diponegoro

Deskripsi. Buku Ajar 3/1/2010. Pengajar. Materi Kuliah. Materi Kuliah #2. Komputasi Paralel. Kuliah 01: Pendahuluan

Cara Kerja Processor. Primo riveral. Abstrak. Pendahuluan.

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

Pengantar Sistem Terdistribusi

SATUAN ACARA PERKULIAHAN MATA KULIAH : Organisasi Sistem Komputer Strata/Jurusan : SI/T. Informatika

Soal terdiri dari 50 Pilihan Ganda Setiap soal pilihan ganda hanya satu jawaban yang benar

INPUT/OUTPUT. Fungsi : Memindahkan informasi antara CPU atau memori utama dengan dunia luar

:21 UTC :22 UTC

Pengantar Sistem Tersebar

Organisasi Sistem Komputer

INPUT/OUTPUT. Fungsi : Memindahkan informasi antara CPU atau memori utama dengan dunia luar

Penggunaan Algoritma Paralel dalam Optimasi Prosesor Multicore

Bab 1. Pengenalan Sistem Terdistribusi

William Stallings Computer Organization and Architecture

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

Instruction Execution Phases

PROSES DAN THREADS DALAM SISTEM OPERASI

SATUAN ACARA PERKULIAHAN (SAP)

KINERJA ALGORITMA PARALEL UNTUK PENCARIAN KATA DENGAN METODE BOYER-MOORE MENGGUNAKAN PVM

Apa yang dimaksud dengan program?

Kompleksitas Algoritma Rank Sort dan Implementasi pada Parallel Programming Dengan Menggunakan OpenMP

Komponen Terhubung dan Jalur Terpendek Algoritma Graf Paralel

Abstrak. Pendahuluan

PENGANTAR ORGANISASI DAN ARSITEKTUR KOMPUTER CENTRAL PROCESSING UNIT

MATA KULIAH: PIPELINING PERTEMUAN 12

Analisis Algoritma: Anany Levitin, Introduction to Design and Analysis of Algorithm, 3 rd Edition, Pearson Education, Inc.

ARSITEKTUR DAN ORGANISASI KOMPUTER

Transkripsi:

PENDAHULUAN 1 Kebutuhan akan Pengolahan Paralel Motivasi : - Pengolahan data numerik dalam jumlah yang sangat besar - Kebutuhan akan ketersediaan data yang senantiasa up to date Contoh 11 : Simulasi sirkulasi global laut di Oregon State University Lautan dibagi ke dalam 4096 daerah membentang dari timur ke barat, 1024 daerah membentang dari utara ke selatan dan 12 lapisan Berarti terdapat sekitar 50 juta daerah berdimensi tiga Satu iterasi mampu mensimulasikan sirkulasi lautan untuk jangka waktu 10 menit dan membutuhkan sekitar 30 milyar kalkulasi floating point Para ahli kelautan ingin menggunakan model tersebut untuk mensimulasikan sirkulasi lautan untuk periode 1 tahun Pengolahan Paralel : - pengolahan informasi yang menekankan pada manipulasi data-data elemen secara simultan - dimaksudkan untuk mempercepat komputasi dari sistem komputer dan menambah jumlah keluaran yang dapat dihasilkan dalam jangka waktu tertentu Komputer Paralel : - Komputer yang memiliki kemampuan untuk melakukan pengolahan paralel Throughput : - Banyaknya keluaran yang dihasilkan per unit waktu Peningkatan throughput dapat dilakukan dengan : - Meningkatkan kecepatan operasi APP Pendahuluan 1/11

- Meningkatkan jumlah operasi yang dapat dilakukan dalam satu waktu tertentu (concurrency) 2 Paradigma Pengolahan Paralel 21 M J FLYNN Pengklasifikasian oleh Flynn, dikenal sebagai Taksonomi Flynn, membedakan komputer paralel ke dalam empat kelas berdasarkan konsep aliran data (data stream) dan aliran instruksi (instruction stream), sebagai : SISD, SIMD, MISD, MIMD SISD (Single stream, Single stream) Komputer tunggal yang mempunyai satu unit kontrol, satu unit prosesor dan satu unit memori Control Processor Memory [Akl 1989] SIMD (Single stream, Multiple stream) Komputer yang mempunyai beberapa unit prosesor di bawah satu supervisi satu unit common control Setiap prosesor menerima instruksi yang sama dari unit kontrol, tetapi beroperasi pada data yang berbeda Processor Shared Memory Control Processor Processor or Interconnection Network [Akl 1989] MISD (Multiple stream, Single stream) Sampai saat ini struktur ini masih merupakan struktur teoritis dan belum ada komputer dengan model ini APP Pendahuluan 2/11

Control 1 Processor 1 Control 2 Processor 2 Memory Control N Processor N [Akl 1989] MIMD (Multiple stream, Multiple stream) Organisasi komputer yang memiliki kemampuan untuk memproses beberapa program dalam waktu yang sama Pada umumnya multiprosesor dan multikomputer termasuk dalam kategori ini Control 1 Processor 1 Control 2 Processor 2 Shared Memory or Interconnection Network Control N Processor N 22 TG LEWIS [Akl 1989] TG Lewis membedakan komputer paralel ke dalam dua kelas, berdasarkan ada atau tidak adanya common global clock, sebagai : synchronous dan asynchronous APP Pendahuluan 3/11

PARALLEL COMPUTER SYNCHRONOUS ASYNCHRONOUS Vector / Array MIMD SIMD Reduction Systolic Gambar 1 Taksonomi Parallel Computing oleh TG Lewis dkk [Lewis,1992] Synchronous : - Pada komputer paralel yang termasuk dalam kategri ini terdapat koordinasi yang mengatur beberapa operasi untuk dapat berjalan bersamaan sedemikian hingga tidak ada ketergantungan antar operasi - Parallelism yang termasuk dalam kategori ini adalah vector/array parallelism, SIMD dan systolic parallelism - Systolic parallel computer adalah multiprocessor dimana data didistribusikan dan dipompa dari memory ke suatu array prosesor sebelum kembali ke memory APP Pendahuluan 4/11

Memory Processing Element Gambar 2 Model Komputasi Tradisional (SISD) [Quinn 1994] Processing Element Processing Element Processing Element Processing Element Memory Gambar 3 Model Komputasi Systolic Array [Quinn 1994] Asynchronous : - Pada komputer paralel yang termasuk dalam kategori asynchronous, masing-masing prosesor dapat diberi tugas atau menjalankan operasi berbeda dan masing-masing prosesor melaksanakan operasi tersebut secara sendiri-sendiri tanpa perlu koordinasi - Paradigma yang juga termasuk dalam kategori ini adalah MIMD dan reduksi - Paradigma reduksi adalah paradigma yang berpijak pada konseph graph reduksi Program dengan model reduksi diekspresikan sebagai graph alur data Komputasi berlangsung dengan cara mereduksi graph dan program berhenti jika graph akhirnya hanya mempunyai satu simpul 23 MICHAEL J QUINN Quinn membedakan paralelisma ke dalam dua jenis : Parallelism dan Control Parallelism Parallelism : penerapan operasi yang sama secara simultan terhadap elemen-elemen dari kumpulan data Control Parallelism : APP Pendahuluan 5/11

penerapan operasi-operasi berbeda terhadap elemen-elemen data yang berbeda secara bersamaan Pada control parallelism dapat terjadi aliran data antar proses-proses dan kemungkinan terjadi aliran data yang kompleks/rumit Pipeline merupakan satu kasus khusus dari control parallelism dimana aliran data membentuk jalur yang sederhana A B C w2 w1 SEKUENSIAL A B C w5 w4 w3 w2 w1 PIPELINED A B C w4 w1 A B C w5 w2 A B C w6 W3 DATA PARALLELISM Gambar 4 Ilustrasi perbandingan pipelining dengan data parallelism [Quinn 1994] APP Pendahuluan 6/11

Contoh : Perhatikan ke-empat taman yang harus dirawat berikut ini : a b c a b c a b c a b c Taman 1 Taman 2 Taman 3 Taman 4 a Tanaman Pagar b Lapangan rumput c Kebun bunga Nama Pekerjaan Pekerja 1 Merapihkan tanaman pagar Ali, Budi, Cipto, Dadang, Edi 2 Memangkas rumput Frans, Gugun 3 Menanam bibit bunga Heru, Indra, Joko 4 Menyiram taman Ali Pekerjaan 4 dapat dilakukan jika ketiga pekerjaan 1, 2 dan 3 telah selesai Pekerjaan 1, 2 dan 3 dapat dilakukan secara bersamaan, sebagai contoh control parallelism Masing-masing pekerjaan adalah contoh data parallelism Sementara pekerjaan 4 dikerjakan pada sebuah taman, pekerjaan 1, 2 dan 3 dapat dikerjakan pada satu taman yang lain 3 Terminologi Pengolahan Paralel : pengolahan informasi yang ditekankan pada manipulasi elemen data yang dimiliki oleh satu atau lebih dari satu proses secara bersamaan dalam rangka menyelesaikan sebuah problem Komputer Paralel : komputer multi-prosesor dengan kemampuan melakukan pengolahan paralel Supercomputer : APP Pendahuluan 7/11

sebuah general-purpose computer yang mampu me-nyelesaikan problem dengan kecepatan komputasi sangat tinggi Semua superkomputer kontemporer adalah komputer paralel Beberapa di antaranya memiliki prosesor yang sangat kuat dalam jumlah yang relatif sedikit, sementara yang lainnya dibangun oleh mikroprosesor dalam jumlah yang cukup besar Throughput : banyaknya keluaran yang dihasilkan per unit waktu Pipeline : Pada komputasi pipelined, komputasi dibagi ke dalam sejumlah langkah yang masingmasing disebut sebagai segmen, atau stage Output dari sebuah segmen menjadi input segmen yang lain 4 Analisa Algoritma Paralel Pada saat sebuah algoritma digunakan untuk memecahkan sebuah problem, maka performance dari algoritma tersebut akan dinilai Hal ini berlaku untuk algoritma sekuensial maupun algoritma paralel Penampilan sebuah algoritma pengolahan peralel dapat dinilai dari beberapa kriteria, seperti running time dan banyaknya prosesor yang digunakan 41 Running Time Running time adalah waktu yang digunakan oleh sebuah algoritma untuk menyelesaikan masalah pada sebuah komputer paralel dihitung mulai dari saat algoritma mulai hingga saat algoritma berhenti Jika prosesor-prosesornya tidak mulai dan selesai pada saat yang bersamaan, maka running time dihitung mulai saat komputasi pada prosesor pertama dimulai hingga pada saat komputasi pada prosesor terakhir selesai 411 Counting Steps Untuk menentukan runnging time, secara teoritis dilakukan analisa untuk menentukan waktu yang dibutuhkan sebuah algoritma dalam mencari solusi dari sebuah masalah Hal ini dilakukan dengan cara menghitung banyaknya operasi dasar, atau step (langkah), yang dilakukan oleh algoritma untuk keadaan terburuknya (worst case) Langkah-langkah yang diambil oleh sebuah algoritma dibedakan ke dalam dua jenis yaitu : APP Pendahuluan 8/11

a Computational step Sebuah computational step adalah sebuah operasi aritmetika atau operasi logika yang dilakukan terhadap sebuah data dalam sebuah prosesor b Routing step Pada routing step, sebuah data akan melakukan perjalanan dari satu prosesor ke prosesor lain melalui shared memory atau melalui jaringan komunikasi Contoh 41 : Perhatikan sebuah file komputer dengan n entri berbeda Pada file tersebut akan diperiksa apakah x terdapat di dalamnya Dengan algoritma sekuensial, keadaan terburuknya (worst case) untuk menemukan x membutuhkan n langkah, dimana tiap langkah adalah membandingkan x dengan sebuah entri pada file Keadaan terburuk terjadi jika x ternyata sama dengan entri terakhir pada file atau x tidak terdapat pada file tersebut Dengan EREW SM SIMD (Exclusive Read Exclusive Write Shared Memory SIMD) komputer dengan N prosesor, dimana N n, pada worst casenya dibutuhkan log N + n / N langkah Misalkan P 1, P 2,, P N prosesor-prosesor pada EREW SM SIMD komputer tersebut Proses pencarian entri yang sama dengan x adalah : - Broadcasting, x dikomunikasikan pada semua prosesor dengan cara 1 P 1 membaca x dan mengkomunikasikan dengan P 2 2 P 1 dan P 2 secara simultan mengkomunikasikan x dengan P 3 dan P 4 3 P 1, P 2, P 3 dan P 4 secara simultan meng-komunikasikan x dengan P 5, P 6, P 7 dan P 8 Dan seterusnya hingga semua prosesor mengenal x Proses ini dilakukan dalam log N langkah - Searching, File dimana x akan dicari dibagi ke dalam sub file dan secara simultan dilakukan pencarian oleh prosesor-prosesor : P 1 mencari pada n / N entri pertama, APP Pendahuluan 9/11

P 2 mencari pada n / N entri kedua, P 3 mencari pada n / N entri ketiga, P N mencari pada n / N entri ke-n Proses ini membutuhkan n / N langkah Jadi total langkah yang dibutuhkan oleh algoritma tersebut adalah : langkah log N + n / N 412 Speedup Pengukuran speedup sebuah algoritma paralel adalah salah satu cara untuk mengevaluasi kinerja algoritma tersebut Speedup adalah perbandingan antara waktu yang diperlukan algoritma sekuensial yang paling efisien untuk melakukan komputasi dengan waktu yang dibutuhkan untuk melakukan komputasi yang sama pada sebuah mesin pipeline atau paralel Speedup = Worst case running time dari algoritma sekuensial terefisien Worst case running time dari algoritma paralel Contoh 42 : Dari contoh 41 Running time proses searching dengan mesin sekuensial adalah O(n) Running time dari proses searching pada komputer EREW SM SIMD adalah O( n / N ) Jadi speedup = O(N) 42 Banyaknya Prosesor (Number of Processor) Semakin banyak prosesor yang digunakan semakin tinggi biaya untuk memperoleh solusi sebuah problem Hal ini terjadi karena perlu dipertimbangkan biaya pengadaan prosesor dan perawatannya Jumlah prosesor yang tergantung dari n, n=ukuran problem, dinyatakan sebagai p(n) Kadang-kadang jumlah prosesor tidak tergantung pada ukuran problem Contoh 43 : Perhatikan n bilangan x 1,x 2,,x n yang akan dijumlahkan APP Pendahuluan 10/11

Dengan menggunakan komputer tree-connected SIMD dengan log n level dan n / 2 daun, dibutuhkan pohon dengan ukuran (n-1) atau p(n) = n -1 Ilustrasi untuk n = 8 P 1 P 2 P 3 P 4 P 5 P 6 P 7 INPUT x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 Sedangkan pada contoh 41, banyaknya prosesor, N, tidak tergantung pada ukuran problem, n APP Pendahuluan 11/11