Kebutuhan pengolahan paralel

dokumen-dokumen yang mirip
PENDAHULUAN. -. Pengolahan data numerik dalam jumlah yang sangat besar. -. Kebutuhan akan ketersediaan data yang senantiasa up to date.

KEBUTUHAN KOMPUTER PARALEL

PENDAHULUAN. Motivasi : -. Pengolahan data numerik dalam jumlah yang sangat besar. -. Kebutuhan akan ketersediaan data yang senantiasa up to date.

KLASIFIKASI ARSITEKTURAL

PENGOLAHAN PARALEL. Kebutuhan akan Komputer Paralel PENDAHULUAN. Dahulu:

ORGANISASI KOMPUTER II AUB SURAKARTA

ARSITEKTUR KOMPUTER. Satu CPU yang mengeksekusi instruksi satu persatu dan menjemput atau menyimpan data satu persatu.

Arsitektur Komputer. Dua element utama pd sistem komputer konvensional: Memory Processor

PAPER MULTIPROCESSOR

KOMPONEN KOMPUTER PARALLEL

>> KLASIFIKASI ARSITEKTURAL

Disusun Oleh: Agenda. Terminologi Klasifikasi Flynn Komputer MIMD. Time Sharing Kesimpulan

Organisasi & Arsitektur. Komputer. Org & Ars komp Klasifikasi Ars Komp Repr Data

Pertemuan Ke-11 MULTIPROSESOR

BAB II LANDASAN TEORI. informasi menjadi sebuah teks yang tidak dapat dibaca (Ferguson dkk, 2010).

BAB II LANDASAN TEORI

Penggunakan lebih dari satu CPU untuk menjalankan sebuah program secara simultan. Tujuan Utama Untuk meningkatkan performa komputasi.

Thread, SMP, dan Microkernel (P ( e P rtemuan ua ke-6) 6 Agustus 2014

ANALISIS UNJUK KERJA KOMPUTASI DISTRIBUTED SHARED MEMORY PADA SISTEM CLUSTER KOMPUTER PERSONAL

Deskripsi. Buku Ajar 3/1/2010. Pengajar. Materi Kuliah. Materi Kuliah #2. Komputasi Paralel. Kuliah 01: Pendahuluan

10. PARALLEL PROCESSING

PENGANTAR KOMPUTASI MODERN

ARSITEKTUR KOMPUTER 1

BAB I PENDAHULUAN. Merancang aplikasi Paralel Processing yang diimplementasikan dengan penggunaan Computer-Unified-Device-Architecture (CUDA).

KOMPUTASI PARALEL UNTUK PENGOLAHAN PRESTASI AKADEMIK MAHASISWA

Struktur dasar komputer. Suatu sistem komputer terdiri dari lima unit struktur dasar, yaitu: Unit masukan (Input Unit) Unit kontrol (Control Unit)

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

SATUAN ACARA PERKULIAHAN MATA KULIAH PENGOLAHAN PARALEL (S1/ TEKNIK KOMPUTER)


CLUSTER COMPUTING. Oleh: Ahmad Syauqi Ahsan

KOMPUTASI PARALEL PADA APLIKASI PAYROLL

KONTRAK PEMBELAJARAN (KP) MATA KULIAH

PERANCANGAN DAN ANALISIS JUMLAH PROSESOR MENGGUNAKAN MODEL CUBE-CONNECTED DAN TREE-CONNECTED DALAM ALGORITMA PARALEL.

SATUAN ACARA PERKULIAHAN MATA KULIAH ALGORITMA PENGOLAHAN PARALEL (S1/ TEKNIK INFORMATIKA)

Prio Handoko, S.Kom., M.T.I.

Pengolahan Paralel PENGOLAHAN PARALEL. Ernastuti 1/58. Ernastuti

Pengolahan Paralel. Kuliah#2 TSK205 Sistem Digital - TA 2011/2012. Eko Didik Widianto. Teknik Sistem Komputer - Universitas Diponegoro

BAB 03 Bus & Sistem Interkoneksi

BAB II TINJAUAN PUSTAKA

INFRASTRUKTUR WAREHOUSE KATEGORI INFRASTRUKTUR DW

PENGOLAHAN PARALEL. Ernastuti

SISTEM OPERASI. Belajar SO?

ARSITEKTUR SISTEM. Alif Finandhita, S.Kom, M.T. Alif Finandhita, S.Kom, M.T 1

Oleh: Ahmad Syauqi Ahsan

Mikroposesor-berbasis Sistem PC

Penerapan Algoritma Divide and Conquer Dalam Komputasi Paralel

Cara Kerja Processor. Primo riveral. Abstrak. Pendahuluan.

INFRASTRUKTUR WAREHOUSE

BAB II JARINGAN INTERKONEKSI BANYAK TINGKAT. masukan dan keluaran yang disebut dengan inlet dan outlet. Fungsi utama dari sistem

Bab 3.Proses dan Penjadualan

SATUAN ACARA PERKULIAHAN

Sumber Daya Informatika Kesehatan. Surahyo Sumarsono

BAB IV PENGUJIAN DAN ANALISIS

Pertemuan Ke-3 Struktur Interkonesi (Bus System)

Perbedaan Kernell Linux dan Windows

1 Tinjau Ulang Sistem Komputer

Model Pemrograman Paralel

Pengantar Hardware: Sistem Bus pada Komputer. Hanif Fakhrurroja, MT

Mikroposesor-berbasis Sistem PC. Sistem Komputer Universitas Gunadarma

ANALISIS KOMPUTASI PARALEL DAN SERIAL PADA ALGORITMA MERGE SORT

MAKALAH SISTEM OPERASI Perbedaan Proses dan Thread. Disusun Oleh : NOVITA ANGGRAINI PUTRI

Introduction to Computer Architecture. Mata Kuliah Arsitektur Komputer Program Studi Sistem Informasi 2013/2014 STMIK Dumai -- Materi 01 --

Sistem Terdistribusi 2. Model arsitektur Terdistribusi

Struktur Sistem Komputer

Pendeteksian Kemacetan Lalu Lintas dengan Compute Unified Device Architecture (CUDA)

BAB II JARINGAN INTERKONEKSI BANYAK TINGKAT. selama bertahun tahun. Jaringan berkembang seiring dengan minimal tiga

PROSES. Sistem Terdistribusi

Thread. pada satu waktu. menjalankan banyak tugas/thread. yang sama

Aditya Wikan Mahastama

Perbedaan Anatara Thread dan Proses

BAB II LANDASAN TEORI

Konsep Organisasi dan Arsitektur Komputer (Pertemuan ke-2)

SISTEM OPERASI TERDISTRIBUSI

Bab I Pengenalan Sistem Operasi. Apa yang dimaksud Sistem Operasi?

7.1 Pendahuluan. 7.2 Central Processing Unit (CPU)

VIRTUAL PARALLEL ENVIRONMENT USING PVM CASE STUDY BUBBLE SORT ALGORITHM

Large Scale Networks: Switching & Forwarding (Week 5)

NOTASI UNTUK ALGORITMA PARALEL

Pengantar Sistem Terdistribusi

Penggunaan Algoritma Paralel dalam Optimasi Prosesor Multicore

Pengantar Teknologi Informasi A. Pertemuan 7. Prossesor & Memori

Ayi Purbasari

PROSESOR Register Memori A L U. Cache Memori Memori Utama Memori Sekunder C U

PENGANTAR TEKNOLOGI INFORMASI

Cache Memori (bagian 3)

SEKOLAH TINGGI MANAJEMEN INFORMATIKA & KOMPUTER JAKARTA STI&K SATUAN ACARA PERKULIAHAN

JARINGAN UNTUK MERGING

Organisasi dan Arsitektur Komputer : Perancangan Kinerja

Sistem Operasi Pertemuan 4 Thread, SMP & Microkernel. H u s n i Lab. Sistem Komputer & Jaringan Teknik Informatika Univ.

SINKRONISASI DATA DENGAN PEMROSESAN PARALEL MENGGUNAKAN MODEL PEMROGRAMAN MAPREDUCE

Struktur Sistem Komputer

Apa yang dimaksud dengan program?

PENGANTAR ORGANISASI DAN ARSITEKTUR KOMPUTER SISTEM INPUT OUTPUT

ARSITEKTUR TELEMATIKA DISTRIBUTED PROCESSING ( CLIENT SERVER )

CPU-Z. Nama : Diemas Egy P. Sekolah : SMKN 5 Malang

2-1. Apa itu Komputer?? HARDWARE 1 PERANGKAT SISTEM KOMPUTER. Erwin Harahap

GARIS-GARIS BESAR PROGRAM PENGAJARAN (GBPP)

Organisasi Sistem Komputer

PENGANTAR KOMPUTER & SOFTWARE I KONSEP DASAR ORGANISASI DAN ARSITEKTUR KOMPUTER

TUGAS SISTEM OPERASI

Transkripsi:

PEMROSESAN PARALEL

Kebutuhan pengolahan paralel Motivasi : Pengolahan data numerik dalam jumlah yang sangat besar. Kebutuhan akan ketersediaan data yang senantiasa up to date. Contoh : Simulasi sirkulasi global laut di Oregon State University. Lautan dibagi ke dalam 4096 daerah membentang dari timur ke barat, 1024 daerah membentang dari utara ke selatan dan 12 lapisan. Berarti terdapat sekitar 50 juta daerah berdimensi tiga. Satu iterasi mampu mensimulasikan sirkulasi lautan untuk jangka waktu 10 menit dan membutuhkan sekitar 30 milyar kalkulasi floating point. Para ahli kelautan ingin menggunakan model tersebut untuk mensimulasikan sirkulasi lautan untuk periode 1 tahun.

Pengolahan Paralel : Pengolahan informasi yang menekankan pada manipulasi data-data elemen secara simultan. Dimaksudkan untuk mempercepat komputasi dari sistem komputer dan menambah jumlah keluaran yang dapat dihasilkan dalam jangka waktu tertentu.

Paradigma Pengolahan Paralel 1. M. J. FLYNN Pengklasifikasian oleh Flynn, dikenal sebagai Taksonomi Flynn, membedakan komputer paralel ke dalam empat kelas berdasarkan konsep aliran data (data stream) dan aliran instruksi (instruction stream), sebagai : SISD, SIMD, MISD, MIMD.

1. SISD (Single Instruction stream, Single Data stream) Komputer tunggal yang mempunyai satu unit kontrol, satu unit prosesor dan satu unit memori Instruksi dilaksanakan secara berurut tetapi boleh juga overlap dalam tahapan eksekusi (overlap) Satu alur instruksi didecode untuk alur data tunggal Control Instructi Processor Data Memory on Stream Stream

2. SIMD (Single Instruction stream, Multiple Data stream) Komputer yang mempunyai beberapa unit prosesor di bawah satu supervisi satu unit common control. Setiap prosesor menerima instruksi yang sama dari unit kontrol, tetapi beroperasi pada data yang berbeda. Processor Data Stream Shared Memory Control Instruction Stream Processor Data Stream or Processor Data Stream Interconnection Network

3. MISD (Multiple Instruction stream, Single Data stream) Sampai saat ini struktur ini masih merupakan struktur teoritis dan belum ada komputer dengan model ini. Control 1 Instruction Processor 1 Stream Control 2 Instruction Processor 2 Stream... Control N Instruction Stream... Processor N Data Stream Memory

4. MIMD (Multiple Instruction stream, Multiple Data stream) Organisasi komputer yang memiliki kemampuan untuk memproses beberapa program dalam waktu yang sama. Pada umumnya multiprosesor dan multikomputer termasuk dalam kategori ini. Control 1 Instruction Processor 1 Stream Control 2 Instruction Processor 2 Stream... Control N Instruction Stream... Processor N Data Stream Data Stream Data Stream Shared Memory or Interconnection Network

MIMD dibagi menjadi 2 grup: Multiprocessor yang menggunakan memory bersama. Multicomputer.

Multiprosessor Sistem multiprocessor adalah suatu komputer yang mempunyai lebih dari satu CPU pada motherboardnya. Jika sistem operasi dibangun untuk memanfaatkan kelebihan ini, maka SO tersebut dapat menjalankan proses-proses berbeda (atau thread-thread berbeda yang dimiliki oleh proses yang sama) pada CPU-CPU berbeda. P P Shared Memory P Processors are connected with memory via the memory bus (which is fast), or switches P

Shared Memory Multiprocessors 3 Model Shared Memory Multiprocessors: Uniform Memory Access (UMA) Nonuniform Memory Access (NUMA) Cache Only Memory Architecture (COMA) Yang membedakan dari ketiga model diatas adalah bagaimana memori dan pheripheral device di shared atau didistribusikan

Uniform Memory Access (UMA) Terlihat bahwa memori dibagi secara merata ke semua prosesor Semua prosesor mempunyai waktu akses yang sama ke semua word memori Setiap prosesor menggunakan private cache Dan untuk peripheral juga dishare dengan cara yang sama UMA cocok untuk general purpose dan aplikasi time sharing oleh multiple user UMA dapat digunakan untuk meningkatkan ekseskusi dari program tunggal yang besar pada aplikasi time-critical

Non Uniform Memory Access (NUMA) NUMA Multiprocessor adalah sebuah sistem shared memory dimana waktu aksesnya bervariasi ke lokasi memori word

Shared memory yang secara fisik didistribusikan ke semua processor disebut lokal memori dan kumpulan dari lokal memori membentuk ruang alamat global yang dapat diakses oleh semua processor NUMA dapat mengakses lokal memori lebih cepat dengan lokal processor, sedangkan akses ke memori yang jauh diberikan ke proc. Lain yang kapasitasnya lebih besar untuk ditambah delay melalui interkoneksi jaringan Disamping distribusi memori, secara umum shared memory dapat ditambahkan ke multiprosessror syste,, dalam hal ini ada tiga pola akses memory, dimana yang tgerdepat adalah akses ke lokal memori, akses ke global memori dan yang paling lambat adalah akses dari memory yang jauh (hierarchical Cluster Model (Chedar System))

Cache Only Memory Access (COMA) COMA adalah multiprocessor yang hanya menggunakan cache memory COMA dapat ditemukan pada NUMA machines, dimana pendistribusioan main memory dirubah ke cache. Disini tidak ada hirarki memori pada setiap node computer Semua cache berasal dari ruang alamat global. Akses ke cache jauh dibantu oleh direktori cache yang didistribusikan. Tergantung kepada interkoneksi jaringan yang digunakan, terkadang direktori digunakan untuk membantu penempatan copian dari blok-blok cache Penempatan awak data tidak penting karena data akan menempati tempat dimana data tersebut akan digunakan

Multicomputer Sistem Multicomputer Multicomputer dapat dianggap berupa suatu komputer NUMA loosely atau cluster yang tightly coupled. Multicomputer biasanya digunakan ketika diperlukan power komputasi tinggi tetapi lingkungan mempunyai ruang fisik atau tenaga listrik terbatas. P M P M Interconnection Network P M Processors have private address space. Interprocess communication via message passing only In clusters, computers are connected via LAN P M

Major Issues in MIMD 1. Processor-memory Interconnection 2. Cache Coherence 3. Synchronization Support 4. Scalability Issue 5. Distributed Shared Memory

Sistem Multicore CPU-CPU Intel dari era Pentium 4 terbaru (Northwood dan Prescott) menerapkan suatu teknologi bernama Hyper-threading yang memungkinkan lebih dari satu thread (biasanya dua) untuk berjalan pada CPU yang sama. Produk processor yang lebih baru seperti Sun UltraSPARC T1, AMD Athlon 64 X2, AMD Athlon FX, AMD Opteron, Intel Pentium D, Intel Core, Intel Core 2 dan Intel Xeon menyertakan banyak core processor juga untuk meningkatkan jumlah thread yang dapat dieksekusi.

A Taxonomy of Parallel Computers Parallel Architectures SISD SIMD MISD MIMD Vector Array Multiprocessors Multicomputers UMA COMA NUMA MPP COW Bus Switched CC- NUMA NC- NUMA Grid Cube Shared Memory Message Passing

Keterangan: UMA NUMA COMA MPP COW CC-NUMA NC-NUMA : Uniform Memory Access : Non Uniform Memory Access : Cache Only Memory Access : Massively Parallel Processor : Cluster of Workstations : Cache Coherent NUMA : Non Cache NUMA

Terminologi Pengolahan Paralel : Pengolahan informasi yang ditekankan pada manipulasi elemen data yang dimiliki oleh satu atau lebih dari satu proses secara bersamaan dalam rangka menyelesaikan sebuah problem. Komputer Paralel : Komputer multi-prosesor dengan kemampuan melakukan pengolahan paralel.

Supercomputer : sebuah general-purpose computer yang mampu menyelesaikan problem dengan kecepatan komputasi sangat tinggi. Semua superkomputer kontemporer adalah komputer paralel. Beberapa di antaranya memiliki prosesor yang sangat kuat dalam jumlah yang relatif sedikit, sementara yang lainnya dibangun oleh mikroprosesor dalam jumlah yang cukup besar. Throughput : banyaknya keluaran yang dihasilkan per unit waktu

Semakin banyak prosesor yang digunakan semakin tinggi biaya untuk memperoleh solusi sebuah problem. Hal ini terjadi karena perlu dipertimbangkan biaya pengadaan prosesor dan perawatannya. Jumlah prosesor yang tergantung dari n, n=ukuran problem, dinyatakan sebagai p(n). Kadang-kadang jumlah prosesor tidak tergantung pada ukuran problem.

Contoh SIMD: Perhatikan n bilangan x 1,x 2,,x n yang akan dijumlahkan. Dengan menggunakan komputer tree-connected SIMD dengan log n level dan n / 2 daun, dibutuhkan pohon dengan ukuran (n-1) atau p(n) = n -1. Ilustrasi untuk n = 8 P 1 P 2 P 3 P 4 P 5 P 6 P 7 INPUT x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8

Interconnection Networks Uses of interconnection networks Connect processors to shared memory Connect processors to each other Interconnection media types Shared medium Switched medium

Network topology: Static Networks Dynamic Networks Static networks provide fixed connections between nodes (node can be a processing unit, a memory module, I/O Module). Links between nodes are unchangeable and cannot be easily reconfigured. Dynamic networks provide reconfigurable connections between nodes. The switch box is the basic component of the dynamic network. The connections between nodes are established by the setting of a set of interconnected network.

Most common networks

Topologi Jaringan Interkoneksi MIMD Ada beberapa topologi dasar: Ring Mesh Tree Hypercube

Topologi Ring Apabila komunikasinya dua arah disepanjang ring, maka jarak maksimum antara dua simpul pada ring dengan n simpul adalah n/2 Paket-paket pesan berukuran tetap digunakan dengan melibatkan alamat tujuan yang diinginkan Topologi ini cocok untuk jumlah prosesor yang relatif sedikit dengan komunikasi data minimal

Topologi Mesh Bentuk mesh yang paling sederhana adalah array dua dimensi tempat masing-masing simpul saling terhubung dengan keempat tetangganya. Diameter komunikasi sebuah mesh yang sederhana adalah 2(n-1) Koneksi wraparround pada bagianbagian ujung akan mengurangi ukuran diameter menjadi 2(n/s) Topologi mesh ini cocok untuk hal-hal yang berkaitan dengan algoritma yang berorientasi matriks

Topologi Tree Jaringan topologi tree digunakan untuk mendukung algoritma searching dan sorting. Top node: root Four nodes at the bottom : leaf (or terminal) nodes The rest of the nodes are called intermediate nodes.

Topologi Hypercube Topologi ini menggunakan N=2 n prosesor yang disusun dalam sebuah kubus berdimensi n, dimana setiap simpul mempunyai n = log 2 N link bidirectional dengan simpul yang berdekatan Diameter komunikasi hiperkubus seperti itu sama dengan n