Game NIM with Reinforcement Learning ABSTRAK

dokumen-dokumen yang mirip
GAME CATUR JAWA WITH REINFORCEMENT LEARNING

Pembuatan Game NIM menggunakan Alpha-beta Pruning ABSTRAK

Kecerdasan Buatan (Artificial Intelligence) Muhammad Dahria

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

AKUISISI PENGETAHUAN MENGGUNAKAN MULTIPLE CLASSIFICATION RIPPLE DOWN RULES (MCRDR)

Sekilas Tentang Kecerdasan Buatan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. (intelligent system) adalah sistem yang dibangun dengan menggunakan

ARTIFICIAL INTELLIGENCE

BAB 3 ANALISIS DAN PERANCANGAN

Pengenalan Kecerdasan Buatan (KB)

BAB 1 PENGENALAN KECERDASAN BUATAN 2 Dengan definisi ini, Kecerdasan Buatan menawarkan baik media maupun uji teori kecerdasan. Teori-teori ini dapat d

Jurnal Mahajana Informasi, Vol.1 No 2, 2016 e-issn: SIMULASI PERGERAKAN CHESS KNIGHT DALAM PAPAN CATUR

Reinforcement Learning Paradigma baru dalam Machine Learning

Perbandingan Penerapan Algoritma Minimax Dengan Algoritma Alpha-Beta Pruning Pada Permainan Othello

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Artificial intelligence

SISTEM PAKAR IDENTIFIKASI KENDARAAN MENGGUNAKAN METODE INFERENSI

Combinatorial Game Theory, Game Tree, dan Intelegensia Buatan

H. A. Simon [1987] : Rich and Knight [1991]:

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI ALGORITMA STOCHASTIC HILL CLIMBING PADA PERMAINAN MASTERMIND

BAB I PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENGANTAR KECERDASAN BUATAN

SISTEM PAKAR ANALISIS PENYAKIT LUPUS ERITEMATOSIS SISTEMIK PADA IBU HAMIL MENGGUNAKAN METODE FORWARD CHAINING

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB I PENGENALAN INTELEGENSI BUATAN

BAB 1 PENDAHULUAN. Hal 1. 1 Dan W. Patterson, Introduction to Artificial Intelligence and Expert System, Prentice Hall, 1990,

Algoritma Greedy untuk Pengambilan Keputusan dalam Permainan Kartu Hearts

KECERDASAN BUATAN Artificial intelligence TRI WAHYUDI TIPA 15

ARTIFICIAL INTELLIGENCE / AI (Kecerdasan Buatan)

PERANCANGAN SYSTEM PAKAR GENERIC MENGGUNAKAN BINARY TREE

Rancangan Permainan Othello Berbasis Android Menggunakan Algoritma Depth-First Search

SISTEM PAKAR DIAGNOSIS JENIS JERAWAT PADA WAJAH MENGGUNAKAN METODE K-MEANS CLUSTERING

BAB 3 METODOLOGI 3.1. Analisis Kebutuhan dan Masalah Analisis Kebutuhan

BAB 1 PENDAHULUAN. Dengan pesatnya perkembangan teknologi dalam bidang IT (Information

Gambar 3.2 Struktur Hierarki Game Spinman

Artificial Intelligence. (Teknik dan Aplikasinya)

BAB I PENDAHULUAN. Dalam beberapa tahun terakhir Artificial Intelligence (AI) atau kecerdasan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

RANCANGAN SISTEM PAKAR DENGAN METODE FORWARD CHAINING DAN HETEROASSOCOATIVE MEMORY UNTUK MENDETEKSI TINGKAT DEPRESI SESEORANG

BAB I PENDAHULUAN. World Wide Web saat ini menjadi trend dunia. Perkembangan web site

PENGEMBANGAN SUMBER BELAJAR MATAKULIAH SISTEM CERDAS KOMPETENSI JARINGAN SYARAF TIRUAN

ANALISIS ALGORITMA MINIMAX DENGAN OPTIMASI ALPHA BETA PRUNIGN PADA PERMAINAN FIVE IN ROW

Seminar Tugas Akhir. Perancangan Sistem Pakar Fuzzy Untuk Pengenalan Dini Potensi Terserang Stroke Berbasis Web

Rancang Bangun Sistem Pakar untuk Diagnosis Penyakit Mulut dan Gigi dengan Metode Fuzzy Logic

Implementasi Artificial Intelligence pada game Defender of Metal City dengan menggunakan Finite State Machine

Artificial Intelegence. Eka Yuniar

ALGORITMA MINIMAX DALAM PERMAINAN CHECKERS

PEMANFAATAN TEKNOLOGI KNOWLEDGE-BASED EXPERT SYSTEM UNTUK MENGIDENTIFIKASI JENIS ANGGREK DENGAN MENGGUNAKAN BAHASA PEMROGRAMAN JAVA

UKDW BAB 1 PENDAHULUAN Latar Belakang

Sistem Pakar Untuk Mendeteksi Kerusakan Pada Sepeda Motor 4-tak Dengan Menggunakan Metode Backward Chaining

MODIFIKASI METODE BACKTRACKING UNTUK MEMBANTU MENCARI PENYELESAIAN PERMAINAN PEG SOLITAIRE

Seminar Nasional Aplikasi Teknologi Informasi 2004 Yogyakarta, 19 Juni 2004

ABSTRAK. Kata kunci: Artifficial Intelligence (AI), Finite State Machine (FSM), video game

BAB 1 PENDAHULUAN Latar Belakang

Kecerdasan Buatan B Artificial Inttelligent CEH3I3 PRODI SISTEM KOMPUTER UNIVERSITAS TELKOM BANDUNG 2017

AI_Pengantar AI PENGANTAR KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)

BAB II LANDASAN TEORI

SISTEM GERAK PARKIR MOBIL OTOMATIS DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN

Lesson-1. Introduction to Artificial Intelligence

BAB I PENDAHULUAN. sangat diandalkan selama kurang lebih 70 tahun lamanya (Mahfudz, 2013:18).

KECERDASAN BUATAN ARTIFICIAL INTELLIGENCE. Copyright: Anik Handayani FT-UM

MANAGEMENT INFORMATION SYSTEMS Raymond McLeod, Jr. and George Schell

BAB 1 PENDAHULUAN 1.1 Latar Belakang

mental kita begitu penting bagi kehidupan

PENERAPAN SISTEM INFERENSI FUZZY DALAM MENENTUKAN PRIORITAS HEURISTIK PADA APLIKASI GAME FIGHTING SEDERHANA

ALGORITMA GENETIK SEBAGAI FUNGSI PRUNING ALGORITMA MINIMAX PADA PERMAINAN TRIPLE TRIAD CARD.

OPERASI LOGIKA PADA GENERAL TREE MENGGUNAKAN FUNGSI REKURSIF

BAB 1 PENDAHULUAN. Keunggulan manusia dibanding makhluk lainnya terletak pada kecerdasannya.

BAB I PENDAHULUAN. dilakukan untuk kesenangan dan kadang-kadang digunakan sebagai sarana

UKDW. Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. Perkembangan jaman semenjak abad ke-20 ditandai dengan bertumbuhnya

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

ek SIPIL MESIN ARSITEKTUR ELEKTRO

REPRESENTASI RULE DENGAN TEKNIK INFERENSI FORWARD CHAINING UNTUK SISTEM PAKAR PEMELIHARAAN BIBIT IKAN LELE

PERANCANGA SISTEM PAKAR PENDETEKSI GANGGUAN KEHAMILAN ABSTRAK

PEMBUATAN GAME CONGKLAK DENGAN ALGORITMA ALPHA BETA PRUNNING BERBASIS ANDROID NASKAH PUBLIKASI. diajukan oleh Nofarianto Sihite

PERANCANGAN APLIKASI PENCARIAN (SEARCHING) FILE DENGAN MENGGUNAKAN METODE BEST FIRST SEARCH JUNA ESKA,

Implementasi Pohon Keputusan untuk Membangun Jalan Cerita pada Game Engine Unity

RANCANG BANGUN TOOL UNTUK JARINGAN SYARAF TIRUAN (JST) MODEL PERCEPTRON

Algoritma A* untuk AI Path Finding bagi NPC

BAB I PENDAHULUAN. orang tua yang dapat menghambat pengetahuan anak. Masalah tersebut akan

Penerapan Pohon dalam Algoritma Expectiminimax untuk Permainan Stokastik

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

BAB II LANDASAN TEORI

PENDAHULUAN 1. Latar Belakang 2. Rumusan Masalah 3. Tujuan Dan Manfaat

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2007/2008

Penggunaan Mamdani Fuzzy Expert System untuk Mengevaluasi Kinerja Dosen

KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE) By :Suthami A.

Penerapan Pohon Untuk Menyelesaikan Masalah Labirin

Implementasi Algoritma Negascout Untuk Permainan Checkers

KECERDASAN BUATAN Artificial Intelligence (AI)

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

PENGEMBANGAN SISTEM PAKAR DIAGNOSIS PENYAKIT DAN HAMA PADA TANAMAN SEMANGKA BERBASIS ANDROID

PEMANFATAN TEOREMA BAYES DALAM PENENTUAN PENYAKIT THT

Muhammad Yudin Ritonga ( )

PEMBUATAN SISTEM PAKAR UNTUK TES KEPRIBADIAN MENGGUNAKAN METODE INVENTORI. Naskah Publikasi

Transkripsi:

Game NIM with Reinforcement Learning Kresna Ade Putra Teknik Informatika Politeknik Elekronika Negeri Surabaya Institut Teknologi Sepuluh Nopember Surabaya Email: kresnoado@ymail.com, ABSTRAK Kecerdasan buatan (AI) dapat diartikan sebagai suatu cabang ilmu yang memodelkan proses proses berfikir manusia dan mendesain mesin agar dapat menirukan tidakan dan prilaku manusia[1]. Tetapi pada kenyataannya dari sekian banyak teori Artificial Intelegent yang ada, Mulai dari teori Graph, teori Tree, teori State, knowledge based system, hingga sistem pakar tidak satupun dari teori tersebut sesuai dengan definisi dari AI. Kenyataan inilah yang mendasari para ilmuwan untuk mulai meneliti tentang machine learning. Salah satu tipe dari machine learning adalah reinforcement learning. Reinforcement learning berangkat dari bagaimana membuat mesin dapat menjadi pintar setelah berinteraksi dengan lingkungannya sebagaimana tingkah laku manusia. Teori inilah yang sanggup mewakili definisi dari AI. Jika saja teori ini dapat dimodelkan dan ditransformasikan dalam bentuk computational system, maka akan terjadi perubahan yang luar biasa pada computational learning theory. Kata Kunci: Game NIM, Artificial Intelegent, Reinforcement Learning ABSTRACT Aritficial Intelligent (AI) can be interpreted as an area of science that convert the human process of thinking and then design the machine so that the machine can imitate human behaviour of thinking. But from so much Artificial Intelegent theory, start from Graph theory, Tree theory, State theory, knowledge based system, till expert system, none of those theory is true according to the meaning of AI itselves. Those theory just depending on the merger of Tree theory and probability theory to take some decision, like expert system does. This fact then constitutoing the scientist to start to learn about machine learning. One of machine learning theory is reinforcement learning. These theory meaning is how to make machine became smart after it interact with it s environment, as human did.. This theory is competent with the definition of AI. Just if these theory can be transformed into computational system, hence there will be a huge change in computational learning theory. Keywords: Game NIM, Artificial Intelegent, Reinforcement Learning

1. PENDAHULUAN 1.1 Latar Belakang Pada tahun 1956, John McCarthy, seorang professor dari MIT, mulai memperkenalkan bidang baru secara spesifik yang diberi nama Aritficial Intelligent (AI). Beliau mendefinisikan bidang tersebut sebagai bidang yang memodelkan proses proses berfikir manusia dan mendesain mesin agar dapat menirukan tidakan dan prilaku manusia. Kemudian AI mulai berkembang pesat. Metode metode AI pun bermunculan. Mulai dari teori Graph, teori Tree, teori State, knowledge based system, hingga sistem pakar yang berbasis probabilitas. Namun teori teori tersebut sebenarnya tidaklah sesuai dengan prinsip AI yang dikemukakan oleh John McCarthy. Teori teori tersebut tidak bertumpu pada konsep learning yang merupakan dasar teori seorang manusia dapat berfikir. Teori teori tersebut hanya mengandalkan gabungan antara teori tree dan teori probabilitas untuk mengambil suatu keputusan. Kenyataan inilah yang mendasari para ilmuwan untuk mulai meneliti tentang sistem learning yang kemudian dikenal dengan machine learning. Dalam penelitiannya machine learning dibedakan menjadi tiga, yakni supervised learning, unsupervised learning, dan reinforcement learning. Supervised learning sangat bertumpu pada contoh data yang ada. Sedangkan unsupervised learning tidak memerlukan contoh data. Ketika menjumpai suatu masalah maka sistem harus dapat menjawab sendiri masalah tersebut. Kedua teori tersebut pada awalnya diyakini sebagai teori-teori learning yang dapat mengarah untuk bisa mengembangkan suatu learning machine (mesin/program yang dapat belajar), namun ternyata hanya berhenti pada learned machine (mesin/program yang diajari), suatu machine yang pintar setelah diajari, bukan machine yang pintar setelah belajar. Kemudian para ilmuwan terus menggali konsep konsep seputar learning teori. Hingga akhirnya didapat teori reinforcement learning yang berangkat dari bagaimana membuat mesin dapat menjadi pintar setelah berinteraksi dengan lingkungannya sebagaimana tingkah laku manusia. Teori inilah yang sanggup mewakili definisi awal dari AI yang didefinisikan oleh John McCarthy. Teori inilah yang dapat disebut The real human artificial intelligent. 1.2 TUJUAN Tujuan proyek akhir ini adalah untuk membuat komputer (CPU) dapat bermain dengan manusia dalam permainan Game NIM dengan menggunakan teori reinforcement learning. 1.3 PERMASALAHAN Permasalahan dalam pengerjaan proyek akhir ini adalah bagaimana mengimplementasikan teori reinforcement learning ke dalam Game NIM. 1.4 BATASAN MASALAH Pada pengerjaan proyek akhir ini digunakan batasan batasan sebagai berikut : a. Dibangun dengan menggunakan bahasa pemrogramman JAVA. b. Menggunakan gerakan Greedy Move dalam perhitungan value function-nya. 2. TEORI PENUNJANG 2.1 Teori Game Dalam dunia modern ini, penggunaan teknologi untuk menunjang kegiatan manusia semakin banyak dan sangat berkembang. Salah satu bentuk kebutuhan pokok manusia adalah hiburan dan sebagai salah satu wujudnya adalah berbagai macam permainan. Ada berbagai macam permainan yang dapat kita temukan dewasa ini. Namun pernahkah kita berfikir apakah sebenarnya yang dimaksud dengan permainan atau yang lazim kita sebut game itu. Sesuatu dapat dikatakan sebuah game jika memiliki ciri ciri umum yang ada pada game, yaitu : Memiliki 2 pemain. Kesempatan bermain bergantian. Kerugian seorang pemain adalah keuntungan bagi pemain lain. Pemain mengetahui seluruh informasi state dari game. Tidak mengandung probabilistik seperti dadu. 2.2 Game NIM Game NIM adalah sebuah game sederhana yang diawali dengan serangkaian batang dengan jumlah tertentu. Kemudian pemain harus memecah serangkaian batang tersebut menjadi dua kumpulan dimana jumlah batang di setiap kumpulan tidak boleh sama 2

dan tidak boleh kosong. Contoh ilustrasi Game NIM dapat dilihat pada Gambar 2.1. Gambar 2.1 Ilustrasi Game NIM 2.3 Artificial Intelligence (AI) Kecerdasan Buatan (dalam bahasa inggris: Artificial Intelligence atau AI) didefinisikan sebagai kecerdasan yang ditunjukkan oleh suatu entitas buatan. Sistem seperti ini umumnya dianggap komputer. Kecerdasan diciptakan dan dimasukkan ke dalam suatu mesin (komputer) agar dapat melakukan pekerjaan seperti yang dapat dilakukan manusia. Beberapa macam bidang yang menggunakan kecerdasan buatan antara lain sistem pakar, permainan komputer(games), logika fuzzy, jaringan saraf tiruan dan robotika. 2.4 Reinforcement Learning (RL) Reinforcement Learning berangkat dari bagaimana membuat mesin dapat menjadi pintar setelah berinteraksi dengan lingkungannya sebagaimana tingkah laku manusia. Sehingga reinforcement learning dapat dijabarkan sebagai suatu proses yang melibatkan suatu agen yang berinteraksi dengan suatu lingkungan (Environment). Agen harus mempelajari tentang lingkungan tersebut, dan harus pula menemukan bagaimana cara bertindak yang optimal dalam lingkungan tersebut. Diluar agen dan lingkungan reinforcement learning memiliki empat subelement yaitu : kebijakan(policy), fungsi penghargaan (reward function), fungsi nilai (value function), dan, satu subelement yang bersifat optional, yakni model dari lingkungan. Dalam game NIM berbagai element dari reinforcement learning diterapkan ke dalam pohon n-ary yang terbentuk. Pada setiap cabang akan memiliki nilai dan perhitungan yang bertujuan memaksimalkan nilai dari setiap cabang tersebut. Sedangkan value function sendiri adalah total dari reward yang didapat. Dalam rumus matematika reward dapat diasumsikan sebagai suatu inisialisasi sedangkan value function adalah nilai yang harus dihitung. Berikut rumus matematika dari inisialisasi(reward) dan perhitungan value function. 2.1 Rumus Matematika Inisialisasi Komputer menang à V(s) = 1 (1) Komputer kalah à V(s) = 0 (2) State Lainnya à V(s) = 0.5 (3) 2.2 Rumus Matematika Value Function V(s) = V(s) + α [ V (s) V(s) ] (4) Keterangan : V(s) = Value Function α = Konstanta (di set = 0.1) V (s) = Value Function dari State dibawahnya Dengan kata lain pada setiap cabang dari pohon n-ary yang berjumlah n terdapat suatu nilai yang bernama value function. Nilai inilah yang kemudian di inisialisasi berdasarkan kondisi menang-kalah. Nilai ini pula lah yang nantinya akan dilakukan perhitungan sesuai rumus yang ada dan jumlah iterasi yang diinginkan. 3. METODOLOGI Bab ini membahas perancangan dan pembuatan Game NIM with reinforcement learning, yang secara garis besar meliputi perancangan proses learning, perangcangan sistem permainan Game NIM, dan implementasi learning yang sudah ada ke dalam sistem permainan Game NIM. Aliran proses Game NIM with reinforcement learning dapat dilihat pada Gambar 1. Gambar 1: Aliran proses Game NIM with reinforcement learning 3

Dari aliran proses di atas dapat dilihat bahwa sistem ini memiliki 2 aliran proses yang saling berhubungan, yaitu aliran proses learning dan aliran proses playing. Dalam perancangannya kedua aliran ini memiliki proses yang berbeda meskipun memiliki beberapa kesamaan. Untuk mempermudah penjelasan, bab ini akan memiliki tiga sub bab yaitu : 1. Perancangan dan pembuatan sistem learning dengan reinforcement learning. Pada proses ini akan dirancang sebuah sistem yang dapat mengimplementasikan rumus rumus reinforcement learning untuk Game NIM, Sub bab ini sendiri akan terbagi menjadi beberapa bagian, yaitu : Perancangan dan pembuatan pohon Game NIM. Dalam proses ini akan dibuat suatu pohon n-ary yang dalam artian lain pohon yang terbentuk memiliki jumlah turunan yang tidak pasti yang kemudian dilambangkan dengan nilai n. Sebagaimana sebuah pohon maka suatu node dari pohon tersebut haruslah dapat mengenali cabang - cabangnya dan setiap cabang cabang tersebut juga harus dapat mengenali cabang miliknya sendiri hingga berakhir pada cabang yang sudah tidak memiliki cabang lagi. Proses Inisialisasi. Seperti yang telah dijelaskan pada bab sebelumnya, reinforcement learning mengenal sistem reward and punisment. Pada penerapannya dalam Game NIM setiap state atau node yang menghasilkan kemenangan bagi CPU (AI) maka akan diberi nilai satu (1.0) dan yang menghasilkan kekalahan bagi CPU (AI) akan mendapat nilai nol (0.0). Nilai 0.5 berlaku untuk state / node lainnya yang masih memiliki turunan dibawahnya. Proses learning sesuai iterasi.. Dalam proses ini dilakukan perhitungan value function pada setiap iterasi dan proses ini berlangsung sesuai dengan jumlah iterasi yang diinginkan oelh user. 2. Perancangan dan pembuatan sistem permainan NIM. Pada proses ini dilakukan perancangan dan pembuatan permainan Game NIM dengan menggunakan hasil learning yang telah dilakukan sebagai artificial intelligent (AI). Dalam proses learning sistem perlu mengetahui empat attribut yakni jumlah iterasi, konstanta learning, pemain dengan giliran pertama, dan jumlah batang NIM. Sedangkan untuk sistem permainan NIM jumlah iterasi tidak diperlukan, sehingga user hanya perlu menginputkan jumlah batang yang ingin dimainkan, siapa yang bergerak terlebih dahulu, dan konstanta learning untuk melakukan learning otomatis sebanyak satu kali iterasi pada saat satu kali permainan selesai. 4. ANALISA Pengujian learning pada Tiga Iterasi yang berbeda dengan jumlah batang Tujuh. Dilakukan learning dengan iterasi yang berbeda namun menggunakan konstanta yang sama yakni 0.1 dan jumlah batang yang sama yakni 7 serta giliran pertama bergerak adalah CPU. Dan hasil yang didapat adalah : Table 4.1 Hasil learning dengan Tiga Iterasi yang berbeda 4

5. PENUTUP A. Kesimpulan Dari hasil analisa program dapat diambil beberapa kesimpulan sebagai berikut : 1. Sistem yang dibuat memungkinkan manusia untuk bermain Game NIM dengan komputer. 2. Sistem yang dibuat memungkinkan user memilih jumlah batang yang dinamis tanpa dibatasi selama jumlah batang lebih dari 3 (tiga). 3. Semakin banyak learning dilakukan, maka sistem akan semakin pintar karena state yang mengarah pada kemenangan bagi AI akan memiliki nilai yang semakin mendekati 1 (Satu) hingga akhirnya bernilai satu. B. Saran Dalam pembuatan Game NIM with reinforcement learning terdapat banyak sekali kekurangan yang karena keterbatasan waktu, biaya serta pikiran, tidak dapat dilakukan. Maka untuk tahap pengembangan selanjutnya, ada beberapa hal yang penulis inginkan untuk diperbaiki diantaranya: 1. Program ini dirancang dan dikembangkan dengan menggunakan Bahasa pemrogramman JAVA sehingga pohon game NIM yang diperlukan dibentuk menggunakan obyek yang merupakan keunggulan JAVA. Untuk selanjutnya dapat digunakan Bahasa pemrogramman lainnya seperti misalnya Bahasa C yang menggunakan struct untuk membuat suatu tree (pohon). Lalu dapat dibandingkan kecepatan programnya, mana yang lebih cepat melakukan reinforcement learning JAVA dengan obyeknya atau C dengan struct dan pionter nya. 2. Penulis yakin masih banyak kekurangan disana-sini, oleh karenanya pengembangan selanjutnya sangatlah diperlukan. Daftar Pustaka [1]Sri Kusumadewi, Artificial Intelligence (Teknik dan Aplikasinya), edisi I, penerbit Graha Ilmu, Yogya, 2003. [2]Ali Ridho Barakbah, Reinforcement learning paradigma baru dalam machine learning. [3]Tom Dietterich, Reinforcement learning [4]Richard S. Sutton dan Andrew G. Barto, reinforcement learning : an introduction, MIT press, Cambridge, 1998 [5]Ali Ridho Barakbah, reinforcement learning practice [6]Ali Ridho Barakbah, Game Theory [7]Sri Hartati, Herry Suharto, Soesilo Wijono, Pemrograman GUI Swing Java, Penerbit ANDI, Yogyakarta, 2006 [8]Rangsang Purnama, Pemrograman GUI menggunakan JAVA, Penerbit Prestasi Pustaka Publisher, Surabaya, 2007 [9]Ali Ridho Barakbah, Introduction to mechine learning 5