Kontrol Optimum. Syarat Transversalitas, Current-valued Hamiltonian. Toni Bakhtiar. Departemen Matematika IPB. Februari 2014

Kontrol Optimum Syarat Transversalitas, Current-valued Hamiltonian Toni Bakhtiar Departemen Matematika IPB Februari 2014 tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 1 / 37

Outline Syarat transversalitas 1 Masalah waktu terminal tetap (fixed) 2 Masalah waktu terminal bebas (free) MKO dengan diskonto 1 Current-valued hamiltonian 2 Model konsumsi optimum Review: Solusi SPD tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 2 / 37

Prinsip Maksimum Pontryagin MKO: opt J = S(x(T ), T ) + T f (x(t), u(t), t) dt 0 s.t. ẋ(t) = g(x(t), u(t), t) x(0) = x 0, T dan x(t ) belum ditentukan. Hamiltonian: H(x, u, p, t) := f (x, u, t) + pg(x, u, t). Syarat perlu optimalitas: 1 H u = 0, ṗ = H x, ẋ = H p, 2 Syarat batas terpenuhi: x(0) = x 0. 3 Syarat transversalitas terpenuhi: (S x p)δx T + (H + S t )δt T = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 3 / 37

Syarat Transversalitas Masalah Waktu Terminal Tetap 1 Jika T fixed dan x(t ) fixed, yaitu x(t ) = x T, berakibat δt = 0 dan δx(t ) = 0, maka STV vanished. 2 Jika T fixed dan x(t ) free, berakibat δt = 0 dan δx(t ) = 0, maka STV tereduksi menjadi (S x p T = 0. Selanjutnya, jika S 0 maka STV berubah menjadi p(t ) = 0. 3 Jika T fixed dan x(t ) terletak pada manifold M, yaitu M(x(T ), T ) = 0 atau M(x(t), t) t=t = 0, maka STV menjadi (R x p T = 0, dengan R(x(t), t) = S(x(t), t) + µm(x(t), t) untuk suatu konstanta µ. Selanjutnya STV dapat ditulis p(t ) = S x (T ) + µm x (T ). (lihat Seierstad & Sydsæter (1987), pp. 177) tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 4 / 37

Syarat Transversalitas Problem Selesaikan MKO berikut: Problem Selesaikan MKO berikut: max J = 1 0 (x u2 ) dt s.t. ẋ = u x(0) = 2 x(1) bebas. min J = 1 2 [x(1)]2 + 1 1 0 2 u2 dt s.t. ẋ = u x(0) = 1 x(1) bebas. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 5 / 37

Syarat Transversalitas Problem Selesaikan MKO berikut: Problem Selesaikan MKO berikut: max J = 1 (x + u) dt 0 s.t. ẋ = 1 u 2 x(0) = 1 x(1) bebas. max J = 1 0 (ux u2 x 2 ) dt s.t. ẋ = x + u x(0) = 1 x(1) bebas. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 6 / 37

Solution Definisikan f (x, u) := ux u 2 x 2. diperoleh fungsi hamilton: Syarat perlu optimalitas: H := f + pg H := (ux u 2 x 2 ) + p(x + u). Syarat H u = 0 memberikan Syarat ṗ = H x memberikan x 2u + p = 0 u = 1 2 (x + p). ṗ = u + 2x p = 3 2 x 3 2 p x = 2 3 ṗ + p. Syarat ẋ = H p memberikan ẋ = x + u = x + 1 2 (x + p) = 3 2 x + 1 2 p. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 7 / 37

Solution Dari PD di atas: sehingga p = 3 2 ẋ 3 2 ṗ = 3 2 ( 3 2 x + 1 2 p) 3 2 ṗ = 3 2 ( 3 2 ( 2 3 ṗ + p) + 1 2 p) 3 2 ṗ = 3p p 3p = 0, (PD homogen orde-2) p(t) = Ae 3t + Be 3t, x(t) = (1 + 2 3 3)Ae 3t + (1 2 3 3)Be 3t, u(t) = (1 + 1 3 3)Ae 3t + (1 1 3 3)Be 3t. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 8 / 37

Solution Karena x(0) = 1 maka B = 7A + 4 3A 2 3 3, sehingga p(t) = 3t Ae + (7A + 4 3A 2 3 3)e 3t. Karena x(1) bebas maka p(1) = 0, sehingga 3 Ae + (7A + 4 3A 2 3 3)e 3 = 0 A 0.141 B 4.502. Dengan demikian, p (t) = 3t 0.141e 4.502e 3t, x (t) = 3t 0.304e + 0.696e 3t, u (t) = 3t 0.222e 1.903e 3t. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 9 / 37

Syarat Transversalitas Masalah Waktu Terminal Bebas 1 Jika T free dan x(t ) fixed, berakibat δt = 0 dan δx(t ) = 0, maka STV menjadi (H + S t T = 0. 2 Jika T free dan x(t ) free, berakibat δt = 0 dan δx(t ) = 0, maka STV menjadi (S x p T = 0 dan (H + S t T = 0. 3 Jika T free dan x(t ) free tetapi M(x(T ), T ) = 0 maka STV menjadi (R x p T = 0 dan (H + R t T = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 10 / 37

Syarat Transversalitas Problem Selesaikan MKO berikut: max J = T 0 (t2 + u 2 ) dt s.t. ẋ = u x(0) = 4 x(t ) = 5, T bebas. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 11 / 37

Syarat Transversalitas Problem Selesaikan MKO berikut: min J = S(x(T ), T ) + T 0 s.t. ẋ 1 = x 2 ẋ 2 = u x 1 (0) = 0 x 2 (0) = 0. 1 2 u2 dt S(x(T ), T ) 0, T = 1, x 1 (1) = 2, x 2 (1) = 3. S(x(T ), T ) = 1 2 (x 1(T ) 2) 2, T = 1, x 1 (1) dan x 2 (1) free. S(x(T ), T ) = 1 2 (x 1(T ) 2) 2, T = 1, x 1 (1) dan x 2 (1) free tetapi memenuhi x 1 (1) + 2x 2 (1) 10 = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 12 / 37

Solution Kendala persamaan diferensial dari MKO di atas dapat ditulis menjadi ( ) ( ) ẋ1 x2 := ẋ =, u ẋ 2 sehingga didefinisikan fungsi hamilton berikut: H := f + p g = 1 2 u2 + ( ) ( ) x p 1 p 2 2 = 1 u 2 u2 + p 1 x 2 + p 2 u. Syarat perlu optimalitas memberikan: H u = 0 u + p 2 = 0 p 2 = u. ṗ 1 = H x1 ṗ 1 = 0 p 1 (t) = A. ṗ 2 = H x2 ṗ 2 = p 1 ṗ 2 = A p 2 (t) = At + B u(t) = At B. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 13 / 37

Solution Selanjutnya kendala persamaan diferensial memberikan ẋ 2 = u ẋ 2 = At B x 2 (t) = 1 2 At2 Bt + C, ẋ 1 = x 2 ẋ 1 = 1 2 At2 Bt + C x 1 (t) = 1 6 At3 1 2 Bt2 + Ct + D. Nilai awal x 1 (0) = 0 dan x 2 (0) = 0 mengakibatkan C = D = 0, sehingga x 1 (t) = 1 6 At3 1 2 Bt2, x 2 (t) = 1 2 At2 Bt. Kasus 1: T = 1, x 1 (1) = 2, x 2 (1) = 3 memberikan SPL: 1 6 A 1 2 B = 2, 1 2 A B = 3. Diperoleh solusi A = 6 dan B = 6, sehingga x 1 (t) = t 3 + 3t 2, x 2 (t) = 3t 2 + 6t, u (t) = 6t + 6. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 14 / 37

Solution Kasus kedua merupakan kasus dengan state akhir bebas dan melibatkan fungsi scrap. Kasus 2: S(x(T ), T ) = 1 2 (x 1(T ) 2) 2, T = 1, x 1 (1) dan x 2 (1) free memberikan syarat transversalitas (S x p T = 0 (S x1 p 1 T = 0 dan (S x2 p 2 T = 0, yang dapat dijabarkan menjadi Selanjutnya, p 1 (1) = x 1 (1) 2 dan p 2 (1) = 0. (A = x 1 (1) 2 dan A + B = 0) (x 1 (1) = A + 2 dan A = B), sehingga diperoleh 1 6 A 1 2 B = A + 2 1 6 A 1 2 A = A + 2 A = 3 2 = B. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 15 / 37

Solution Jadi, solusi optimalnya ialah: x 1 (t) = 1 4 t3 + 3 4 t2, x 2 (t) = 3 4 t2 + 3 2 t, u (t) = 3 2 t + 3 2. Solution Kasus 3: S(x(T ), T ) = 1 2 (x 1(T ) 2) 2, T = 1, x 1 (1) dan x 2 (1) free tetapi memenuhi Syarat transversalitas M(x 1 (1), x 2 (1), 1) = 0, M = x 1 (1) + 2x 2 (1) 10. (R x p T = 0 (S xi + µm xi p i T = 0 p 1 (1) = x 1 (1) 2 + µ dan p 2 (1) = 0 + 2µ. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 16 / 37

Solution Ingat kembali: Diperoleh SPL: x 1 (t) = 1 6 At3 1 2 Bt2 x(1) = 1 6 A 1 2 B, x 2 (t) = 1 2 At2 Bt x 2 (1) = 1 2 A B, p 1 (t) = A p 1 (1) = A, p 2 (t) = At + B p 2 (1) = A + B. A = 1 6 A 1 2 B 2 + µ A + B = 2µ ( 1 6 A 1 2 B) + 2( 1 2 A B) = 10. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 17 / 37

Solution Dalam notasi matriks 5 6 1 2 1 1 1 2 7 6 5 2 0 dengan solusi Jadi, A B µ = 5 6 1 2 1 1 1 2 7 6 5 2 0 A B µ 1 = 2 0 10 2 0 10, = 3 2 47 10 8 5. x1 (t) = 1 4 t3 + 47 20 t2, x2 (t) = 3 4 t2 + 47 10 t, u (t) = 3 2 t + 47 20. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 18 / 37

MKO dengan Diskonto Diskonto (discounting) merupakan ciri dasar dalam masalah pengoptimuman dinamik, terutama dalam bidang ekonomi. Nilai kini (present value) atau nilai terdiskon (discounted value) dari peubah x(t) ialah x 0 (t) = x(t)e rt, r > 0. Suku e rt disebut sebagai faktor diskon (discount factor) dengan r merupakan rate of return (biasanya identik dengan tingkat suku bunga). Dalam masalah ekonomi, perusahaan dan konsumen biasanya diasumsikan ingin memaksimumkan discounted value dari penerimaan (revenue) atau keuntungan (profit). Integran dalam fungsional objektif biasanya berbentuk f (x(t), u(t))e rt. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 19 / 37

MKO dengan Diskonto MKO dengan diskonto memiliki bentuk umum: max J = T 0 f (x, u)e rt dt s.t. ẋ = g(x, u) x(0) = x 0. Fungsi hamilton dari MKO di atas ialah H(x, u, t) = f (x, u)e rt + pg(x, u). Syarat H u = 0 memberikan f u e rt + pg u = 0 f u + (pe rt )g u = 0. Secara implisit, peubah kontrol u merupakan fungsi dari x dan (pe rt ), ditulis u = φ(x, pe rt ). tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 20 / 37

MKO dengan Diskonto Syarat ṗ = H x memberikan ṗ = f x (x, u)e rt pg x (x, u). yang dapat ditulis menjadi ṗe rt = f x (x, φ(x, pe rt )) (pe rt )g x (x, φ(x, pe rt )). Syarat ẋ = H p memberikan kendala persamaan diferensial ẋ = g(x, φ(x, pe rt )). Jika x(t ) bebas maka dipunyai dua syarat batas x(0) = x 0, p(t ) = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 21 / 37

MKO dengan Diskonto Definisikan peubah baru m := pe rt, yang memiliki turunan terhadap t sbb: ṁ = ṗe rt + pre rt = ṗe rt + mr. Dengan menyubstitusi suku ṗe rt diperoleh sistem persamaan diferensial: ṁ = mr f x (x, φ(x, m)) mg x (x, φ(x, m)) ẋ = g(x, φ(x, m)). SPD di atas memuat dua peubah x dan m yang keduanya merupakan fungsi dari waktu t. Peubah waktu t tidak muncul secara eksplisit dalam SPD (SPD mandiri). SPD mandiri relatif lebih mudah diselesaikan, dan yang lebih penting, diagram fase dapat digambarkan sebagai sebuah bentuk analisis kualitatif. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 22 / 37

Current-valued Hamiltonian Dari penjelasan sebelumnya dapat disimpulkan bahwa, SPD mandiri (autonomous DES) jika peubah t muncul secara eksplisit hanya pada faktor diskon. Namun demikian, penyelesaian MKO seperti di atas kurang praktis. Prosedur yang lebih mudah dan lazim ialah dengan menggunakan current-valued hamiltonian. Tinjau kembali MKO berikut: Hamiltonian: max J = T 0 f (x, u)e rt dt s.t. ẋ = g(x, u) x(0) = x 0. H := fe rt + pg. Current-valued hamiltonian (CVH) didefinisikan sebagai: H := He rt = f + mg, m := pe rt. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 23 / 37

Current-valued Hamiltonian Perhatikan: H = He rt H = He rt m = pe rt p = me rt. H disebut sebagai current-valued hamiltonian dan H disebut sebagai present-valued hamiltonian. m disebut sebagai current-valued adjoint function dan p disebut sebagai present-valued adjoint function. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 24 / 37

Current-valued Hamiltonian Syarat perlu optimalitas: Syarat H u = 0 ekivalen dengan He rt u Syarat ṗ = H x ekivalen dengan = 0 H u = 0 H u = 0. ṁe rt mre rt = H x e rt ṁ mr = H x. Syarat ẋ = H p tetap: ẋ = g. Jika x(t ) bebas maka dipunyai dua syarat batas x(0) = x 0, p(t ) = 0 m(t )e rt = 0 m(t ) = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 25 / 37

Current-valued Hamiltonian Problem (Model Konsumsi Optimum) Seorang individu memiliki uang sejumlah x 0 di akun bank pada t = 0 dan mendapat bunga sebesar ρ. Misalkan c(t) menyatakan banyaknya uang yang ditarik dari akun pada saat t untuk keperluan konsumsi, sehingga berlaku ẋ = ρx c, x(0) = x 0. Individu tersebut ingin menentukan pola konsumsi c(t) yang memaksimumkan fungsi utilitas J(c) = T 0 U(c(t))e rt dt, dengan U(c(t)) menyatakan besarnya utilitas yang dirasakan dengan mengonsumsi sebesar c(t). Diasumsikan, U(c(t)) = ln c(t). Diasumsikan juga bahwa di akhir periode, individu tersebut harus menyisakan uang sejumlah b di dalam akunnya. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 26 / 37

Current-valued Hamiltonian Problem (Model Konsumsi Optimum) MKO: max J = T 0 e rt ln c dt s.t. ẋ = ρx c x(0) = x 0, x(t ) = b. Solution CVH: H = ln c + m(ρx c). Syarat perlu optimalitas: Syarat H c = 0 memberikan 1 c m = 0 c(t) = 1 m(t). tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 27 / 37

Current-valued Hamiltonian Solution Syarat ṁ mr = H x memberikan SPD: ṁ mr = mρ ṁ = m(r ρ). ṁ = m(r ρ) ẋ = ρx 1 m. SPD di atas dapat diselesaikan satu per satu: ṁ = m(r ρ) 1 m dm = (r ρ)dt m(t) = Ae (r ρ)t. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 28 / 37

Current-valued Hamiltonian Solution PD kedua memberikan ẋ = ρx 1 m ẋ ρx = 1 ρ)t A e (r (ẋ ρx)e ρt = 1 A e rt d dt (xe ρt ) = 1 A e rt xe ρt = 1 t A 0 e rs ds + B x(t) = (e rt 1) e ρt + Be ρt. Ar Syarat x(0) = x 0 memberikan B = x 0 dan syarat x(t ) = b memberikan A = (e rt 1)e ρt r(b x 0 e ρt ). tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 29 / 37

Current-valued Hamiltonian Solution Diperoleh Jika b = x 0 maka c(t) = r(be ρt x 0 ) e rt e (ρ r )t. 1 c(t) = rx 0(e ρt 1) e rt e (ρ r )t. 1 Dan jika ditambahkan syarat r = ρ maka c(t) = ρx 0, yang menunjukkan tingkat konsumsi sama besar dengan bunga yang diterima, sehingga uang dalam akun tidak pernah bertambah. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 30 / 37

Solusi SPD Di banyak kasus, SPD yang dihasilkan, yaitu ṁ = mr f x (x, φ(x, m)) mg x (x, φ(x, m)) ẋ = g(x, φ(x, m)), tidak dapat diselesaikan sendiri-sendiri seperti contoh sebelumnya, melainkan harus diselesaikan secara simultan. Perhatikan SPD mandiri takhomogen berikut: ẏ 1 = a 11 y 1 + a 12 y 2 + b 1 ẏ 2 = a 21 y 1 + a 22 y 2 + b 2. Solusi umum SPD di atas merupakan penjumlahan solusi homogen dan solusi partikular: y 1 = y1 h + y p 1 y 2 = y2 h + y p 2. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 31 / 37

Solusi SPD Solusi Homogen SPD homogen dari sistem di atas ialah: ẏ 1 = a 11 y 1 + a 12 y 2 ẏ 2 = a 21 y 1 + a 22 y 2. Turunkan persamaan (1) dan substitusikan persamaan (2) ke dalamnya: ÿ 1 = a 11 ẏ 1 + a 12 ẏ 2 = a 11 ẏ 1 + a 12 (a 21 y 1 + a 22 y 2 ). Dari persamaan (1) diperoleh y 2 = ẏ1 a 11 y 1 a 12, sehingga [ ] ẏ 1 a 11 y 1 ÿ 1 = a 11 ẏ 1 + a 12 a 21 y 1 + a 22 a 12 atau dalam bentuk PDLH homogen orde-2: ÿ 1 (a 11 + a 22 )ẏ 1 + (a 11 a 22 a 12 a 21 )y 1 = 0. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 32 / 37

Solusi SPD Solusi Homogen Persamaan karakteristik: r 2 (a 11 + a 22 )r + (a 11 a 22 a 12 a 21 )y 1 = 0, dengan r 1,2 = 1 2 (a 11 + a 22 ) ± 1 2 (a11 + a 22 ) 2 4(a 11 a 22 a 12 a 21 ). Solusi PDLH homogen orde-2 dipengaruhi oleh r 1 dan r 2 : real dan berbeda real dan sama kompleks y h 1 (t) = Ae r 1t + Be r 2t. y h 1 (t) = (A + Bt)e r 2t. y h 1 (t) = e kt (A cos vt + B sin vt), k = 1 2 (a 11 + a 22 ), v = 4(a 11 a 22 a 12 a 21 ) 1 2 (a 11 + a 22 ) 2. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 33 / 37

Solusi SPD Solusi Partikular Dalam kasus ini, solusi partikular yang ingin dicari merupakan solusi tunak (steady state solution). Solusi tunak dari SPD ialah ȳ 1 dan ȳ 2 di mana ẏ 1 = ẏ 2 = 0. Dari SPD sebelumnya: sehingga diperoleh a 11 ȳ 1 + a 12 ȳ 2 + b 1 = 0 a 21 ȳ 1 + a 22 y 2 + b 2 = 0, y p 1 = ȳ 1 = a 21b 1 a 11 b 2 a 11 a 22 a 12 a 21, y p 2 = ȳ 2 = a 12b 2 a 22 b 1 a 11 a 22 a 12 a 21. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 34 / 37

Solusi SPD Direct Method (Eigenvalue Method) SPD ditulis dalam bentuk matriks: dengan Solusi hohogen: ẏ = [ ẏ1 ẏ 2 ẏ = Qy + b, ] [ a11 a, Q = 12 a 21 a 22 ] [ b1, b = b 2 y h (t) = Av 1 e λ 1t + Bv 2 e λ 2t, dengan (λ i, v i ) merupakan pasangan nilai eigen dan vektor eigen. Solusi partikular: Qȳ + b = 0 y p = ȳ = Q 1 b. ]. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 35 / 37

Current-valued Hamiltonian Problem Selesaikan MKO berikut: Problem Selesaikan MKO berikut: max J = T 0 e rt (ax bx 2 cu 2 ) dt s.t. ẋ = u αx x(0) = x 0, x(t ) bebas. max J = T 0 e rt (ux x 2 u 2 ) dt s.t. ẋ = x + u x(0) = x 0, x(t ) bebas. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 36 / 37

PR 1 Buatlah review tentang penerapan kontrol optimum (prinsip maksimum Pontryagin) untuk menyelesaikan masalah tertentu. 2 Referensi dapat berupa: Jurnal Buku Lainnya 3 Review setidaknya memuat: Identifikasi masalah Formulasi masalah kontrol optimum Solusi analitik dan/atau numerik. 4 Review diketik di kertas A4 dan dilampiri fotokopi referensi. Dikumpulkan paling lambat sebelum pelaksanaan UAS. tbakhtiar@ipb.ac.id (IPB) MAT332 Kontrol Optimum Februari 2014 37 / 37