Analisis Matriks Ahmad Muchlis January 22, 2014
2 Notasi Pada umumnya matriks yang kita bicarakan dalam naskah ini adalah matriks kompleks. Himpunan semua matriks kompleks [real] berukuran m n dinyatakan dengan C m n [R m n ]. Huruf kapital cetak tebal digunakan untuk menyatakan sebuah matriks. Padanan huruf kecil cetak normal dari sebuah nama matriks digunakan untuk menyatakan komponen matriks tersebut. Persisnya, jika A menyatakan sebuah matriks, maka komponen pada baris ke-i kolom ke-j matriks A kita nyatakan dengan a ij. Dalam hal tersebut kita tuliskan juga A = [a ij ]. Satu-satunya kekecualian adalah penggunaan simbol nol, 0, untuk menyatakan matriks yang semua komponennya adalah bilangan 0. Matriks identitas dinyatakan dengan I. Bilamana diperlukan, ukuran matriks diberikan sebagai subskrip. Sebagai contoh, 0 m,n menyatakan matriks nol berukuran m n, sedangkan I k menyatakan matriks identitas k k. Huruf kecil cetak tebal digunakan untuk menyatakan vektor. Seringkali, ketika mengatakan vektor, yang kita maksud adalah matriks kolom, yaitu matriks m 1, untuk m yang relevan. Unsur ke-i basis baku kita nyatakan dengan e i. Jadi, e i adalah vektor kolom yang semua komponennya adalah 0, kecuali komponen ke-i yang bernilai 1. Transpos matriks A dituliskan sebagai A t. Sedangkan transpos konyugat matriks A, yaitu matriks yang diperoleh dengan mengganti setiap komponen A t dengan konyugat kompleksnya, dituliskan sebagai A t atau dengan lebih singkat sebagai A. Himpunan semua nilai eigen matriks persegi A kita tuliskan sebagai sp(a). Sedangkan radius spektral, yaitu modulus terbesar nilai-nilai eigen, matriks A kita tuliskan sebagai ρ(a). Himpunan semua kombinasi linier vektor-vektor u 1, u 2,..., u k dinyatakan dengan notasi u 1, u 2,..., u k.
1 Matriks Normal Teorema Spektral telah memberikan kaitan antara matriks Hermite dengan diagonalisasi oleh matriks uniter yang menghasilkan matriks diagonal real. Matriks seperti apa yang terkait dengan diagonalisasi oleh matriks uniter secara umum? Pertanyaan ini menjadi fokus perhatian kita dalam bab pertama ini. 1.1 Matriks Permutasi Bab ini kita awali dengan mempelajari sebuah kelas matriks sederhana. Definisi 1.1.1. Misalkan P matriks berukuran n n. Kita katakan P matriks permutasi jika setiap baris dan setiap kolom P memuat tepat satu komponen taknol dan komponen taknol tersebut adalah 1. Dari definisi di atas, jelas bahwa matriks identitas adalah sebuah matriks permutasi. Selanjutnya, perhatikan bahwa semua baris setiap matriks permutasi adalah baris-baris matriks identitas. Dua baris berbeda pada sebuah matriks permutasi adalah dua baris berbeda pada matriks identitas. Demikian pula, semua kolom setiap matriks permutasi adalah kolom-kolom matriks identitas. Dua kolom berbeda pada sebuah matriks permutasi adalah dua kolom berbeda pada matriks identitas. Misalkan P matriks permutasi berukuran n n. Untuk i = 1, 2,..., n, misalkan komponen 1 baris ke-i matriks P terletak di posisi (kolom) t i. Ini berarti bahwa baris tersebut adalah baris ke-t i pada matriks identitas. Dengan kata lain, baris ke-i matriks P adalah e t t i. Pengaitan i t i memberikan pemetaan σ : {1, 2,..., n} {1, 2,..., n}: σ(i) = t i. Karena dua 3
4 1. MATRIKS NORMAL baris berbeda P adalah dua baris berbeda pada matriks identitas, maka pemetaan σ ini bersifat satu-satu, dan akibatnya juga bersifat pada. Jadi σ adalah permutasi pada {1, 2,..., n}. Sebaliknya, dari setiap permutasi σ pada {1, 2,..., n} kita memperoleh secara tunggal matriks permutasi P = [p ij ], yaitu dengan mengambil p ij = δ jσ(i), dimana δ menyatakan 1, jika l = k delta Kronecker: δ kl =. Hal ini menunjukkan korespondensi satu-satu antara himpunan semua permutasi pada {1, 2,..., n} 0, jika l k. dengan himpunan semua matriks permutasi berorde n. Untuk selanjutnya, matriks permutasi yang berkaitan dengan permutasi σ kita tuliskan sebagai P σ. Ini berarti, komponen 1 baris ke-i matriks P σ terletak pada kolom ke-σ(i), i = 1, 2,..., n. Kita akan lihat berikut ini aksi perkalian matriks permutasi terhadap matriks. Misalkan u = u 1 u 2. Cn. Maka P σ u = u n u σ(1) u σ(2). u σ(n). Sebagai konsekuensinya, mengalikan matriks P σ di sebelah kiri matriks A C n m berarti melakukan permutasi σ terhadap baris-baris A. Bekerja menurut kolom, untuk j = 1, 2,..., n, komponen 1 pada kolom ke-j matriks P σ terletak di posisi (baris) σ 1 (j); dengan kata lain, kolom ke-j matriks P σ adalah e σ 1 (j). ] Misalkan v C n dan v t = [v 1 v 2 v n. Maka v t P σ = [ ] v σ 1 (1) v σ 1 (2) v σ 1 (n). Dengan demikian, mengalikan matriks P di sebelah kanan matriks B C m n berarti melakukan permutasi σ 1 terhadap kolom-kolom B. Misalkan σ dan τ dua permutasi pada {1, 2,..., n}. Maka P σ = e t σ(1) e t σ(2). e t σ(n)
1.1. MATRIKS PERMUTASI 5 dan P τ = e t τ(1) e t τ(2).. Selanjutnya, untuk i = 1, 2,..., n, baris ke-i matriks e t τ(n) P σ P τ adalah baris ke-σ(i) matriks P τ, yaitu baris e t τ(σ(i)). Jadi, P σp τ = e t (τ σ)(1) e t (τ σ)(2). e t (τ σ)(n), yaitu matriks permutasi P τ σ. Fakta-fakta di atas dapat kita pahami sebagai berikut. Aksi perkalian matriks permutasi memberikan pemetaan dari himpunan baris-baris matriks ke himpunan yang sama. Kemudian, fakta bahwa P σ P τ = P τ σ menegaskan bahwa perkalian dua matriks permutasi merepresentasikan komposisi dua permutasi. Dari baris-baris dan kolom-kolom P σ kita peroleh ] P t σ = [e σ(1) e σ(2) e σ(n) = e t σ 1 (1) e t σ 1 (2). e t σ 1 (n) Fakta-fakta di atas cukup bagi kita untuk menyimpulkan tiga sifat berikut. Sifat 1.1.2. Untuk setiap permutasi σ berlaku P t σ = P σ 1.. Akibat 1.1.3. Untuk setiap permutasi σ berlaku P t σ = P 1 σ. Akibat 1.1.4. Jika A C n n, maka P σ AP t σ diperoleh dari A dengan melakukan permutasi σ sekaligus kepada baris-baris dan kolom-kolom A. Akibat 1.1.3 mengatakan bahwa setiap matriks permutasi adalah matriks ortogonal. Karena matriks permutasi adalah matriks real, maka setiap matriks permutasi juga adalah matriks uniter. Permutasi π k pada {1, 2,..., k} dengan π k (i) = i + 1, i = 1, 2,..., k 1, dan π k (k) = 1 adalah sebuah siklus dengan panjang k. Matriks permutasi k k yang berkaitan dengan siklus memiliki arti penting. Pertama, setiap permutasi adalah komposisi sejumlah permutasi siklis yang saling lepas. Misalkan σ permutasi pada {1, 2,..., n}. Perhatikan
6 1. MATRIKS NORMAL bahwa terdapat bilangan asli terkecil k yang memenuhi σ k (1) = 1. Kita dapat mengubah urutan 1, 2,..., n untuk meletakkan 1, σ(1), σ 2 (1),..., σ k 1 di muka. Kemudian lakukan perubahan urutan dengan cara serupa kepada bilangan-bilangan lainnya, sampai semua bilangan 1, 2,..., n selesai diurutkan. ( ) 1 2 3 4 5 6 7 Contoh. Pada permutasi τ = berlaku τ 3 (1) = 2 6 5 7 3 1 4 1, τ 2 (3) = 3 dan τ 2 (4) = 4. Maka kita dapat mengambil urutan baru 1, 2, 6, 3, 5, 4, 7 yang berasal dari urutan 1, τ(1), τ 2 (1), 3, τ(3), 4, τ(4). Selanjutnya, kita memperoleh matriks baru dengan melakukan penyusunan ulang baris-baris dan kolom-kolom matriks permutasi yang diberikan sesuai dengan urutan baru bilangan-bilangan 1, 2,..., n. Tindakan ini tidak lain dari melakukan permutasi yang sama kepada baris-baris dan kolomkolom matriks permutasi yang diberikan. Dalam bahasa matriks, tindakan ini adalah perkalian dengan sebuah matriks permutasi di sebelah kiri dan dengan transpos matriks permutasi terakhir tersebut di sebelah kanan. Karena matriks permutasi adalah matriks ortogonal, matriks permutasi semula serupa dengan matriks baru yang kita peroleh. Perhatikan bahwa matriks baru yang kita peroleh adalah matriks permutasi juga. Bentuk matriks baru ini adalah matriks blok diagonal dengan komponen-komponen diagonal utama berupa matriks permutasi siklus. Dengan demikian, setiap matriks permutasi dapat dituliskan sebagai perkalian P 1 diag(s 1, S 2,..., S l )P, untuk suatu matriks permutasi P dan matriks-matriks permutasi siklus S 1, S 2,..., S l. Akibatnya, nilai-nilai dan vektor-vektor eigen matriks permutasi dapat diperoleh melalui nilai-nilai dan vektor-vektor eigen matriks siklus. ( ) 1 2 3 4 5 6 7 Contoh. Matriks permutasi untuk τ = di atas 2 6 5 7 3 1 4 serupa dengan matriks diag(s 1, S 2, S 3 ), dengan 0 1 0 [ ] 0 1 S 1 = 0 0 1 dan S 2 = S 3 =. 1 0 1 0 0 Nilai penting kedua adalah bahwa matriks permutasi siklus C = P πn = [e n e 1 e 2 e n 1 ] membangun kelas matriks sirkulan, yaitu matriks yang merupakan kombinasi linier dari {I, C, C 2,..., C n 1 }. Oleh karena itu, matriks C dikenal juga dengan nama matriks sirkulan fundamental. Berikut ini, kita tentukan nilai-nilai dan vektor-vektor eigen C.
1.2. MATRIKS NORMAL 7 Sifat 1.1.5. Polinom karakteristik C adalah c(t) = t n 1. Bukti: Dengan ekspansi pada kolom pertama, kita dapatkan t 1 0 0 0 0 t 1 0 0 det(ti C) = det........ 0 0 0 t 1 1 0 0 0 t = t t n 1 + ( 1) n+1 ( 1)( 1) n 1 = t n 1. Dengan demikian, nilai-nilai eigen C adalah semua akar-pangkat-n dari 1. Dalam bentuk polar, akar-akar-pangkat-n dari 1 adalah 1, ω, ω 2,..., ω n 1, dimana ω = e 2πi/n. Teorema berikut dapat kita buktikan dengan menghitung langsung. Teorema 1.1.6. Untuk i = 0, 1,..., n 1, ω i adalah nilai eigen C dengan 1 ω i vektor eigen berupa kelipatan w i = ω 2i.. ω (n 1)i Sebagai akibatnya, C = F diag(1, ω, ω 2,..., ω n 1 ) F 1, dimana F = [w 0 w 1 w n 1 ]. Perhatikan bahwa F F = ni n. Dengan demikian, C adalah matriks dengan nilai-nilai eigen tak semuanya real yang dapat didiagonalkan oleh matriks uniter. Fakta di atas bersama-sama dengan dua fakta bahwa (i) setiap matriks permutasi adalah matriks uniter, dan (ii) setiap matriks permutasi serupa, oleh matriks permutasi, dengan matriks blok diagonal yang komponenkomponen diagonalnya adalah matriks permutasi siklus atau [1], membawa kita kepada kesimpulan bahwa setiap matriks permutasi adalah matriks dengan nilai-nilai eigen tak harus semuanya real yang dapat didiagonalkan oleh matriks uniter. 1.2 Matriks Normal Sebagai konsekuensi Teorema Spektral, kita ketahui bahwa setiap matriks Hermite dapat didiagonalkan oleh matriks uniter dan bahwa semua nilai
8 1. MATRIKS NORMAL karakteristik matriks Hermite adalah real. Dengan kata lain, setiap matriks Hermite A dapat dituliskan sebagai A = UDU, dimana U adalah matriks uniter dan D adalah matriks diagonal real. Kita juga dapat dengan mudah menunjukkan keberlakuan pernyataan sebaliknya: setiap matriks berbentuk UDU, dengan U suatu matriks uniter dan D suatu matriks diagonal real, adalah matriks Hermite. Dengan demikian, pendiagonalan oleh matriks uniter menjadi matriks diagonal real adalah karakteristik matriks Hermite. Pada subbab terdahulu, telah kita lihat bahwa matriks permutasi dapat didiagonalkan oleh matriks uniter, tetapi ia tidak mesti matriks Hermite. Pertanyaan yang dapat diajukan disini adalah kelas matriks mana yang memiliki karakteristik dapat didiagonalkan oleh matriks uniter? Pertama-tama, perhatikan bahwa jika A C n n dapat didiagonalkan oleh matriks uniter, yaitu A = UDU, untuk suatu matriks uniter U dan matriks diagonal D, maka AA = (UDU )(UDU ) = (UDU )(UDU ) = UDDU = UDDU = (UDU )(UDU ) = (UDU ) (UDU ) = A A. Definisi 1.2.1. Misalkan A C n n. Kita katakan A matriks normal jika AA = A A. Perhatikan bahwa matriks Hermite, matriks permutasi dan matriks uniter adalah matriks-matriks normal. Berdasarkan diskusi sebelum Definisi 1.2.1, sifat normal adalah syarat perlu agar sebuah matriks dapat didiagonalkan oleh matriks uniter. Lebih lanjut, sifat normal juga ternyata merupakan syarat cukup untuk itu. Dengan demikian, kita memperoleh karakterisasi berikut. Teorema 1.2.2. Misalkan A C n n. Maka A dapat didiagonalkan oleh matriks uniter jika dan hanya jika A matriks normal. Bukti: Kita cukup membuktikan bahwa jika A matriks normal, maka A dapat didiagonalkan oleh matriks uniter. Pertama-tama, implikasi ini benar untuk kasus A = 0. Selanjutnya, asumsikan A 0 dan kita gunakan induksi pada n untuk membuktikan implikasi.
1.2. MATRIKS NORMAL 9 Misalkan A C 2 2 matriks normal. Misalkan λ C nilai eigen A dengan vektor eigen u C 2 yang memenuhi u u = 1. Pilih[ v C] 2 sehingga U = [u v] C 2 2 λ α uniter. Perhatikan bahwa A = U U, untuk 0 β suatu α, β C. Dari kenormalan A kita peroleh [ ] [ ] ( [ ] ) ( [ ] ) λ α λ 0 U U λ α = U U λ 0 U U 0 β α β 0 β α β = AA ( [ = A ] A ) ( [ ] ) λ 0 = U U λ α U U α β 0 β [ ] [ ] λ 0 λ α = U U. α β 0 β Dengan mencoret U dan U di kedua ruas, kita peroleh [ ] [ ] λλ + αα αβ λλ λα =. βα ββ αλ αα + ββ Dengan menyamakan komponen pada [ baris ] pertama kolom pertama, kita λ 0 peroleh α = 0, sehingga A = U U. Jadi A didiagonalkan oleh 0 β matriks uniter. Misalkan n > 2 dan pernyataan teorema benar untuk semua matriks berorde n 1. Misalkan A C n n matriks normal. Misalkan λ C nilai eigen A dengan vektor eigen u C 2 yang memenuhi ] u u = 1. Pilih v 2, v 3,..., v n C n sehingga X = [u v 2 v 3 v n C n n uniter. Perhatikan bahwa [ ] λ y A = X X, untuk suatu y C n 1 dan B C (n 1) (n 1). Kita 0 B peroleh y = 0 dan BB = B B (rincian [ pembuktian ] diberikan sebagai λ 0 Soal Latihan 9). Akibatnya, A = X X dan B matriks normal. 0 B Dari hipotesis induksi, B = U 1 D 1 U 1, untuk suatu matriks [ uniter ] U 1 dan matriks diagonal D 1 di C (n 1) (n 1) 1 0. Pilih U = X dan D = 0 U 1 diag (λ, D 1 ) di C n n. Maka U matriks uniter, D matriks diagonal dan A = UDU (tuliskan rincian penjelasan untuk kesimpulan-kesimpulan ini). Jadi A didiagonalkan oleh matriks uniter.
10 1. MATRIKS NORMAL Dari pembuktian di atas, kita dapat mengkonstruksi matriks diagonal D sedemikian rupa, sehingga nilai-nilai eigen A muncul secara berkelompok di diagonal utama D. Ini berarti bahwa kita dapat memilih D = diag(λ 1 I n1, λ 2 I n2,..., λ s I ns ), dimana λ 1, λ 2,..., λ s adalah nilai-nilai eigen A yang berbeda, dan n 1 + n 2 + + n s = n. Secara struktur, Teorema 1.2.2 memberikan dekomposisi ruang vektor C n atas subruang-subruang yang saling ortogonal, dimana setiap subruang itu tidak lain daripada ruang eigen matriks A. Dengan demikian, setiap vektor di masing-masing subruang dipetakan oleh A ke kelipatan dirinya sendiri. Secara persis, kita dapat menuliskan C n sebagai hasil tambah langsung C n = E 1 E 2 E s, dimana E i adalah ruang eigen A untuk nilai eigen λ i, i = 1, 2..., s, yang memenuhi E i E j. j i 1.3 Matriks Definit Taknegatif Misalkan A C m n sembarang. Maka AA adalah matriks Hermite. Lebih jauh, setiap nilai eigen AA tidak negatif: jika λ C adalah nilai eigen AA dengan vektor eigen x, maka λ = x AA x x = A x 2 x x 2 0. Kita memiliki nama khusus untuk matriks dengan nilai eigen seperti itu. Definisi 1.3.1. Matriks Hermite A C n n adalah matriks definit taknegatif [definit positif ] jika semua nilai eigen A tidak negatif [positif]. Dengan mengingat hubungan antara nilai eigen dan singularitas sebuah matriks persegi, kita mempunyai sifat berikut. Sifat 1.3.2. Misalkan A matriks definit tak-negatif. Maka: (a) A definit positif jika dan hanya jika A tak-singular, (b) jika A definit positif, maka A 1 juga definit positif. Matriks definit tak-negatif memiliki sejumlah karakterisasi. Karakterisasi pertama berkaitan dengan variasi. Teorema 1.3.3. Misalkan A C n n matriks Hermite. Maka: (a) A definit tak-negatif jika dan hanya jika x Ax 0, untuk setiap x C n, dan
1.3. MATRIKS DEFINIT TAKNEGATIF 11 (b) A definit positif jika dan hanya jika x Ax > 0, untuk setiap x C n, x 0. Bukti: Kita berikan di sini bukti untuk (a). Bukti untuk (b) diberikan sebagai latihan. Misalkan A definit tak-negatif dan x C n. Karena A Hermite, terdapat basis ortonormal {u 1, u 2,..., u n } bagi C n dengan Au i = λ i u i, untuk suatu λ i R, i = 1, 2,..., n. Karena A definit tak-negatif, maka semua λ 1, λ 2,..., λ n tak-negatif. Tulis x = α i u i, dengan α 1, α 2,..., α n C. Maka x Ax = = = α j u j j=1 ( ) ( ) A α i u i = α j u j α i Au i ( ) α j u j α i λ i u i = j=1 j=1 j=1 λ j α j 2 u j 2 0. j=1 α j α i λ i u ju i Untuk arah sebaliknya, misalkan x Ax 0, untuk setiap x C n. Misalkan λ R nilai eigen A dengan vektor eigen u, u u = 1. Maka 0 u Au = u λu = λu u = λ. Ingat kembali bahwa submatriks dari matriks A adalah matriks yang diperoleh dengan memilih baris-baris dan kolom-kolom dari A tanpa mengubah urutan. Sebagai alternatif, submatriks dari A adalah A sendiri atau matriks yang diperoleh dengan menghapus sebagian baris atau kolom A. Definisi 1.3.4. Submatriks utama berorde k dari matriks A adalah submatriks yang diperoleh dengan membuang n k baris dan n k kolom bernomor sama dari matriks A. Submatriks utama pemuka berorde k dari matriks A adalah submatriks yang diperoleh dengan membuang n k baris dan n k kolom terakhir dari matriks A. Sifat 1.3.5. Misalkan A C n n matriks Hermite dan matriks B adalah submatriks utama dari A. Jika A definit tak-negatif, maka B juga definit tak-negatif. Jika A definit positif, maka B juga definit positif. Bukti: Pertama-tama, asumsikan B adalah [ submatriks ] utama pemuka dari B F A yang berukuran k k, sehingga A = F, untuk suatu F C k (n k) C
12 1. MATRIKS NORMAL dan C C (n k) (n k). Karena A matriks [ ] Hermite, haruslah B juga matriks Hermite. Misalkan y C k y. Tulis x = C n. Maka 0 [ ] [ ] [ ] x Ax = y 0 B F y [ ] [ ] F = y B y y F = y By. C 0 0 Dengan demikian, jika A definit tak-negatif, maka y By 0, untuk setiap y C k, yaitu B definit tak-negatif. Jika A definit positif, maka y By > 0, untuk setiap y C k, y 0, yang berarti B definit positif. Jika B bukan submatriks utama pemuka dari A, kita mempunyai matriks permutasi P C n n, sehingga B adalah submatriks utama pemuka dari PAP t. Perhatikan bahwa A dan PAP t = PAP 1 memiliki spektrum (himpunan nilai eigen) yang sama. Jika A definit tak-negatif, maka PAP t juga definit tak-negatif dan berdasarkan pembuktian yang telah kita lakukan B definit tak-negatif. Argumentasi serupa kita gunakan untuk menyimpulkan bahwa jika A definit positif, maka B definit positif. Akibat 1.3.6. Semua komponen diagonal utama matriks definit tak-negatif senantiasa tak-negatif. Semua komponen diagonal utama matriks definit positif senantiasa positif. [ ] 1 2 Sebagai contoh, matriks pasti tidak definit tak-negatif. Demikian pula, matriks pasti tidak definit positif. 2 1 [ ] 0 2 2 1 Akibat 1.3.6 memberikan syarat perlu untuk definit tak-negatif dan definit positif. Syarat tersebut tidak cukup. Matriks kedua pada contoh di atas tidak definit tak-negatif sekali pun memenuhi syarat yang diberikan. Teorema berikut memberikan karakterisasi bagi matriks definit tak-negatif dan definit positif berdasarkan minor (determinan submatriks utama) matriks. Teorema 1.3.7. Misalkan A C n n matriks Hermite. Maka: (a) A definit positif jika dan hanya jika determinan setiap submatriks utama pemuka A positif, dan (b) A definit tak-negatif jika dan hanya jika determinan setiap submatriks utama A tak-negatif.
1.3. MATRIKS DEFINIT TAKNEGATIF 13 Untuk kasus definit tak-negatif, persyaratan pada determinan[ submatriks utama pemuka saja tidak cukup. Ini ditunjukkan oleh matriks ] 0 0 0 1 yang determinan kedua submatriks utama pemukanya tak-negatif, tetapi matriksnya sendiri tidak definit tak-negatif. Untuk membuktikan Teorema 1.3.7 kita lihat terlebih dahulu hubungan antara nilai-nilai eigen sebuah matriks Hermite dan nilai-nilai eigen submatriks utamanya. Teorema 1.3.8. Misalkan A C n n matriks Hermite dengan nilai-nilai eigen λ 1 λ 2 λ n. Untuk i = 1, 2,..., n, misalkan u i vektor eigen A untuk λ i. Jika 1 k < l n, maka λ k x Ax λ l, untuk semua x u k, u k+1,..., u l, x x = 1. Bukti: Cukup kita buktikan untuk kasus {u 1, u 2,..., u n } bebas linier. Karena A matriks Hermite, maka ruang-ruang eigen A saling ortogonal dan kita dapat memilih {u 1, u 2,... u n } himpunan ortonormal. Misalkan 1 k < l n dan x u k, u k+1,..., u l, x x = 1. Maka x = l α k u k +α k+1 u k+1 + +α l u l, dengan α k, α k+1,..., α l C dan α i 2 = 1. Perhatikan bahwa α i = u i x, i = k,..., l. Karena A matriks Hermite, haruslah x Ax R dan kita peroleh x Ax = x A = l α i u i = x i=k l α i λ i x u i = i=k l α i Au i = x i=k l α i λ i α i = i=k Karena λ k λ i λ l, i = k + 1,..., l 1, maka λ k = λ k Jadi λ k x Ax λ l. l α i 2 i=k l λ i α i 2 λ l i=k i=k l α i λ i u i i=k l λ i α i 2. i=k l α i 2 = λ l. i=k Perhatikan bahwa, pada bukti di atas, u k Au k = λ k dan u l Au l = λ l. Dengan demikian, λ k = min{x Ax x u k, u k+1,..., u l, x x = 1} dan λ l = maks{x Ax x u k, u k+1,..., u l, x x = 1}. Ketika k = 1 dan l = n kita memperoleh akibat berikut.
14 1. MATRIKS NORMAL Akibat 1.3.9. Misalkan A C n n eigen λ 1 λ 2 λ n. Maka matriks Hermite dengan nilai-nilai λ 1 = min x x=1 x Ax dan λ n = maks x x=1 x Ax. Vektor x pada Teorema 1.3.8 dan Akibat 1.3.9 di atas dibatasi pada vektor dengan panjang 1. Kita dapat mengganti vektor tersebut dengan sembarang vektor x yang taknol, tetapi ekspresi x Ax juga diganti dengan x Ax x. Ekspresi ratio ini dikenal sebagai kuosien Rayleigh, sedangkan Akibat 1.3.9 dikenal dengan nama Teorema x Rayleigh-Ritz. Teorema berikut dikenal dengan nama Teorema Sela (interlacing theorem). Teorema 1.3.10. Misalkan A C n n matriks Hermite dan B C k k submatriks utama dari A. Misalkan pula nilai-nilai eigen A adalah λ 1 λ 2 λ n dan nilai-nilai eigen B adalah µ 1 µ 2 µ k. Maka λ i µ i λ n+i k, untuk i = 1, 2,..., k. Bukti: Tanpa mengurangi keumuman, misalkan B adalah submatriks utama pemuka dari A. Misalkan u j C n adalah vektor eigen A untuk nilai eigen λ j, j = 1, 2,..., n, dan y i C k adalah vektor eigen B untuk nilai y i eigen µ i, i = 1, 2,..., k, sehingga [ {u] 1, u 2,..., u n } dan {y 1, y 2,..., y k } keduanya bebas linier. Maka v i = C n adalah vektor eigen matriks blok 0 diagonal diag(b, 0) C n n untuk nilai eigen µ i, i = 1, 2,..., k. Misalkan i = 1, 2,..., k. Definisikan dua subruang K = v 1, v 2,..., v i dan L = u i, u i+1..., u n dari C n. Maka dim(k) = i dan dim(l) = n i + 1, sehingga K L bukan ruang nol. [ ] Misalkan x K L, x y x = 1. Maka x =, untuk suatu y y 1, y 2,..., y i. 0 Dengan Teorema 1.3.8 kita peroleh λ i x Ax = y By µ i. Dengan hasil di atas yang dikenakan pada matriks A kita memperoleh µ i λ n+i k. [ ] 1 2 Sebagai ilustrasi penggunaan Teorema Sela ini, matriks memiliki dua nilai eigen berbeda. Sesungguhnya, nilai eigen terkecil matriks ini 2 1 tidak lebih dari 1, sedangkan nilai eigen terbesarnya tidak kurang dari 1.
1.3. MATRIKS DEFINIT TAKNEGATIF 15 Akibat 1.3.11. Misalkan A C n n matriks Hermite dan B C (n 1) (n 1) submatriks utama dari A. Misalkan pula nilai-nilai karakteristik A adalah λ 1 λ 2 λ n dan nilai-nilai karakteristik B adalah µ 1 µ 2 µ n 1. Maka λ 1 µ 1 λ 2 µ 2 λ n 1 µ n 1 λ n. Sekarang kita siap untuk membuktikan Teorema 1.3.7. Ingat kembali bahwa determinan matriks Hermite adalah hasilkali semua nilai eigennya. Bukti Teorema 1.3.7: Misalkan A = [a ij ] dan λ 1 λ 2 λ n adalah nilai-nilai eigen A. Untuk bagian (a): (= ) Untuk n = 2: Dari Akibat 1.3.6, a 11 > 0. Lalu, det(a) = λ 1 λ 2 > 0. Misalkan sekarang n 3 sembarang dan implikasi (= ) pada Teorema 1.3.7 (a) benar untuk semua matriks berukuran n 1. Misalkan A k adalah submatriks utama pemuka dari A yang berorde k, 1 k n 1. Maka A k adalah submatriks utama pemuka dari matriks B yang diperoleh dengan membuang baris dan kolom terakhir dari A. Dari Sifat 1.3.5, B definit positif, sehingga semua submatriks utama pemuka dari B memiliki determinan positif. Ini berarti determinan semua submatriks utama pemuka dari A yang berukuran kurang dari n positif. Submatriks utama pemuka dari A yang berukuran n adalah A sendiri. Akan tetapi, det(a) = λ 1 λ 2 λ n > 0, dan bukti selesai. ( =) Untuk n = 2: Diketahui a 11 > 0 dan det(a) > 0. Dari Akibat 1.3.10, kita beroleh 0 < a 11 λ 2. Karena det(a) = λ 1 λ 2 > 0, haruslah λ 1 > 0. Jadi, λ 1, λ 2 keduanya positif, berarti A definit positif. Misalkan sekarang n 3 sembarang dan implikasi ( =) pada Teorema 1.3.7 [(a) berlaku ] untuk semua matriks berukuran n 1. Partisi A menjadi B u A = u, dimana B berorde n 1. Semua submatriks utama pemuka α dari B adalah submatriks utama pemuka dari A yang berukuran kurang dari n. Dengan hipotesis induksi, B definit positif. Misalkan nilai-nilai eigen A terurut sebagai λ 1 λ 2 λ n, dan nilainilai eigen B adalah µ 1 µ 2 µ n 1. Teorema Sela memberikan urutan λ i µ i λ i+1, i = 1, 2,..., n 1. Karena B definit positif, maka µ 1 > 0, sehingga λ 2,..., λ n semuanya positif. Akhirnya, λ 1 = det(a) λ 2 λ n > 0. Untuk bagian (b): (= ) Bukti yang serupa dengan bukti untuk bagian (a) kita gunakan untuk
16 1. MATRIKS NORMAL menunjukkan determinan setiap submatriks utama pemuka A tak-negatif. Untuk menuntaskan pembuktian, perhatikan bahwa setiap submatriks utama A adalah submatriks utama pemuka sebuah matriks yang serupa dengan A. ( =) Polinom karakteristik untuk A dapat ditulis c A (t) = t n + ( 1) i s i t n i, dimana s i adalah jumlah determinan semua submatriks utama dari A yang berukuran i i, i = 1, 2,..., n. Karena determinan semua submatriks utama dari A tak negatif, maka s 1, s 2,..., s n semuanya tidak negatif. Misalkan λ sembarang nilai eigen A. Maka c A (λ) = 0. Andaikan λ < 0. Jika n genap, maka λ n positif dan ( 1) i λ n i 0, i = 1, 2,..., n, sehingga c A (λ) > 0. Sebaliknya, jika n ganjil, maka λ n negatif dan ( 1) i λ n i 0, i = 1, 2,..., n, sehingga c A (λ) < 0. kontradiksi. Jadi haruslah λ 0. Kedua kasus n ini berakhir dengan Di awal subbab ini telah kita lihat bahwa matriks AA definit taknegatif, untuk setiap matriks A sembarang. Kebalikannya juga berlaku. Teorema 1.3.12. Misalkan A C n n matriks Hermite. Maka: (a) A definit tak-negatif jika dan hanya jika terdapat matriks B C n n yang memenuhi A = BB, dan (b) A definit positif jika dan hanya jika terdapat matriks tak-singular B Bukti: C n n yang memenuhi A = BB. Kita cukup membuktikan bagian hanya jika pada kedua pernyataan dalam teorema. uniter U C n n Karena A matriks Hermite, terdapat matriks dan matriks diagonal D = diag (λ 1, λ 2,..., λ n ) yang memenuhi A = UDU. Sifat definit tak-negatif pada A berarti λ 1, λ 2,..., λ n semuanya tak-negatif. Pilih bilangan-bilangan kompleks α 1, α 2,..., α n, dengan α i 2 = λ i, i = 1, 2,..., n. Definisikan B = U diag (α 1, α 2,..., α n ) U. Maka BB = (U diag (α 1, α 2,..., α n ) U ) (U diag (α 1, α 2,..., α n ) U ) = U diag ( α 1 2, α 2 2,..., α n 2) U = U diag (λ 1, λ 2,..., λ n ) U = A. Dalam hal A definit positif, semua α 1, α 2,..., α n taknol, sehingga B taksingular. Pada bukti di atas tampak bahwa B adalah matriks normal. Lebih jauh, dari pemilihan bilangan-bilangan α 1, α 2,..., α n dalam pembuktian di atas,
1.4. SOAL LATIHAN 17 kita lihat bahwa matriks normal B pada Teorema 1.3.12 tidaklah tunggal. Akan tetapi, kita mempunyai teorema berikut. Teorema 1.3.13. Misalkan A C n n matriks Hermite. Maka A definit positif jika dan hanya jika terdapat matriks segitiga bawah tak-singular L C n n yang memenuhi A = LL. Hanya ada satu matriks L yang semua komponen diagonal utamanya real positif. Bukti: Seperti pada Teorema 1.3.12, kita cukup membuktikan bagian hanya jika saja. Ini kita lakukan [ dengan ] induksi pada n. [ ] a 11 a 21 l 11 0 Untuk n = 2, jika A =, pilih matriks L =, dimana l 11 memenuhi l 11 2 = a 11, l 22 memenuhi l 22 2 = det A, sedangkan a 21 a 22 l 21 l 22 a 11 l 21 = a 21l 11. Hanya satu l 11 dan l 22 positif yang memenuhi, yaitu l 11 = a 11 a 11 det A dan l 22 =. a 11 Misalkan n 3 dan asumsikan teorema [ ] berlaku untuk semua matriks berorde B u n 1. Partisi A menjadi A = u, dengan B berorde n 1, u C n 1 α dan α C. Dengan Sifat 1.3.5, B definit positif dan α real positif. Dari hipotesis induksi kita peroleh B = L 1 L 1, untuk suatu matriks segitiga bawah L 1 berorde n 1. Matriks L 1 [ mestilah tak-singular. ] Perhatikan B u bahwa karena A ekivalen baris dengan 0 α u B 1, maka det A = u [ ] ( α u B 1 u ) det B. Pilih matriks L = L 1 0 v β, dimana v = L 1 1 u dan β C yang memenuhi β 2 = det A. Ketunggalan L diperoleh dari ketunggalan L 1 dan pemilihan β = det B det A det B. Penulisan A = LL pada teorema ini dikenal sebagai faktorisasi Cholesky. 1.4 Soal Latihan 1. Misalkan S n adalah himpunan semua permutasi pada {1, 2,..., n} dan Perm n adalah himpunan semua matriks permutasi n n. Tunjukkan bahwa terdapat pemetaan bijektif Φ : S n Perm n yang memenuhi Φ (σ τ) = Φ(τ)Φ(σ), untuk semua σ, τ S n.
18 1. MATRIKS NORMAL 2. Misalkan A C m n dengan rank(a) = r. Tunjukkan bahwa terdapat matriks permutasi P, matriks-matriks B berukuran m r dan C berukuran r n, yang memenuhi rank(b) = rank(c) = r dan AP = BC. 3. Misalkan P 1, P 2,..., P k matriks-matriks permutasi berorde n. Misalkan α i R, 0 α i 1, i = 1, 2,..., k. Tunjukkan bahwa jumlah k semua komponen pada setiap baris matriks A = α i P i konstan, demikian pula dengan jumlah semua komponen setiap kolomnya. 4. Misalkan τ = ( 1 2 3 4 5 6 7 2 6 5 7 3 1 4 ). (a) Tentukan matriks permutasi P C 7 7 yaang memenuhi P τ = Pdiag (S 1, S 2, S 3 ) P 1, dimana 0 1 0 [ ] 0 1 S 1 = 0 0 1 dan S 2 = S 3 =. 1 0 1 0 0 (b) Tentukan nilai-nilai dan vektor-vektor eigen P τ. 0 1 0 5. Misalkan A = 1 0 1. Apakah terdapat matriks tak singular S 0 1 0 sehingga S 1 AS tidak simetris? 6. Misalkan A C n n. Tunjukkan bahwa A dapat didiagonalkan oleh matriks uniter menjadi matriks diagonal yang semua komponen utamanya imajiner murni jika dan hanya jika A = A. [Matriks A C n n yang memenuhi A = A dikatakan Hermite miring.] 7. Buktikan bahwa [ A R 2 2 ] adalah matriks [ ortogonal jika ] dan hanya cos θ sin θ cos θ sin θ jika A = atau A = untuk suatu sin θ cos θ sin θ cos θ θ R. 8. Misalkan A matriks normal. Buktikan bahwa ruang kolom A ortogonal terhadap ruang nol A.
1.4. SOAL LATIHAN 19 9. Misalkan A matriks normal berorde n dan Au = λu, untuk suatu skalar λ dan u C n yang memenuhi u u = 1. Misalkan [ ] X = ] [u v 2 v 3 v n C n n uniter. Jika X λ y AX =, dimana y C n 1 dan B berorde n 1, tunjukkan bahwa y = 0 dan 0 B BB = B B. 10. Misalkan L matriks segitiga bawah. Buktikan bahwa L matriks normal jika dan hanya jika L matriks diagonal. 11. Misalkan A matriks normal berorde n dan x C n. Buktikan bahwa x vektor eigen A jika dan hanya jika x vektor eigen A. 12. Misalkan A C n n. Tunjukkan bahwa terdapat matriks-matriks H, M C n n yang memenuhi H = H, M = M dan A = H + M, sehingga setiap matriks dapat dituliskan sebagai jumlah dua matriks nomal. 13. Misalkan A, B C n n definit tak-negatif dan α, β bilangan-bilangan real tak-negatif. Tunjukkan bahwa αa + βb definit tak-negatif. 14. Misalkan x 1, x 2,..., x n C n. Misalkan komponen baris ke-i kolom ke-j matriks A C n n adalah x j x i, i, j = 1, 2,..., n. Tunjukkan bahwa A definit tak-negatif. 15. Misalkan A C n n matriks Hermite. Tunjukkan bahwa A definit tak-negatif jika dan hanya jika A = B 2, untuk suatu matriks definit tak-negatif B C n n. Tunjukkan bahwa dalam hal ini B tunggal. 16. Misalkan A matriks definit tak-negatif. Buktikan bahwa A k definit tak-negatif, untuk semua bilangan asli k. 1 2 3 17. Tunjukkan bahwa matriks A = 2 8 12 definit positif. Kemudian, dapatkan faktorisasi Cholesky untuk 3 12 27 A.
20 1. MATRIKS NORMAL
2 Faktorisasi Matriks Diagonalisasi sebuah matriks persegi adalah contoh dekomposisi matriks. Melalui dekomposisi, kita memberikan representasi matriks dalam bentuk atau struktur yang lebih sederhana. Representasi ini pada dasarnya terkait dengan perubahan basis ruang vektor. Dalam bahasa matriks, dekomposisi matriks adalah penulisan matriks tersebut sebagai perkalian beberapa matriks yang memenuhi syarat-syarat tertentu. Secara umum, penulisan sebuah matriks sebagai perkalian dua atau lebih matriks dikatakan sebagai faktorisasi matriks. Sebagaimana dekomposisi, kita menginginkan faktorisasi matriks ke dalam faktor-faktor dengan bentuk atau struktur yang lebih sederhana. 2.1 Dekomposisi Nilai Singular Dalam Subbab 1.2 kita membicarakan diagonalisasi matriks normal oleh matriks uniter. Diagonalisasi ini dapat kita pandang sebagai perubahan matriks representasi sebuah operator linier (pemetaan linier dengan domain dan kodomain yang sama). Secara persis, terdapat sebuah basis ortonormal yang memberikan matriks representasi baru berupa matriks diagonal. Eksistensi basis ortonormal demikian terbatas hanya untuk operator linier yang memiliki matriks representasi berupa matriks normal. Bagaimana dengan matriks lainnya? Matriks yang tidak normal tidak mungkin serupa uniter dengan matriks diagonal. Pada subbab ini, kita masih ingin mempertahankan representasi diagonal terhadap basis ortonormal. Untuk itu kita harus mengorbankan sifat keserupaan. 21
22 2. FAKTORISASI MATRIKS Misalkan A C m n. Dalam Subbab 1.3 telah kita lihat bahwa matriks AA C m m adalah matriks definit tak-negatif. Sesungguhnyalah, menurut Teorema 1.3.12, setiap matriks definit tak-negatif dapat dituliskan sebagai perkalian sebuah matriks dengan transpos konyugatnya. Ini berarti semua nilai eigen AA tak-negatif. Kita buktikan terlebih dahulu sifat berikut. Sifat 2.1.1. Misalkan A C m n. Maka Inti(A ) = Inti(AA ), yaitu untuk setiap x C m berlaku A x = 0 jika dan hanya jika AA x = 0. Bukti: Bagian hanya jika jelas berlaku. Misalkan sekarang AA x = 0. Maka A x 2 = x AA x = x 0 = 0. Jadi A x = 0. Teorema 2.1.2. Misalkan A C m n, A 0. Maka terdapat bilangan asli r min{m, n}, matriks diagonal D R r r yang semua komponen diagonal utamanya positif [ dan ] matriks-matriks uniter U C m m, V C n n, D 0 sehingga A = U V. 0 0 Bukti: Tulis AA = UΛU, dimana Λ = diag(λ 1, λ 2,..., λ m ), λ i real tak-negatif, dan U C m m uniter. Dengan melakukan permutasi serentak pada baris-baris dan kolom-kolom Λ bila perlu, kita dapat mengasumsikan λ 1, λ 2,..., λ r semuanya positif, sedangkan λ r+1 = λ r+2 = = λ m = 0, untuk suatu r m. Pilih D = diag( λ 1, λ 2,..., [ λ r ). Partisi ] U menjadi ] U = [U 1 U 2, dimana U 1 C m r D 2 0. Maka Λ =, U 1 0 0 U 1 = I r, U 1 U 2 = 0 dan AA = U 1 D 2 U 1. Dengan demikian, AA U 2 = 0, dan akibatnya A U 2 = 0. Definisikan V 1 = A U 1 D 1 ] C n r. Maka V1 V 1 = I r. Perluas V 1 menjadi matriks uniter V = [V 1 V 2 C n n. Kita peroleh [ ] D 0 U V = 0 0 = [ ] [ ] [ D 0 U 1 U 2 0 0 [ ] [ V1 U 1 D 0 V 2 ] = U 1 DV 1 = U 1 D ( A U 1 D 1) V 1 V 2 = U 1 DD 1 U 1A = U 1 U 1A. ]
2.1. DEKOMPOSISI NILAI SINGULAR 23 Karena U uniter, maka I m = UU = U 1 U 1 + U 2U 2, sehingga U 1U 1 = I m U 2 U 2. Dengan demikian, [ ] D 0 U V = U 1 U 1A 0 0 = A U 2 U 2A = A (A U 2 U 2) = A. Baris terakhir kita peroleh dari A U 2 = 0. Definisi 2.1.3. Misalkan A C m n. Misalkan pula λ 1, λ 2,..., λ r nilainilai eigen positif AA, u 1, u 2,..., u r dan v 1, v 2,..., v r seperti pada bukti Teorema 2.1.2. Kita katakan λ adalah nilai singular dari A, dan untuk i = 1, 2,..., r, vektor u i [v i ] dinamakan vektor singular kiri [kanan] matriks A. [ ] D 0 Definisi 2.1.4. Dekomposisi A = U V yang diberikan pada Teorema 2.1.2 dinamakan dekomposisi nilai singular matriks 0 0 A. Dari Teorema 2.1.2 dan buktinya kita memperoleh fakta-fakta berikut: [ ] 1. Perhatikan bahwa AV = U 1 D 0, sehingga kolom-kolom U 1 menyusun sebuah basis bagi Peta(A). Kemudian, perhatikan juga bahwa AV 2 = 0. Dengan memperhatikan dimensi Inti(A), kita dapat menyimpulkan bahwa kolom-kolom V 2 menyusun sebuah basis bagi Inti(A). Akibatnya, bilangan r pada Teorema 2.1.2 adalah rank A. Jadi, setiap matriks A C m n memiliki nilai singular sebanyak ranknya. 2. Dekomposisi nilai singular menyatakan bahwa C n terdekomposisi atas subruang-subruang saling ortogonal yang dipetakan konstan oleh A ke subruang-subruang dari C m yang juga saling ortogonal. 3. Untuk i = 1, 2,..., r, Av i = λ i u i dan A u i = λ i v i. 4. Sekali pun dekomposisi nilai singular tidak tunggal, biasanya diambil urutan λ 1 λ 2 λ r sebagai [ bentuk ] kanonik dekomposisi D 0 nilai singular. Dalam hal ini, matriks tunggal. 0 0
24 2. FAKTORISASI MATRIKS 5. Kalau kita kalikan ruas kanan pada dekomposisi nilai singular, kita lihat bahwa submatriks-submatriks U 2 dan V 2 tidak berperan untuk menghasilkan A di ruas kiri. Oleh karena itu, kita mempunyai bentuk ringkas dekomposisi nilai singular: Teorema 2.1.5. Misalkan A C m n, A 0. Maka terdapat bilangan asli r min{m, n}, matriks diagonal D R r r yang semua komponen diagonal utamanya positif dan matriks-matriks U C m r, V C n r yang memenuhi U U = I r = V V, sehingga A = UDV. Dalam hal ini kita mempunyai V = A UD 1. ] 5. Pada Teorema 2.1.5, misalkan D = diag (σ 1, σ 2,..., σ r ), U = [u 1 u 2... u r, ] r dan V = [v 1 v 2... v r. Maka kita peroleh A = σ i u i vi. Ruas kanan hubungan terakhir ini dikenal dengan nama ekspansi hasilkali luar matriks A. Dengan demikian, setiap matriks dapat dituliskan sebagai hasil penjumlahan sejumlah hingga matriks dengan rank satu. Dekomposisi nilai singular memberikan kepada kita sebuah faktorisasi, yaitu faktorisasi kutub. Teorema 2.1.6. Misalkan A C m n dengan m n. Maka terdapat matriks definit tak-negatif P C m m dan U C m n yang memenuhi UU = I m sehingga PU = A dan rank(p) = rank(a). matriks P tunggal. Dalam hal ini, Bukti: Tulis dekomposisi nilai singular untuk A: A = W 1 D 1 V 1, dengan D 1 R r r matriks diagonal yang semua komponen diagonal utamanya positif, W 1 C m r, V 1 C n r memenuhi W 1 W 1 = I r = V 1 V 1. Perluas D 1, W 1 dan V 1 menjadi D = diag(d, 0) C m m, W = [W 1 W 2 ] C m m, V = [V 1 V 2 ] C n m sehingga W uniter dan V V = I m. Maka WDV = A. Pilih P = WDW C m m dan U = WV C m n. Perhatikan bahwa P definit tak-negatif, UU = WV VW = WW = I m, dan PU = A. Selanjutnya, kita berikan di sini garis besar bukti ketunggalan P, rincian diserahkan kepada pembaca. Misalkan PU dan P 1 U 1 dua faktorisasi kutub untuk A. Dengan meninjau AA serta mengingat sifat Hermite P dan P 1, kita peroleh P 2 = P 2 1. Diagonalisasi matriks Hermite memberikan konsekuensi bahwa vektor-vektor
2.2. FAKTORISASI SEGITIGA 25 eigen P dan P 2 persis sama. Akibatnya, vektor-vektor eigen P dan P 1 juga persis sama. Dengan dasar yang sama, jika λ nilai eigen P 2, maka λ = µ 2, untuk suatu nilai eigen µ bagi P. Karena P definit tak-negatif, λ adalah nilai eigen P 2 jika dan hanya jika λ adalah nilai eigen P. Pernyataan serupa juga berlaku untuk P 1. Ini membawa kita kepada kesimpulan bahwa P 1 = P. Faktorisasi kutub pada matriks dapat dibandingkan dengan representasi kutub bilangan kompleks. Setiap bilangan kompleks z dapat dituliskan sebagai perkalian sebuah bilangan real tak-negatif dengan sebuah bilangan kompleks dengan modulus 1, yaitu dalam bentuk z = re iθ, untuk r, θ R, r 0. 2.2 Faktorisasi segitiga Dengan dekomposisi nilai singular, setiap matriks persegi ekivalen uniter dengan suatu matriks diagonal. [Dua matriks persegi A dan B dikatakan ekivalen jika terdapat matriks-matriks tak singular S dan T yang memenuhi B = SAT. Kedua matriks A dan B ekivalen uniter jika S dan T adalah matriks-matriks uniter.] Pengertian ekivalen ini lebih umum daripada keserupaan. Keserupaan tidak lain dari ekivalensi dimana kita meminta syarat tambahan T = S 1. Telah kita lihat bahwa hanya matriks normal yang serupa uniter dengan matriks diagonal. Mempertahankan kediagonalan memaksa kita melonggarkan keserupaan menjadi ekivalensi. Sebaliknya, mempertahankan keserupaan memaksa kita melepaskan kediagonalan. Secara umum, matriks persegi hanya serupa uniter dengan matriks segitiga. Teorema 2.2.1 (Dekomposisi Schur). Misalkan A C n n. Maka terdapat matriks uniter U C n n dan matriks segitiga atas R C n n yang memenuhi A = URU. Teorema Schur ini dapat dibuktikan menggunakan induksi terhadap n dengan cara yang serupa dengan pembuktian Teorema 1.2.2. Belakangan nanti akan kita lihat bahwa dengan melepaskan syarat uniter kita dapat memperoleh matriks segitiga dengan struktur yang lebih baik. Bila komponen-komponen di luar diagonal utama matriks segitiga pada dekomposisi Schur tidak teridentifikasi, dekomposisi yang akan kita tinjau nanti memberikan informasi tentang komponen-komponen tersebut.
26 2. FAKTORISASI MATRIKS Bila pada dekomposisi kita berbicara tentang mencari representasi lain bagi matriks sebagai pemetaan linier, dalam pembicaraan selanjutnya kita ingin memecah matriks sebagai hasil perkalian dua matriks lain. Dalam bahasa pemetaan, yang akan kita tinjau tidak lain dari menuliskan pemetaan linier sebagai komposisi dua pemetaan linier. Pada Bab 1 kita telah mengenal faktorisasi yang melibatkan matriks segitiga, yaitu faktorisasi Cholesky (lihat Teorema 1.3.13). Faktorisasi ini berlaku untuk matriks definit positif. Secara umum kita mempunyai faktorisasi berikut. Teorema 2.2.2. Misalkan A C n n dengan rank(a) = r. Jika determinan submatriks utama pemuka berorde k dari A taknol, k = 1, 2,..., r, maka A = LR, untuk suatu matriks segitiga bawah L C n n dan matriks segitiga atas R C n n. Bukti: Pertama-tama, kita gunakan induksi pada n untuk membuktikan kasus A tak singular. Misalkan n = 2 dan A = [a ij ]. Maka memenuhi LR = A. [ ] 1 0 L =, R = a 21 /a 11 1 [ a 11 a 12 0 a 22 a 12 a 21 /a 11 Asumsikan A C n n dan teorema berlaku untuk semua matriks tak [ singular berukuran (n 1) (n 1). Partisi matriks A menjadi A = ] B w z, α dengan B C (n 1) (n 1). Dengan hipotesis teorema, B tak singular dan memenuhi hipotesis induksi, sehingga B = L 1 R 1, dimana L 1 matriks segitiga bawah dan R 1 matriks segitiga atas. [ Karena B tak ] singular, L 1 dan R 1 L 1 0 keduanya juga tak singular. Maka L = z R 1 adalah matriks segitiga bawah, R = w 0 α z R 1 1 L 1 1 w adalah matriks segitiga atas dan 1 1 [ ] R 1 L 1 1 LR = A. Sekarang misalkan A singular dengan rank r. Maka A memiliki submatriks utama pemuka B berukuran r r yang tak singular dan memenuhi hipotesis teorema, sehingga B = L 1 R 1, untuk suatu matriks segitiga bawah L 1 dan matriks segitiga atas R 1. Karena rank(a) = r terdapat matriks-matriks ]
2.2. FAKTORISASI SEGITIGA 27 C C r (n r), E C (n r) r, sehingga A memiliki bentuk blok [ ] B BC A = EB EBC [ ] L 1 R 1 L 1 R 1 C =. EL 1 R 1 EL 1 R 1 C [ ] [ ] L 1 0 R 1 R 1 C Pilih L = dan R =. Maka L matriks segitiga EL 1 0 0 0 bawah, R matriks segitiga atas dan LR = A. Faktorisasi pada Teorema 2.2.2 ini lazim dikenal sebagai faktorisasi LU karena diperkenalkan dengan menggunakan notasi U untuk matriks segitiga atas. Pada dasarnya, faktorisasi ini adalah notasi matriks untuk hasil eliminasi Gauss, tanpa pertukaran baris, pada matriks A. Faktorisasi LU, bila ada, tidak mesti tunggal. Kita dapat memperoleh ketunggalan dengan menambahkan syarat bahwa L tak singular dan semua komponen diagonal utama L adalah 1. Dari sisi eliminasi Gauss, ketunggalan ini kita peroleh jika kita membatasi diri hanya pada satu tipe operasi baris elementer saja, yaitu menjumlahkan satu baris dengan kelipatan baris lainnya. Proses ortonormalisasi Gram-Schmidt kita gunakan untuk memperoleh basis ortonormal dari sebuah basis sembarang. Dalam bahasa matriks, proses Gram-Schmidt mengubah matriks tak-singular A C n n menjadi matriks uniter Q C n n. Dengan memperhatikan bagaimana proses ortonormalisasi ini bekerja, kita lihat bahwa kedua matriks tersebut memenuhi hubungan A = QR, untuk suatu matriks segitiga atas R C n n. Proses Gram-Schmidt dapat juga kita kenakan pada himpunan bebas linier selain basis. Teorema berikut merupakan konsekuensi proses Gram- Schmidt. Teorema 2.2.3. Misalkan A C m n dengan m n. Jika rank(a) = n, maka A = QR, untuk suatu Q C m n yang memenuhi Q Q = I n dan matriks segitiga atas R C n n. Dengan menambahkan persyaratan bahwa semua komponen diagonal utama R real positif, faktorisasi ini tunggal. Faktorisasi yang diperkenalkan dalam teorema ini dikenal sebagai faktorisasi QR. faktorisasi QR ini. Berbagai teknik dalam komputasi matriks bersandar pada
28 2. FAKTORISASI MATRIKS Secara teoritis, proses Gram-Schmidt memberikan bukti konstruktif untuk faktorisasi QR. Akan tetapi, dalam prakteknya kita menggunakan teknik lain dalam melakukan faktorisasi ini. Dua teknik, refleksi Householder dan rotasi Givens, telah digunakan secara luas. Teorema 2.2.4. Misalkan v C n, v 0. Maka H = I n 2vv v v adalah refleksi terhadap subruang v = {y C n y v = 0}, yaitu Hx = y αv, untuk setiap x = y + αv C n, dengan y v, α C. Bukti: Dengan menghitung langsung: Hx = (I n 2vv v v ) (y + αv) = y + αv 2v y v v 2αv = y αv. Kesamaan terakhir diperoleh karena y v. Matriks H pada Teorema 2.2.4 disebut refleksi Householder. Teorema 2.2.5. Refleksi Householder H adalah matriks Hermite, memenuhi H 2 = I n, dan, dengan demikian, H uniter. Bukti: Dengan menghitung langsung. Bukti lengkap diserahkan pada pembaca. Gagasan menggunakan refleksi Householder untuk memperoleh faktorisasi QR untuk matriks A adalah mencari vektor v sehingga H memetakan kolom pertama A ke kelipatan e 1 (vektor e i adalah unsur basis baku bagi C n dengan komponen 1 pada posisi ke-i). Sifat uniter H mengharuskan vektor hasil peta tersebut memiliki norma Euklid yang sama dengan norma kolom pertama A. Refleksi Householder kita gunakan untuk memperoleh vektor dengan komponen nol dalam jumlah banyak. Untuk matriks real, ketika kita ingin mendapatkan komponen nol secara lebih selektif, kita menggunakan rotasi Givens. Definisi 2.2.6. Matriks G R n n dinamakan rotasi Givens jika cos θ sin θ 0 G = P sin θ cos θ 0 P t, 0 0 I n 2 untuk suatu matriks permutasi P dan skalar θ R.
2.2. FAKTORISASI SEGITIGA 29 Ini berarti, komponen-komponen matriks G = [g ij ] selain g kk, g kl, g lk dan g ll sama dengan komponen-komponen matriks identitas, untuk suatu 1 k, l n, k l. Dengan menghitung langsung, kita memperoleh sifat berikut. Sifat 2.2.7. Matriks G adalah matriks ortogonal. Secara geometri, G adalah matriks rotasi pada bidang-kl sebesar θ (berlawanan dengan arah jarum jam). Selain matriks segitiga, bentuk lain yang juga banyak digunakan dalam komputasi matriks adalah bentuk Hessenberg. Matriks A = [a ij ] C n n dikatakan matriks Hessenberg jika a ij = 0, untuk semua 1 j + 1 < i n. Kita dapat memanfaatkan refleksi Householder untuk memperoleh faktorisasi A = US, dimana U, S C n n, U matriks uniter, dan S matriks Hessenberg. Lebih jauh, dengan menggunakan rangkaian refleksi Householder yang sama di sebelah kanan, bentuk Hessenberg yang telah diperoleh pada faktorisasi A = US di atas akan tetap dalam bentuk Hessenberg. Ini memberi kita teorema berikut. Teorema 2.2.8. Misalkan A C n n. Maka terdapat matriks uniter U C n n dan matriks Hessenberg S C n n yang memenuhi A = USU. Keperluan akan bentuk Hessenberg akan tampak ketika kita bekerja di lapangan real. Dekomposisi Schur tidak berlaku kalau C kita ganti dengan R. Kegagalan terjadi manakala matriks real yang didekomposisi memiliki nilai eigen bukan real. Dalam hal ini, hasil paling mendekati yang dapat diperoleh adalah bentuk Hessenberg sebagai pengganti matriks segitiga. Teorema 2.2.9. Misalkan A R n n. Q R n n sehingga berlaku Λ 1 N 12 N 13 N 1k 0 Λ 2 N 23 N 2k Q t AQ = 0 0 Λ 3 N 3k,....... 0 0 0 Λ k Maka terdapat matriks ortogonal dimana Λ 1, Λ 2,..., Λ k adalah matriks-matriks berukuran 1 1 atau 2 2, dan Λ i berukuran 2 2 hanya jika nilai-nilai eigennya tak real. Matriks Λ i berukuran 2 2 pada teorema di atas berbentuk jika λ = α + i β adalah nilai eigen A, dengan β 0. [ α β ] β α
30 2. FAKTORISASI MATRIKS 2.3 Soal Latihan 1. Misalkan λ R, λ > 0. Tunjukkan bahwa λ nilai karakteristik AA jika dan hanya jika λ nilai karakteristik A A. 2. Misalkan A C n n memenuhi A = A. (a) Apa yang bisa dikatakan tentang nilai-nilai karakteristik A? (b) Tentukan dekomposisi nilai singular untuk A. 3. Berikan bukti alternatif untuk Teorema 2.1.2 dengan pertama-tama mendiagonalisasi A A. 4. Misalkan σ maks (A) menyatakan nilai singular terbesar A. Buktikan bahwa σ maks (A) = maks{ x Ay x U2 m, y U2 n } dimana U2 k = {x Ck x 2 = 1}. 5. Misalkan A C m n, rank(a) = r, dan B diperoleh dengan membuang kolom terakhir A sehingga rank(b) = r 1. Misalkan nilainilai singular A adalah σ 1 σ 2 σ r dan nilai-nilai singular B adalah τ 1 τ 2 τ r 1. Tunjukkan bahwa σ i τ i σ i+1, i = 1, 2,..., r 1. 6. Misalkan A, B C m n. Buktikan bahwa σ maks (A + B) σ maks (A) + σ maks (B), dimana σ maks (X) menyatakan nilai singular terbesar matriks X. 7. Misalkan A C n n tak-singular. Jika PU = A adalah dekomposisi kutub untuk A, tunjukkan bahwa A normal jika dan hanya jika PU = UP. α 2 0 8. Tentukan semua α C yang membuat matriks A = 1 α 1 tidak 0 1 α memiliki faktorisasi LU. 9. Misalkan A C n n tak singular dan A = QR = Q 1 R 1 adalah dua faktorisasi QR untuk matriks A. Tunjukkan bahwa terdapat matriks diagonal D = diag(d 1, d 2,..., d n ), dengan d 1 = d 2 = = d n = 1, sehingga berlaku Q = Q 1 D.
2.3. SOAL LATIHAN 31 1 19 34 10. Diberikan matriks real A = 2 5 20, gunakan refleksi House- 2 8 37 holder untuk memperoleh faktorisasi QR bagi A. Kemudian, gunakan rotasi Givens untuk tujuan yang sama. [Gunakan kalkulator, lakukan pembulatan sampai 4 angka di belakang koma.] ] 11. Misalkan A = [a 1 a 2 a n C n n. Tentukan v C n sehingga H = I n 2vv v v memenuhi Ha 1 = a 1 e 1. 12. Buktikan Teorema 2.2.5. 13. Misalkan A = [a ij ] R n n. Tentukan θ R sehingga cos θ sin θ 0 sin θ cos θ 0 0 0 I n 2 A memiliki komponen nol pada baris kedua kolom pertama. 14. Jika A C n n matriks tridiagonal, haruskah matriks R hasil faktorisasi QR matriks A adalah matriks diagonal? Mengapa? [A = [a ij ] matriks tridiagonal jika a ij = 0, untuk semua i, j yang memenuhi i j > 1.] 15. Buktikan Teorema 2.2.8.
3 Norma Matriks Konsep ruang vektor merupakan rampatan sifat-sifat aljabar vektor di bidang dan di ruang. Selain sifat aljabar, vektor di bidang dan ruang juga memiliki sifat-sifat geometris yang bertumpu pada konsep sudut dan jarak. Dengan memperkenalkan konsep hasilkali dalam di ruang vektor, kita memunculkan kembali sejumlah sifat geometris vektor. Sekali pun adanya konsep sudut membuat tinjauan geometris pada ruang vektor lebih lengkap, konsep jarak sudah memadai untuk berbagai keperluan. Secara aljabar, ini kita lakukan melalui konsep norma. Sudah kita ketahui bahwa ruang matriks m n isomorfik dengan ruang vektor berdimensi mn. Melalui isomorfisma ini, kita dapat menggunakan sembarang norma ruang vektor berdimensi mn untuk ruang matriks m n. Ketika perkalian matriks juga kita perhitungkan, norma tersebut memerlukan syarat yang lebih keras. Dalam bab ini kita akan membicarakan norma matriks, khususnya untuk matriks persegi. Sebelum itu, kita akan membicarakan beberapa hal yang berkaitan dengan norma vektor. 3.1 Norma Vektor Pertama-tama, [ kita berikan sejumlah ] norma yang lazim digunakan di C n. t Misalkan x = x 1 x 2... x n C n. Norma yang lazimnya diperkenalkan pertama kali adalah norma Euklid: x 2 = x i 2. ( ) 1/2 Norma ini berasal dari hasilkali titik. 33
34 3. NORMA MATRIKS Perampatan hasilkali titik menjadi hasilkali dalam memberi kita lebih banyak norma. Untuk setiap hasilkali dalam, : C n C n C, kita memperoleh norma x = x, x 1 2. Secara khusus, jika A C n n definit positif, maka x, y = x Ay, x, y C n, memberikan hasilkali dalam di C n. Dengan demikian, dari matriks definit positif A C n n kita peroleh norma x A = x Ax. Tidak setiap norma berasal dari hasilkali dalam. Agar norma di C n berasal dari hasilkali dalam, identitas jajargenjang berikut harus berlaku: x + y 2 + x y 2 = 2 ( x 2 + y 2), untuk setiap x, y C n. dalam: Dengan demikian, kedua norma berikut ini tidak berasal dari hasilkali x 1 = x i dan x = maks x i. i Indeks subskrip pada ketiga norma tersebut memiliki makna. umum kita mempunyai, untuk p R, p 1, norma-p: Secara ( x p = x i p ) 1/p. Ketaksamaan segitiga untuk norma-p dikenal sebagai ketaksamaan Minkowski. Untuk membuktikan ketaksamaan ini, kita akan menggunakan sebuah rampatan dari ketaksamaan Cauchy-Bunyakowski-Schwarz, yaitu ketaksamaan Hölder. Sifat 3.1.1 (Ketaksamaan Hölder). Misalkan p, q R positif dan memenuhi 1 p + 1 q = 1. Maka y x x p y q, untuk setiap x, y C n. Bukti: Tidak ada yang perlu dibuktikan ketika n = 1. Asumsikan n 2. Kita buktikan terlebih dahulu kasus x i dan y i real positif, i = 1, 2,..., n, dan x p = y q = 1. Dalam hal ini, x i < 1 dan y i < 1, i = 1, 2,..., n. Misalkan i = 1, 2,..., n. Definisikan a i = p ln x i dan b i = q ln y i. Sifat cekung ke atas fungsi eksponensial memberikan x i y i = e a i/p+b i /q 1 p ea i + 1 q eb i = 1 p xp i + 1 q yq i.
3.1. NORMA VEKTOR 35 Dengan menjumlahkan terhadap i = 1, 2,..., n, kita peroleh y x 1 p + 1 q = x p y q. Dalam hal norma x atau y bukan 1, ambil ˆx = x/ x p dan ŷ = y/ y q. Maka ˆx p = ŷ q = 1 dan ŷ ˆx ˆx p ŷ q = 1. Perkalian kedua ruas dengan x p y q memberikan y x x p y q. Dalam hal komponen-komponen x dan y real tak-negatif, kita perpendek x dan y menjadi berturut-turut w dan z dengan membuang semua posisi di mana komponen x atau y adalah 0. Maka semua komponen w dan z real positif. Selanjutnya kita peroleh: y x = y x = z w z p w q y p x q. Akhirnya, misalkan x, y C n sembarang. Misalkan w, z C n dengan w i = x i, z i = y i, i = 1, 2,..., n. Maka x p = w p dan y p = z p. Ketaksamaan segitiga bilangan kompleks memberikan y x = y i x i y i x i = z w z p w q = x p x q. Teorema 3.1.2 (Ketaksamaan Minkowsi). Misalkan p R, p 1. Maka untuk setiap x, y C n berlaku ( ) 1/p ( ) 1/p ( ) 1/p x i + y i p x i p + y i p. Bukti: Ketaksamaan jelas berlaku ketika x + y p = 0. Karena itu asumsikan sebaliknya. Pertama-tama, kita peroleh x + y p p = x i + y i p = x i + y i x i + y i p 1 x i x i + y i p 1 + y i x i + y i p 1.
36 3. NORMA MATRIKS Dengan ketaksamaan Hölder, kita peroleh ( ) 1/q x i x i + y i p 1 x p x i + y i q(p 1), dimana 1/p + 1/q = 1. Syarat 1/p + 1/q = 1 berakibat q(p 1) = p dan 1/q = (p 1)/p. Dengan demikian, sehingga ( ) 1/q ( ) (p 1)/p x i + y i q(p 1) = x i + y i p = x + y p 1 p, Dengan cara serupa, Jadi, x i x i + y i p 1 x p x + y p 1 p. y i x i + y i p 1 y p x + y p 1 p. x + y p p x p x + y p 1 p + y p x + y p 1 p = ( x p + y p ) x + y p 1 p, dan ketaksamaan Minkowski segera kita dapatkan. Indeks tak hingga pada norma maksimum modulus memperoleh pembenaran dari sifat berikut. Sifat 3.1.3. Untuk setiap x C n berlaku x = lim p x p. Bukti: Untuk x = 0, pernyataan jelas benar. Misalkan x 0 dan x m adalah maksimum modulus komponen-komponen x. Maka: x p = ( ) 1/p x i p ( ( ) ) xi p 1/p = x m x m ( = x m k + x i 1/p p), x m
3.1. NORMA VEKTOR 37 dimana k 1 menyatakan banyaknya komponen x yang modulusnya sama dengan x m dan penjumlahan pada ekspresi terakhir diambil untuk semua komponen x yang modulusnya lebih kecil dari x m. Dengan kalkulus, ( k + x i 1/p x m p) 1 jika p, dan Sifat 3.1.3 terbukti. Norma vektor pada C n membawa sebuah metrik di ruang tersebut, sehingga memungkinkan kita berbicara tentang sifat-sifat analitis pada C n. Sifat 3.1.4. Diberikan sembarang norma pada C n, definisikan d(x, y) = x y, x, y C n. Maka berlaku: 1. d(x, y) 0, x, y C n, dan d(x, y) = 0 jika dan hanya jika x = y; 2. d(x, y) = d(y, x), x, y C n ; 3. d(x, y) d(x, z) + d(z, y), x, y, z C n. Dengan demikian, C n adalah sebuah ruang metrik dengan metrik d. Perhatikan bahwa ketiga sifat pada Sifat 3.1.4 adalah sifat-sifat jarak antara dua vektor di garis, ruang dan bidang. Ini berarti bahwa metrik tidak lain dari rampatan pengertian jarak. Tujuan pembahasan kita selanjutnya adalah menunjukkan bahwa sifatsifat analitis ruang vektor bernorma yang berdimensi hingga tidak bergantung pada norma yang digunakan. Sebagai contoh, sebuah barisan di C n yang konvergen menurut satu norma juga konvergen menurut norma yang satu lagi. Hal ini terjadi karena semua norma pada ruang demikian ekivalen. Perhatikan bahwa, sesuai namanya, ekivalensi norma adalah sebuah relasi ekivalen. Definisi 3.1.5. Dua norma dan di C n dikatakan ekivalen jika terdapat konstanta-konstanta real positif m dan M yang memenuhi m x x M x, x C n. Pertama-tama, subhimpunan tak hampa S dari sebuah ruang metrik dikatakan tertutup jika setiap barisan di S yang konvergen mestilah konvergen ke suatu unsur S. Barisan {x k } kita katakan konvergen ke a jika d(x k, a) 0 ketika k. Sifat 3.1.6. Misalkan sembarang norma di C n. Himpunan U = {x C n x = 1} bersifat tertutup dan terbatas dengan metrik yang diturunkan dari norma.
38 3. NORMA MATRIKS Bukti: Sifat terbatas U jelas terpenuhi. Sekarang misalkan {u k } barisan di U yang konvergen ke a. Akan ditunjukkan bahwa a U, yaitu bahwa a = 1. Perhatikan bahwa 0 1 a = u k a u k a. Karena u k konvergen ke a, maka u k a konvergen ke 0. Akibatnya, 1 a = 0, sehingga a = 1. Secara khusus, Sifat 3.1.6 berlaku untuk norma 1. Kita akan tunjukkan bahwa semua norma di C n ekivalen dengan norma 1. Sifat 3.1.7. Dengan metrik yang diturunkan dari norma 1, sembarang fungsi norma : C n R kontinu di U 1 = {x C n x 1 = 1}. Bukti: Pertama-tama, kita buktikan bahwa terdapat konstanta real positif c yang memenuhi x c x 1, untuk semua x C n. Misalkan x = [α 1 α 2 α n ] t C n, maka x = α i e i. Kita peroleh x α i e i α i maks e j = c j α i = c x 1, dimana c = maks j e j. Selanjutnya, misalkan {u k } barisan di U 1 yang konvergen (menurut metrik yang diturunkan dari 1 ) ke a U 1. Maka 0 u k a u k a c u k a 1. Karena u k a 1 konvergen ke 0, maka u k a juga konvergen ke 0, sehingga u k konvergen ke a, bukti selesai. Dengan menggunakan Teorema Weierstrass (setiap fungsi real yang kontinu pada himpunan yang tertutup dan terbatas mencapai maksimum dan minimum di himpunan tersebut), Sifat 3.1.7 membawa konsekuensi berikut: Teorema 3.1.8. Setiap norma sembarang mencapai maksimum dan minimum di U 1 = {x C n x 1 = 1}. Misalkan norma mencapai maksimum dan minimum berturut-turut M dan m di U 1. Perhatikan bahwa M dan m keduanya positif. Misalkan pula x sembarang vektor taknol di C n. Maka m x x 1 M. Dengan menggunakan sifat norma kita peroleh m x 1 x M x 1. Ini berarti bahwa setiap norma di C n ekivalen dengan norma 1. Dengan menggunakan fakta bahwa ekivalensi norma adalah sebuah relasi ekivalen kita mempunyai teorema berikut.
3.2. NORMA MATRIKS 39 Teorema 3.1.9. Setiap dua norma dan di C n ekivalen. Teorema 3.1.9 berlaku untuk ruang berdimensi hingga. Contoh penyangkal dapat kita temukan pada ruang vektor l = {(a 1, a 2,... ) a i C, hampir semuanya 0}, dengan operasi komponen demi komponen. Maka 1 dan keduanya norma di l, tetapi keduanya tidak ekivalen (lihat Soal Latihan 4). 3.2 Norma Matriks Telah kita ketahui bahwa himpunan matriks C m n membentuk ruang vektor atas C yang isomorfik dengan C mn. Sebagai akibatnya, ruang matriks ini dapat kita perlengkapi dengan norma, yaitu dengan mengambil norma vektor di C mn. Dalam hal m = n, kita juga mempunyai operasi perkalian di C n n. Dalam kasus ini, kita menginginkan adanya kaitan antara norma matriks dengan operasi perkalian. Definisi 3.2.1. Pemetaan ν : C n n berlaku: R adalah norma matriks jika 1. ν(a) 0, A C n n, dan ν(a) = 0 A = 0; 2. ν(a + B) ν(a) + ν(b), A, B C n n ; 3. ν(αa) = α ν(a), α C, A C n n ; dan 4. ν(ab) ν(a)ν(b), A, B C n n. Sifat 1 kita namakan kepositifan, Sifat 2 ketaksamaan segitiga, dan Sifat 4 submultiplikatif. Sebagaimana norma vektor, kita lazim menggunakan notasi A untuk menyatakan norma matriks A. Berikut ini beberapa norma matriks A = [a ij ] C n n yang banyak digunakan. 1. A 1 = maks j a ij (jumlah modulus kolom terbesar); 2. A 2 = maks σ i (A) i (nilai singular terbesar);
40 3. NORMA MATRIKS 3. A = maks i 4. A F = a ij (jumlah modulus baris terbesar); j=1 j=1 a ij 2 (norma Frobenius). Ekivalensi norma yang kita bicarakan di atas juga berlaku untuk norma matriks. Ini kita peroleh karena ekivalensi norma tidak memerlukan sifat submultiplikatif. Norma matriks yang kita perkenalkan di atas memuat subskrip. Penggunaan subskrip pada Contoh 1-3 di atas memiliki makna tertentu. Teorema 3.2.2. Misalkan A C n n. Untuk sembarang norma di C n, Ax x A := maks x 0 C n n. = maks Ax mendefinisikan sebuah norma matriks di x =1 Bukti: Pertama-tama, kita tunjukkan bahwa maksimum pada definisi memang ada. Mengingat Sifat 3.1.6, kita cukup menunjukkan bahwa fungsi x Ax kontinu di U = {x C n x = 1}. Karena norma vektor di C n ekivalen, kita dapat menggunakan norma 1. Misalkan barisan {u k } di U konvergen ke w U. Ini berarti bahwa u k w 1 konvergen ke 0. Akan ditunjukkan bahwa Au k Aw konvergen ke 0. Untuk i = 1, 2,..., n, modulus komponen ke-i pada A (u k w) memenuhi (A (u k w)) i = = ( ) a ij (u k ) j w j j=1 a ij (u k ) j w j j=1 a ij j=1 (u k ) j w j j=1 a ij u k w 1. j=1
3.2. NORMA MATRIKS 41 Dengan menjumlahkan kedua ruas, kita peroleh 0 Au k Aw 1 = A(u k w) 1 = (A(u k w)) i a ij u k w 1 j=1 = u k w 1 j=1 a ij. Karena u k w 1 konvergen ke 0, maka Au k Aw 1 konvergen ke 0. Dengan ekivalensi norma di C n, Au k Aw juga konvergen ke 0. Karena 0 Au k Aw Au k Aw, kita peroleh Au k Aw konvergen ke 0, sehingga Au k konvergen ke Aw. Ini berarti bahwa fungsi x Ax kontinu di U. Dengan Teorema Weierstrass, fungsi tersebut mencapai maksimum di U. Jadi A terdefinisi. Selanjutnya, di sini hanya akan diberikan bukti sifat submultiplikatif. Bukti ketiga sifat norma matriks lainnya diserahkan kepada pembaca. Sifat AB A B jelas berlaku ketika AB = 0. Sekarang misalkan AB 0. Maka AB > 0 dan maksimum ABx tercapai ketika Bx 0. x Akibatnya, AB = maks x 0 = maks x 0 Bx maks Bx 0 maks y 0 = A B. ABx ABx = maks x x 0 Bx x ( ) ABx Bx Bx x ABx Bx maks Bx x 0 x Ay y maks Bx x 0 x Norma matriks yang diperoleh menurut Teorema 3.2.2 disebut norma hasil induksi. Norma matriks yang merupakan hasil induksi dari norma vektor kita tulis dengan notasi yang sama.
42 3. NORMA MATRIKS Kita tunjukkan berikut ini bahwa norma matriks jumlah modulus kolom terbesar adalah benar hasil induksi dari norma vektor 1. Misalkan x C n memenuhi x 1 = x i = 1. Maka Ax 1 = = a ij x j j=1 j=1 ( a ij x j = maks k ) a ik j=1 j=1 a ij x j ( x j j=1 ) a ij x j = maks j a ij. Akibatnya maks Ax 1 maks a ij. Selanjutnya, misalkan maksimum x 1 =1 j jumlah kolom modulus A tercapai pada kolom m. Maka maks Ax Ae m 1 = x 1 =1 = maks j a im a ij maks x 1 =1 Ax. Norma matriks hasil induksi memenuhi dua sifat berikut. Bukti keduanya tidak terlalu sukar, sehingga pembaca diharapkan dapat dengan mudah memperolehnya. Sifat 3.2.3. Misalkan norma vektor di C n. Maka norma matriks hasil induksinya di C n n memenuhi Ax A x, untuk setiap A C n n, x C n. Sifat 3.2.4. Jika adalah norma matriks di C n n hasil induksi, maka I n = 1. Sebagai konsekuensi Sifat 3.2.4, norma matriks F pada contoh di atas bukan norma hasil induksi. Sifat 3.2.3, dengan demikian tidak dapat dikenakan kepada norma F. Sekali pun demikian, untuk norma matriks bukan hasil induksi kita mempunyai sifat berikut. Sifat 3.2.5. Untuk setiap norma matriks di C n n, terdapat norma vektor di C n yang memenuhi Ax A x, untuk setiap A C n n, x C n.
3.2. NORMA MATRIKS 43 Bukti: Kita hanya perlu memberikan bukti untuk kasus dimana bukan norma hasil induksi. Untuk setiap x C n, definisikan x = xe 1, dimana e 1 adalah vektor basis baku pertama di C n. Akan kita tunjukkan terlebih dahulu bahwa adalah norma vektor di C n. Pertama-tama, x = xe 1 0. Kemudian, x = 0 = xe 1 = 0 = xe 1 = 0 = x = 0. Kemudian, untuk α C berlaku αx = (αx)e 1 = α(xe 1 ) = α xe 1 = α x. Akhirnya, x + y = (x + y)e 1 = xe 1 + ye 1 xe 1 + ye 1 = x + y. Sekarang kita buktikan bahwa memenuhi Ax A x. Karena perkalian matriks bersifat asosiatif, kita dapatkan Ax = (Ax)e 1 = A(xe 1) A xe 1 A x. Jelas bahwa, pada Sifat 3.2.5, norma hasil induksi dari norma vektor didominasi oleh norma matriks yang diberikan, yaitu A A, untuk setiap A C n n. Teorema berikut menyatakan bahwa norma hasil induksi tidak mungkin mendominasi norma hasil induksi lain. Teorema 3.2.6. Misalkan dan norma-norma hasil induksi di C n n. Jika A A, untuk semua A C n n, maka A = A, untuk semua A C n n. Bukti: Dari Soal Latihan 16, terdapat c R, c > 0, yang memenuhi v = c v, untuk setiap v C n. Akibatnya, untuk semua v C n, v 0, berlaku Av v = Av v. Kesimpulan yang diinginkan segera kita dapatkan. Ingat kembali bahwa radius spektral matriks A, ditulis ρ(a), adalah maksimum modulus nilai karakteristik A. Perhatikan bahwa radius spektral bukan norma matriks, kecuali ketika n = 1. Sekali pun demikian, kita mempunyai dua teorema berikut yang menunjukkan hubungan antara norma matriks dengan radius spektralnya. Teorema 3.2.7. Jika adalah norma matriks di C n n, maka ρ(a) A, untuk setiap A C n n. Bukti: Kita gunakan norma vektor yang diberikan pada bukti Sifat 3.2.5. Misalkan A C n n dan λ sembarang nilai eigen A dengan vektor
44 3. NORMA MATRIKS eigen x yang memenuhi x = 1. Maka λ = λ x = λx = Ax A x = A. Karena ρ(a) adalah maksimum modulus nilai eigen A, maka ρ(a) A. Lebih jauh, spektral radius sebuah matriks adalah infimum dari normanorma matriks tersebut. Teorema 3.2.8. Misalkan A C n n. Untuk setiap ɛ > 0, terdapat norma matriks di C n n yang memenuhi A < ρ(a) + ɛ. Bukti: Dengan Teorema 2.2.1, terdapat matriks uniter U C n n sehingga matriks R = U AU matriks segitiga atas. Komponen-komponen diagonal utama R memberikan semua nilai eigen A. Tuliskan λ 1 r 12 r 13 r 1n λ 2 r 23 r 2n R = λ 3 r 3n.. 0... Untuk δ R, δ > 0, definisikan matriks D = diag(1, δ, δ 2,..., δ n 1 ) berukuran n n. Perhatikan matriks λ 1 δr 12 δ 2 r 13 δ n 1 r 1n λ 2 δr 23 δ n 2 r 2n D 1 RD = λ 3 δ n 3 r 3n.. 0... Misalkan ɛ > 0. Pilih δ sehingga j=i+1 misalnya δ = min{ 1 2, ɛ/ ( n 2 maks r ij ) }. Maka D 1 U AUD = D 1 RD = maks i maks i < ρ(a) + ɛ. λ i + maks i λ n λ n δ j 1 r ij < ɛ, i = 1, 2,..., n 1, j=i+1 λ i + δ j 1 r ij j=i+1 δ j 1 r ij
3.2. NORMA MATRIKS 45 Untuk D dan U yang tak singular, A = D 1 U AUD memberikan sebuah norma matriks, lihat Soal Latihan 15. Ini membuktikan Teorema 3.2.8. Dalam Soal Latihan 15, kita lihat bahwa kita dapat membuat sebuah norma matriks baru melalui relasi keserupaan. Norma baru ini tidak mesti sama dengan norma semula. Berikut ini kita lihat hubungan kedua norma ketika kita menggunakan matriks uniter untuk keserupaan. Definisi 3.2.9. Norma matriks di C n n dikatakan invarian uniter jika berlaku UAV = A, untuk semua A C n n dan semua matriks uniter U, V di C n n. Norma 2 dan F keduanya invarian uniter. Secara umum, sifat invarian uniter norma matriks dapat dilihat melalui hubungan antara norma dengan nilai singular. Teorema 3.2.10. Misalkan norma matriks yang invarian uniter di C n n. Maka A 2 A, untuk setiap A C n n. Bukti: Dari bukti Sifat 3.2.5, kita definisikan norma vektor di C n melalui x = xe 1, untuk setiap x Cn. Norma vektor tersebut memenuhi hubungan Ax A x, untuk setiap A C n n, x C n, dan akibatnya, norma hasil induksi dari norma vektor itu memenuhi A A, untuk semua A C n n. Misalkan x C n. Maka terdapat matriks refleksi Householder H sehingga Hx = x 2 e 1. Karena matriks Householder uniter, maka x 2 e 1 = x 2 e 1 = Hx = (Hx)e 1 = H(xe 1 ) = xe 1 = x. Jadi x = e 1 x 2, untuk semua x C n. Akibatnya, untuk sembarang A C n n berlaku A 2 = maks x 0 = maks x 0 Ax 2 = maks x 2 x 0 Ax x = A. Jadi A 2 = A A, untuk setiap A C n n. Ax / e 1 x / e 1 Teorema-teorema 3.2.6 dan 3.2.10 membawa kita kepada fakta berikut. Teorema 3.2.11. Norma 2 adalah satu-satunya norma matriks hasil induksi di C n n yang invarian uniter.
46 3. NORMA MATRIKS Sebagai catatan penutup, adalah mungkin untuk berbicara norma matriks pada kelas semua matriks {A C m n m, n N}. Dalam hal ini kita tidak bekerja dengan satu norma saja. Persyaratan submultiplikatif kita kenakan hanya ketika perkalian matriks dapat kita lakukan. Sebagai contoh, kita bisa mendefinisikan untuk A C m n, A 2 = maks x 0 Ax 2 x 2, dimana norma vektor pada pembilang adalah norma-2 di C m, sedangkan norma vektor pada penyebut adalah norma-2 di C n. Dalam hal ini, sifat submultiplikatif berlaku: AB 2 A 2 B 2, untuk setiap A C m k, B C k n. Perhatikan bahwa norma yang digunakan untuk AB adalah norma-2 di C m n, sedangkan untuk A dan B berturut-turut adalah norma-2 di C m k dan C k n. 3.3 Bilangan Kondisi Dalam komputasi, hampir tidak mungkin bagi kita untuk menghindari galat, baik karena pembulatan maupun pemotongan. Selain itu, data masukan mungkin merupakan hasil eksperimen atau pengamatan dengan akurasi rendah. Berapa besar pengaruh galat terhadap hasil komputasi? Berikut ini kita perkenalkan perangkat analisis untuk masalah sistem persamaan linier. Misalkan A C n n tak singular dan b C n, b 0. Maka persamaan Ax = b memiliki solusi. Jika b kita ganggu menjadi b + δb, solusi persamaan pun terganggu menjadi x + δx. Kita peroleh Aδx = δb, sehingga δx = A 1 δb. Pilih norma matriks di C n n sembarang dan norma vektor di C n yang memenuhi ketaksamaan pada Sifat 3.2.5. Maka δx A 1 δb dan 1 x A 1. Dengan demikian b δx x A A 1 δb b. Ketaksamaan di atas memberikan sebuah batas bagi deviasi relatif solusi persamaan Ax = b dalam hubungan dengan deviasi relatif b. Hubungan tersebut ditentukan oleh A A 1. Karena kita menginginkan deviasi relatif solusi tidak jauh lebih besar daripada deviasi relatif b, kita menginginkan A A 1 kecil.
3.4. SOAL LATIHAN 47 Definisi 3.3.1. Besaran A A 1 kita namakan bilangan kondisi matriks A, ditulis κ(a). Ketaksamaan di atas dan ketaksamaan pada Soal Latihan 17 memberikan κ(a) 1. 3.4 Soal Latihan 1. Misalkan norma di C n. (a) Buktikan bahwa u v u v, untuk setiap u, v C n. (b) Apakah selalu berlaku u v u + v? 2. Misalkan ν(a) adalah maksimum modulus komponen A C n n. Tunjukkan, untuk setiap n > 1, bahwa terdapat A, B C n n yang memenuhi ν(ab) > ν(a)ν(b). 3. Misalkan ν(a) adalah jumlah modulus semua komponen A C n n. Periksa apakah ν memenuhi sifat submultiplikatif. 4. Diberikan ruang vektor l = {(a 1, a 2,... ) a i C, hampir semuanya 0} (dengan operasi komponen demi komponen). Maka 1 dan keduanya norma di l. Tunjukkan bahwa kedua norma tersebut tidak ekivalen. 5. Misalkan A C n n. Buktikan bahwa Ax 2 konstan untuk semua x 2 x 0 di C n jika dan hanya jika semua nilai singular A sama besar. 6. Tunjukkan bahwa memenuhi sifat submultiplikatif. 7. Misalkan x C n dan A = xx.tentukan A 1, A 2, A dan A F dengan menggunakan norma-norma vektor x yang tepat. 8. Misalkan A 0. Tunjukkan bahwa jika nilai-nilai singular A adalah σ 1, σ 2,..., σ r, maka A F = σi 2 = (tr(a A)) 1/2 ( r ) 1/2 = (tr(aa )) 1/2. 9. Tentukan m, M real positif yang memenuhi sekaligus (i) m A 1 A 2 M A 1, untuk setiap A C n n, dan (ii) m A 1 1 = A 1 2, A 2 2 = M A 2 1, untuk suatu A 1, A 2 C n n.
48 3. NORMA MATRIKS 10. Tentukan norma vektor di C n yang memenuhi pernyataan Sifat 3.2.5 untuk norma matriks F. 11. Tunjukkan bahwa norma matriks 2 adalah norma hasil induksi dari norma Euklid di C n. 12. (a) Misalkan D C n n matriks diagonal. Tentukan D 2. (b) Misalkan A C n n. ρ(a) = A 2. Buktikan bahwa jika A normal, maka 13. Tunjukkan bahwa norma matriks adalah norma hasil induksi dari norma maksimum modulus komponen. 14. Jika adalah norma matriks di C n n hasil induksi, tunjukkan bahwa I n = 1. 15. Misalkan suatu norma vektor di C n dan S C n n tak singular. (a) Tunjukkan bahwa x := Sx mendefinikan sebuah norma vektor di C n. (b) Tunjukkan bahwa norma matriks hasil induksi kedua norma vektor tersebut memenuhi A C n n. = SAS 1, untuk setiap A 16. Misalkan, dua norma di C n. Misalkan pula norma-norma hasil induksi keduanya memenuhi A A, untuk semua A C n n dengan rank 1. Buktikan bahwa terdapat konstanta real positif c yang memenuhi v = c v, untuk setiap v C n. 17. Misalkan A C n n tak singular dan b C n, b 0. Misalkan δb deviasi pada b dan δx deviasi pada solusi yang diakibatkan δb. Tunjukkan bahwa δb b κ(a) δx x.
4 Masalah Nilai Eigen Masalah nilai eigen adalah satu dari dua masalah dasar dalam aljabar linier dan teori matriks. Pada masalah nilai eigen kita mencari nilai-nilai eigen suatu matriks atau pemetaan linier beserta vektor-vektor eigen yang terkait. Dari sudut komputasi, masalah ini adalah masalah yang sukar. Tidak ada satu metode tertentu yang dapat digunakan untuk memperoleh secara eksak nilai eigen semua matriks. 4.1 Lokalisasi Nilai Eigen Ketika menyelesaikan masalah nilai eigen, seringkali kita harus cukup puas dengan metode iteratif. Penentuan lokasi nilai eigen merupakan hal krusial dalam metode-metode iteratif. Dari Teorema 3.2.7, norma matriks dapat digunakan untuk menentukan lokasi nilai-nilai eigen. Semua nilai eigen matriks A C n n berada di dalam lingkaran dengan pusat titik asal dan jari-jari A, untuk sembarang norma di C n n. Penggunaan norma untuk menentukan lokasi nilai eigen masih terlalu kasar. Teorema berikut memberikan lokalisasi yang lebih baik. Bukti teorema memerlukan fakta bahwa nilai-nilai eigen sebuah matriks bergantung secara kontinu pada komponen-komponen matriks tersebut. Sebelum menyatakan teorema, untuk A = [a ij ] C n n kita definisikan terlebih dahulu cakram Gershgorin D i = z C z a ii a ij, i = 1, 2,..., n. j i 49
50 4. MASALAH NILAI EIGEN Teorema 4.1.1 (Gershgorin). Setiap nilai eigen matriks A C n n berada dalam salah satu cakram D i. Lebih jauh, jika gabungan m buah cakram D = D i1 D i2 D im tidak beririsan dengan n m cakram lainnya, maka D memuat tepat m nilai eigen A. Bukti: Untuk membuktikan bagian pertama, misalkan λ C nilai eigen A dengan vektor eigen x C n, x = 1. Maka terdapat k sehingga 1 = x = x k x i, i = 1, 2,..., n. Dari hubungan Ax = λx, komponen ke-k pada Ax adalah a kj x j = λx k, sehingga (λ a kk ) x k = a kj x j. j=1 j k Dengan mengambil modulus, kita peroleh λ a kk a kj x j a kj x k = a kj. j k j k j k Untuk bukti bagian kedua, misalkan D = diag(a 11, a 22,..., a nn ) dan N = A D. Maka A = D+N. Untuk t [0, 1], definisikan A(t) = D+tN. Misalkan k tetap, 1 k n. Perhatikan bahwa cakram Gershgorin D k (t) untuk A(t) memiliki titik pusat a kk, yang tidak bergantung pada t, dan jari-jari yang bergantung secara linier pada t. Ketika t bergerak dari t = 0 ke t = 1, cakram Gershgorin D k (t) membesar dan nilai eigen ke-k bagi A(t) bergerak mengikuti lintasan terhubung Γ k dari a kk ke suatu nilai eigen λ bagi A. Jika λ berada di cakram Gershgorin D j, maka keterhubungan lintasan Γ k membuat D j D k (1) = D j D k. Ini berakibat m lintasan nilai eigen A(t) yang berawal di titik-titik a i1 i 1, a i2 i 2,..., a imim akan berada sepenuhnya di D. Hal serupa juga berlaku bagi n m lintasan nilai eigen A(t) lainnya yang akan berada sepenuhnya di komplemen D. Jadi, D memuat tepat m nilai eigen. Teorema berikut memberikan sebuah aplikasi Teorema Gershgorin. Teorema 4.1.2 (Bauer-Fike). Misalkan A C n n dapat didiagonalkan dan A = SDS 1, dimana S C n n tak singular dan D C n n diagonal. Misalkan E C n n sembarang. Maka untuk setiap nilai eigen µ bagi A + E terdapat nilai eigen λ bagi A yang memenuhi µ λ κ (S) E. Bukti: Misalkan D = diag(λ 1, λ 2,..., λ n ) dan F = S 1 ES. Maka nilainilai eigen A + E adalah nilai-nilai eigen D + F. Dengan mengenakan Teorema 4.1.1 pada matriks D + F kita memperoleh hasil yang diinginkan. Perhatikan bahwa Teorema Bauer-Fike juga menetapkan lokasi nilai eigen di dalam sebuah cakram. Jika kita mengetahui nilai-nilai eigen matriks A,
4.1. LOKALISASI NILAI EIGEN 51 maka nilai-nilai eigen tersebut akan menjadi pusat cakram untuk lokasi nilainilai eigen matriks A + E. Berbeda dengan Teorema Gershgorin, jari-jari cakram yang diberikan Teorema Bauer-Fike konstan. Karena norma-norma matriks ekivalen, kita boleh mengharapkan ada versi lain Teorema Bauer-Fike yang menggunakan norma selain norma-. Teorema 4.1.3 (Bauer-Fike). Misalkan A C n n dapat didiagonalkan dan A = SDS 1, dimana S C n n tak singular dan D C n n diagonal. Misalkan E C n n sembarang. Maka untuk setiap p R, 1 p <, dan untuk setiap nilai eigen µ bagi A + E terdapat nilai eigen λ bagi A yang memenuhi µ λ κ p (S) E p. Bukti: Misalkan v vektor eigen A + E untuk nilai eigen µ. Misalkan w = S 1 v 0 dan F = S 1 ES. Maka (D + F)w = (D + F)S 1 v = S 1 (A + E)v = S 1 µv = µw dan F p S 1 p E p S p = κ p (S) E p. Jika µi D singular, maka µ sama dengan salah satu komponen diagonal utama D, yang beerarti µ = λ, salah satu nilai eigen A. Misalkan sekarang µi D tak singular. Maka w = (µi D) 1 Fw. Kita peroleh juga w p (µi D) 1 p F p w p, sehingga (µi D) 1 p F p 1. Menurut Soal Latihan 2, (µi D) 1 p = 1/ min µ d j, dimana 1 j n D = diag(d 1, d 2,..., d n ). Akibatnya, (µi D) 1 p = 1/ µ λ, untuk suatu nilai eigen λ bagi A. Jadi, terdapat nilai eigen λ bagi A sehingga 1 2 0 2 µ λ F p κ p (S) E p. 1 1 0 Sebagai contoh, misalkan matriks A + E = 1 2 1 1 1 2. Kita dapat 1 2 0 1 1 1 0 0 0 0 mengambil A matriks sirkulan 0 1 1, sehingga E = 1. De- 1 0 1 1 2 0 0 ngan ω = 1 2 + 1 2 i 3, nilai-nilai eigen A adalah 2, 1 + ω, 1 + ω 2, dan S = 1 1 1 1 1 ω ω 2. Kita peroleh κ 1 (S) = κ (S) = 3 dan E 1 = E = 1, 3 1 ω 2 ω sehingga jari-jari cakram Bauer-Fike adalah 3. Di lain pihak, κ 2 (S) = 1 dan E 2 = 1 4 (1 + 5), yang memberikan jari-jari 1 4 (1 + 5) 0, 809. Lokalisasi nilai eigen juga dapat diberikan untuk matriks dengan struktur tertentu. Di Bab 1 kita telah mengenal kuosien Rayleigh untuk matriks Hermite. Teorema 1.3.8 memberikan nilai-nilai eigen matriks sebagai batas
52 4. MASALAH NILAI EIGEN bagi nilai kuosien Rayleigh dalam subruang tertentu. Lebih jauh, nilai-nilai eigen batas tersebut adalah kuosien Rayleigh untuk vektor tertentu, yaitu vektor eigen bagi masing-masing nilai eigen. Hal sebaliknya juga berlaku. Diberikan kuosien Rayleigh untuk sembarang vektor, kita dapat memberikan lokalisasi bagi vektor eigen berdasarkan vektor dan kuosien Rayleigh tersebut. Teorema 4.1.4. Misalkan A C n n matriks Hermite dan u C n dengan u u = 1. Misalkan µ = u Au R. Maka selang {x R x µ Au µu 2 } memuat suatu nilai eigen A. Bukti teorema ini diserahkan kepada pembaca. 4.2 Metode QR Secara teoritis, semua nilai eigen matriks A dapat kita peroleh kalau kita berhasil melakukan dekomposisi Schur pada A, lihat Teorema 2.2.1. Bukti Teorema 2.2.1 bersifat konstruktif, tetapi memerlukan nilai eigen A. Akibatnya, kita tidak dapat menggunakan konstruksi tersebut untuk memperoleh nilai-nilai eigen A. Teknik yang lazim digunakan untuk memperoleh dekomposisi Schur tanpa memerlukan nilai eigen adalah dengan memanfaatkan faktorisasi QR. Berikut ini kita deskripsikan metode QR untuk memperoleh nilai eigen matriks A. Pertama-tama kita konstruksi barisan matriks {A k } sebagai berikut: Inisialisasi: A 0 = A; Iterasi: untuk k = 0, 1,... : A k = Q k R k (faktorisasi QR); A k+1 = R k Q k. Perhatikan bahwa R k = Q k A k, sehingga A k+1 = Q k A kq k, yaitu A k+1 serupa uniter dengan A k. Kita akan perlihatkan bahwa, dengan kondisi tertentu, barisan {A k } konvergen ke sebuah matriks segitiga atas. Kekonvergenan barisan {A k } seperti ini ekivalen dengan barisan {Q k } konvergen ke suatu matriks diagonal diag(e iθ 1, e iθ 2,..., e iθn ).
4.2. METODE QR 53 Sebelum itu, kita perkenalkan dahulu notasi-notasi berikut: Q (k) = Q 0 Q 1 Q k dan R (k) = R k R k 1 R 0. Maka untuk k = 0, 1,..., matriks Q (k) adalah matriks uniter, sedangkan matriks R (k) matriks segitiga atas. Kita mempunyai sifat-sifat berikut. Sifat 4.2.1. Untuk k = 0, 1,... berlaku: 1. A k+1 = ( Q (k)) AQ (k), 2. AQ (k) = Q (k+1) R k+1, 3. A k+1 = Q (k) R (k) adalah faktorisasi QR untuk pangkat ke-k dari A. Bukti: Kita akan membuktikan pernyataan pertama dengan melakukan nduksi pada k. Bukti untuk dua pernyataan lainnya diserahkan kepada pembaca sebagai latihan. Untuk k = 0: A 1 = Q 0 A 0Q 0 = ( Q (0)) AQ (0). Asumsikan k 0 dan A k+1 = ( Q (k)) AQ (k). Maka A k+2 = Q k+1 A k+1q k+1 ( = Q k+1 Q (k)) AQ (k) Q k+1 ( ) = Q (k) Q k+1 AQ (k) Q k+1 ( = Q (k+1)) AQ (k+1). Teorema berikut memberikan syarat cukup bagi kekonvergenan barisan {A k } ke sebuah matriks segitiga atas. Kita tuliskan A k = [a k,ij ]. Sebelum itu, kita berikan sejumlah fakta yang berkaitan dengan kekonvergenan barisan matriks, yang kita perlukan dalam pembuktian teorema. Bukti fakta-fakta tersebut diberikan sebagai latihan. 1. Misalkan {A k } dan {B k } dua barisan di C n n yang konvergen berturutturut ke A dan B di C n n. AB C n n. Maka barisan {A k B k } konvergen ke 2. Misalkan {A k = [a k,ij ]} barisan di C n n dan A = [a ij ] di C n n. Maka {A k } konvergen ke A jika dan hanya jika barisan {a k,ij } konvergen ke a ij, i, j = 1, 2,..., n. 3. Jika sebuah barisan matriks segitiga atas {R k } konvergen ke A, maka A matriks segitiga atas.
54 4. MASALAH NILAI EIGEN 4. Misalkan {U k } barisan matriks uniter di C n n yang konvergen ke U C n n. Maka U juga uniter dan, dengan demikian, himpunan semua matriks uniter di C n n tertutup. Teorema 4.2.2. Misalkan A C n n dapat didiagonalkan, sehingga A = PDP 1, dengan D = diag(λ 1, λ 2,..., λ n ), λ 1 > λ 2 > > λ n > 0. Misalkan pula P 1 = LR, untuk suatu matriks segitiga bawah L dan matriks segitiga atas R. Maka untuk i = 1, 2,..., n, a k,ii konvergen ke λ i, sedangkan untuk 1 j < i n, a k,ij konvergen ke 0. Bukti: Pertama-tama, asumsikan bahwa semua komponen diagonal utama L adalah 1, lihat diskusi sesudah Teorema 2.2.2. Misalkan P = UT adalah faktorisasi QR pada matriks P (jadi U matriks uniter dan T matriks segitiga atas). Maka A k = PD k P 1 = UTD k LR ( = UT D k LD k) D k R. Perhatikan bahwa matriks L k = D k LD k = [l k,ij ] adalah matriks segitiga bawah dengan komponen-komponen: 0 jika i < j, l k,ij = 1 jika i = j, ( ) k λi λ lij j jika i > j. Karena asumsi pada modulus nilai-nilai eigen A, maka L k konvergen ke I. Misalkan L k = I+F k. Maka F k konvergen ke 0, dan TL k = ( I + TF k T 1) T. Kekonvergenan F k ke 0 menyebabkan I + TF k T 1 tak singular untuk semua k > K, dimana K suatu bilangan asli. Untuk k > K, menurut Teorema 2.2.3, terdapat secara tunggal matriks-matriks uniter U k dan matriksmatriks segitiga atas T k = [t k,ij ], sehingga I+TF k T 1 = U k T k dan t k,ii > 0 untuk 1 i n. Barisan matriks uniter {U k } adalah barisan terbatas. Akibatnya, terdapat subbarisan {U k } yang konvergen ke matriks Û. Dari Soal Latihan 6, Û haruslah uniter. Karena T k = U ( k I + TFk T 1), maka subbarisan {T k } juga konvergen ke matriks T. Perhatikan bahwa T adalah matriks segitiga atas yang semua komponen diagonal utamanya tak-negatif. Dengan
4.2. METODE QR 55 mengambil limit subbarisan {I + TF k T 1 }, kita peroleh I = Û T. Akibatnya, semua komponen diagonal utama T positif. Dengan menggunakan Teorema 2.2.3 sekali lagi, haruslah Û = T = I. Argumentasi di atas kita gunakan untuk menunjukkan bahwa jika terdapat subbarisan konvergen lainnya dari {U k } dan {T k }, maka kedua subbarisan tersebut haruslah konvergen ke matriks identitas. Ini berarti bahwa keseluruhan barisan {U k } dan {T k } keduanya konvergen ke I. Dari I + TF k T 1 = U k T k, kita peroleh TL k = U k T k T dan, akibatnya, Q (k 1) R (k 1) = A k = UU k T k TD k R = (UU k ) ( T k TD k R ). Karena UU k matriks uniter dan T k TD k R matriks segitiga atas, maka (UU k ) ( T k TD k R ) adalah juga faktorisasi QR untuk matriks A k. Untuk setiap k, terdapat matriks k = diag (d k,1, d k,2,..., d k,n ), dengan d k,1 = d k,2 = = d k,n = 1, sehingga Q (k 1) = UU k k. Karena P = UT, maka A = UTDT 1 U 1. Dari A k+1 = ( Q (k)) AQ (k), kita peroleh A k+1 = ( Q (k)) UTDT 1 U 1 Q (k) = (UU k+1 k+1 ) UTDT 1 U 1 UU k+1 k+1 = k+1 U k+1 TDT 1 U k+1 k+1. Misalkan B k = U k TDT 1 U k = [b k,ij ]. Karena {U k } konvergen ke matriks identitas, maka {B k } konvergen ke TDT 1 yang merupakan matriks segitiga atas yang diagonal utamanya sama dengan diagonal utama D, yaitu b k,ii konvergen ke λ i, untuk i = 1, 2,..., n, dan b k,ij konvergen ke 0 untuk 1 j < i n. Kita juga memperoleh A k = k B k k. Dengan demikian, untuk i j, a k,ij = d k,i d k,j b k,ij, sedangkan a k,ii = b k,ii. Jadi, untuk i = 1, 2,..., n, a k,ii konvergen ke λ i, dan untuk 1 j < i n, a k,ij konvergen ke 0. Kekonvergenan terakhir ini kita peroleh karena d k,i = 1, untuk i = 1, 2,..., n. Perhatikan bahwa kita menggunakan tanda kutip untuk menyatakan kekonvergenan barisan matriks {A k }. Sesungguhnyalah, yang kita peroleh adalah kekonvergenan komponen-komponen matriks A k yang terletak pada diagonal utama dan di bawahnya. Hanya komponen-komponen tersebut yang relevan untuk pembicaraan kita tentang nilai-nilai eigen matriks A. Sedangkan untuk komponen-komponen di atas diagonal utama matriks A k, kita tidak mengetahui, dan tidak memerlukan, kekonvergenan mereka.
56 4. MASALAH NILAI EIGEN Dalam implementasinya, kita dapat mempercepat kekonvergenan metode QR dengan terlebih dahulu mengubah matriks A ke bentuk Hessenberg. Ini kita lakukan dengan memanfaatkan Teorema 2.2.8. Dengan perubahan ini, metode QR tinggal membuat diagonal tepat di bawah diagonal utama berisikan komponen-komponen 0. 4.3 Metode Lanczos Kita tidak selalu memerlukan semua nilai eigen sebuah matriks. Dalam banyak masalah, kita lebih memerlukan beberapa nilai eigen, biasanya nilai eigen yang ekstrim. Pada subbab ini kita akan membicarakan masalah memperoleh nilai eigen ekstrim matriks real simetris. Metode yang digunakan dikenal dengan nama metode Lanczos. Sepanjang subbab ini, matriks A adalah matriks real yang simetris. Akibatnya, A memiliki n nilai eigen real yang tidak harus berbeda. Misalkan λ 1 λ 2 λ n adalah nilai-nilai eigen A. Dengan Teorema Rayleighx t Ax Ritz (Akibat 1.3.9), kita peroleh λ 1 = min x t x=1 xt Ax = min x 0 x t x, sedangkan x t Ax λ n = maks x t x=1 xt Ax = maks x 0 x t. Dengan kata lain, nilai-nilai eigen ekstrim x A adalah nilai-nilai ekstrim kuosien Rayleigh. Gagasan yang digunakan adalah menggunakan nilai-nilai ekstrim kuosien Rayleigh pada subruang dari R n sebagai hampiran nilai-nilai eigen ekstrim matriks A. Kita memperhalus hampiran yang diperoleh secara iteratif. Perhatikan bahwa kuosien Rayleigh pada dasarnya adalah sebuah fungsi dari R n \ {0} ke R dengan aturan r A (x) = xt Ax x t x. Misalkan {u 1, u 2,..., u n } adalah basis ortonormal bagi R n. Maka U = [u 1 u 2 u n ] R n n matriks ortogonal. Untuk k = 1, 2,..., n, tuliskan matriks U k = [u 1 u 2 u k ] R n k. Setiap unsur subruang S k = u 1, u 2,..., u k dapat dituliskan sebagai U k y, untuk suatu y R k. Untuk k = 1, 2,..., n, definisikan M k = maks{r A (x) x S k, x 0} dan m k = min{r A (x) x S k, x 0}. Akibatnya, λ 1 m k M k λ n. Perhatikan bahwa M k = λ k (U t k AU k), nilai eigen terbesar matriks U t k AU k dan m k = λ 1 (U t k AU k), nilai eigen terkecil matriks U t k AU k. Dari uraian di atas, kita dapat menggunakan M k sebagai hampiran (dari bawah) untuk λ n dan m k sebagai hampiran (dari atas) untuk λ 1. Dengan metode Lanczos, kita mulai dengan k = 1 untuk memperoleh hampiran
4.4. SOAL LATIHAN 57 berupa nilai ekstrim kuosien Rayleigh pada sebuah subruang berdimensi satu. Pada iterasi selanjutnya kita memperbesar dimensi subruang dan, sudah tentu, kita menginginkan hasil iterasi ini memberikan hampiran yang lebih baik. Masalahnya adalah bagaimana kita memperoleh matriks U yang akan memenuhi keinginan kita itu. Misalkan kita sudah melakukan k iterasi. Ini berarti kita sudah memiliki hampiran M k = r A (w k ), dimana w k = U k y k, untuk suatu y k R k. Untuk iterasi berikutnya, kita mencari vektor w k+1 yang memenuhi M k+1 = r A (w k+1 ) > r A (w k ). Vektor w k+1 ini haruslah berada di subruang S k+1. Karena masalah kita adalah menentukan matriks U, dalam hal ini yang kita perlu tentukan adalah vektor u k+1. Secara spesifik, kita ingin memperoleh vektor u k+1 yang akan memberikan w k+1 seperti di atas. Dari kalkulus, kita mengetahui bahwa peningkatan nilai r A terbesar kita dapatkan dalam arah vektor gradien r A. Kita dapat menurunkan bahwa r A (x) = 2 x t x (Ax r A(x)x). Dengan asumsi bahwa r A (w k ) 0, nilai r A akan meningkat bila kita memilih u k+1 sehingga r A (w k ) S k+1. Pada sisi lain, misalkan m k = r A (z k ). Karena penurunan nilai r A terbesar kita dapatkan dalam arah berlawanan dengan gradien r A, kita juga menginginkan u k+1 sehingga r A (z k ) S k+1. Perhatikan bahwa r A (w k ) berada di w k, Aw k. Karena w k S k, maka Aw k A(S k ). Dengan demikian, haruslah S k+1 memuat subruang A(S k ). Tuntutan ini dapat dipenuhi dengan memilih S k+1 = S k + Aw k. Secara iteratif, {u 1, u 2,..., u k } adalah basis ortonormal bagi subruang u 1, Au 1, A 2 u 1,..., A k 1 u 1. Iterasi dapat kita lakukan sepanjang Aw k S k. Subruang x, Ax, A 2 x,..., A k 1 x dinamakan subruang Krylov dan dinotasikan dengan K(A, x, k). Secara umum, dim(k(a, x, k)) k. 4.4 Soal Latihan 1. Misalkan A C n n memenuhi a ii > 1, 2,..., n. Buktikan bahwa A tak singular. a ij, untuk semua i = 2. Misalkan D = diag(d 1, d 2,..., d n ) dan µ C. Jika µi D tak-singular, tunjukkan bahwa (µi D) 1 1 p = min i µ d i. 3. Buktikan Teorema 4.1.4. j=1
58 4. MASALAH NILAI EIGEN 4. Buktikan pernyataan-pernyataan 2 dan 3 pada Teorema 4.2.1. 5. (a) Misalkan {A k } barisan konvergen di C n n. Buktikan bahwa A k, berarti juga {A k }, terbatas. (b) Misalkan {A k } dan {B k } dua barisan di C n n yang konvergen berturut-turut ke A dan B di C n n. {A k B k } konvergen ke AB C n n. Buktikan bahwa barisan 6. Misalkan {U k } barisan matriks uniter di C n n yang konvergen ke U C n n. Tunjukkan bahwa U juga uniter dan, dengan demikian, himpunan semua matriks uniter di C n n tertutup. 7. Berikan argumentasi untuk pernyataan bahwa kedua barisan {U k } dan {T k } pada bukti Teorema 4.2.2 konvergen ke I. 8. Misalkan A R n n dan x R n. Tunjukkan bahwa (x t Ax) = (A+A t )x. Simpulkan bahwa r A (x) = 1 [( A + A t ) x t x 2r A (x)x ]. x Buku\AnalisisMatriks.tex