![]()
當一個方陣無法對角化時,我們還能將它簡化到怎樣的程度?這是線性代數中一個自然又深刻的問題。本文圍繞上述疑問展開,介紹了若爾當標準型——它是方陣在相似變換下所能達到的"最簡形式",也是最接近對角矩陣的標準結構。
無論你是初學線性代數的學生,還是希望重溫這一經典課題的數學愛好者,本文都將帶你一窺矩陣內涵的簡潔之美。
撰文 | 朱慧堅(廣州南方學院數學與統計學院副教授)、丁玖(廣州南方學院數學與統計學院教授)
關于矩陣,我們近來已經寫了幾篇文章,如特征值問題、矩陣可對角化的充分必要條件,以及可對角化的幾類矩陣,如實對稱矩陣和正交矩陣。然而,當一個方陣不可對角化時,或者等價地說,該矩陣至少有一個特征值的代數重數大于幾何重數時,可提的一個數學問題是:通過
![]()
![]()
對于長成這番模樣的矩陣,以及與它們具有相似關系的其他矩陣,其背后暗藏著怎樣的玄機?本文旨在揭開這類矩陣的神秘面紗:在我們熟知的特征值與特征向量背后,還隱藏著一類"廣義特征向量"。它們與普通特征向量一起,如同一根根立柱,共同支撐起矩陣內部結構最簡潔的呈現形式——"若爾當標準型"。由于一般矩陣在實數范圍內可能沒有實特征值,下面的討論都是在復數域中進行。
廣義特征向量
![]()
![]()
若爾當塊與若爾當鏈
![]()
![]()
![]()
![]()
若爾當塊數量公式
到目前為止,為介紹若爾當矩陣標準型的基本思想起見,僅對所得到的標準型只有一個若爾當塊的那些矩陣開發出了一個相似變換化簡程式。這類矩陣僅有一個特征值,它的代數重數自然
![]()
即,計算公式(6)給出本例矩陣標準型各階若爾當塊的個數。
幾乎所有的矩陣都不會是這么特殊的,所以需要繼續挖掘標牌為"若爾當"的矩陣數學金礦。然而,為了讓讀者稍稍放松一下思考中的神經,先離開線性代數的主題,從近代歐洲的數學史中稍稍了解一下若爾當這位十九世紀杰出法國數學家的簡歷。
卡米爾·若爾當(Camille Jordan,1838-1922)以與伽羅瓦群有關的基礎性研究和教科書《巴黎綜合理工學院分析教程》而聞名于世,但他的半生職業卻是工程師。后來他在綜合理工和法蘭西學院教書。他在分析學中最著名的工作是復分析中需要用到的一個拓撲結果"若爾當曲線定理",即該閉曲線將平面分為以曲線為共同邊界的有界"內部"和無界"外部";這幾何上看似直觀,卻非顯然。若爾當矩陣是他留給線性代數這門當今大數據時代最實用學科之一的重大遺產。若爾當于 1870 年首次提出了現以他名字命名的矩陣標準型。
若爾當矩陣
下面將考慮一般方陣的若爾當標準型問題。這時,所給矩陣通常有相異的特征值,并且每個特征值的幾何重數可以是不大于代數重數的任意正整數。因而可以想象它的這個"最簡結構"通常含有若干個若爾當塊。在進一步的討論前,先引進若爾當型矩陣的正式定義。
定義.主對角塊是若爾當塊的一個塊對角方陣 被稱為是若爾當矩陣。
由于若爾當矩陣中的若爾當塊都是上三角矩陣,而且每個若爾當塊只有一個特征值,它就是主對角線上共同的常數,故若爾當矩陣所有特征值的全體,若按代數重數排列,則與所有若爾當塊的主對角元一一對應。這里提醒讀者注意,不同若爾當塊的主對角元可能相同,或言之,每個相異特征值都有可能"攜帶"一個或幾個主對角元都等于這個特征值但尺寸卻可以不一的若爾當塊,全依這個特征值的"級別"而定。這就像國際航空公司的"常旅客計劃"會員制,普通會員只能免費托運一件行李,金卡會員卻可以免費托運兩件行李,而最高級別的鉆石會員則能享受到最高禮遇:免費托運三件行李。正是由于這個待遇,筆者之一去年退休回國時,三件托運行李中的一只帆布大包,裝進了幾十年教學生涯中收集保存的近百本《美國數學月刊》,贈送給了新近成立的廣州南方學院數學與統計學院。希望這一批擁有全世界讀者最多人數、文字與數學均編輯得極為專業、幾近完美的闡述性數學期刊,能給今年秋季入學的"創院首屆生"留下難以磨滅的數學閱讀記憶。
有了上述若爾當矩陣的定義,我們可以進而討論怎樣將一般方陣通過相似變換盡可能地化簡到一個最靠近對角矩陣的"極簡矩陣";這就是它所對應的"若爾當標準型"——若爾當矩陣。作為證明這個標準型存在性定理的先期準備,我們再考慮一種方陣,鞏固讀者對若爾當鏈和若爾當塊的印象。新的矩陣比之前的要求稍微少了一點限制。
![]()
![]()
若爾當標準型定理
然而,具體地將所有的若爾當鏈都提取出來,對一般矩陣而言,寫出詳細的構造性證明是一項頗為繁瑣的工作。在包含若爾當矩陣的書籍中,若爾當矩陣標準型定理的證明都有好幾頁的篇幅,有的需要若干個引理的預備結果。比如美國矩陣理論行家霍恩和約翰遜在他們合著的內容洋洋大觀的《矩陣分析》的第三章第一節專講若爾當標準型定理,借助于舒爾定理"任意復方陣酉相似于上三角矩陣",先證明了這個上三角矩陣又相似于一個塊對角上三角矩陣,其中每個對角塊都有相等的對角元素,繼而證明有相等對角元素的上三角矩陣相似于一個若爾當矩陣。這個過程復雜而冗長。1971 年,蘇聯數學家菲利波夫(Aleksei F. Filippov,1923-2006)發表了一個精巧的證明,其對若爾當標準型的歸納法構造思路,被美國麻省理工學院的數學家斯特朗(Gilbert Strang,1934-)在他的教科書《線性代數及其應用》的附錄 B 中稱為"可能是最清晰簡單的",并把它放進了自己的著作里。
這里,為縮短本文篇幅起見,跟隨菲利波夫思路,用數學歸納法證明
若爾當標準型定理.任何復方陣相似于一個若爾當矩陣。
![]()
![]()
![]()
![]()
若爾當標準型的計算步驟
![]()
![]()
![]()
若爾當標準型的應用
一般方陣的若爾當標準型給出了在相似變換下,該矩陣能夠達到的最簡形式。它保持原矩陣的特征多項式不變,也繼承了特征值及其代數重數和幾何重數。對于可對角化的矩陣,若爾當標準型的外形是對角矩陣。在許多涉及矩陣的問題中,將矩陣化約成對應的若爾當標準型,不僅有可能使得分析和計算更易進行,甚至在某些方面是唯一可行的求解方案。這里給出兩個應用例子,一個早就寫進了教科書,另一個則是十多年來的研究論題。
![]()
![]()
十五年前,當筆者之一讀到楊振寧先生的訪談錄并初步認識到楊-巴克斯特方程與辮群、扭結理論等數學學科的關系后,心中冒出奇想:姑且不論該方程在物理中的重要意義,即便僅僅考察與它具有同一形式的如上矩陣方程,說不定是一件滿足好奇心的快事。說干就干,先手工求
![]()
![]()
矩陣的若爾當標準型揭示出了矩陣的基本性質,其外在表現是特征值、特征向量及其廣義特征向量。由于將有限維向量空間映射到自身的線性算子,在任一被選定的空間基底下有且僅有一個"坐標表示",它就是線性算子的矩陣化。通過這個矩陣的若爾當標準型,人們可以將該線性算子分解成更為簡單的"子算子",使得原先算子的關鍵內涵暴露無遺,易被充分理解。
最后,我們簡單提及矩陣若爾當標準型在通常的大學本科線性代數教材中不大涉及的"矩陣的解析理論"中的一個應用。這個解析理論可使人人都會直接計算的矩陣多項式躍進到傍上微積
![]()
致謝:《返樸》周舒義編輯發現了文中六階矩陣例子的計算錯誤并修改之,特此致謝!
注:本文封面圖片來自版權圖庫,轉載使用可能引發版權糾紛。
![]()
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2.『返樸』提供按月檢索文章功能。關注公眾號,回復四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權說明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.