可控制性(Controllability)是控制系統中的重要特性,在許多控制問題中都很重要,例如是否可以透過回授穩定一個本身不穩定的系統,或是最佳控制的相關問題。
可控制性及可觀測性是同一個問題上的对偶概念。
簡單來說,可控制性是指是否可以透過一些允許的程序讓系統調整到其組態空間內的任何一個組態。隨著其系統模型或是框架的不同,定義也會略有改變。
以下是一些在系統或是控制文獻中出現過的可控制性定義:
狀態可控制性是指在确定性系統的状态空间內,也就是系統所有狀態變數數值組成的集合,可以完全描述系統在任一時間以下的狀態。特別是不需要有關系統以往的資訊,只要知道目前的狀態,以後所有的狀態都是已知的。
完全狀態可控制性(有時也稱為狀態可控制性)是指外在輸入(由控制變數組成的向量)可以在有限時間內將系統由任意狀態改變為另一個狀態[1]:737。
可控制性表示可以使系統到達任意狀態,但不表示系統可以維持在該狀態,有可能系統只是在該狀態停留短暫間而已。
考慮連續時間下的線性系統[note 1]
存在一個控制 u {\displaystyle u} 使系統在時間 t 0 {\displaystyle t_{0}} 至時間 t 1 {\displaystyle t_{1}} ,由狀態 x 0 {\displaystyle x_{0}} 改變為狀態 x 1 {\displaystyle x_{1}} ,若且唯若 x 1 − ϕ ( t 0 , t 1 ) x 0 {\displaystyle x_{1}-\phi (t_{0},t_{1})x_{0}} 是以下的列空间中
其中 ϕ {\displaystyle \phi } 是狀態轉移矩陣,而 W ( t 0 , t 1 ) {\displaystyle W(t_{0},t_{1})} 是可控制性格拉姆矩陣。
其實上,若 η 0 {\displaystyle \eta _{0}} 是 W ( t 0 , t 1 ) η = x 1 − ϕ ( t 0 , t 1 ) x 0 {\displaystyle W(t_{0},t_{1})\eta =x_{1}-\phi (t_{0},t_{1})x_{0}} 的解,則控制 u ( t ) = − B ( t ) T ϕ ( t 0 , t ) T η 0 {\displaystyle u(t)=-B(t)^{T}\phi (t_{0},t)^{T}\eta _{0}} 即為所需的控制輸入。
注意上述定義的 W {\displaystyle W} 有以下的特質:
可控制性格拉姆矩陣和狀態轉移矩陣的積分有關。另外有一個較簡單,類似在非時變系統下的可控制性判斷方式。
考慮連續時間的線性系統 Σ {\displaystyle \Sigma } ,在時間區間 [ t 0 , t ] {\displaystyle [t_{0},t]} 內光滑變化:
其狀態轉移矩陣也是光滑的,引入n x m的矩陣函數 M 0 ( t ) = ϕ ( t 0 , t ) B ( t ) {\displaystyle M_{0}(t)=\phi (t_{0},t)B(t)} ,並且定義
考慮一個由 M i {\displaystyle M_{i}} , i = 0 , 1 , … , k {\displaystyle i=0,1,\ldots ,k} 組成的矩陣:
M ( k ) ( t ) := [ M 0 ( t ) , … , M k ( t ) ] {\displaystyle M^{(k)}(t):=\left[M_{0}(t),\ldots ,M_{k}(t)\right]} .
若存在 t ¯ ∈ [ t 0 , t ] {\displaystyle {\bar {t}}\in [t_{0},t]} 以及非負整數k使得 rank M ( k ) ( t ¯ ) = n {\displaystyle \operatorname {rank} M^{(k)}({\bar {t}})=n} ,則 Σ {\displaystyle \Sigma } 為可控制系統[3]。
若 Σ {\displaystyle \Sigma } 在區間 [ t 0 , t ] {\displaystyle [t_{0},t]} 內也是解析變化,則 Σ {\displaystyle \Sigma } 在 [ t 0 , t ] {\displaystyle [t_{0},t]} 中的每個非平凡子區間內可控制,若且唯若存在 t ¯ ∈ [ t 0 , t ] {\displaystyle {\bar {t}}\in [t_{0},t]} 及非負變數使得 r a n k {\displaystyle rank} M ( k ) ( t i ) = n {\displaystyle M^{(k)}(t_{i})=n} [3]。
上述方式仍然很不容易確認,因為包括了狀態轉移矩陣 ϕ {\displaystyle \phi } 的計算。另一個等效的條件如下:令 B 0 ( t ) = B ( t ) {\displaystyle B_{0}(t)=B(t)} ,對於每一個 i {\displaystyle i} ≥ {\displaystyle \geq } 0,定義
此例中,每一個 B i {\displaystyle B_{i}} 是直接由 ( A ( t ) , B ( t ) ) {\displaystyle (A(t),B(t))} 求得。此系統有穩定性的充份必要條件是存在 t ¯ ∈ [ t 0 , t ] {\displaystyle {\bar {t}}\in [t_{0},t]} 及非負整數 k {\displaystyle k} 使得下式成立:
考慮一個在 ( − ∞ , ∞ ) {\displaystyle (-\infty ,\infty )} 內解析變化的系統及矩陣
A ( t ) = [ t 1 0 0 t 3 0 0 0 t 2 ] {\displaystyle A(t)={\begin{bmatrix}t&1&0\\0&t^{3}&0\\0&0&t^{2}\end{bmatrix}}} , B ( t ) = [ 0 1 1 ] . {\displaystyle B(t)={\begin{bmatrix}0\\1\\1\end{bmatrix}}.} 則 [ B 0 ( 0 ) , B 1 ( 0 ) , B 2 ( 0 ) , B 3 ( 0 ) ] = [ 0 1 0 − 1 1 0 0 0 1 0 0 2 ] {\displaystyle [B_{0}(0),B_{1}(0),B_{2}(0),B_{3}(0)]={\begin{bmatrix}0&1&0&-1\\1&0&0&0\\1&0&0&2\end{bmatrix}}} ,其矩陣秩為3,因此在 R {\displaystyle \mathbb {R} } 之內的每一個非平凡區間都是可控制的。
考慮以下的連續線性时不变系统
其中
n × n r {\displaystyle n\times nr} 可控制矩陣為
系統可控制的充份必要條件是其可控制矩陣為滿秩(也就是 rank ( R ) = n {\displaystyle \operatorname {rank} (R)=n} )。
針對離散時間,狀態方程如下的線性狀態空間系統(也就是時間變數 k ∈ Z {\displaystyle k\in \mathbb {Z} } ):
其中 A {\displaystyle A} 是 n × n {\displaystyle n\times n} 的矩陣, B {\displaystyle B} 是 n × r {\displaystyle n\times r} 的矩陣,(也就是 u {\displaystyle \mathbf {u} } 是 r {\displaystyle r} 個輸入,整理成 r × 1 {\displaystyle r\times 1} 的向量)。測試其可控制性的方式為以下 n × n r {\displaystyle n\times nr} 矩陣
有全秩(也就是 rank ( C ) = n {\displaystyle \operatorname {rank} ({\mathcal {C}})=n} )。因此,若此系統可控制, C {\displaystyle {\mathcal {C}}} 會有 n {\displaystyle n} 個線性獨立的列;若 C {\displaystyle {\mathcal {C}}} 中有 n {\displaystyle n} 個列是線性獨立的, n {\displaystyle n} 個狀態中的每一個都可以用適當的輸入變數 u ( k ) {\displaystyle u(k)} 來達到。
假設在初始時間(表示為k=0)狀態 x ( 0 ) {\displaystyle {\textbf {x}}(0)} ,狀態方程可以得到 x ( 1 ) = A x ( 0 ) + B u ( 0 ) {\displaystyle {\textbf {x}}(1)=A{\textbf {x}}(0)+B{\textbf {u}}(0)} ,則 x ( 2 ) = A x ( 1 ) + B u ( 1 ) = A 2 x ( 0 ) + A B u ( 0 ) + B u ( 1 ) {\displaystyle {\textbf {x}}(2)=A{\textbf {x}}(1)+B{\textbf {u}}(1)=A^{2}{\textbf {x}}(0)+AB{\textbf {u}}(0)+B{\textbf {u}}(1)} ,以此類推,利用反覆將狀態變數反向代回,可以得到
或者等效的
將狀態向量 x ( n ) {\displaystyle {\textbf {x}}(n)} 想要的值放在左側時,可解出一連串控制向量的條件是若且唯若等號右側的第一個矩陣有全秩。
例如,考慮 n = 2 {\displaystyle n=2} 和 r = 1 {\displaystyle r=1} 的例子(只有一個控制輸入)。因此, B {\displaystyle B} 和 A B {\displaystyle AB} 是 2 × 1 {\displaystyle 2\times 1} 的向量。若 [ B A B ] {\displaystyle {\begin{bmatrix}B&AB\end{bmatrix}}} 為秩2(滿秩),因此 B {\displaystyle B} 和 A B {\displaystyle AB} 為線性獨立,可以生成整個平面。若秩為1,則 B {\displaystyle B} 和 A B {\displaystyle AB} 平行,無法生成整個平面。
假設初始狀態為0。
在時間 k = 0 {\displaystyle k=0} 時: x ( 1 ) = A x ( 0 ) + B u ( 0 ) = B u ( 0 ) {\displaystyle x(1)=A{\textbf {x}}(0)+B{\textbf {u}}(0)=B{\textbf {u}}(0)}
在時間 k = 1 {\displaystyle k=1} 時: x ( 2 ) = A x ( 1 ) + B u ( 1 ) = A B u ( 0 ) + B u ( 1 ) {\displaystyle x(2)=A{\textbf {x}}(1)+B{\textbf {u}}(1)=AB{\textbf {u}}(0)+B{\textbf {u}}(1)}
在時間 k = 0 {\displaystyle k=0} 時,所有可到達的狀態是在由向量 B {\displaystyle B} 組成的直線上。 在時間 k = 1 {\displaystyle k=1} 時,所有可到達的狀態是在由向量 A B {\displaystyle AB} 和 B {\displaystyle B} 組成的線性組合上。 若系統可控制,這二個向量可以生成整個平面,在時間 k = 2 {\displaystyle k=2} 時即可完成。 前面有假設初始狀態為0,此一假設只是為了推導方便,若可以從原點到達所有的狀態,就可以由任意的初始狀態到所有的狀態(只要進行坐標平移)
上述例子對於所有正整數的 n {\displaystyle n} 都成立,不過 n = 2 {\displaystyle n=2} 的例子比較容易視覺化。
以下是一個用汽車類比(英语:Car analogy)上述範例的例子。 一個人坐在車上,車在一個無窮大的平面上,車頭朝向北方。 目的是透過駕駛(直線前進或是直線倒車)一段距離、停車、轉彎、再駕駛(直線前進或是直線倒車)一段距離的方式到平面上的任何一點。 假如車上沒有方向盤,因此車只能直線前進或後退,車所能到的方向只有車的正南方或正北方的位置上。 沒有方向盤類似 C {\displaystyle C} 的秩為1(二次所走的位移均平行)的情形。
假如車有方向盤,可以任意的旋轉,自然可以到平面上的任何一點,這類似 C {\displaystyle C} 的秩為2的例子。
若將此範圍延伸到 n = 3 {\displaystyle n=3} ,則例子會變成讓飛機到三維空間中的任何一點(不考慮飛機本身的機頭面對方向。 可做的事為:
雖然三維的例子比較不容易視覺化,不過原理類似。
以下控制仿射形式的非線性系統
其在 x 0 {\displaystyle x_{0}} 附近局部可到達(accessible)的條件是可到達分佈 R {\displaystyle R} 可以生成 n {\displaystyle n} 個空間,其中 n {\displaystyle n} 等於 x {\displaystyle x} 的秩,而且R可以由下式表示[4]:
此處 [ a d f k g ] {\displaystyle [\mathrm {ad} _{\mathbf {f} }^{k}\mathbf {\mathbf {g} } ]} 是重複的李括號(英语:Lie bracket of vector fields)運算,定義如下
線性系統的可控制性矩陣可以由此式推導而得。
若離散控制系統具有零可控制性(null-controllable),表示針對某一初始狀態 x ( 0 ) = x 0 {\displaystyle x(0)=x_{0}} ,存在可控制的 u ( k ) {\displaystyle u(k)} 使得 x ( k 0 ) = 0 {\displaystyle x(k_{0})=0} 。此條件和存在矩陣 F {\displaystyle F} 使得 A + B F {\displaystyle A+BF} 為冪零矩陣的條件等價。
此條件可以由可控制-不可控制分離推導而得。
輸出可控制性(Output controllability)是有關系統輸出(以上表示為y)的特性,輸出可控制性描述外在輸入是否可以在有限時間內,將輸出從任意初始狀態控制到特定輸出。輸出可控制性和狀態可控制性不一定會有相關性。尤其:
針對線性連續時間系統,例如由矩陣 A {\displaystyle A} 、 B {\displaystyle B} 、 C {\displaystyle C} 及 D {\displaystyle D} 描述的系統,其 m × ( n + 1 ) r {\displaystyle m\times (n+1)r} 輸出可控制性矩陣
有滿行秩(rank m {\displaystyle m} )若且唯若此系統為輸出可控制系統[1]:742,此結果也是卡尔曼的可控制性準則[來源請求]。
在一些沒有完全控制權的系統,常常無法在可控制子空間內將系統從任意初始位置移到從任意結束位置。會出現此一現象的原因可能是因為系統本身就有的輸入信號限制(例如致動器的飽和)或是因為其他原因而給系統的限制(例如因為安全相關的考量)。在輸入及狀態有限制時的系統可控制性,是可到達性(reachability)[5]及生存理论(英语:viability theory)[6]探討的內容。
在所謂的行為系統理論方法(behavioral system theoretic approach)中,不會直接定義模型輸入-輸出的結構。在此框架內,系統由是由變數集合的允許軌跡來表示,其中有些可能是輸入或是輸出。
在此框架中,可控制的系統是指,系統過去的行為(外在變數的軌跡)可以和任何未來的行為連接,而其連接方式都在可允允許的系統行為內[7]:151。
可穩定性(stabilizability)是比可控制性要弱的一個條件。系統具有可穩定性若所有不可控的狀態都有穩定的動態特性。因此雖然系統中有一些狀態是不可控的,在系統動作時,所有的狀態都還是維持在一定的範圍內(有界)[8]。Hautus引理有針對可穩定性的判斷
令T ∈ Т,且x ∈ X(其中X是所有可能狀態的集合,Т是一段時間區間)。在時間T內從x開始的可達到集合(reachable set)定義為[9]:
R T ( x ) = { z ∈ X : x → T z } {\displaystyle R^{T}{(x)}=\left\{z\in X:x{\overset {T}{\rightarrow }}z\right\}} ,其中 xT→z表示存在一個在時間T內從x到z的狀態轉換。
針對自主系統,其可達到集合為:
其中R為可控制性矩陣。
若以可達到集合來表示,系統有可控制性若且唯若 I m ( R ) = R n {\displaystyle Im(R)=\mathbb {R} ^{n}} 。
證明 根據以下的等式:
考慮系統可控制,因此R的列需為線性獨立,因此
另一個和可達到集合有關的集合為可控制集合(controllable set),定義如下:
Sontag提出了可達到性(reachability)和可控制性的關係[9]:
(a) n維離散線性系統可控制,若且唯若:
(b) 連結時間線性系統可控制,若且唯若:
若且唯若 C ( 0 ) = C e ( 0 ) = X {\displaystyle C(0)=C^{e}{(0)=X}} 針對所有e>0。