Une matrice A {\displaystyle A} de type n × p {\displaystyle n\times p} est à coefficients positifs lorsque tous ses éléments sont réels positifs ; on écrira alors A ⩾ 0 {\displaystyle A\geqslant 0} . Elle est dite strictement positive lorsque tous ses éléments sont strictement positifs ; on écrira alors A > 0 {\displaystyle A>0} .
A {\displaystyle A} et B {\displaystyle B} étant deux matrices réelles n × p {\displaystyle n\times p} on définit une relation d'ordre partiel sur ces matrices en posant A ⩽ B ⟺ def B − A ⩾ 0 {\displaystyle A\leqslant B\quad {\stackrel {\text{def}}{\Longleftrightarrow }}\quad B-A\geqslant 0} .
Il est immédiat que cette relation d'ordre est compatible avec l'addition. De même elle est compatible avec la multiplication (à gauche ou à droite) par une matrice positive.
À toute matrice carrée positive A ∈ M n ( R + ) {\displaystyle A\in {\mathcal {M}}_{n}(\mathbb {R} _{+})} nous associons le graphe (orienté) G ( A ) {\displaystyle {\mathcal {G}}(A)} défini par :
Rappelons par ailleurs qu'un chemin de longueur k ∈ N {\displaystyle k\in \mathbb {N} } est une suite de k {\displaystyle k} arcs telle que l'extrémité de chaque arc soit l'origine du suivant. L'origine du premier arc est l'origine du chemin et l'extrémité du dernier arc est l'extrémité du chemin. On peut considérer qu'un chemin de longueur 0 {\displaystyle 0} relie chaque sommet à lui-même.
Il est aisé (par exemple en faisant une récurrence) de vérifier :
Lemmes —
Rappelons qu'un graphe est fortement connexe si pour tout couple ( i , j ) {\displaystyle (i,j)} de sommets il existe un chemin joignant i {\displaystyle i} à j {\displaystyle j} . Il résulte alors aisément par utilisation du second lemme ci-dessus que G ( A ) {\displaystyle {\mathcal {G}}(A)} est fortement connexe si et seulement s'il existe un naturel k {\displaystyle k} tel que ( A + I ) k > 0 {\displaystyle (A+I)^{k}>0} .
Tout chemin dans un graphe peut être simplifié en supprimant les cycles (chemin dont l'origine coïncide avec l'extrémité) parcourus dans ce chemin. Par conséquent un tel chemin simplifié ne peut passer qu'une fois au plus par chaque sommet et est donc de longueur inférieure ou égale à n − 1 {\displaystyle n-1} . Le graphe est donc fortement connexe si et seulement s'il existe un naturel k ⩽ n − 1 {\displaystyle k\leqslant n-1} tel que ( A + I ) k > 0 {\displaystyle (A+I)^{k}>0} .
Nous dirons que la matrice carrée positive A ∈ M n ( R + ) {\displaystyle A\in {\mathcal {M}}_{n}(\mathbb {R} _{+})} est irréductible si le graphe G ( A ) {\displaystyle {\mathcal {G}}(A)} est fortement connexe.
En particulier une matrice strictement positive est irréductible puisque chaque sommet i {\displaystyle i} de G ( A ) {\displaystyle {\mathcal {G}}(A)} est relié à tout sommet j {\displaystyle j} par un arc (chemin de longueur 1).
L'étude ci-dessus montre qu'une caractérisation des matrices positives irréductibles est la suivante : Il existe un naturel k ⩽ n − 1 {\displaystyle k\leqslant n-1} tel que ( A + I ) k > 0 {\displaystyle (A+I)^{k}>0} .
On peut également caractériser ces matrices positives irréductibles par ( A + I ) n − 1 > 0 {\displaystyle (A+I)^{n-1}>0} .
Si ( A + I ) k > 0 {\displaystyle (A+I)^{k}>0} pour k ⩽ n − 1 {\displaystyle k\leqslant n-1} on a ( A + I ) n − 1 = ( A + I ) k ( A + I ) n − 1 − k {\displaystyle (A+I)^{n-1}=(A+I)^{k}(A+I)^{n-1-k}} . Mais ( A + I ) n − 1 − k {\displaystyle (A+I)^{n-1-k}} est une matrice positive comportant au moins tous les éléments diagonaux strictement positifs. Il est résulte immédiatement que ( A + I ) n − 1 > 0 {\displaystyle (A+I)^{n-1}>0} . L'inverse est trivial en prenant k = n − 1 {\displaystyle k=n-1} .
Il s'agit évidemment d'une matrice carrée positive non irréductible. En plus des caractérisations évidentes obtenues par négation des caractérisations ci-dessus nous avons :
Lemme — Soit une matrice carrée positive A ∈ M n ( R + ) ( n ⩾ 2 ) {\displaystyle A\in {\mathcal {M}}_{n}(\mathbb {R} _{+})~~(n\geqslant 2)} . Il y a équivalence entre
( 1 ) ⇒ ( 2 ) {\displaystyle (1)~\Rightarrow ~(2)} :
Le graphe G ( A ) {\displaystyle {\mathcal {G}}(A)} n'est pas fortement connexe. Il y a donc un couple ( i , j ) {\displaystyle (i,j)} de sommets tel qu'il n'existe aucun chemin d'origine i {\displaystyle i} et d'extrémité j {\displaystyle j} . Soient alors I {\displaystyle I} l'ensemble des extrémités de tous les chemins d'origine i {\displaystyle i} et J = { 1 , 2 , . . . , n } ∖ I {\displaystyle J=\{1,2,...,n\}\smallsetminus I} . Ces 2 ensembles de sommets vérifient bien la condition demandée.
( 2 ) ⇒ ( 3 ) {\displaystyle (2)~\Rightarrow ~(3)} :
C {\displaystyle {\mathcal {C}}} désignant la base canonique de R n {\displaystyle \mathbb {R} ^{n}} , désignons par C ′ {\displaystyle {\mathcal {C}}'} une base obtenue simplement en réordonnant les vecteurs de C {\displaystyle {\mathcal {C}}} de manière à placer d'abord les vecteurs indexés par les éléments de I {\displaystyle I} et enfin ceux indexés par les éléments de J {\displaystyle J} . S {\displaystyle S} désignant la matrice de passage de C {\displaystyle {\mathcal {C}}} à C ′ {\displaystyle {\mathcal {C}}'} convient à la demande.
( 3 ) ⇒ ( 1 ) {\displaystyle (3)~\Rightarrow ~(1)} :
D'après la remarque ci-dessus ( t S A S ) u , v = 0 ⇔ A σ ( u ) , σ ( v ) = 0 {\displaystyle ({}^{t}SAS)_{u,v}=0~\Leftrightarrow ~A_{\sigma (u),\sigma (v)}=0} . Désignons par U {\displaystyle U} l'ensemble des naturels { 1 , 2 , . . . , p } {\displaystyle \{1,2,...,p\}} où p {\displaystyle p} est le format de la matrice B {\displaystyle B} et soit V = { 1 , 2 , . . . , n } ∖ U {\displaystyle V=\{1,2,...,n\}\smallsetminus U} . Posons I = σ − 1 ( U ) {\displaystyle I=\sigma ^{-1}(U)} et J = σ − 1 ( V ) ( = { 1 , 2 , . . . , n } ∖ I ) {\displaystyle J=\sigma ^{-1}(V)(=\{1,2,...,n\}\smallsetminus I)} . On a donc ∀ u ∈ U ∀ v ∈ V A σ ( u ) , σ ( v ) = 0 {\displaystyle \forall u\in U~\forall v\in V\quad A_{\sigma (u),\sigma (v)}=0} et par conséquent ∀ i ∈ I ∀ j ∈ J A i , j = 0 {\displaystyle \forall i\in I~\forall j\in J\quad A_{i,j}=0} . Ceci entraîne qu'un sommet du graphe G ( A ) {\displaystyle {\mathcal {G}}(A)} appartenant à I {\displaystyle I} ne peut être l'origine d'un chemin dont l'extrémité soit dans J {\displaystyle J} et que le graphe ne peut être fortement connexe.
Théorème de Perron-Frobenius — Soit A {\displaystyle A} une matrice positive irréductible.
Définition : Une matrice carrée positive irréductible de rayon spectral ρ {\displaystyle \rho } est dite primitive si ρ > 0 {\displaystyle \rho >0} [2] et si ρ {\displaystyle \rho } est la seule valeur propre (complexe) de module maximal ρ {\displaystyle \rho } .
Théorème — Soit A {\displaystyle A} une matrice primitive de rayon spectral ρ {\displaystyle \rho } . Alors la suite ( ( 1 ρ ⋅ A ) m ) m ∈ N {\displaystyle \left(\left({\frac {1}{\rho }}\cdot A\right)^{m}\right)_{m\in \mathbb {N} }} est convergente.
Sa limite est une matrice strictement positive où toutes les colonnes appartiennent à la droite vectorielle sous-espace propre de A {\displaystyle A} relatif à ρ {\displaystyle \rho } . Plus précisément cette limite est 1 Π 1 ( ρ ) ⋅ B ( ρ ) {\displaystyle {\frac {1}{\Pi _{1}(\rho )}}\cdot B(\rho )} où Π 1 ( λ ) = Π ( λ ) ( λ − ρ ) {\displaystyle \Pi _{1}(\lambda )={\frac {\Pi (\lambda )}{(\lambda -\rho )}}} , Π ( λ ) {\displaystyle \Pi (\lambda )} étant le polynôme caractéristique de A {\displaystyle A} et B ( λ ) {\displaystyle B(\lambda )} la comatrice transposée de λ I − A {\displaystyle \lambda I-A} .
Les lignes de la limite appartiennent de manière similaire au sous-espace propre à gauche de A {\displaystyle A} relatif à ρ {\displaystyle \rho } (formé des transposées des vecteurs colonne propres de t A {\displaystyle ^{t}A} relatif à ρ {\displaystyle \rho } ).
Nous appliquerons le résultat suivant[3] :
Appliquons ceci avec la matrice M = A {\displaystyle M=A} et le polynôme f m ( λ ) = ( λ ρ ) m {\displaystyle f_{m}(\lambda )=\left({\frac {\lambda }{\rho }}\right)^{m}\quad } ( ρ {\displaystyle \rho } est toujours la valeur propre positive maximale de A {\displaystyle A} et m {\displaystyle m} est un naturel supérieur à l'ordre maximal des valeurs propres (comme racines du polynôme caractéristique de A {\displaystyle A} )).
Nous pouvons choisir λ 1 = ρ {\displaystyle \lambda _{1}=\rho } . Comme ρ {\displaystyle \rho } est valeur propre simple de A {\displaystyle A} d'après P.F. on a p 1 = 1 {\displaystyle p_{1}=1} . Le premier terme de la somme est donc égal à B ( ρ ) Π 1 ( ρ ) {\displaystyle {\frac {B(\rho )}{\Pi _{1}(\rho )}}} .
Nous allons maintenant montrer que chacun des s − 1 {\displaystyle s-1} autres termes tend vers 0 {\displaystyle 0} lorsque m → + ∞ {\displaystyle m\rightarrow +\infty } . Par la formule de Leibniz le i {\displaystyle i} -ème terme s'écrit 1 ρ m 1 ( p i − 1 ) ! ∑ k = 0 p i − 1 ( p i − 1 k ) [ B ( λ ) Π i ( λ ) ] λ = λ i ( k ) m ( m − 1 ) . . . ( m − k + 1 ) λ i m − k {\displaystyle {\frac {1}{\rho ^{m}}}{\frac {1}{(p_{i}-1)!}}\sum _{k=0}^{p_{i}-1}{\binom {p_{i}-1}{k}}\left[{\frac {B(\lambda )}{\Pi _{i}(\lambda )}}\right]_{\lambda =\lambda _{i}}^{(k)}m(m-1)...(m-k+1)\lambda _{i}^{m-k}} . Le terme d'ordre k {\displaystyle k} de cette somme (finie) s'écrit α m ( m − 1 ) . . . ( m − k + 1 ) ( λ i ρ ) m {\displaystyle \alpha ~m(m-1)...(m-k+1)\left({\frac {\lambda _{i}}{\rho }}\right)^{m}} , α {\displaystyle \alpha } étant une constante (indépendante de m {\displaystyle m} ). Mais par hypothèse | λ i ρ | < 1 {\displaystyle \left|{\frac {\lambda _{i}}{\rho }}\right|<1} . On en déduit bien que ce terme tend vers 0 {\displaystyle 0} .
On a donc lim m → + ∞ ( 1 ρ A ) m = B ( ρ ) Π 1 ( ρ ) {\displaystyle \lim _{m\rightarrow +\infty }\left({\frac {1}{\rho }}A\right)^{m}={\frac {B(\rho )}{\Pi _{1}(\rho )}}} .
Mais on montre dans la démonstration de P.F. que B ( ρ ) > 0 {\displaystyle B(\rho )>0} . De plus l'égalité classique ( λ I − A ) B ( λ ) = Π ( λ ) I {\displaystyle (\lambda I-A)B(\lambda )=\Pi (\lambda )I} montre en faisant λ = ρ {\displaystyle \lambda =\rho } que les colonnes de B ( ρ ) {\displaystyle B(\rho )} sont vecteurs propres de A {\displaystyle A} relatifs à ρ {\displaystyle \rho } et donc vecteurs extrémaux.
En travaillant sur la matrice transposée de A {\displaystyle A} (qui a le même polynôme caractéristique que A {\displaystyle A} ) on obtient le résultat analogue concernant les lignes de A {\displaystyle A} .
Théorème — Soit A {\displaystyle A} une matrice carrée positive. Il y a équivalence entre :
(1) ⇒ {\displaystyle \Rightarrow } (2)
On applique le théorème précédent. lim m → ∞ ( 1 ρ A ) m {\displaystyle \lim _{m\rightarrow \infty }\left({\frac {1}{\rho }}A\right)^{m}} est strictement positive et par suite pour m = m o {\displaystyle m=m_{o}} assez grand ( 1 ρ A ) m o > 0 {\displaystyle \left({\frac {1}{\rho }}A\right)^{m_{o}}>0} , ce qui entraîne A m o > 0 {\displaystyle A^{m_{o}}>0} .
(2) ⇒ {\displaystyle \Rightarrow } (1)
Remarquons d'abord que A {\displaystyle A} est irréductible. En effet ( A + I ) m ⩾ A m > 0 {\displaystyle (A+I)^{m}\geqslant A^{m}>0} (par exemple par la formule du binôme).
Soient donc λ {\displaystyle \lambda } une valeur propre complexe de A de module maximal ρ {\displaystyle \rho } et X {\displaystyle X} un vecteur colonne propre associé. | X | {\displaystyle |X|} est vecteur propre de A {\displaystyle A} relatif à ρ {\displaystyle \rho } (cf. démonstration du théorème de Perron Frobenius) et est donc strictement positif. Ainsi A | X | = ρ | X | = | A X | {\displaystyle A|X|=\rho |X|=|AX|} . De A | X | = | A X | {\displaystyle A|X|=|AX|} et A > 0 {\displaystyle A>0} on déduit que les éléments de X {\displaystyle X} ont le même argument α {\displaystyle \alpha } . Donc A | X | e i α = λ | X | e i α {\displaystyle A|X|e^{i\alpha }=\lambda |X|e^{i\alpha }} et en simplifiant par e i α {\displaystyle e^{i\alpha }} on voit que λ = ρ {\displaystyle \lambda =\rho } .
De A m > 0 {\displaystyle A^{m}>0} on déduit par récurrence ( A {\displaystyle A} irréductible ne peut avoir une colonne nulle) que ∀ q ⩾ m , A q > 0 {\displaystyle \forall q\geqslant m,~A^{q}>0} . Soit alors λ {\displaystyle \lambda } une valeur propre de A {\displaystyle A} de module maximal ρ {\displaystyle \rho } et X {\displaystyle X} un vecteur propre associé. De A X = λ X {\displaystyle AX=\lambda X} on déduit ∀ q ⩾ p A q X = λ q X {\displaystyle \forall q\geqslant p~A^{q}X=\lambda ^{q}X} . Mais A q {\displaystyle A^{q}} étant strictement positive, on déduit de ce qui vient d’être montré que ∀ q ⩾ p , λ q = ρ q {\displaystyle \forall q\geqslant p,~\lambda ^{q}=\rho ^{q}} .
En écrivant que λ m = ρ m {\displaystyle \lambda ^{m}=\rho ^{m}} et λ m + 1 = ρ m + 1 {\displaystyle \lambda ^{m+1}=\rho ^{m+1}} on voit que λ = ρ {\displaystyle \lambda =\rho } et A {\displaystyle A} est bien primitive.
On remarque qu'en particulier une matrice strictement positive est primitive (c'est dans ce cas des matrices strictement positive qu'O. Perron a établi son théorème en 1907).
Une matrice carrée positive irréductible non primitive est dite imprimitive. Dans ce cas le nombre h {\displaystyle h} de valeurs propres complexes de module maximal ρ {\displaystyle \rho } est désigné par indice d'imprimitivité de A {\displaystyle A} .
Le théorème de Perron Frobenius ne s'applique pas aux matrices réductibles. Cependant il est possible d'en donner une forme affaiblie valable de manière générale.
Théorème — Soit A {\displaystyle A} une matrice carrée positive. Elle possède une valeur propre positive (ou nulle) ρ {\displaystyle \rho } et le sous-espace propre associé comporte au moins un vecteur propre positif. Toute autre valeur propre complexe de A {\displaystyle A} est de module inférieur (ou égal) à ρ {\displaystyle \rho } .
ρ {\displaystyle \rho } est compris entre le minimum et le maximum des sommes des éléments des lignes de A {\displaystyle A} .
Soit en effet le polynôme caractéristique de A m : Π m ( λ ) = λ n + b m , 1 λ n − 1 + . . . + b m , n {\displaystyle A_{m}:~\Pi _{m}(\lambda )=\lambda ^{n}+b_{m,1}\lambda ^{n-1}+...+b_{m,n}} . Pour tout i ∈ { 1 , 2 , . . . , n } b m , i {\displaystyle i\in \{1,2,...,n\}\quad b_{m,i}} est un polynôme (à coefficients constants) en les éléments de A m {\displaystyle A_{m}} et comme l'ensemble de ces éléments est borné à cause de la convergence de la suite A m {\displaystyle A_{m}} il s'ensuit que l'ensemble des b m , i {\displaystyle b_{m,i}} est borné.
Si maintenant μ {\displaystyle \mu } est une racine complexe non nulle de Π m {\displaystyle \Pi _{m}} on peut écrire 1 + b m , 1 1 μ + . . . + b m , n 1 μ n = 0 {\displaystyle {}1+b_{m,1}{\frac {1}{\mu }}+...+b_{m,n}{\frac {1}{\mu ^{n}}}=0} . Si l'ensemble des valeurs propres des A m {\displaystyle A_{m}} n'était pas borné on aurait une suite μ p {\displaystyle \mu _{p}} de valeurs propres vérifiant lim p → + ∞ | μ p | = + ∞ {\displaystyle \lim _{p\rightarrow +\infty }~|\mu _{p}|=+\infty } . Mais à cause du caractère borné de l'ensemble des b m , i {\displaystyle b_{m,i}} le membre de gauche de l'égalité ci-dessus avec μ = μ p {\displaystyle \mu =\mu _{p}} tendrait vers 1, ce qui est clairement contradictoire.
Ordonnons alors pour tout m {\displaystyle m} les valeurs propres (complexes) λ m , 1 , . . . , λ m , n {\displaystyle \lambda _{m,1},...,\lambda _{m,n}} de A m {\displaystyle A_{m}} dans l’ordre décroissant des modules en plaçant ρ m {\displaystyle \rho _{m}} en première position : λ m , 1 = ρ m {\displaystyle \lambda _{m,1}=\rho _{m}} . L’ensemble des valeurs propres étant borné, on peut extraire de la suite des listes ordonnées ci-dessus une suite encore indexée par m {\displaystyle m} (par abus de langage) telle que ∀ i ∈ { 1 , 2 , . . . , n } λ m , i → λ i {\displaystyle \forall i\in \{1,2,...,n\}~\lambda _{m,i}\rightarrow \lambda _{i}} (en particulier λ m , 1 = ρ m → λ 1 = ρ {\displaystyle \lambda _{m,1}=\rho _{m}\rightarrow \lambda _{1}=\rho } ).
Comme ρ m > 0 {\displaystyle \rho _{m}>0} il s’ensuit que ρ ⩾ 0 {\displaystyle \rho \geqslant 0} . Comme ∀ i ∈ { 1 , , . . . , n } | λ m , i | ⩽ ρ m ∀ i ∈ { 1 , , . . . , n } | λ i | ⩽ ρ {\displaystyle \forall i\in \{1,,...,n\}\quad |\lambda _{m,i}|\leqslant \rho _{m}\qquad \forall i\in \{1,,...,n\}\quad |\lambda _{i}|\leqslant \rho } .
∀ λ ∈ C d e t ( λ I − A m ) → d e t ( λ I − A ) {\displaystyle \forall \lambda \in \mathbb {C} \quad \mathrm {det} (\lambda I-A_{m})\rightarrow \mathrm {det} (\lambda I-A)} (continuité du déterminant).
Or d e t ( λ I − A m ) = ∏ i = 1 n ( λ − λ m , i ) → ∏ i = 1 n ( λ − λ i ) {\displaystyle \mathrm {det} (\lambda I-A_{m})=\prod _{i=1}^{n}(\lambda -\lambda _{m,i})\;\rightarrow \;\prod _{i=1}^{n}(\lambda -\lambda _{i})} . Ceci montre que le polynôme caractéristique de A {\displaystyle A} est Π i = 1 n ( λ − λ i ) {\displaystyle \Pi _{i=1}^{n}(\lambda -\lambda _{i})} et donc que les valeurs propres de A {\displaystyle A} sont exactement les λ i {\displaystyle \lambda _{i}} .
Comme pour tout m {\displaystyle m} le vecteur X m {\displaystyle X_{m}} est normé on peut à nouveau de la suite déjà extraite précédemment extraire une suite que nous indexerons encore par m {\displaystyle m} par abus de langage de façon que X m {\displaystyle X_{m}} converge vers un vecteur X {\displaystyle X} non nul (en fait normé).
On a évidemment X ⩾ 0 {\displaystyle X\geqslant 0} et A X = ρ X {\displaystyle AX=\rho X} par passage à la limite de X m ⩾ 0 {\displaystyle X_{m}\geqslant 0} et A m X m = ρ m X m {\displaystyle A_{m}X_{m}=\rho _{m}X_{m}} .
Enfin pour chaque m ρ m {\displaystyle m\quad \rho _{m}} est compris entre le minimum et le maximum des sommes des lignes de A m {\displaystyle A_{m}} . Par passage à la limite on obtient l'encadrement annoncé sur ρ {\displaystyle \rho } .
Parmi les familles de matrices à coefficients positifs qui ont été beaucoup étudiées on compte les matrices stochastiques, les matrices bistochastiques et les matrices stochastiques à coefficients positifs.