« Analyse numérique et calcul scientifique/Généralités sur les matrices » : différence entre les versions

Contenu supprimé Contenu ajouté
m Robot : Remplacement de texte automatisé (- n'est pas + n’est pas , - Aujourd'hui + Aujourd’hui , - d'euros + d’euros , - d'agir + d’agir , - l'apparence + l’apparence )
très nombreuses réparations + rectif niveau, mais il resterait à remplacer tous les || par \| et tous les K^{n,n} par \operatorname M_n(K) et K^{n,m} par \operatorname M_{n,m}(K)
Ligne 4 :
| précédent = [[../Splines/]]
| suivant =
| niveau = 1416
}}
__TOC__
{{Clr}}
 
== Notations et rappels ==
L'ensemble <math>\mathbb{K}</math> est un corps commutatif, <math>\mathbb{R}</math> ou <math>\mathbb{C}</math> et <math>\mathbb{K}^{n,m}</math>, l'espace vectoriel des matrices à <math>n</math> lignes et <math>m</math> colonnes à coefficients dans <math>\mathbb{K}</math>. Si <math>\mathbf{ A}\in\mathbb{ K}^{n,m}</math> a pour coefficients <math>a_{ij}</math>, on notera :
 
:<math>
\mathbf{A}={(a_{ij})}_{i,j} \qquad i\in\{1,\ldots,n\},\quad j\in\{1,\ldots,m\}
</math>
 
où <math>i</math> désigne l'indice de ligne et <math>j</math>, l'indice de colonne.
La matrice <math>\mathbf{ A}^T</math> désigne la transposée de la matrice <math>\mathbf{ A}</math> : <math>\mathbf{ A}^T\in\mathbb{ K}^{m,n}</math> et :
 
:<math>
a^T_{ij}=a_{ji}\qquad i=1,\ldots,n,\quad j=1,\ldots,m
</math>.
 
La matrice <math>\mathbf{ A}^*</math> est l'adjointe de la matrice <math>\mathbf{ A}</math> :
 
:<math>
\mathbf{ A}^*=\bar{\mathbf{ A}}^T
</math>
 
{{Wikipédia|Rayon spectral}}
Lorsque <math>m=n</math> et <math>\mathbf{A}\in\mathbb{C}^{n,n}</math>, si <math>\lambda_i</math>, <math>i=1,\ldots,n</math> sont les valeurs propres dans <math>\mathbb{C}</math> de <math>\mathbf{A}</math> alors le ''rayon spectral'' de <math>\mathbf{A}</math> est:
Lorsque <math>m=n</math> et <math>\mathbf A\in\C^{n,n}</math>, si <math>\lambda_i</math>, <math>i=1,\ldots,n</math> sont les valeurs propres dans <math>\C</math> de <math>\mathbf A</math> alors le ''rayon spectral'' de <math>\mathbf A</math> est :
 
:<math>
\rho(\mathbf{ A})=\max _{i=1,\ldots,n} |\lambda_i|
</math>
 
et sa trace est :
 
:<math>
\mathrmoperatorname{tr}(\mathbf{ A})=\sum_{i=1}^na_{ii}=\sum_{i=1}^n\lambda_i
</math>.
 
{{Wikipédia|Matrice autoadjointe positive|Matrice positive}}
<math>\mathbf{A}\in\mathbb{C}^{n,n}</math> est dite ''positive'' si <math>\forall \vec{x}\in\mathbb{C}^n</math>, <math>(\mathbf{A}\vec{x},\vec{x})\geq 0</math> et ''définie positive'' si <math>\forall \vec{x}\in\mathbb{C}^n</math>, <math>\vec{x}\neq 0</math>, <math>(\mathbf{A}\vec{x},\vec{x})\geqslant 0</math>. La matrice <math>\mathbf{I}</math> désigne la matrice identité dans <math>\mathbb{C}^{n,n}</math>. De plus, une matrice <math>\mathbf{A}</math> est dite ''diagonale'' si <math>a_{ij}=0</math> pour <math>i\neq j</math>. Elle est dite ''bande'' <math>(p,q)</math> si <math>a_{ij}=0</math> pour <math>i\geq j+p</math> et <math>j\geq i+q</math>, soit: à définir
{{Wikipédia|Matrice définie positive}}
<math>\mathbf A\in\C^{n,n}</math> est dite
*''positive'' si <math>\forall x\in\C^n:\quad(\mathbf Ax,x)\ge0</math> ;
*''définie positive'' si <math>\forall x\in\C^n,\quad x\neq 0:\quad(\mathbf{A}x,x)\geqslant 0</math> ;
La matrice <math>\mathbf I</math> désigne la matrice identité dans <math>\C^{n,n}</math>.
De plus, une matrice <math>\mathbf A</math> est dite
*''diagonale'' si <math>a_{ij}=0</math> pour <math>i\neq j</math> ;
*''bande'' <math>(p,q)</math> si <math>a_{ij}=0</math> pour <math>i\geq j+p</math> et <math>j\geq i+q</math>.
 
Elle est dite <math>(2l+1)</math> -diagonale si c’est une matrice bande <math>(l+1,l+1)</math>, c'est-à-dire <math>a_{ij}=0</math> pour <math>i\geq j+l+1</math> et <math>j\geq i+l+1</math>. Il est aussi important de se souvenir des propriétés suivantes :
* une matrice hermitienne <math>\mathbf{ A}\in\mathbb{C}^{n,n}</math> [[Espace préhilbertien complexe/Espaces hermitiens|hermitienne]], c'est-à-dire telle que <math>\mathbf{ A}=\mathbf{ A}^*</math>, a toutes ses valeurs propres réelles et il existe une base de <math>\mathbb{C}^n</math> de vecteurs propres de <math>\mathbf{ A}</math> : <math>\mathbf{ A}</math> est donc diagonalisable. En particulier, une matrice réelle symétrique a toutes ses valeurs propres réelles ;
* une matrice définie positive a toutes ses valeurs propres strictement positives ;
* pour une matrice <math>\mathbf{ A}\in\mathbb{C}^{n,n}</math>, il existe une matrice inversible <math>\mathbf{ P}\in\mathbb{C}^{n,n}</math> telle que la matrice <math>\mathbf{ B}=\mathbf{ P}^{-1}\mathbf{ A}\mathbf{P}</math> soit diagonale par blocblocs, chaque bloc étant une sous-matrice de Jordan <math>\mathbf{J}_p J_p</math> d'ordre <math>n_p</math>, c'est-à-dire telle que :
:<math>
 
\mathbf J_p=\begin{pmatrix}\lambda_p & 1 & 0 & \cdots & 0 \\
<math>
\mathbf{J}_p=\begin{bmatrix}\lambda_p & 1 & 0 & \cdots & 0 \\
0 & \lambda_p & 1 & \ddots & \vdots \\
\vdots & \ddots & \lambda_p & 1 & 0\\
\vdots &&\ddots & \lambda_p & 1 \\
0 &\cdots& \cdots &0& \lambda_p\end{bmatrixpmatrix}
</math>.
 
== Normes matricielles ==
{{Définition
| titre = Définition : Normenorme d'une matricematricielle
| contenu ={{Wikipédia|Norme matricielle}}
On appelle norme matricielle sur <math>\mathbb{K}^{n,n}</math>, toute application de <math>\mathbb{K}^{n,n}\rightarrowto\mathbb{R}^+</math> notée <math>\mathbf{A}\in\mathbb{K}^{n,n}\rightarrow mapsto||\mathbf{A}||</math> possédant les propriétés suivantes :
# <math>||\mathbf{A}cdot||=0\quad\Leftrightarrow\quad \mathbf{A}=\mathbf{0}</math> est une norme ;
# <math>\forall \lambda\in\mathbbmathbf{KA}</math>, <math>\forall \mathbf{AB}\in\mathbb{ K}^{n,n}</math>, <math>\quad||\lambda \mathbf{A}\cdot\mathbf{B}||=\leq ||\lambdamathbf{A}||\; ||\mathbf{AB}||</math>.
}}
# <math>\forall \mathbf{A}</math> et <math>\forall \mathbf{B}\in\mathbb{K}^{n,n}</math>, <math>||\mathbf{A}+\mathbf{B}||\leq ||\mathbf{A}||+||\mathbf{B}||</math>
# <math>\forall \mathbf{A}</math> et <math>\forall \mathbf{B}\in\mathbb{K}^{n,n}</math>, <math>||\mathbf{A}\cdot\mathbf{B}||\leq ||\mathbf{A}||\;||\mathbf{B}||</math>}}
 
{{Exemple|titre=Exemple : norme de Schur|contenu=
==== exemple : Norme de Shur ====
Si <math>\mathbf{A}={(a_{ij})}\in\mathbb{ K}^{n,n}</math>, sa norme de Shur[[w:Issai Schur|Schur]], ou de [[w:Ferdinand Georg Frobenius|Frobenius]], est définie par :
:<math>
\|\mathbf{A}\|_S=\sqrt{\sum_{i,j=1}^n |a_{ij}|^2}
</math>.
}}
 
=== Norme subordonnée ===
<math>
Rappelons (cf. [[Espaces vectoriels normés/Limites et continuité#Continuité des applications linéaires|§ « Continuité des applications linéaires » du cours sur les espaces vectoriel normés]]) qu'étant donnée une norme <math>||\cdot||</math> sur l'espace vectoriel <math>K^n</math>, l’application encore notée <math>||\cdot ||</math> et définie par :
||\mathbf{A}||_S=\sqrt{\sum_{i,j=1}^n |a_{ij}|^2}
:<math>
\mathbf{A}\in K^{n,n}\rightarrow ||\mathbf{A}||=\sup_{x\in K^n,x\neq0}\frac{||\mathbf{A}x||}{||x||}
</math>
est une norme matricielle.
 
Cette norme, dite ''subordonnée à la norme vectorielle'' <math>||\cdot||</math> donnée, vérifie :
:<math>
||\mathbf{A}||=\sup_{0\leq ||x||\leq 1}||\mathbf{A}x||
=\sup_{\|x\|= 1}||\mathbf{A}x||
</math>.
 
{{Définition|titre=Notations|contenu=
==== proposition ====
étant donnéePour <math>||\cdot||p</math> unetel normeque vectorielle<math>1\leq surp\leq +\infty</math>, on notera <math>||\mathbbmathbf{KA}^n||_p</math>, l’applicationla encorenorme notéematricielle subordonnée à la norme vectorielle <math>||\cdot x||_p</math> et définie par :
* si <math>1\leq p<+\infty</math>,
*:<math>
||x||_p=\left(\sum_{i=1}^n |x_i|^p \right)^{1/p}
</math> ;
* si <math>p=+\infty</math>,
*:<math>
||x||_\infty=\max_{i=1,\ldots,n} |x_i|
</math>.
}}
 
{{Proposition|contenu=
<math>
Si <math>\mathbf{A}=(a_{ij})\in K^{n,n}</math>, nous avons :
\mathbf{A}\in\mathbb{K}^{n,n}\rightarrow ||\mathbf{A}||=\sup_{\vec{x}\in\mathbb{K}^n,\vec{x}\neq0}\frac{||\mathbf{A}\vec{x}||}{||\vec{x}||}
*<math>||\mathbf{A}||_1=\max_{j=1,\ldots,n}\sum_{i=1}^n |a_{ij}|</math> ;
</math>
*<math>||\mathbf{A}||_2=\bigl(\rho(\mathbf{A}^* \mathbf{A})\bigr)^{1/2}</math> ;
*<math>||\mathbf{A}||_\infty=\max_{i=1,\ldots,n} \sum_{j=1}^n |a_{ij}|</math>.
}}
 
{{Remarque|titre=Remarques|contenu=
est une norme matricielle. Cette norme vérifie:
# Une norme matricielle n’est pas nécessairement subordonnée à une norme vectorielle, comme la norme de Schur pour laquelle <math>||\mathbf{I}||_S=\sqrt{n}</math>.
 
# Par définition d'une norme subordonnée, nous avons :
<math>
#:<math>
||\mathbf{A}||=\sup_{0\leq ||\vec{x}||\leq 1}||\mathbf{A}\vec{x}||
=\sup_{forall x\vecin K^n,\quad\forall \mathbf{xA}=\in 1K^{n,n},\quad ||\mathbf{A}x||\vec{le\|\mathbf A\|\;||x}||
</math>.
#:Inversement, étant donnée une norme matricielle <math>||\cdot||</math> sur <math>K^{n,n}</math>, il existe toujours une norme vectorielle <math>||\cdot||</math> telle que la majoration ci-dessus soit vérifiée. On peut choisir par exemple :
 
#::<math>
{{Définition
\forall x\in K^n,\quad ||x||=\left\|\begin{pmatrix}
| titre = Définition : Norme subordonnée
| contenu =
La norme matricielle définie par~\eqref{eq:1.1} ou~\eqref{eq:1.2} est dite \emph{subordonnée à la norme vectorielle} <math>||\cdot||</math> donnée.}}
 
La proposition~\ref{prop:1.2} résulte d'un théorème classique concernant les normes dans <math>\mathcal{L}(E,F)</math> où <math>E</math> et <math>F</math> sont des espaces vectoriels sur le même corps <math>\mathbb{K}</math> tels que <math>\dim E=m</math> et <math>\dim F=n</math>.
 
=== Notations ===
Pour <math>p</math> tel que <math>1\leq p\leq +\infty</math>, on notera <math>||\mathbf{A}||_p</math> la norme matricielle subordonnée à la norme vectorielle <math>||\vec{x}||_p</math> définie par:
 
* si <math>1\leq p<+\infty</math>
<math>
||\vec{x}||_p=\left(\sum_{i=1}^n |x_i|^p \right)^{1/p}
</math>
 
* si <math>p=+\infty</math>
 
<math>
||\vec{x}||_\infty=\max_{i=1,\ldots,n} |x_i|
</math>
 
==== Proposition ====
Si <math>\mathbf{A}=(a_{ij})\in\mathbb{K}^{n,n}</math>, nous avons:
 
<math>||\mathbf{A}||_1=\max_{j=1,\ldots,n}\sum_{i=1}^n |a_{ij}|</math>
 
<math>||\mathbf{A}||_2=\bigl(\rho(\mathbf{A}^* \mathbf{A})\bigr)^{1/2}</math>
 
<math>||\mathbf{A}||_\infty=\max_{i=1,\ldots,n} \sum_{j=1}^n |a_{ij}|</math>
 
==== Remarques ====
# Une norme matricielle n’est pas nécessairement subordonnée à une norme vectorielle, comme par exemple la norme de Shur pour laquelle <math>||\mathbf{I}||_S=\sqrt{n}</math>;
# Sous les hypothèses de la proposition~\ref{prop:1.2}, nous avons :
 
:<math>
\forall \vec{x}\in\mathbb{K}^n,\quad\forall \mathbf{A}\in\mathbb{K}^{n,n},\quad ||\mathbf{A}\vec{x}||\leq ||\mathbf{A}||\;||\vec{x}||
</math>
 
Inversement, étant donnée une norme matricelle <math>||\cdot||</math> sur <math>\mathbb{K}^{n,n}</math>, il existe toujours une norme vectorielle <math>||\cdot||</math> telle que~\eqref{eq:1.6} soit vérifiée. On peut choisir par exemple :
 
<math>
\forall\vec{x}\in\mathbb{K}^n,\quad ||\vec{x}||=\left\|\begin{bmatrix}
x_1 & 0 & \cdots & 0 \\
\vdots & \vdots& & \vdots \\
x_n & 0 & \cdots & 0 \\
\end{bmatrixpmatrix}\right\|
</math>.
#:L'axiome 2 de la définition des normes matricielles implique en effet que <math>||\mathbf{A}x||\le\|\mathbf A\|\;||x||</math>.
 
}}
L'axiome (4) de la définition~\ref{def:1.1} implique en effet que <math>||\mathbf{A}\vec{x}||\leq ||\mathbf{A}||\;||\vec{x}||</math>.
 
{{Théorème
| contenu =
Soit <math>\mathbf{A}\in\mathbb{ K}^{n,n}</math> alors pour toute norme matricielle <math>||\cdot||</math>, nous avons <math>\rho(\mathbf{A})\leq ||\mathbf{A}||</math>.}}
 
En général, <math>\rho(\mathbf{A})\neq ||\mathbf{A}||</math>. Cependant, si <math>\mathbf{A}</math> est hermitienne alors <math>\rho(\mathbf{A})=||\mathbf{A}||_2</math> car <math>||\mathbf{A}||_2=\bigl(\rho(\mathbf{A}^*\mathbf{A})\bigr)^{1/2}</math> (cf. proposition ci-dessus), or <math>
\lambda_i(\mathbf{A}^*\mathbf{A})=\bigl(\lambda_i(\mathbf{A})\bigr)^2</math>.
 
 
En général, <math>\rho(\mathbf{A})\neq ||\mathbf{A}||</math>. Cependant lorsque <math>\mathbf{A}</math> est une matrice hermitienne alors <math>\rho(\mathbf{A})=||\mathbf{A}||_2</math> car, d'après~\eqref{eq:1.4}:
 
<math>
||\mathbf{A}||_2=\bigl(\rho(\mathbf{A}^*\mathbf{A})\bigr)^{1/2}\quad\text{et}\quad
\lambda_i(\mathbf{A}^*\mathbf{A})=\bigl(\lambda_i(\mathbf{A})\bigr)^2
</math>
 
{{Théorème
| contenu =
Soit <math>\mathbf{A}\in\mathbb{ K}^{n,n}</math>. Pour tout <math>\varepsilon>0</math>, il existe une norme matricielle <math>||\cdot||</math> subordonnée à une norme vectorielle telle que <math>||\mathbf{A}||\leq \rho(\mathbf{A})+\varepsilon</math>.}}
 
== Suites dans <math>\mathbb{K}^{n,m}</math> ==
{{...}}
 
 
{{Bas de page