Sauter au contenu
Logo image

Section 12.1 Groupes de matrices

Sous-section 12.1.1 Quelques rappels d’algèbre linéaire

Avant d’étudier les groupes de matrices, nous devons rappeler quelques notions fondamentales d’algèbre linéaire. L’une des idées les plus fondamentales de l’algèbre linéaire est celle de transformation linéaire. Une transformation linéaire ou application linéaire \(T : {\mathbb R}^n \rightarrow {\mathbb R}^m\) est une application qui préserve l’addition de vecteurs et la multiplication par un scalaire ; c’est-à-dire que pour des vecteurs \({\mathbf x}\) et \({\mathbf y}\) dans \({\mathbb R}^n\) et un scalaire \(\alpha \in {\mathbb R}\text{,}\)
\begin{align*} T({\mathbf x}+{\mathbf y}) & = T({\mathbf x}) + T({\mathbf y})\\ T(\alpha {\mathbf y}) & = \alpha T({\mathbf y})\text{.} \end{align*}
Une matrice \(m \times n\) à coefficients dans \({\mathbb R}\) représente une transformation linéaire de \({\mathbb R}^n\) dans \({\mathbb R}^m\text{.}\) Si nous écrivons les vecteurs \({\mathbf x} = (x_1, \ldots, x_n)^\transpose\) et \({\mathbf y} = (y_1, \ldots, y_n)^\transpose\) de \({\mathbb R}^n\) comme matrices colonnes, alors une matrice \(m \times n\)
\begin{equation*} A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} \end{equation*}
envoie les vecteurs dans \({\mathbb R}^m\) linéairement par multiplication matricielle. Remarquons que si \(\alpha\) est un réel,
\begin{equation*} A({\mathbf x} + {\mathbf y} ) = A {\mathbf x }+ A {\mathbf y} \qquad \text{et} \qquad \alpha A {\mathbf x} = A ( \alpha {\mathbf x})\text{,} \end{equation*}
\begin{equation*} {\mathbf x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}\text{.} \end{equation*}
Nous abrégerons souvent la matrice \(A\) en écrivant \((a_{ij})\text{.}\)
Réciproquement, si \(T : {\mathbb R}^n \rightarrow {\mathbb R}^m\) est une application linéaire, nous pouvons associer une matrice \(A\) à \(T\) en considérant ce que \(T\) fait aux vecteurs
\begin{align*} {\mathbf e}_1 & = (1, 0, \ldots, 0)^\transpose\\ {\mathbf e}_2 & = (0, 1, \ldots, 0)^\transpose\\ & \vdots &\\ {\mathbf e}_n & = (0, 0, \ldots, 1)^\transpose\text{.} \end{align*}
On peut écrire tout vecteur \({\mathbf x} = (x_1, \ldots, x_n)^\transpose\) comme
\begin{equation*} x_1 {\mathbf e}_1 + x_2 {\mathbf e}_2 + \cdots + x_n {\mathbf e}_n\text{.} \end{equation*}
Par conséquent, si
\begin{align*} T({\mathbf e}_1) & = (a_{11}, a_{21}, \ldots, a_{m1})^\transpose,\\ T({\mathbf e}_2) & = (a_{12}, a_{22}, \ldots, a_{m2})^\transpose,\\ & \vdots &\\ T({\mathbf e}_n) & = (a_{1n}, a_{2n}, \ldots, a_{mn})^\transpose\text{,} \end{align*}
alors
\begin{align*} T({\mathbf x} ) & = T(x_1 {\mathbf e}_1 + x_2 {\mathbf e}_2 + \cdots + x_n {\mathbf e}_n)\\ & = x_1 T({\mathbf e}_1) + x_2 T({\mathbf e}_2) + \cdots + x_n T({\mathbf e}_n)\\ & = \left( \sum_{k=1}^{n} a_{1k} x_k, \ldots, \sum_{k=1}^{n} a_{mk} x_k \right)^\transpose\\ & = A {\mathbf x}\text{.} \end{align*}

Exemple 12.1.1.

Si nous posons \(T : {\mathbb R}^2 \rightarrow {\mathbb R}^2\) l’application définie par
\begin{equation*} T(x_1, x_2) = (2 x_1 + 5 x_2, - 4 x_1 + 3 x_2)\text{,} \end{equation*}
les axiomes que \(T\) doit satisfaire pour être une transformation linéaire se vérifient aisément. Les vecteurs colonnes \(T {\mathbf e}_1 = (2, -4)^\transpose\) et \(T {\mathbf e}_2 = (5,3)^\transpose\) nous indiquent que \(T\) est donnée par la matrice
\begin{equation*} A = \begin{pmatrix} 2 & 5 \\ -4 & 3 \end{pmatrix}\text{.} \end{equation*}
Puisque nous nous intéressons aux groupes de matrices, nous devons savoir quelles matrices possèdent des inverses multiplicatifs. Rappelons qu’une matrice \(n \times n\) \(A\) est inversible si et seulement s’il existe une autre matrice \(A^{-1}\) telle que \(A A^{-1} = A^{-1} A = I\text{,}\)
\begin{equation*} I = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix} \end{equation*}
est la matrice identité \(n \times n\text{.}\) D’après l’algèbre linéaire, \(A\) est inversible si et seulement si le déterminant de \(A\) est non nul. Une matrice inversible est parfois dite non singulière.

Exemple 12.1.2.

Si \(A\) est la matrice
\begin{equation*} \begin{pmatrix} 2 & 1 \\ 5 & 3 \end{pmatrix}\text{,} \end{equation*}
alors l’inverse de \(A\) est
\begin{equation*} A^{-1} = \begin{pmatrix} 3 & -1 \\ -5 & 2 \end{pmatrix}\text{.} \end{equation*}
L’existence de \(A^{-1}\) est garantie, puisque \(\det(A) = 2 \cdot 3 - 5 \cdot 1 = 1\) est non nul.
D’autres propriétés des déterminants s’avéreront également utiles au cours de ce chapitre. Soient \(A\) et \(B\) des matrices \(n \times n\text{.}\) D’après l’algèbre linéaire, nous avons les propriétés suivantes des déterminants.
  • Le déterminant est un homomorphisme dans le groupe multiplicatif des réels ; c’est-à-dire \(\det( A B) = (\det A )(\det B)\text{.}\)
  • Si \(A\) est une matrice inversible, alors \(\det(A^{-1}) = 1 / \det A\text{.}\)
  • Si nous définissons la transposée d’une matrice \(A = (a_{ij})\) par \(A^\transpose = (a_{ji})\text{,}\) alors \(\det(A^\transpose) = \det A\text{.}\)
  • Soit \(T\) la transformation linéaire associée à une matrice \(n \times n\) \(A\text{.}\) Alors \(T\) multiplie les volumes par un facteur \(|\det A|\text{.}\) Dans le cas de \({\mathbb R}^2\text{,}\) cela signifie que \(T\) multiplie les aires par \(|\det A|\text{.}\)
Les applications linéaires, les matrices et les déterminants sont traités dans tout manuel élémentaire d’algèbre linéaire ; cependant, si vous n’avez pas suivi de cours d’algèbre linéaire, il est relativement simple de vérifier directement ces propriétés pour les matrices \(2 \times 2\text{,}\) le cas qui nous préoccupe le plus.

Sous-section 12.1.2 Les groupes linéaires général et spécial

L’ensemble de toutes les matrices \(n \times n\) inversibles forme un groupe appelé le groupe linéaire général. Nous noterons ce groupe \(GL_n({\mathbb R})\text{.}\) Le groupe linéaire général possède plusieurs sous-groupes importants. Les propriétés multiplicatives du déterminant impliquent que l’ensemble des matrices de déterminant égal à un est un sous-groupe du groupe linéaire général. Autrement dit, supposons que \(\det(A) =1\) et \(\det(B) = 1\text{.}\) Alors \(\det(AB) = \det(A) \det (B) = 1\) et \(\det(A^{-1}) = 1 / \det A = 1\text{.}\) Ce sous-groupe est appelé le groupe linéaire spécial et est noté \(SL_n({\mathbb R})\text{.}\)

Exemple 12.1.3.

Étant donné une matrice \(2 \times 2\)
\begin{equation*} A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\text{,} \end{equation*}
le déterminant de \(A\) est \(ad-bc\text{.}\) Le groupe \(GL_2({\mathbb R})\) est constitué des matrices pour lesquelles \(ad-bc \neq 0\text{.}\) L’inverse de \(A\) est
\begin{equation*} A^{-1} = \frac{1}{ad-bc} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}\text{.} \end{equation*}
Si \(A\) est dans \(SL_2({\mathbb R})\text{,}\) alors
\begin{equation*} A^{-1} = \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}\text{.} \end{equation*}
Géométriquement, \(SL_2({\mathbb R})\) est le groupe qui préserve les aires des parallélogrammes. Soit
\begin{equation*} A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \end{equation*}
un élément de \(SL_2({\mathbb R})\text{.}\) Dans la Figure 12.1.4, le carré unité correspondant aux vecteurs \({\mathbf x} = (1,0)^\transpose\) et \({\mathbf y} = (0,1)^\transpose\) est envoyé par \(A\) sur le parallélogramme de côtés \((1,0)^\transpose\) et \((1, 1)^\transpose\) ; c’est-à-dire que \(A {\mathbf x} = (1,0)^\transpose\) et \(A {\mathbf y} = (1, 1)^\transpose\text{.}\) Remarquons que ces deux parallélogrammes ont la même aire.
Un carré sur un repère avec le bord gauche représenté par un vecteur de l’origine à (0,1) et le bord inférieur par un vecteur de l’origine à (1,0).
Un parallélogramme sur un repère avec le bord gauche représenté par un vecteur de l’origine à (1,1) et le bord inférieur par un vecteur de l’origine à (1,0).
Figure 12.1.4. \(SL_2(\mathbb R)\) agissant sur le carré unité

Sous-section 12.1.3 Le groupe orthogonal \(O(n)\)

Un autre sous-groupe de \(GL_n({\mathbb R})\) est le groupe orthogonal. Une matrice \(A\) est orthogonale si \(A^{-1} = A^\transpose\text{.}\) Le groupe orthogonal est l’ensemble de toutes les matrices orthogonales. Nous notons \(O(n)\) le groupe orthogonal \(n \times n\text{.}\) Nous laissons comme exercice la démonstration que \(O(n)\) est un sous-groupe de \(GL_n( {\mathbb R})\text{.}\)

Exemple 12.1.5.

Les matrices suivantes sont orthogonales :
\begin{equation*} \begin{pmatrix} 3/5 & -4/5 \\ 4/5 & 3/5 \end{pmatrix}, \quad \begin{pmatrix} 1/2 & -\sqrt{3}/2 \\ \sqrt{3}/2 & 1/2 \end{pmatrix}, \quad \begin{pmatrix} -1/\sqrt{2} & 0 & 1/ \sqrt{2} \\ 1/\sqrt{6} & -2/\sqrt{6} & 1/\sqrt{6} \\ 1/ \sqrt{3} & 1/ \sqrt{3} & 1/ \sqrt{3} \end{pmatrix}\text{.} \end{equation*}
Il existe une façon plus géométrique de voir le groupe \(O(n)\text{.}\) Les matrices orthogonales sont exactement les matrices qui préservent la longueur des vecteurs. Nous pouvons définir la longueur d’un vecteur à l’aide du produit scalaire euclidien, ou produit scalaire, de deux vecteurs. Le produit scalaire euclidien de deux vecteurs \({\mathbf x}=(x_1, \ldots, x_n)^\transpose\) et \({\mathbf y}=(y_1, \ldots, y_n)^\transpose\) est
\begin{equation*} \langle {\mathbf x}, {\mathbf y} \rangle = {\mathbf x}^\transpose {\mathbf y} = (x_1, x_2, \ldots, x_n) \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix} = x_1 y_1 + \cdots + x_n y_n\text{.} \end{equation*}
Nous définissons la longueur d’un vecteur \({\mathbf x}=(x_1, \ldots, x_n)^\transpose\) par
\begin{equation*} \| {\mathbf x} \| = \sqrt{\langle {\mathbf x}, {\mathbf x} \rangle} = \sqrt{x_1^2 + \cdots + x_n^2}\text{.} \end{equation*}
À la notion de longueur d’un vecteur est associée l’idée de distance entre deux vecteurs. Nous définissons la distance entre deux vecteurs \({\mathbf x}\) et \({\mathbf y}\) par \(\| {\mathbf x}-{\mathbf y} \|\text{.}\) Nous laissons comme exercice la démonstration de la proposition suivante sur les propriétés des produits scalaires euclidiens.

Exemple 12.1.7.

Le vecteur \({\mathbf x} =(3,4)^\transpose\) a pour longueur \(\sqrt{3^2 + 4^2} = 5\text{.}\) On peut également vérifier que la matrice orthogonale
\begin{equation*} A= \begin{pmatrix} 3/5 & -4/5 \\ 4/5 & 3/5 \end{pmatrix} \end{equation*}
préserve la longueur de ce vecteur. Le vecteur \(A{\mathbf x} = (-7/5,24/5)^\transpose\) est lui aussi de longueur 5.
Puisque \(\det(A A^\transpose) = \det(I) = 1\) et \(\det(A) = \det( A^\transpose )\text{,}\) le déterminant de toute matrice orthogonale est soit \(1\) soit \(-1\text{.}\) Considérons les vecteurs colonnes
\begin{equation*} {\mathbf a}_j = \begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{nj} \end{pmatrix} \end{equation*}
de la matrice orthogonale \(A= (a_{ij})\text{.}\) Puisque \(AA^\transpose = I\text{,}\) \(\langle {\mathbf a}_r, {\mathbf a}_s \rangle = \delta_{rs}\text{,}\)
\begin{equation*} \delta_{rs} = \begin{cases} 1 & r = s \\ 0 & r \neq s \end{cases} \end{equation*}
est le delta de Kronecker. Ainsi, les vecteurs colonnes d’une matrice orthogonale ont tous longueur 1 ; et le produit scalaire euclidien de deux vecteurs colonnes distincts est nul. Tout ensemble de vecteurs satisfaisant ces propriétés est appelé un ensemble orthonormal. Réciproquement, étant donné une matrice \(n \times n\) \(A\) dont les colonnes forment un ensemble orthonormal, il s’ensuit que \(A^{-1} = A^\transpose\text{.}\)
Nous disons qu’une matrice \(A\) est préservatrice de distance, préservatrice de longueur, ou préservatrice de produit scalaire lorsque \(\| A{\mathbf x}- A{\mathbf y} \| =\| {\mathbf x}- {\mathbf y} \|\text{,}\) \(\| A{\mathbf x} \| =\| {\mathbf x} \|\text{,}\) ou \(\langle A{\mathbf x}, A{\mathbf y} \rangle = \langle {\mathbf x},{\mathbf y} \rangle\text{,}\) respectivement. Le théorème suivant, qui caractérise le groupe orthogonal, affirme que ces notions sont équivalentes.

Démonstration.

Nous avons déjà montré que (1) et (2) sont équivalents.
\((2) \Rightarrow (3)\text{.}\)
\begin{align*} \langle A{\mathbf x}, A{\mathbf y} \rangle & = (A {\mathbf x})^\transpose A {\mathbf y}\\ & = {\mathbf x}^\transpose A^\transpose A {\mathbf y}\\ & = {\mathbf x}^\transpose {\mathbf y}\\ & = \langle {\mathbf x}, {\mathbf y} \rangle\text{.} \end{align*}
\((3) \Rightarrow (2)\text{.}\) D’abord, \(\langle A{\mathbf x}, A {\mathbf y} \rangle = (A{\mathbf x})^\transpose A{\mathbf y} = {\mathbf x}^\transpose A^\transpose A {\mathbf y} = {\mathbf x}^\transpose {\mathbf y}.\) Si \(M\) est une matrice \(n \times n\) quelconque, alors \(\mathbf e_i^\transpose M \mathbf e_j^\transpose = M_{ij}\text{,}\)\(M_{ij}\) est le coefficient de ligne \(i\) et colonne \(j\) de la matrice \(M\text{.}\) En remarquant que \({\mathbf x}^\transpose A^\transpose A {\mathbf y} = {\mathbf x}^\transpose {\mathbf y}\text{,}\) posons \(\mathbf x = \mathbf e_i\) et \(\mathbf y = \mathbf e_j\text{.}\) Alors
\begin{equation*} \mathbf e_i^\transpose A^\transpose A \mathbf e_j = \mathbf e_i^\transpose \mathbf e_j. \end{equation*}
Ainsi, le coefficient \(ij\) de \(A^\transpose A\) est \(1\) lorsque \(i = j\) et \(0\) sinon. En d’autres termes, \(A^\transpose A = I\) et \(A^{-1} = A^\transpose\text{.}\)
\((3) \Rightarrow (4)\text{.}\) Si \(A\) préserve le produit scalaire, alors \(A\) préserve la distance, puisque
\begin{align*} \| A{\mathbf x} - A{\mathbf y} \|^2 & = \| A({\mathbf x} - {\mathbf y}) \|^2\\ & = \langle A({\mathbf x} - {\mathbf y}), A({\mathbf x} - {\mathbf y}) \rangle\\ & = \langle {\mathbf x} - {\mathbf y}, {\mathbf x} - {\mathbf y} \rangle\\ & = \| {\mathbf x} - {\mathbf y} \|^2\text{.} \end{align*}
\((4) \Rightarrow (5)\text{.}\) Si \(A\) préserve la distance, alors \(A\) préserve la longueur. En posant \({\mathbf y} = 0\text{,}\) nous obtenons
\begin{equation*} \| A{\mathbf x}\| = \| A{\mathbf x}- A{\mathbf y} \| = \| {\mathbf x}- {\mathbf y} \| = \| {\mathbf x} \|\text{.} \end{equation*}
\((5) \Rightarrow (3)\text{.}\) Nous utilisons l’identité suivante pour montrer que préserver la longueur implique préserver le produit scalaire :
\begin{equation*} \langle {\mathbf x}, {\mathbf y} \rangle = \frac{1}{2} \left[ \|{\mathbf x} +{\mathbf y}\|^2 - \|{\mathbf x}\|^2 - \|{\mathbf y}\|^2 \right]\text{.} \end{equation*}
Observons que
\begin{align*} \langle A {\mathbf x}, A {\mathbf y} \rangle & = \frac{1}{2} \left[ \|A {\mathbf x} + A {\mathbf y} \|^2 - \|A {\mathbf x} \|^2 - \|A {\mathbf y} \|^2 \right]\\ & = \frac{1}{2} \left[ \|A ( {\mathbf x} + {\mathbf y} ) \|^2 - \|A {\mathbf x} \|^2 - \|A {\mathbf y} \|^2 \right]\\ & = \frac{1}{2} \left[ \|{\mathbf x} + {\mathbf y}\|^2 - \|{\mathbf x}\|^2 - \|{\mathbf y}\|^2 \right]\\ & = \langle {\mathbf x}, {\mathbf y} \rangle\text{.} \end{align*}
Deux figures côte à côte. La figure de gauche est un repère avec une flèche pointant vers le haut et la droite depuis l’origine vers (a,b) et une seconde flèche pointant vers le bas et la droite depuis l’origine vers un point (a, -b). La figure de droite est un repère avec une flèche pointant vers le haut et la droite depuis l’origine vers (cosinus thêta, sinus thêta) et une flèche pointant vers le haut et la gauche à angle droit par rapport au premier vecteur depuis l’origine vers (sinus thêta, moins cosinus thêta).
Deux figures côte à côte. La figure de gauche est un repère avec une flèche pointant vers le haut et la droite depuis l’origine vers (a,b) et une seconde flèche pointant vers le bas et la droite depuis l’origine vers un point (a, -b). La figure de droite est un repère avec une flèche pointant vers le haut et la droite depuis l’origine vers (cosinus thêta, sinus thêta) et une flèche pointant vers le haut et la gauche à angle droit par rapport au premier vecteur depuis l’origine vers (sinus thêta, moins cosinus thêta).
Figure 12.1.9. \(O(2)\) agissant sur \(\mathbb R^2\)

Exemple 12.1.10.

Examinons de plus près le groupe orthogonal sur \({\mathbb R}^2\text{.}\) Un élément \(A \in O(2)\) est déterminé par son action sur \({\mathbf e}_1 = (1, 0)^\transpose\) et \({\mathbf e}_2 = (0, 1)^\transpose\text{.}\) Si \(A{\mathbf e}_1 = (a,b)^\transpose\text{,}\) alors \(a^2 + b^2 = 1\text{,}\) puisque la longueur d’un vecteur doit être préservée lors de la multiplication par \(A\text{.}\) Puisque la multiplication par un élément de \(O(2)\) préserve la longueur et l’orthogonalité, \(A{\mathbf e}_2 = \pm(-b, a)^\transpose\text{.}\) Si nous choisissons \(A{\mathbf e}_2 = (-b, a)^\transpose\text{,}\) alors
\begin{equation*} A = \begin{pmatrix} a & -b \\ b & a \end{pmatrix} = \begin{pmatrix} \cos \theta & - \sin \theta \\ \sin \theta & \cos \theta \end{pmatrix}, \end{equation*}
\(0 \leq \theta \lt 2 \pi\text{.}\) La matrice \(A\) fait tourner un vecteur de \(\mathbb R^2\) dans le sens antihoraire autour de l’origine d’un angle \(\theta\) (Figure 12.1.9).
Si nous choisissons \(A{\mathbf e}_2 = (b, -a)^\transpose\text{,}\) nous obtenons la matrice
\begin{equation*} B = \begin{pmatrix} a & b \\ b & -a \end{pmatrix} = \begin{pmatrix} \cos \theta & \sin \theta \\ \sin \theta & -\cos \theta \end{pmatrix}. \end{equation*}
Ici, \(\det B = -1\) et
\begin{equation*} B^2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}. \end{equation*}
Une réflexion par rapport à l’axe horizontal est donnée par la matrice
\begin{equation*} C = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}, \end{equation*}
et \(B = AC\) (voir la Figure 12.1.9). Ainsi, une réflexion par rapport à une droite \(\ell\) est simplement une réflexion par rapport à l’axe horizontal suivie d’une rotation.
Deux autres groupes de matrices ou liés aux matrices que nous considérerons sont le groupe orthogonal spécial et le groupe des mouvements euclidiens. Le groupe orthogonal spécial, \(SO(n)\text{,}\) est simplement l’intersection de \(O(n)\) et \(SL_n({\mathbb R})\) ; c’est-à-dire les éléments de \(O(n)\) de déterminant égal à un. Le groupe euclidien, \(E(n)\text{,}\) peut s’écrire comme l’ensemble des paires ordonnées \((A, {\mathbf x})\text{,}\)\(A\) est dans \(O(n)\) et \({\mathbf x}\) est dans \({\mathbb R}^n\text{.}\) Nous définissons la multiplication par
\begin{equation*} (A, {\mathbf x}) (B, {\mathbf y}) = (AB, A {\mathbf y} +{\mathbf x})\text{.} \end{equation*}
L’élément neutre du groupe est \((I,{\mathbf 0})\) ; l’inverse de \((A, {\mathbf x})\) est \((A^{-1}, -A^{-1} {\mathbf x})\text{.}\) Dans l’Exercice 12.4.6, on vous demande de vérifier que \(E(n)\) est bien un groupe pour cette opération.
Un repère avec une flèche pointant vers le haut et la droite depuis l’origine vers un point x.
Un repère avec une flèche de même longueur et de même direction que dans le diagramme précédent depuis un point situé à droite et au-dessus de l’origine vers un point x + y.
Figure 12.1.11. Translations dans \(\mathbb R^2\)