2.2 Covariance de \(2\) variables aléatoires
2.2.1 Covariance entre deux v.a.
On appelle convariance l'application \(\left(X,Y\right)\longmapsto Cov\left(X,Y\right)\) définie par:
\[\boxed{Cov\left(X,Y\right)=E\left\{ \left[X-E\left(X\right)\right]\left[Y-E\left(Y\right)\right]\right\} =E\left(XY\right)-E\left(X\right)E\left(Y\right)}\]
Si X et Y sont \(2\) v.a. discrètes:
\[Cov\left(X,Y\right)=\sum_{i=1}^{m}\sum_{j=1}^{n}\left[x_{i}-E\left(X\right)\right]\left[y_{j}-E\left(Y\right)\right]p_{ij}\]
où \(p_{ij}\) est la probabilité de la réalisation de l'événement \(X\) retourne \(x_{i}\) et \(Y\) retourne \(y_{i}\) .
Si X et Y sont \(2\) v.a. dénombrables:
\[Cov\left(X,Y\right)=\sum_{i=1}^{+\infty}\sum_{j=1}^{+\infty}\left[x_{i}-E\left(X\right)\right]\left[y_{j}-E\left(Y\right)\right]p_{ij}\]
où \(p_{ij}\) est la probabilité de la réalisation de l'événement \(X\) retourne \(x_{i}\) et \(Y\) retourne \(y_{i}\) .
Si \(X\) et \(Y\) sont \(2\) v.a. continues:
\[Cov\left(X,Y\right)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}\left[x-E\left(X\right)\right]\left[y-E\left(Y\right)\right]f\left(x,y\right)dxdy\]
où \(d^{2}P=f\left(x,y\right)dxdy\) est la probabilité de la réalisation de l'événement \(X\) retourne une valeur dans \(\left[x,x+dx\right]\) et \(Y\) retourne une valeur dans \(\left[y,y+dy\right]\).
2.2.2 Matrice de covariance entre deux v.a.
La matrice:
\[Var\left(X,Y\right)=\left(\begin{array}{cc}V\left(X\right) & Cov\left(X,Y\right)\\Cov\left(Y,X\right) & V\left(Y\right)\end{array}\right)\]
est appelée matrice de covariance.
Remarquons simplement qu'elle est symétrique et donc diagonalisable.
2.2.3 Coefficient de corrélation entre deux v.a. non constantes
Soient \(2\) v.a. aléatoires \(X\) et \(Y\) non constantes.
Remarquons alors que:
\[\left\{ \begin{array}{l}V\left(X\right)=\sigma^{2}\left(X\right)=Cov\left(X,X\right)\neq0\\V\left(Y\right)=\sigma^{2}\left(Y\right)=Cov\left(Y,Y\right)\neq0\end{array}\right.\]
On définit alors l'application \(\left(X,Y\right)\longmapsto\rho\left(X,Y\right)\) avec:
\[\boxed{r\left(X,Y\right)=\frac{Cov\left(X,Y\right)}{\sigma\left(X\right)\sigma\left(Y\right)}}\]
qui définit le coefficient de corrélation entre les v.a. \(X\) et \(Y\).
On a alors:
\[\boxed{-1\leq r\left(X,Y\right)\leq+1}\]
Si:
- \(r\left(X,Y\right)\) est proche de \(+1\), les 2 v.a. sont fortement corrélées positivement
- \(r\left(X,Y\right)\) est proche de \(-1\), les 2 v.a. sont fortement corrélées négativement
- \(r\left(X,Y\right)\) est proche de \(0\), les 2 v.a. sont faiblement corrélées
Cas particuliers:
- si \(r\left(X,Y\right)=+1\), les 2 v.a. sont parfaitement corrélées positivement
- si \(r\left(X,Y\right)=-1\), les 2 v.a. sont parfaitement corrélées négativement
- si \(r\left(X,Y\right)=0\), les 2 v.a. sont décorrélées
Preuve:
En effet, par exemple dans le cas discret, intéressons-nous au polynôme de degré \(2\):
\[\mathcal{P}:\:\lambda\longmapsto V\left(X_{cr}+\lambda Y_{cr}\right)=E\left[\left(X_{cr}+\lambda Y_{cr}\right)^{2}\right]-0^{2}=1+2\lambda E\left(X_{cr}X_{cr}\right)+\lambda^{2}\]
où \(\lambda\) est un réel et \(X_{cr}\), \(Y_{cr}\) sont \(2\) v.a. centrées réduites associées aux \(2\) v.a. non constantes \(X\) et \(Y\):
\[\left\{ \begin{array}{l}X_{cr}=\frac{X-E\left(X\right)}{\sigma\left(X\right)}\\Y_{cr}=\frac{Y-E\left(Y\right)}{\sigma\left(Y\right)}\end{array}\right.\]
La positivité de \(\mathcal{P}\) exige donc:
\[\Delta^{\prime}=E^{2}\left(X_{cr}Y_{cr}\right)-1\leq0\]
soit:
\[-1\leq E\left(X_{cr}Y_{cr}\right)\leq-1\]
ce qui conduit bien à:
\[-1\leq r\left(X,Y\right)\leq+1\]