3.6 Intervalles de confiance associées à une famille de v.a. iid normales

3.6.1 Hypothèses

Soit une famille de v.a. \(X_{1}\),...,\(X_{n}\) iid i.e.:
Autrement dit, en introduisant:
\[Z_{i}=X_{i,cr}=\frac{X_{i}-\mu}{\sigma}\]
les v.a. \(Z_{1}\),...,\(Z_{n}\) forment une famille de variables iid normales centrées réduites, i.e. de loi \(\mathcal{N}\left(0,1\right)\).

3.6.2 Fonction \(\Gamma\)

Introduisons la fonction Gamma:
\[\Gamma:\left\{ \begin{array}{l}\mathbb{C}\rightarrow\mathbb{C}\\z\longmapsto\Gamma\left(z\right)=\int_{0}^{+\infty}t^{z-1}e^{-t}dt\end{array}\right.\]
définie pour \(Re\left(z\right)>0\).
En intégrant par parties, on trouve la relation de récurrence:
\[\boxed{\Gamma\left(z+1\right)=z\Gamma\left(z\right)}\]
Ainsi, notamment:
\[\Gamma\left(1\right)=\int_{0}^{+\infty}e^{-t}dt=1\]
et:
\[\Gamma\left(\frac{1}{2}\right)=\int_{0}^{+\infty}t^{-\frac{1}{2}}e^{-t}dt=\int_{0}^{+\infty}x^{-1}e^{-x^{2}}2xdx=2\int_{0}^{+\infty}e^{-x^{2}}dx=\sqrt{\pi}\]
Remarque 1:
Il est intéressant de remarquer que pour un entier \(n\) positif ou nul:
\[\Gamma\left(n+1\right)=n\Gamma\left(n\right)=n\times...\times1\times\Gamma\left(1\right)\]
soit:
\[\Gamma\left(n+1\right)=n!\]
Remarque 2:
On connaît la formule de Stirling donnant \(\ln n!\) lorsque \(n\) est entier:
\[\ln\Gamma\left(n+1\right)=\underset{\scriptsize{n\longrightarrow+\infty}}{\approx}n\ln n-n+\frac{1}{2}\ln\left(2\pi n\right)\]
dont on admettra la généralisation dans le cas où \(n\in\mathbb{R}^{+*}\):
\[\ln\Gamma\left(n+1\right)=\underset{\scriptsize{n\longrightarrow+\infty}}{\approx}n\ln n-n+\frac{1}{2}\ln\left(2\pi n\right)\]

3.6.3 Loi de \(\overline{X}_{cr}\)

On montre que la densité de probabilité associée à la v.a.:
\[\overline{Z}_{n}=\frac{Z_{1}+...+Z_{n}}{n}\]
vaut:
\[f_{\overline{Z}_{n}}:\:\left\{ \begin{array}{l}\mathbb{R}\longrightarrow\mathbb{R}^{+}\\\overline{z}\longmapsto\frac{\sqrt{n}}{\sqrt{2\pi}}\exp\left[-\frac{n\overline{z}^{2}}{2}\right]\end{array}\right.\]
Autrement dit \(\overline{Z}_{n}\) suit une loi \(\mathcal{N}\left(\mu,\sigma^{2}\right)\).
Idée de preuve:
\(Z_{1}\),...,\(Z_{n}\) est une famille iid suivant une loi \(\mathcal{N}\left(0,1\right)\).
La probabilité \(d^{n}P\) qu'une réalisation de \(Z_{1}\) se situe dans \(\left[z_{1},z_{1}+z_{1}\right]\),..., de \(Z_{n}\) se situe dans \(\left[z_{n},z_{n}+z_{n}\right]\) s'écrit, ces v.a. étant indépendantes:
\[d^{n}P=f_{Z_{1}}\left(z_{1}\right)dz_{1}\times...\times f_{Z_{n}}\left(z_{n}\right)dz_{n}\]
où les \(f_{Z_{i}}\) s'identifient à:
\[f_{Z}:\:\left\{ \begin{array}{l}\mathbb{R}\longrightarrow\mathbb{R}^{+}\\z\longmapsto\frac{1}{\sqrt{2\pi}}\exp\left[-\frac{z^{2}}{2}\right]\end{array}\right.\]
En définitive:
\[d^{n}P=\frac{1}{\left(2\pi\right)^{\frac{n}{2}}}\exp\left[-\frac{z_{1}^{2}+...+z_{n}^{2}}{2}\right]dz_{1}...dz_{n}\]
La probabilité qu'une réalisation de \(\overline{Z}_{n}\) se situe dans \(\left[\overline{z},\overline{z}+d\overline{z}\right]\) est donc:
\[dP=f_{\overline{Z}_{n}}\left(\overline{z}\right)d\overline{z}\]
avec:
\[f_{\overline{Z}_{n}}\left(\overline{z}\right)=\frac{1}{\left(2\pi\right)^{\frac{n}{2}}}\int_{\overline{z}=\frac{z_{1}+...+z_{n}}{n}}\exp\left[-\frac{z_{1}^{2}+...+z_{n}^{2}}{2}\right]dz_{1}...dz_{n}\]
Il est plus simple de calculer la fonction caractéristique:
\[\varphi_{\overline{Z}_{n}}\left(t\right)=\int_{-\infty}^{+\infty}f_{\overline{Z}_{n}}\left(\overline{z}\right)e^{i\overline{z}t}dz=\frac{1}{\left(2\pi\right)^{\frac{n}{2}}}\int_{-\infty}^{+\infty}...\int_{-\infty}^{+\infty}e^{it\frac{z_{1}+...+z_{n}}{n}}\exp\left[-\frac{z_{1}^{2}+...+z_{n}^{2}}{2}\right]dz_{1}...dz_{n}\]
qui se factorise en:
\[\varphi_{\overline{Z}_{n}}\left(t\right)=\left[\varphi_{Z}\left(t\right)\right]^{n}\]
avec:
\[\varphi_{Z}\left(t\right)=\frac{1}{\left(2\pi\right)^{\frac{1}{2}}}\int_{-\infty}^{+\infty}e^{it\frac{z}{n}}e^{-\frac{z^{2}}{2}}dz=\frac{e^{-\frac{t^{2}}{2n^{2}}}}{\left(2\pi\right)^{\frac{1}{2}}}\int_{-\infty}^{+\infty}e^{-\frac{1}{2}\left(z+\frac{it}{n}\right)^{2}}dz=e^{-\frac{t^{2}}{2n^{2}}}\]
soit:
\[\varphi_{\overline{Z}_{n}}\left(t\right)=\left[\varphi_{Z}\left(t\right)\right]^{n}=e^{-\frac{t^{2}}{2n}}\]
Par transformation de Fourier inverse:
\[f_{\overline{Z}_{n}}\left(\overline{z}\right)=\frac{1}{2\pi}\int_{-\infty}^{+\infty}\varphi_{\overline{Z}_{n}}\left(t\right)e^{-i\overline{z}t}dt=\frac{1}{2\pi}\int_{-\infty}^{+\infty}e^{-\frac{t^{2}}{2n}}e^{-i\overline{z}t}dt=\frac{e^{-\frac{n\overline{z}^{2}}{2}}}{2\pi}\int_{-\infty}^{+\infty}e^{-\frac{1}{2n}\left(t+ni\overline{z}\right)^{2}}dt\]
Finalement:
\[f_{\overline{Z}_{n}}\left(\overline{z}\right)=\frac{e^{-\frac{n\overline{z}^{2}}{2}}}{2\pi}\left(2n\pi\right)^{\frac{1}{2}}=\frac{\sqrt{n}}{\sqrt{2\pi}}e^{-\frac{n\overline{z}^{2}}{2}}\]
Remarque:
Soit une famille de v.a. \(X_{1}\),...,\(X_{n}\) iid suivant la loi \(\mathcal{N}\left(\mu,\sigma^{2}\right)\).
Alors:
\[\overline{X}_{n}=\frac{X_{1}+...+X_{n}}{n}\]
suit une loi \(\mathcal{N}\left(\mu,\frac{\sigma^{2}}{n}\right)\).

3.6.4 Loi du \(\chi^{2}\)

Soit \(Z_{1}\),...,\(Z_{n}\) une famille iid suivant une loi \(\mathcal{N}\left(0,1\right)\).
La densité de probabilité associée à la v.a.:
\[\boxed{W_{n}=Z_{1}^{2}+...+Z_{n}^{2}}\]
vaut:
\[\left\{ \begin{array}{lcc}f_{W_{n}}\left(w\right)=\left(\frac{1}{2}\right)^{\frac{n}{2}}\frac{w^{\frac{n}{2}-1}}{\Gamma\left(\frac{n}{2}\right)}e^{-\frac{w}{2}} & \textrm{si} & w\geq0\\f_{W_{n}}\left(w\right)=0 & \textrm{si} & w<0\end{array}\right.\]
où:
\[\Gamma\left(\frac{n}{2}\right)=\int_{0}^{+\infty}t^{\frac{n}{2}-1}e^{-t}dt\]
met en jeu la fonction \(\Gamma\).
On dit que \(W_{n}\) suit une loi du \(\chi^{2}\) à \(n\) degrés de liberté et on note:
\[W_{n}\sim\chi^{2}\left(n\right)\]
Remarque:
Soit une famille de v.a. \(X_{1}\),...,\(X_{n}\) iid suivant une loi \(\mathcal{N}\left(\mu,\sigma^{2}\right)\).
Alors:
\[W_{n}=\frac{\left(X_{1}-\mu\right)^{2}+...+\left(X_{n}-\mu\right)^{2}}{\sigma^{2}}\]
suit une loi du \(\chi^{2}\) à \(n\) degrés de liberté.

3.6.5 Loi de student

Soit \(Z_{1}\),...,\(Z_{n}\) une famille iid suivant une loi \(\mathcal{N}\left(0,1\right)\).
Soit les v.a.:
\[\left\{ \begin{array}{l}\overline{Z}_{n}=\frac{Z_{1}+...+Z_{n}}{n}\\S_{n}^{2}=\frac{1}{n-1}\left[\left(Z_{1}-\overline{Z}_{n}\right)^{2}+...+\left(Z_{n}-\overline{Z}_{n}\right)^{2}\right]\end{array}\right.\]
On a vu que:
\[\overline{Z}_{n}\sim\mathcal{N}\left(0,\frac{\sigma^{2}}{n}\right)\]
Remarquons que les v.a. \(\left\{ Y_{i}=Z_{i}-\overline{Z}_{n}\right\} _{i\in\left[1,n\right]}\) ne sont pas indépendantes car elles valident la relation:
\[Y_{1}+...+Y_{n}=0\]
En d'autres termes, le nombre de degrés de liberté, i.e. le nombre de variables indépendantes de cette famille est:
\[\boxed{k=n-1}\]
Introduisons la v.a.:
\[W_{n}=\frac{n-1}{\sigma^{2}}S_{n}^{2}=\frac{\left(Z_{1}-\overline{Z}_{n}\right)^{2}+...+\left(Z_{n}-\overline{Z}_{n}\right)^{2}}{\sigma^{2}}\]
On montre que \(W_{n}\) suit une loi du \(\chi^{2}\) à \(k=n-1\) degrés de liberté :
\[\boxed{W_{n}\sim\chi^{2}\left(k=n-1\right)}\]
La densité de probabilité associée à la v.a.:
\[\boxed{T_{n}=\frac{\overline{Z}_{n}}{\frac{S_{n}}{\sqrt{n}}}}\]
vaut:
\[\left\{ \begin{array}{lcc}f_{T_{n}}\left(t\right)=\frac{1}{\sqrt{n\pi}}\frac{\Gamma\left(\frac{n+1}{2}\right)}{\Gamma\left(\frac{n}{2}\right)}\frac{1}{\left(1+\frac{t^{2}}{n}\right)^{\frac{n+1}{2}}} & \textrm{si} & t\geq0\\f_{T_{n}}\left(t\right)=0 & \textrm{si} & t<0\end{array}\right.\]
où:
\[\left\{ \begin{array}{l}\Gamma\left(\frac{n}{2}\right)=\int_{0}^{+\infty}t^{\frac{n}{2}-1}e^{-t}dt\\\Gamma\left(\frac{n+1}{2}\right)=\int_{0}^{+\infty}t^{\frac{n+1}{2}-1}e^{-t}dt\end{array}\right.\]
mettent en jeu la fonction \(\Gamma\).
On dit que \(T_{n}\) suit une loi student à \(k=n-1\) degrés de liberté et on note:
\[T_{n}\sim\mathcal{T}\left(n-1\right)\]
Remarque:
Soit une famille de v.a. \(X_{1}\),...,\(X_{n}\) iid suivant une loi \(\mathcal{N}\left(\mu,\sigma^{2}\right)\).
Introduisons les v.a. définies pour \(k=n-1\) entier strictement positif:
\[\left\{ \begin{array}{l}\overline{X}_{n}=\frac{X_{1}+...+X_{n}}{n}\\S_{n}^{2}=\frac{1}{n-1}\left[\left(X_{1}-\overline{X}_{n}\right)^{2}+...+\left(X_{n}-\overline{X}_{n}\right)^{2}\right]\end{array}\right.\]
Alors:
\[T_{n}=\frac{\overline{X}_{n}-\mu}{\frac{S_{n}}{\sqrt{n}}}\]
suit une loi student à \(n-1\) degrés de liberté.
On note:
\[T_{n}\sim\mathcal{T}\left(n-1\right)\]

3.6.6 Intervalle de confiance associée à une famille de v.a. iid normales d'espérance \(\mu\) et variance \(\sigma^{2}\) inconnues

Soit une v.a. \(X\) de densité \(f\) dont connaît la loi \(\mathcal{F}\left(0,1\right)\) associée à la v.a. centrée réduite \(X_{cr}\)
Soit une famille de v.a. iid \(X_{1}\),...,\(X_{n}\) normales \(\mathcal{N}\left(\mu,\sigma^{2}\right)\) i.e.:
Sachant que, quel que soit le choix de \(f\):
\[\left\{ \begin{array}{l}E\left(\overline{X}_{n}\right)=\mu\\V\left(\overline{X}_{n}\right)=\frac{\sigma^{2}}{n}\end{array}\right.\]
la v.a.:
\[T_{n}=\frac{\overline{X}_{n}-\mu}{\frac{\hat{S}_{n}}{\sqrt{n}}}\]
est centrée réduite et suit une loi student à \(n-1\) degrés de liberté:
Introduisons la fonction quantile \(\gamma\longmapsto t_{\gamma}^{k}\) définie pour \(\gamma\in\left]0,1\right[\) et \(k\in\mathbb{N}^{*}\):
\[P\left(-t_{1-\frac{\alpha}{2}}^{k}\leq T_{n}\leq+t_{1-\frac{\alpha}{2}}^{k}\right)=1-\alpha\]
paramétré par le nombre \(k=n-1\) de degrés de liberté.
A \(\overline{x}_{n}\) donnée à partir d'un échantillon \(\left\{ x_{1},...,x_{n}\right\} \), l'intervalle:
\[\boxed{\mu\in\left[\overline{x}_{n}-t_{\frac{\alpha}{2},}^{n-1}\frac{s_{n}}{\sqrt{n}},\overline{x}_{n}-t_{\frac{\alpha}{2},}^{n-1}\frac{s_{n}}{\sqrt{n}}\right]}\]
est l'intervalle de confiance de niveau \(1-\alpha\) qui est donc tel que:
\[P\left(-t_{1-\frac{\alpha}{2},}^{n-1}\leq T_{n}\leq t_{1-\frac{\alpha}{2},}^{n-1}\right)=\frac{1}{\sqrt{n\pi}}\frac{\Gamma\left(\frac{n+1}{2}\right)}{\Gamma\left(\frac{n}{2}\right)}\int_{-t_{1-\frac{\alpha}{2}}^{n-1}}^{+t_{1-\frac{\alpha}{2}}^{n-1}}\frac{dt}{\left(1+\frac{t^{2}}{n}\right)^{\frac{n+1}{2}}}=1-\alpha\]
\(t_{1-\frac{\alpha}{2}}^{n-1}\) est un quantile de la loi Student que l'on trouve consigné dans des tables donnant \(t_{\gamma}^{k}\) pour des valeurs remarquables utiles.

3.6.7 Comportement asymptotique de la loi de Student

A la limite où \(n\longrightarrow+\infty\), la v.a. centrée réduite:
\[\boxed{T_{n}=\frac{\overline{Z}_{n}}{\frac{S_{n}}{\sqrt{n}}}\underset{\scriptsize{n\longrightarrow+\infty}}{\sim}\mathcal{N}\left(0,1\right)}\]
Qualitativement, \(S_{n}\) converge vers \(\sigma\) et le T.C.L. appliqué à \(\frac{\overline{Z}_{n}}{\frac{\sigma}{\sqrt{n}}}\) indique une convergence vers une loi normale centrée réduite.
Il en résulte que les quantiles de la loi de Student tendent asymptotiquement vers ceux de la loi normale, donc, en particulier:
\[\boxed{t_{1-\frac{\alpha}{2}}^{n-1}\underset{\scriptsize{n\longrightarrow+\infty}}{\sim}z_{1-\frac{\alpha}{2}}}\]