2.6 Théorème central limite
2.6.1 Enoncé
- Supposons que les v.a. \(X_{1}\),...,\(X_{n}\) sont iid de même densité \(f\) inconnue:
- d'espérance inconnue \(\mu\)
- d'écart-type inconnu \(\sigma\)
Introduisons la variable aléatoire:
\[\boxed{\overline{X}_{n}=\frac{X_{1}+X_{2}+\ldots+X_{n}}{n}}\]
et notons \(f_{\overline{X}_{n}}\) sa densité.
Le théorème central limite (TCL) stipule que, indépendamment de \(f\), \(\mu\) et \(\sigma\):
\[\boxed{\overline{X}_{n}\underset{\scriptsize{n\longrightarrow\infty}}{\sim}\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}}\]
Autrement dit, le TCL indique que, si \(n\) est suffisamment grand, la loi \(\overline{X}_{n}\) suit asymptiquement une distribution normale:
- d'espérance \(\mu\left(\overline{X}_{n}\right)=\mu\)
- de variance \(V\left(\overline{X}_{n}\right)=\frac{\sigma^{2}}{n}\)
2.6.2 Idée de preuve
Ce théorème est fondamental et spectaculaire car il est validé asymptotiquement pour \(f\) est arbitraire.
Les \(X_{1}\),...,\(X_{n}\) formant une famille de v.a. iid donc:
- de même espérance \(\mu\)
- de même variance \(\sigma^{2}\)
- de même densité \(f_{X}=f\)
et par conséquent de même fonction caractéristique \(\varphi_{X}\) supposée définie.
Soit alors la v.a. donnée combinaison linéaire:
\[Z=\sum_{k=1}^{n}\lambda_{k}X_{k}=\frac{1}{n}\sum_{k=1}^{n}X_{k}\]
- d'espérance:\[\boxed{\mu_{Z}=\mu}\]
- de variance:\[\boxed{\sigma_{Z}^{2}=\frac{\sigma^{2}}{n}}\]
on obtient:
\[\varphi_{Z}\left(t\right)=\left[\varphi_{X}\left(\frac{t}{n}\right)\right]^{n}\]
On a alors:
\[\ln\varphi_{Z}\left(t\right)=n\ln\varphi_{X}\left(\frac{t}{n}\right)\]
Or on sait que \(\varphi_{X}\) engendre les moments:
\[\varphi_{X}\left(\alpha\right)=E\left(e^{i\alpha X}\right)=1+i\alpha E\left(X\right)+\frac{1}{2}E\left(X^{2}\right)\left(i\alpha\right)^{2}+o\left(\alpha^{2}\right)\]
soit, puisque \(E\left(X^{2}\right)=V\left(X\right)+E^{2}\left(X\right)=\sigma^{2}+\mu^{2}\):
\[\varphi_{X}\left(\alpha\right)=1+i\alpha\mu-\frac{1}{2}\left(\sigma^{2}+\mu^{2}\right)\alpha^{2}+o\left(\alpha^{2}\right)\]
donc:
\[F\left(\alpha\right)=\ln\varphi_{X}\left(\alpha\right)=\ln\left[1+i\mu\alpha-\frac{\sigma^{2}+\mu^{2}}{2}\alpha^{2}+o\left(\alpha^{2}\right)\right]=\frac{1}{1!}\left(i\mu\alpha-\frac{\sigma^{2}+\mu^{2}}{2}\alpha^{2}\right)-\frac{1}{2!}\left(i\mu\alpha-\frac{\sigma^{2}+\mu^{2}}{2}\alpha^{2}\right)^{2}+o\left(\alpha^{2}\right)\]
soit:
\[F\left(\alpha\right)=\ln\varphi_{X}\left(\alpha\right)=i\mu\alpha-\frac{\sigma^{2}}{2}\alpha^{2}+o\left(\alpha^{2}\right)\]
On a donc:
\[\ln\varphi_{Z}\left(t\right)=nF\left(\frac{t}{n}\right)=i\mu t-\sigma^{2}\frac{t^{2}}{2n}+o\left(\frac{t^{2}}{n}\right)\]
soit:
\[\varphi_{Z}\left(t\right)=e^{i\mu t}\exp\left[-\sigma^{2}\frac{t^{2}}{2n}+o\left(\frac{t^{2}}{n}\right)\right]\]
Par transformation inverse de Fourier, pour \(n\) suffisamment grand:
\[f_{Z}\left(z\right)=\frac{1}{2\pi}\int_{-\infty}^{+\infty}\varphi_{Z}\left(t\right)e^{-itz}dt\cong\frac{1}{2\pi}\int_{-\infty}^{+\infty}e^{-\sigma^{2}\frac{t^{2}}{2n}}e^{-it\left(z-\mu\right)}dt\]
Remarquons que:
\[\sigma^{2}\frac{t^{2}}{2n}+it\left(z-\mu\right)=\frac{\sigma^{2}}{2n}\left[t+\frac{in}{\sigma^{2}}\left(z-\mu\right)\right]^{2}+\frac{n}{2\sigma^{2}}\left(z-\mu\right)^{2}\]
Donc:
\[f_{Z}\left(z\right)=\frac{1}{2\pi}\int_{-\infty}^{+\infty}\varphi_{Z}\left(t\right)e^{-itz}dt=\frac{e^{-\frac{n}{2\sigma^{2}}\left(z-\mu\right)^{2}}}{2\pi}\int_{-\infty}^{+\infty}e^{-\frac{\sigma^{2}}{2n}\left[t+\frac{in}{\sigma^{2}}\left(z-\mu\right)\right]^{2}}dt\]
En admettant que, pour \(\alpha>0\) et \(\beta\in\mathbb{R}\):
\[I\left(\alpha,\beta\right)=\int_{-\infty}^{+\infty}e^{-\alpha\left(x+i\beta\right)^{2}}dx=\sqrt{\frac{\pi}{\alpha}}\]
on obtient donc:
\[f_{Z}\left(z\right)=\frac{e^{-\frac{n}{2\sigma^{2}}\left(z-\mu\right)^{2}}}{2\pi}\frac{\sqrt{2n\pi}}{\sigma}=\frac{1}{\sqrt{2\pi\sigma_{Z}}}e^{-\frac{\left(z-\mu_{Z}\right)^{2}}{2\sigma_{Z}^{2}}}\]
Ainsi:
\[Z=\frac{X_{1}+...+X_{n}}{n}\underset{\scriptsize{n\longrightarrow\infty}}{\sim}\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}\]
2.6.3 Critère numérique approché de convergence vers la loi normale
La convergence approchée vers une loi normale dépend de la forme de \(f\).
On montre qu'il existe une constante \(C\) telle que, si le moment d'ordre \(3\) \(\mu_{3}=E\left(X^{3}\right)\) existe:
\[\left|f_{\overline{X}_{n}}-f_{\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}}\right|\leq\frac{C\mu_{3}}{\sigma^{3}}\frac{1}{\sqrt{n}}\]
Cela signifie que la convergence vers la loi normale \(\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}\) lorsque \(n\) croît est “lente” car le majorant est en \(\frac{1}{\sqrt{n}}\).
Qualitativement, en ordre de grandeur, on peut adopter le critère:
- si \(f\) est proche d'une loi normale, \(f_{\overline{X}_{n}}\) approche \(\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}\) à partir de:\[n\gtrsim4\]
- si \(f\) est “moyennement” proche d'une loi normale, \(f_{\overline{X}_{n}}\) approche \(\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}\) à partir de:\[n\gtrsim12\]
- si \(f\) est “éloignée” d'une loi normale, \(f_{\overline{X}_{n}}\) approche \(\mathcal{N}_{\mu,\frac{\sigma^{2}}{n}}\) à partir de:\[n\gtrsim100\]