3.4 Estimateurs par intervalles de confiance
3.4.1 Introduction
Soit un échantillon \(\left(x_{1},...,x_{n}\right)\) donné.
Il constitue une réalisation d'une famille de \(n\) v.a. iid de même densité \(f_{\theta}\) du paramètre inconnu \(\theta\) que l'on cherche à approcher.
On dispose d'un estimateur \(\left(X_{1},...,X_{n}\right)\longmapsto\hat{\theta}_{n}=\varphi\left(X_{1},...,X_{n}\right)\) de \(\theta\).
On cherche à déterminer avec quel niveau de confiance \(\theta_{n}=\varphi\left(x_{1},...,x_{n}\right)\) est proche de \(\theta\).
Il n'est pas possible de répondre à cette question si on ignore tout de \(f_{\theta}\).
En revanche, il en va différemment si l'on dispose de certaines informations sur la loi \(\mathcal{F}\) suivie par chacune des v.a. indépendantes \(X_{i}\).
3.4.2 Intervalle de confiance d'un paramètre inconnu \(\theta\)
S'il existe un intervalle pour lequel:
\[P\left[\theta_{min}\left(x_{1},...,x_{n}\right)\leq\theta\leq\theta_{max}\left(x_{1},...,x_{n}\right)\right]\leq1-\alpha\]
l'intervalle:
\[IC\left(1-\alpha\right)=\left[\theta_{min}\left(x_{1},...,x_{n}\right),\theta_{max}\left(x_{1},...,x_{n}\right)\right]\]
s'appelle intervalle de confiance à \(1-\alpha\) (donné souvent en pourcentage) de trouver \(\theta\) dans \(IC\left(1-\alpha\right)\).
- Si \(\alpha=0\), on est certain de trouver \(\theta\) dans \(IC\left(1\right)\), intervalle en lequel on a “entièrement confiance”.
- Si \(\alpha=1\), on est certain de ne pas trouver \(\theta\) dans \(IC\left(0\right)\), intervalle en lequel on n'a “aucune confiance”.
3.4.3 Intervalle de confiance associée à l'espérance \(\mu\) inconnue si la variance \(\sigma^{2}\) est connue
Soit une v.a. \(X\) de densité \(f\) dont connaît:
- la loi \(\mathcal{F}\left(0,1\right)\) associée à la v.a. centrée réduite \(X_{cr}\)
- la variance \(\sigma^{2}\) connue
mais dont on ne connaît pas l'espérance \(\mu\).
Soit une famille de v.a. iid \(X_{1}\),...,\(X_{n}\) i.e. indépendantes:
- de même fonction de distribution \(f\)
- de même espérance \(\mu\) inconnue
- de même variance \(\sigma^{2}\) connue
Introduisons la variable:
\[\overline{X}_{n,cr}=\frac{\overline{X}_{n}-\mu}{\frac{\sigma}{\sqrt{n}}}\]
- elle est centrée:\[E\left(\overline{X}_{n,cr}\right)=0\]
- elle est réduite:\[V\left(\overline{X}_{n,cr}\right)=1\]
Elle est donc centrée réduite.
On connaît donc la probabilité que \(a\leq\overline{x}_{n,cr}\leq b\) donnée par:
\[P\left(a\leq\overline{x}_{n,cr}\leq b\right)=\int_{a}^{b}f_{\overline{X}_{n,cr}}\left(\overline{x}_{n,cr}\right)d\overline{x}_{n,cr}\]
Réciproquement, s'il existe \(a\left(\alpha\right)\) et \(b\left(\alpha\right)\) tels que:
\[\int_{a\left(\alpha\right)}^{b\left(\alpha\right)}f_{\overline{X}_{n,cr}}\left(\overline{x}_{n,cr}\right)d\overline{x}_{n,cr}=1-\alpha\]
On dira que \(\overline{x}_{n,cr}\in\left[a\left(\alpha\right),b\left(\alpha\right)\right]\) avec un niveau de confiance de \(1-\alpha\).
A \(\overline{x}_{n}\) donnée à partir d'un échantillon, \(\sigma\) étant connu, on dira que:
\[\mu\in\left[\overline{x}_{n}-b\left(\alpha\right)\frac{\sigma}{\sqrt{n}},\overline{x}_{n}-a\left(\alpha\right)\frac{\sigma}{\sqrt{n}}\right]\]
avec un niveau de confiance de \(1-\alpha\).
Bilan:
Un estimateur sans biais de l'espérance \(\mu\) est donné par:
\[\overline{X}_{n}=\frac{X_{1}+...+X_{n}}{n}\]
A \(\sigma\) connu, \(\mu\) appartient à l'intervalle de confiance \(IC\left(1-\alpha\right)\) de niveau \(1-\alpha\) donné par:
\[\boxed{IC\left(1-\alpha\right)=\left[\overline{x}_{n}-b\left(\alpha\right)\frac{\sigma}{\sqrt{n}},\overline{x}_{n}-a\left(\alpha\right)\frac{\sigma}{\sqrt{n}}\right]}\]
où \(a\left(\alpha\right)\) et \(b\left(\alpha\right)\) seront déterminés si on sait déterminer à partir de \(f\) la loi de la v.a.:
\[\boxed{\overline{X}_{n,cr}=\frac{\overline{X}_{n}-\mu}{\frac{\sigma}{\sqrt{n}}}}\]
3.4.4 Intervalle de confiance associée à l'espérance \(\mu\) et variance \(\sigma^{2}\) inconnues
Soit une v.a. \(X\) de densité \(f\) dont connaît la loi \(\mathcal{F}\left(0,1\right)\) associée à la v.a. centrée réduite \(X_{cr}\)
mais dont on ne connaît ni l'espérance \(\mu\), ni la variance \(\sigma^{2}\).
Soit une famille de v.a. iid \(X_{1}\),...,\(X_{n}\) i.e. indépendantes:
- de même fonction de distribution \(f\)
- de même espérance \(\mu\) inconnue
- de même variance \(\sigma^{2}\) inconnue
Sachant que, quel que soit le choix de \(f\):
\[\left\{ \begin{array}{l}E\left(\overline{X}_{n}\right)=\mu\\V\left(\overline{X}_{n}\right)=\frac{\sigma^{2}}{n}\end{array}\right.\]
la v.a.:
\[\overline{Z}=\overline{X}_{n,cr}=\frac{\overline{X}_{n}-\mu}{\frac{\hat{S}_{n}}{\sqrt{n}}}\]
est centrée réduite.
On connaît donc la probabilité que \(a\leq\overline{z}\leq b\) donnée par:
\[P\left(a\leq\overline{z}\leq b\right)=\int_{a}^{b}f_{\overline{Z}}\left(\overline{z}\right)d\overline{z}\]
Réciproquement, s'il existe \(a\left(\alpha\right)\) et \(b\left(\alpha\right)\) tels que:
\[\int_{a\left(\alpha\right)}^{b\left(\alpha\right)}f_{\overline{Z}}\left(\overline{z}\right)d\overline{z}=1-\alpha\]
On dira que \(\overline{x}_{n,cr}\in\left[a\left(\alpha\right),b\left(\alpha\right)\right]\) avec un niveau de confiance de \(1-\alpha\).
A \(\overline{x}_{n}\) donnée à partir d'un échantillon, \(\sigma\) étant connu, on dira que:
\[\mu\in\left[\overline{x}_{n}-b\left(\alpha\right)\frac{s_{n}}{\sqrt{n}},\overline{x}_{n}-a\left(\alpha\right)\frac{s_{n}}{\sqrt{n}}\right]\]
avec un niveau de confiance de \(1-\alpha\).
Bilan:
Un estimateur sans biais:
- de l'espérance \(\mu\) est donné par lz moyenne arithmétique:\[\overline{X}_{n}=\frac{X_{1}+...+X_{n}}{n}\]
- de la variance \(\sigma^{2}\) est donnée par la varaince empirique:\[\hat{S_{n}^{2}}=\frac{\left(X_{1}-\overline{X}_{n}\right)^{2}+...+\left(X_{n}-\overline{X}_{n}\right)^{2}}{n-1}\]
\(\mu\) appartient à l'intervalle de confiance \(IC\left(1-\alpha\right)\) de niveau \(1-\alpha\) donné par:
\[\boxed{IC\left(1-\alpha\right)=\left[\overline{x}_{n}-b\left(\alpha\right)\frac{s_{n}}{\sqrt{n}},\overline{x}_{n}-a\left(\alpha\right)\frac{s_{n}}{\sqrt{n}}\right]}\]
où \(a\left(\alpha\right)\) et \(b\left(\alpha\right)\) seront déterminés si on sait déterminer à partir de \(f\) la loi de la v.a.:
\[\boxed{\overline{Z}=\frac{\overline{X}_{n,c}}{\frac{\hat{S}_{n}}{\sqrt{n}}}=\frac{\overline{X}_{n}-\mu}{\frac{\hat{S}_{n}}{\sqrt{n}}}}\]