Skip to content

Commit cc32426

Browse files
authored
Add files via upload
1 parent 24bb418 commit cc32426

15 files changed

Lines changed: 375 additions & 0 deletions
1.04 MB
Binary file not shown.
Lines changed: 159 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,159 @@
1+
{
2+
"cells": [
3+
{
4+
"cell_type": "markdown",
5+
"metadata": {},
6+
"source": [
7+
"# TP 2.1: Un peu de probabilités"
8+
]
9+
},
10+
{
11+
"cell_type": "markdown",
12+
"metadata": {},
13+
"source": [
14+
"## 1. Autour de la loi normale\n",
15+
"\n",
16+
"La fonction `rnorm()` permet de générer des observations indépendantes d'une loi normale. Par défaut, la moyenne de cette loi est nulle et la variance vaut 1."
17+
]
18+
},
19+
{
20+
"cell_type": "code",
21+
"execution_count": null,
22+
"metadata": {},
23+
"outputs": [],
24+
"source": [
25+
"# Génère un vecteur de 10 observations\n",
26+
"vecteur_gaussien_10 <- rnorm(10)\n",
27+
"vecteur_gaussien_10"
28+
]
29+
},
30+
{
31+
"cell_type": "markdown",
32+
"metadata": {},
33+
"source": [
34+
"<div class=\"alert alert-block alert-success\">\n",
35+
" Utilisez la cellule suivante pour répondre aux questions :\n",
36+
" <ol>\n",
37+
" <li>Représenter l'histogramme des valeurs contenues dans <code>vecteur_gaussien_10</code> grâce à la fonction <code>hist()</code> en limitant l'axe des abscisses à $[-3,3]$.</li>\n",
38+
" <li>Effectuer les mêmes opérations en générant cette fois 100 observations dans un objet <code>vecteur_gaussien_100</code>. Commenter.</li>\n",
39+
" <li>Dans une matrice de taille $200 \\times 10$, générer des observations d'une loi normale centrée réduite.</li>\n",
40+
" <li>Calculer les 200 moyennes des 200 échantillons donnés par les lignes de la matrice précédente. Stocker les résultats dans un objet <code>vecteur_moyen_10</code> et représenter l'histogramme de ces 200 moyennes en utilisant la même échelle que précédemment pour l'axe des abscisses.</li>\n",
41+
" <li>Calculer la moyenne et la variance des valeurs du vecteur <code>vecteur_moyen_10</code>. Ces résultats sont-ils cohérents avec les valeurs théoriques ?</li>\n",
42+
" <li>Effectuer les mêmes opérations avec des échantillons de 100 observations dans une matrice $200 \\times 100$.</li>\n",
43+
" </ol>\n",
44+
"</div>"
45+
]
46+
},
47+
{
48+
"cell_type": "code",
49+
"execution_count": null,
50+
"metadata": {},
51+
"outputs": [],
52+
"source": [
53+
"# À FAIRE"
54+
]
55+
},
56+
{
57+
"cell_type": "markdown",
58+
"metadata": {},
59+
"source": [
60+
"## 2. Vers la loi du $\\chi^2$\n",
61+
"\n",
62+
"Comme dans l'exercice précédent, nous générons 200 échantillons de 10 observations générées selon un loi normale centrée réduite."
63+
]
64+
},
65+
{
66+
"cell_type": "code",
67+
"execution_count": null,
68+
"metadata": {},
69+
"outputs": [],
70+
"source": [
71+
"matrice_200_10 <- matrix(rnorm(200*10), nrow=200)"
72+
]
73+
},
74+
{
75+
"cell_type": "markdown",
76+
"metadata": {},
77+
"source": [
78+
"<div class=\"alert alert-block alert-success\">\n",
79+
" Utilisez la cellule suivante pour répondre aux questions :\n",
80+
" <ol>\n",
81+
" <li>À partir de la matrice <code>matrice_200_10</code>, calculer le vecteur <code>vecteur_carre_10</code> de longueur 200 contenant la somme des carrés des valeurs de chacun des 200 échantillons de taille 10.</li>\n",
82+
" <li>Représenter l'histogramme de ces valeurs.</li>\n",
83+
" <li>Superposer la densité d'une loi de $\\chi^2$ (fonction <code>dchisq()</code>)à 10 degrés de liberté.<br>\n",
84+
" <center><img src=\"img/chi2.png\"></center></li>\n",
85+
" </ol>\n",
86+
"</div>"
87+
]
88+
},
89+
{
90+
"cell_type": "code",
91+
"execution_count": null,
92+
"metadata": {},
93+
"outputs": [],
94+
"source": [
95+
"# À FAIRE"
96+
]
97+
},
98+
{
99+
"cell_type": "markdown",
100+
"metadata": {},
101+
"source": [
102+
"## 3. Vers la loi de Fisher\n",
103+
"\n",
104+
"Nous générons cette fois deux matrices remplies d'observations indépendantes de loi normale centrée réduite et de tailles respectives $200 \\times 5$ et $200 \\times 10$."
105+
]
106+
},
107+
{
108+
"cell_type": "code",
109+
"execution_count": null,
110+
"metadata": {},
111+
"outputs": [],
112+
"source": [
113+
"matrice_200_5 <- matrix(rnorm(200*5), nrow=200)\n",
114+
"matrice_200_10 <- matrix(rnorm(200*10), nrow=200)"
115+
]
116+
},
117+
{
118+
"cell_type": "markdown",
119+
"metadata": {},
120+
"source": [
121+
"<div class=\"alert alert-block alert-success\">\n",
122+
" Utilisez la cellule suivante pour répondre aux questions :\n",
123+
" <ol>\n",
124+
" <li>Comme dans l'exercice précédent, calculer les vecteurs <code>vecteur_carre_5</code> et <code>vecteur_carre_10</code> de longueur 200 contenant la somme des carrés des valeurs de chaque ligne des deux matrices.</li>\n",
125+
" <li>Calculer le vecteur <code>vecteur_rapport_5_10</code> obtenu par le rapport de <code>vecteur_carre_5</code> sur <code>vecteur_carre_10</code>.</li>\n",
126+
" <li>Représenter l'histogramme des 200 valeurs du vecteur <code>vecteur_rapport_5_10</code>.</li>\n",
127+
" <li>Superposer la densité d'une loi de Fisher (fonction <code>df()</code>)à 5 et 10 degrés de liberté.</li>\n",
128+
" </ol>\n",
129+
"</div>"
130+
]
131+
},
132+
{
133+
"cell_type": "code",
134+
"execution_count": null,
135+
"metadata": {},
136+
"outputs": [],
137+
"source": [
138+
"# À FAIRE"
139+
]
140+
}
141+
],
142+
"metadata": {
143+
"kernelspec": {
144+
"display_name": "R",
145+
"language": "R",
146+
"name": "ir"
147+
},
148+
"language_info": {
149+
"codemirror_mode": "r",
150+
"file_extension": ".r",
151+
"mimetype": "text/x-r-source",
152+
"name": "R",
153+
"pygments_lexer": "r",
154+
"version": "3.6.1"
155+
}
156+
},
157+
"nbformat": 4,
158+
"nbformat_minor": 4
159+
}
Lines changed: 216 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,216 @@
1+
{
2+
"cells": [
3+
{
4+
"cell_type": "markdown",
5+
"id": "dd560ada",
6+
"metadata": {},
7+
"source": [
8+
"# TP 2.2 : Estimation"
9+
]
10+
},
11+
{
12+
"cell_type": "markdown",
13+
"id": "20c928e4",
14+
"metadata": {},
15+
"source": [
16+
"## 1. Loi de Pareto\n",
17+
"\n",
18+
"On considère dans cette partie une variable aléatoire suivant une loi de Pareto d'indice $\\alpha$. C'est-à-dire $X\\sim \\mathcal{P}(\\alpha)$ si \n",
19+
"$$\n",
20+
"\\mathbb{P}(X>t)=x^{-\\alpha},\\quad t>1.\n",
21+
"$$\n",
22+
"On supposera, si besoin, que le parametre $\\alpha>2$ pour s'arrurer que l'espérance et la variance de $X$ soit bien définie.\n"
23+
]
24+
},
25+
{
26+
"cell_type": "markdown",
27+
"id": "2a4f7ed1",
28+
"metadata": {},
29+
"source": [
30+
"<div class=\"alert alert-block alert-success\">\n",
31+
" En utilisant le fait suivant :\n",
32+
"Si $Z$ est une variable aléatoire de fonction de répartition $F$ alors si $U\\sim \\mathcal{U}([0,1])$, la variable $F^{-1}(U)$ suit la même loi que $Z$.\n",
33+
"\n",
34+
"Construire un vecteur de taille 100 contenant des réalisations d'une variable aléatoire suivant une loi $\\mathcal{P}(3)$.\n",
35+
" \n",
36+
"</div>"
37+
]
38+
},
39+
{
40+
"cell_type": "code",
41+
"execution_count": null,
42+
"id": "6bc45bb2",
43+
"metadata": {},
44+
"outputs": [],
45+
"source": [
46+
"## A FAIRE"
47+
]
48+
},
49+
{
50+
"cell_type": "markdown",
51+
"id": "deccc0a1",
52+
"metadata": {},
53+
"source": [
54+
"## 2. Estimation\n",
55+
"\n",
56+
"Dans cette partie on souhaite comparer les estimateurs par la méthodes des moments et du maximum de vraisemblance du parametre $\\alpha$.\n",
57+
"<div class=\"alert alert-block alert-success\">\n",
58+
" Utilisez la cellule suivante pour répondre aux questions :\n",
59+
" <ol>\n",
60+
" <li> Calculer (à la main) l'estimateur par la méthode des moments de $\\alpha$.</li>\n",
61+
" <li> Discuter en quelque mots si cet estimateur est fortement consistent ? Asymptotiquement normal ? </li>\n",
62+
" <li> Illustrer numériquement la consistence de l'estimateur des moments. </li>\n",
63+
" <li> Illustrer, en vous inspirant de la première partie du TP 2.1 numériquement, la normalité asymptotique de l'estimateur des moments.</li>\n",
64+
" </ol>\n",
65+
"</div>"
66+
]
67+
},
68+
{
69+
"cell_type": "code",
70+
"execution_count": null,
71+
"id": "077a0cba",
72+
"metadata": {},
73+
"outputs": [],
74+
"source": [
75+
"#A FAIRE"
76+
]
77+
},
78+
{
79+
"cell_type": "markdown",
80+
"id": "7e109cec",
81+
"metadata": {},
82+
"source": [
83+
"<div class=\"alert alert-block alert-success\">\n",
84+
" Utilisez la cellule suivante pour répondre aux questions :\n",
85+
" <ol>\n",
86+
" <li> Calculer (à la main) l'estimateur du maximum de vraisemblance de $\\alpha$.</li>\n",
87+
" <li> Illustrer numériquement la consistence de l'estimateur des moments. </li>\n",
88+
" <li> Illustrer, en vous inspirant de la première partie du TP 2.1, numériquement la normalité asymptotique de l'estimateur des moments.</li>\n",
89+
" </ol>\n",
90+
"</div>"
91+
]
92+
},
93+
{
94+
"cell_type": "code",
95+
"execution_count": null,
96+
"id": "f936caf6",
97+
"metadata": {},
98+
"outputs": [],
99+
"source": [
100+
"#A FAIRE"
101+
]
102+
},
103+
{
104+
"cell_type": "markdown",
105+
"id": "0b15056d",
106+
"metadata": {},
107+
"source": [
108+
"<div class=\"alert alert-block alert-success\">\n",
109+
" Utilisez la cellule suivante pour répondre aux questions :\n",
110+
" <ol>\n",
111+
" <li> En vous inspirant de la première partie du TP 2.1, calculer la variance de chaqun des deux estimateurs.</li>\n",
112+
" <li> L'un vous semble-t-il plus performent ? Est-ce surprenant ? </li>\n",
113+
" </ol>\n",
114+
"</div>"
115+
]
116+
},
117+
{
118+
"cell_type": "code",
119+
"execution_count": null,
120+
"id": "1bfa826f",
121+
"metadata": {},
122+
"outputs": [],
123+
"source": [
124+
"#A FAIRE"
125+
]
126+
},
127+
{
128+
"cell_type": "markdown",
129+
"id": "e95d0c76",
130+
"metadata": {},
131+
"source": [
132+
"## 3. Pour aller plus loin : le bootstrap.\n",
133+
"\n",
134+
"Maintenant, contrairement à la première partie du TP 2.1, nous supposerons avoir uniquement un vecteur de 100 réalisation de notre loi de Pareto et qu'il nous est IMPOSSIBLE d'en tirer ou simuler d'avantage.\n",
135+
"\n",
136+
"Pour criconvenir a ce désagrément B. Efron propose en 1979 la méthode suivante :\n",
137+
"\n",
138+
"Soit $X_1,\\dots,X_n$ notre échantillon. On va alors tirer dans cet échantillon pour construire un echantillon bootstrap.\n",
139+
"Formellement on tirer $u(1),\\dots,u(n)$ $n$ variables aléatoires i.i.d uniforme sur {$1,\\dots,n$} (donc discrète). Léchantillon bootstrap est alors $X_{u(1)},\\dots,X_{u(n)}$.\n",
140+
"\n",
141+
"Attention : ce n'est pas un mélange des $(X_i)$, en effet le même $X_{i_0}$ peut apparaitre plusieur fois dans l'échantillon bootstrap.\n",
142+
"\n",
143+
"Pour $B\\in \\mathbb{N}$ on peut répéter cette opétation $B$ fois et ainsi obtenir $B$ échantillons noté $X_{1}^b,\\dots,X_{n}^b$ pour $b$ allant de $1$ à $B$. Sur chaque échantillon on peut alors construire un estimateur de $\\alpha$ et ainsi obtenir $\\hat \\alpha_n^1,\\dot,\\hat \\alpha_n^B$, $B$ estimateur bootstrap.\n",
144+
"\n",
145+
"Sous certaine condition, en particulier si $\\sqrt{n}(\\hat \\alpha_n-\\alpha)\\underset{n\\rightarrow\\infty}{\\longrightarrow}\\mathcal{N}(0,\\sigma^2)$, on a \n",
146+
"$$\n",
147+
"\\sqrt{B}\\left(\\frac{1}{B}\\sum_{b=1}^B\\hat \\alpha_n^b-\\alpha_n\\right)\\underset{n\\rightarrow\\infty}{\\longrightarrow}\\mathcal{N}(0,\\sigma^2).\n",
148+
"$$\n",
149+
"\n",
150+
"<div class=\"alert alert-block alert-success\">\n",
151+
" Utilisez la cellule suivante pour répondre aux questions :\n",
152+
" <ol>\n",
153+
" <li> Mettre en place une procédure bootsrap pour l'estimateur du maximum de vraisemblance. Vous pourrez vous aider de la fonction <code>sample()<code>. </li>\n",
154+
" <li> Vérifier numériquement que la moyenne des estimateur bootstrap vérifie bien la propriété ci dessus. </li>\n",
155+
" </ol>\n",
156+
"</div>"
157+
]
158+
},
159+
{
160+
"cell_type": "code",
161+
"execution_count": null,
162+
"id": "6add6270",
163+
"metadata": {},
164+
"outputs": [],
165+
"source": [
166+
"#A FAIRE"
167+
]
168+
},
169+
{
170+
"cell_type": "markdown",
171+
"id": "d1c7d208",
172+
"metadata": {},
173+
"source": [
174+
"<div class=\"alert alert-block alert-success\">\n",
175+
" Utilisez la cellule suivante pour répondre aux questions : Les questions 2 et 3 concernent les tests que nous verrons demain, vous pourrez donc y revenir à ce moment la.\n",
176+
" <ol>\n",
177+
" <li> Se servir de cette méthode pour estimer la variance de l'estimateur du maximum de vraisemblance. </li>\n",
178+
" <li> Comment se servir de cette méthode pour construire un test de niveau $0.95$ testant l'hypothèse $H_0 : \\alpha= 3$ contre l'alternative $H_1\\neq 3$ </li>\n",
179+
" <li> Vous chercherez à évaluer la puissance de ce test en fonction de $\\alpha$. </li>\n",
180+
" </ol>\n",
181+
"</div>"
182+
]
183+
},
184+
{
185+
"cell_type": "code",
186+
"execution_count": null,
187+
"id": "f06c556b",
188+
"metadata": {},
189+
"outputs": [],
190+
"source": [
191+
"#A FAIRE"
192+
]
193+
}
194+
],
195+
"metadata": {
196+
"kernelspec": {
197+
"display_name": "Python 3 (ipykernel)",
198+
"language": "python",
199+
"name": "python3"
200+
},
201+
"language_info": {
202+
"codemirror_mode": {
203+
"name": "ipython",
204+
"version": 3
205+
},
206+
"file_extension": ".py",
207+
"mimetype": "text/x-python",
208+
"name": "python",
209+
"nbconvert_exporter": "python",
210+
"pygments_lexer": "ipython3",
211+
"version": "3.11.4"
212+
}
213+
},
214+
"nbformat": 4,
215+
"nbformat_minor": 5
216+
}
12.1 KB
Loading
12.3 KB
Loading

seance_09_09_25/img/cah_body.png

15.8 KB
Loading

seance_09_09_25/img/chi2.png

18.5 KB
Loading

seance_09_09_25/img/image_2d.png

9.23 KB
Loading
10.8 KB
Loading

seance_09_09_25/img/image_rgb.png

28.5 KB
Loading

0 commit comments

Comments
 (0)