SupaeroDataScience
diff --git a/‎seance_09_09_25/C_2_stats_inf_proba.pdf‎
1.04 MB b/‎seance_09_09_25/C_2_stats_inf_proba.pdf‎
1.04 MB
diff --git a/‎seance_09_09_25/TP2_1_proba_loi.ipynb‎
Lines changed: 159 additions & 0 deletions b/‎seance_09_09_25/TP2_1_proba_loi.ipynb‎
Lines changed: 159 additions & 0 deletions
diff --git a/‎seance_09_09_25/TP2_2_estimation.ipynb‎
Lines changed: 216 additions & 0 deletions b/‎seance_09_09_25/TP2_2_estimation.ipynb‎
Lines changed: 216 additions & 0 deletions
diff --git a/‎seance_09_09_25/img/body_plan_principal.png‎
12.1 KB b/‎seance_09_09_25/img/body_plan_principal.png‎
12.1 KB
diff --git a/‎seance_09_09_25/img/cah_acp_body.png‎
12.3 KB b/‎seance_09_09_25/img/cah_acp_body.png‎
12.3 KB
diff --git a/‎seance_09_09_25/img/cah_body.png‎
15.8 KB b/‎seance_09_09_25/img/cah_body.png‎
15.8 KB
diff --git a/‎seance_09_09_25/img/chi2.png‎
18.5 KB b/‎seance_09_09_25/img/chi2.png‎
18.5 KB
diff --git a/‎seance_09_09_25/img/image_2d.png‎
9.23 KB b/‎seance_09_09_25/img/image_2d.png‎
9.23 KB
diff --git a/‎seance_09_09_25/img/image_cluster.png‎
10.8 KB b/‎seance_09_09_25/img/image_cluster.png‎
10.8 KB
diff --git a/‎seance_09_09_25/img/image_rgb.png‎
28.5 KB b/‎seance_09_09_25/img/image_rgb.png‎
28.5 KB
@@ -0,0 +1,159 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# TP 2.1: Un peu de probabilités"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## 1. Autour de la loi normale\n",
+    "\n",
+    "La fonction `rnorm()` permet de générer des observations indépendantes d'une loi normale. Par défaut, la moyenne de cette loi est nulle et la variance vaut 1."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Génère un vecteur de 10 observations\n",
+    "vecteur_gaussien_10 <- rnorm(10)\n",
+    "vecteur_gaussien_10"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li>Représenter l'histogramme des valeurs contenues dans <code>vecteur_gaussien_10</code> grâce à la fonction <code>hist()</code> en limitant l'axe des abscisses à $[-3,3]$.</li>\n",
+    "        <li>Effectuer les mêmes opérations en générant cette fois 100 observations dans un objet <code>vecteur_gaussien_100</code>. Commenter.</li>\n",
+    "        <li>Dans une matrice de taille $200 \\times 10$, générer des observations d'une loi normale centrée réduite.</li>\n",
+    "        <li>Calculer les 200 moyennes des 200 échantillons donnés par les lignes de la matrice précédente. Stocker les résultats dans un objet <code>vecteur_moyen_10</code> et représenter l'histogramme de ces 200 moyennes en utilisant la même échelle que précédemment pour l'axe des abscisses.</li>\n",
+    "        <li>Calculer la moyenne et la variance des valeurs du vecteur <code>vecteur_moyen_10</code>. Ces résultats sont-ils cohérents avec les valeurs théoriques ?</li>\n",
+    "        <li>Effectuer les mêmes opérations avec des échantillons de 100 observations dans une matrice $200 \\times 100$.</li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# À FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## 2. Vers la loi du $\\chi^2$\n",
+    "\n",
+    "Comme dans l'exercice précédent, nous générons 200 échantillons de 10 observations générées selon un loi normale centrée réduite."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "matrice_200_10 <- matrix(rnorm(200*10), nrow=200)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li>À partir de la matrice <code>matrice_200_10</code>, calculer le vecteur <code>vecteur_carre_10</code> de longueur 200 contenant la somme des carrés des valeurs de chacun des 200 échantillons de taille 10.</li>\n",
+    "        <li>Représenter l'histogramme de ces valeurs.</li>\n",
+    "        <li>Superposer la densité d'une loi de $\\chi^2$ (fonction <code>dchisq()</code>)à 10 degrés de liberté.<br>\n",
+    "            <center><img src=\"img/chi2.png\"></center></li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# À FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## 3. Vers la loi de Fisher\n",
+    "\n",
+    "Nous générons cette fois deux matrices remplies d'observations indépendantes de loi normale centrée réduite et de tailles respectives $200 \\times 5$ et $200 \\times 10$."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "matrice_200_5 <- matrix(rnorm(200*5), nrow=200)\n",
+    "matrice_200_10 <- matrix(rnorm(200*10), nrow=200)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li>Comme dans l'exercice précédent, calculer les vecteurs <code>vecteur_carre_5</code> et <code>vecteur_carre_10</code> de longueur 200 contenant la somme des carrés des valeurs de chaque ligne des deux matrices.</li>\n",
+    "        <li>Calculer le vecteur <code>vecteur_rapport_5_10</code> obtenu par le rapport de <code>vecteur_carre_5</code> sur <code>vecteur_carre_10</code>.</li>\n",
+    "        <li>Représenter l'histogramme des 200 valeurs du vecteur <code>vecteur_rapport_5_10</code>.</li>\n",
+    "        <li>Superposer la densité d'une loi de Fisher (fonction <code>df()</code>)à 5 et 10 degrés de liberté.</li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# À FAIRE"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "R",
+   "language": "R",
+   "name": "ir"
+  },
+  "language_info": {
+   "codemirror_mode": "r",
+   "file_extension": ".r",
+   "mimetype": "text/x-r-source",
+   "name": "R",
+   "pygments_lexer": "r",
+   "version": "3.6.1"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
@@ -0,0 +1,216 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "dd560ada",
+   "metadata": {},
+   "source": [
+    "# TP 2.2 : Estimation"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "20c928e4",
+   "metadata": {},
+   "source": [
+    "## 1. Loi de Pareto\n",
+    "\n",
+    "On considère dans cette partie une variable aléatoire suivant une loi de Pareto d'indice $\\alpha$. C'est-à-dire $X\\sim \\mathcal{P}(\\alpha)$ si \n",
+    "$$\n",
+    "\\mathbb{P}(X>t)=x^{-\\alpha},\\quad t>1.\n",
+    "$$\n",
+    "On supposera, si besoin, que le parametre $\\alpha>2$ pour s'arrurer que l'espérance et la variance de $X$ soit bien définie.\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "2a4f7ed1",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    En utilisant le fait suivant :\n",
+    "Si $Z$ est une variable aléatoire de fonction de répartition $F$ alors si $U\\sim \\mathcal{U}([0,1])$, la variable $F^{-1}(U)$ suit la même loi que $Z$.\n",
+    "\n",
+    "Construire un vecteur de taille 100 contenant des réalisations d'une variable aléatoire suivant une loi $\\mathcal{P}(3)$.\n",
+    "    \n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "6bc45bb2",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "## A FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "deccc0a1",
+   "metadata": {},
+   "source": [
+    "##  2. Estimation\n",
+    "\n",
+    "Dans cette partie on souhaite comparer les estimateurs par la méthodes des moments et du maximum de vraisemblance du parametre $\\alpha$.\n",
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li> Calculer (à la main) l'estimateur par la méthode des moments de $\\alpha$.</li>\n",
+    "        <li> Discuter en quelque mots si cet estimateur est fortement consistent ? Asymptotiquement normal ? </li>\n",
+    "        <li> Illustrer numériquement la consistence de l'estimateur des moments. </li>\n",
+    "        <li> Illustrer, en vous inspirant de la première partie du TP 2.1 numériquement, la normalité asymptotique de l'estimateur des moments.</li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "077a0cba",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "#A FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "7e109cec",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li> Calculer (à la main) l'estimateur du maximum de vraisemblance de $\\alpha$.</li>\n",
+    "        <li> Illustrer numériquement la consistence de l'estimateur des moments. </li>\n",
+    "        <li> Illustrer, en vous inspirant de la première partie du TP 2.1, numériquement la normalité asymptotique de l'estimateur des moments.</li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "f936caf6",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "#A FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "0b15056d",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li> En vous inspirant de la première partie du TP 2.1, calculer la variance de chaqun des deux estimateurs.</li>\n",
+    "        <li> L'un vous semble-t-il plus performent ? Est-ce surprenant ?  </li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "1bfa826f",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "#A FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "e95d0c76",
+   "metadata": {},
+   "source": [
+    "## 3. Pour aller plus loin : le bootstrap.\n",
+    "\n",
+    "Maintenant, contrairement à la première partie du TP 2.1, nous supposerons avoir uniquement un vecteur de 100 réalisation de notre loi de Pareto et qu'il nous est IMPOSSIBLE d'en tirer ou simuler d'avantage.\n",
+    "\n",
+    "Pour criconvenir a ce désagrément B. Efron propose en 1979 la méthode suivante :\n",
+    "\n",
+    "Soit $X_1,\\dots,X_n$ notre échantillon. On va alors tirer dans cet échantillon pour construire un echantillon bootstrap.\n",
+    "Formellement on tirer $u(1),\\dots,u(n)$ $n$ variables aléatoires i.i.d uniforme sur {$1,\\dots,n$} (donc discrète). Léchantillon bootstrap est alors $X_{u(1)},\\dots,X_{u(n)}$.\n",
+    "\n",
+    "Attention : ce n'est pas un mélange des $(X_i)$, en effet le même $X_{i_0}$ peut apparaitre plusieur fois dans l'échantillon bootstrap.\n",
+    "\n",
+    "Pour $B\\in \\mathbb{N}$ on peut répéter cette opétation $B$ fois et ainsi obtenir $B$ échantillons noté $X_{1}^b,\\dots,X_{n}^b$ pour $b$ allant de $1$ à $B$. Sur chaque échantillon on peut alors construire un estimateur de $\\alpha$ et ainsi obtenir $\\hat \\alpha_n^1,\\dot,\\hat \\alpha_n^B$, $B$ estimateur bootstrap.\n",
+    "\n",
+    "Sous certaine condition, en particulier si $\\sqrt{n}(\\hat \\alpha_n-\\alpha)\\underset{n\\rightarrow\\infty}{\\longrightarrow}\\mathcal{N}(0,\\sigma^2)$, on a \n",
+    "$$\n",
+    "\\sqrt{B}\\left(\\frac{1}{B}\\sum_{b=1}^B\\hat \\alpha_n^b-\\alpha_n\\right)\\underset{n\\rightarrow\\infty}{\\longrightarrow}\\mathcal{N}(0,\\sigma^2).\n",
+    "$$\n",
+    "\n",
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions :\n",
+    "    <ol>\n",
+    "        <li> Mettre en place une procédure bootsrap pour l'estimateur du maximum de vraisemblance. Vous pourrez vous aider de la fonction <code>sample()<code>. </li>\n",
+    "        <li> Vérifier numériquement que la moyenne des estimateur bootstrap vérifie bien la propriété ci dessus. </li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "6add6270",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "#A FAIRE"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "d1c7d208",
+   "metadata": {},
+   "source": [
+    "<div class=\"alert alert-block alert-success\">\n",
+    "    Utilisez la cellule suivante pour répondre aux questions : Les questions 2 et 3 concernent les tests que nous verrons demain, vous pourrez donc y revenir à ce moment la.\n",
+    "    <ol>\n",
+    "        <li> Se servir de cette méthode pour estimer la variance de l'estimateur du maximum de vraisemblance. </li>\n",
+    "        <li> Comment se servir de cette méthode pour construire un test de niveau $0.95$ testant l'hypothèse $H_0 : \\alpha= 3$ contre l'alternative $H_1\\neq 3$ </li>\n",
+    "        <li> Vous chercherez à évaluer la puissance de ce test en fonction de $\\alpha$. </li>\n",
+    "    </ol>\n",
+    "</div>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "f06c556b",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "#A FAIRE"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.4"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}