Quizéo

Illustration sur un exemple

On rappelle que, en Python, la fonctionrandomdu module random permet de générer un nombre aléatoire dans l'intervalle [0 ; 1].
from random import random
random()

Reprenons la variable aléatoire donnée en exemple.

\begin{array}{|c|c|c|c|c|}\hline k&-1&2&3&7\\ \hline P(X=k) & 0,1 & 0,2 & 0,3 & 0,4 \\ \hline \end{array}

On génère un nombre aléatoire entre 0 et 1.
Selon la valeur de ce nombre, on renverra alors l'une des valeurs que peut prendre la variable

X

.

Si ce nombre au hasard est entre 0 et 0,1, on renvoie la première valeur, à savoir -1 ;
si ce nombre est entre 0,1 et0,1 + 0,2,on renvoie la deuxième valeur, à savoir 2 ;
si ce nombre au hasard est entre0,1 + 0,2et0,1 + 0,2 + 0,3, on renvoie la troisième valeur, à savoir 3 ;
sinon, on renvoie la dernière valeur, à savoir 7.

Python et les flottants

En Python, les nombres « à virgule » utilisés sont appelés flottants.

Les calculs sur ces nombres ne sont pas effectués en base 10 comme nous le faisons mais en base 2 ou binaire. Cette méthode de calcul propre à l'informatique peut mener à diverses erreurs d'approximation.

Par exemple, si vous essayez de calculer 0,1 + 0,2 en utilisant Python, celui-ci vous répondra 0,30000000000000004.

En raison de ces erreurs, il est en général très mauvais de tester une égalité sur des nombres flottants en Python. Toutefois, dans le cadre de ce TP, l'erreur que nous ferons pour effectuer notre simulation sera négligeable et nous n'en tiendrons pas compte.

Algorithme général

Notons x = [x0, x1, ..., xk] la liste des valeurs prises par la variable aléatoire 

X

et p = [p0, p1, ..., pk] la liste des probabilités correspondantes.

Pour simuler une variable aléatoire suivant une loi donnée, on procède comme suit .

1.On génère à l'aide de Python un nombre au hasard dans l'intervalle [0;1]. Ce nombre est ensuite stocké dans une variablenb.

2.On initialise une variableià 0.

3.On initialise une variablep_totaleà 0.

4.Tant que la valeur dep_totaleest inférieure ànb:

on ajoute p[i] à la valeur de la variable p_totale ;
on ajoute 1 à la valeur de i ;
on renvoie la valeur de x[i-1].

Exercice

1.En suivant l'algorithme donné ci-dessus, compléter la fonctionsimulation(x, p)qui permet de simuler une variable aléatoire dont la loi est donnée par les listesxetp.

from random import random

def simulation(x, p):
    nb = random()
    i = ...
    p_totale = ...
    while ... :
        p_totale = ...
        i = ...
    return ...

2.En utilisant la fonction précédemment implémentée, simuler la réalisation d'une variable aléatoire suivant la loi suivante.

\begin{array}{|c|c|c|c|c|}\hline k&-1&2&3&7\\ \hline P(X=k) & 0,1 & 0,2 & 0,3 & 0,4 \\ \hline \end{array}

Simulation d'un échantillon

On considère une variable aléatoire réelle 

X

dont la loi est représentée en Python à l'aide de deux listes x et p.

On simule alors 

N

 échantillons de taille n de cette variable aléatoire et on stocke les résultats de cette simulation dans une liste de listes à l'aide de la fonction suivante.

def simulation_multiple(x, p, N, n):
    return [[simulation(x,p) for i in range(n)] for i in range(N)]

Par exemple, la commande simulation_multiple([-1,2,3,7], [0.1, 0.2, 0.3, 0.4], 20, 10) permet de simuler 20 échantillons de taille 10 de la variable aléatoire 

X

dont la loi est donnée ci-dessous.

\begin{array}{|c|c|c|c|c|}\hline k&-1&2&3&7\\ \hline P(X=k) & 0,1 & 0,2 & 0,3 & 0,4 \\ \hline \end{array}

resultat = simulation_multiple([-1,2,3,7], [0.1, 0.2, 0.3, 0.4], 20, 10)

# Affichage des résultats du premier échantillon
print("Premier échantillon : ", resultat[0])

# Affichage des résultats du cinquième échantillon
print("Cinquième échantillon : ", resultat[4])

>>> Premier échantillon : [3, 2, 3, 3, 2, 7, -1, -1, -1, 7]
>>> Cinquième échantillon : [7, 3, 7, 7, 3, 7, 3, 7, 7, 3]

Comparaison avec l'espérance

Pour chaque échantillon, on va calculer la valeur moyennes des

n

réalisations de la variable aléatoire puis on les comparera avec la valeur de l'espérance de la variable aléatoire.

Exercice 

Compléter la fonctionmoyenneci-dessous qui prend en entrée une liste de nombres et renvoie la valeur moyenne de cette liste.
On rappelle que le nombre d'éléments d'une liste peut être obtenu à l'aide de la fonctionlenen Python.

def moyenne(liste):
    total = ...
    for elt in liste :
        total = ...
    moyenne = total / ...
    return moyenne

Le programme suivant permet de réaliser la simulation de 10 000 échantillons de taille 1 000 de la variable aléatoire

X

, puis de calculer la moyenne des résultats pour chaque échantillon.
L'histogramme des résultats est alors représenté et la valeur de l'espérance est symbolisée par une droite en pointillés.

import matplotlib.pyplot as plt

valeurs = [-1,2,3,7]
proba = [0.1, 0.2, 0.3, 0.4]

resultat = simulation_multiple(valeurs, proba, 1000, 100)
moy = [moyenne(L) for L in resultat]
e = esperance(valeurs, proba)

plt.title("Histogramme des moyennes")
plt.xlabel("Moyennes")
plt.ylabel("Quantités")

# On trace l'histogramme
data = plt.hist(moy, bins = 20)
plt.plot([e, e], [0,max(data[0])], 'r--', lw=2)

plt.show()
plt.close()

Utilisation de l'écart-type

On s'intéresse désormais à la proportion des échantillons pour lesquels l'écart par rapport à l'espérance est inférieur à un, deux ou trois écarts-types.

Exercice 

Soit 

X

une variable aléatoire réelle non constante et

(X_1, X_2, \ldots, X_n)

 un échantillon de variables aléatoires de même loique

X

. On note 

M_n=\dfrac{X_1+X_2+\dots + X_n}{n}

.

1.À l'aide de l'inégalité de concentration, minorer les probabilités suivantes :

P\left(|M_n-E(X)| < \dfrac{2\sigma(X)}{\sqrt{n}}\right)

P\left(|M_n-E(X)| < \dfrac{3\sigma(X)}{\sqrt{n}}\right)

2. Compléter la fonction suivante qui prend en entrée deux listes 

x

et

p

 correspondant à une variable aléatoire

X

, un entier 

N

 correspondant au nombre d'échantillons à simuler et 

n

 la taille de ces échantillons.

Cette fonction devra renvoyer la proportion des échantillons pour lesquels l'écart entre la valeur moyenne et l'espérance est inférieure à 2 écarts-types divisés par

\sqrt{n}

.

def proportion(x, p, N, n):
    total = 0
    simu = simulation_multiple(x, p, N, n)
    e = esperance(x, p)
    s = ecart_type(x, p)
    for sim in simu :
        if abs(...) <= ... :
            total = ...
    return ...

valeurs = [-1,2,3,7]
proba = [0.1, 0.2, 0.3, 0.4]

print(proportion(valeurs, proba, 1000, 100))

3. En modifiant les valeurs prises par la variable aléatoire 

X

et les probabilités correspondantes, vérifier que la borne fournie pas l'inégalité de concentration est loin d'être optimale.

Algorithmique et programmation

Activité CAPYTALE : simulation d'un échantillon de variables aléatoires

Représentation d'une variable aléatoire

Simulation d'une variable aléatoire suivant une loi donnée

Illustration sur un exemple

Python et les flottants

Algorithme général

Espérance, variance et écart-type

Calcul de l'espérance, de la variance et de l'écart-type

Échantillon de variables aléatoires

Simulation d'un échantillon

Comparaison avec l'espérance

Utilisation de l'écart-type