Introduction aux Probabilités - Partie 1

Qu’est ce qu’une probabilité ?

Une probabilité quantifie la chance/le risque que se produise un évènement. Cette valeur est toujours comprise entre 0 et 1.

Quelques cas d’usage de la probabilité du quotidien

Le lancer d’un dé

Lorsqu’on lance un dé non pipé à 6 faces, on a 1 chance sur 6 d’obtenir un 3.

On définit l’événement [latex]A[/latex] : « On obtient un 3 », et on note [latex]mathbb{P}(A)[/latex] la probabilité de cet évènement dont la valeur est : [latex] mathbb{P}(A) = frac{1}{6}[/latex] On peut définir d’autres évènements comme :

[latex]B[/latex]: « Le nombre obtenu est impair »
[latex]C[/latex]: « Le nombre est supérieur ou égal à 5 »

On a alors : [latex]mathbb{P}(B) = frac{3}{6} = frac{1}{2}[/latex] [latex]mathbb{P}(C) = frac{2}{6} = frac{1}{3}[/latex]

On peut aussi calculer la probabilité que 2 évènements se produisent en même temps.

[latex]B cap C[/latex]: « Le nombre obtenu est impair » ET « Le nombre obtenu est supérieur ou égal à 5 ».

Donc [latex]B cap C[/latex] est l’événement « On obtient un 5 ».

La probabilité qu’il se produise est : [latex]mathbb{P}(B cap C) = frac{1}{6}[/latex]

De même, on peut calculer la probabilité qu’au moins un événement se produise parmi plusieurs.

L’événement [latex]D = B cup C[/latex] correspond à « Le nombre obtenu est impair » OU « Le nombre obtenu est supérieur ou égal à 5 », c’est-à-dire « Le nombre obtenu est 1, 3, 5, ou 6 ».

Dans ce cas : [latex]begin{aligned} mathbb{P}(D) &= mathbb{P}(B cup C) \ &= mathbb{P}(B) + mathbb{P}(C) – mathbb{P}(B cap C) \&= frac{1}{2} + frac{1}{3} – frac{1}{6} \mathbb{P}(D) &= frac{2}{3} \end{aligned} [/latex]

Découvrir notre formation Data Analyst

Un paquet de cartes

Un paquet de cartes classique est composé de 52 cartes avec :

4 couleurs (pique, carreau, trèfle, coeur)
13 cartes par couleur (du 2 au 10, valet, dame, roi, as)

On s’intéresse au résultat lorsqu’on tire une seule carte du paquet.

On définit les évènements :

[latex]C[/latex] : « La carte est un cœur »
[latex]T[/latex] : « La carte est une tête (valet, dame ou roi) »
[latex]A[/latex] : « La carte est un as »

Alors :

[latex]mathbb{P}(C) = frac{13}{52} = frac{1}{4}[/latex]
[latex]mathbb{P}(T) = frac{12}{52} = frac{3}{13}[/latex]
[latex]mathbb{P}(A) = frac{4}{52} = frac{1}{13}[/latex]

On a aussi :

[latex]mathbb{P}(T cap C) = frac{3}{52}[/latex]
[latex]mathbb{P}(T cap A) = 0[/latex]
[latex]mathbb{P}(A cap C) = frac{1}{52}[/latex]

Le complémentaire de ces évènements est :

[latex]C^C[/latex] : « La carte n’est pas un cœur »
[latex]T^C[/latex] : « La carte n’est pas une tête »
[latex]A^C[/latex] : « La carte n’est pas un as »

Dans ce cas, on a :

[latex]mathbb{P}(C^C) = 1 – mathbb{P}(C) = 1 – frac{1}{4} = frac{3}{4}[/latex]
[latex]mathbb{P}(T^C) = 1 – mathbb{P}(T) = 1 – frac{3}{13} = frac{10}{13}[/latex]
[latex]mathbb{P}(A^C) = 1 – mathbb{P}(A) = 1 – frac{1}{13} = frac{12}{13}[/latex]

Si on tire une carte et qu’on sait que c’est un cœur, alors la probabilité que la carte soit une tête vaut [latex]frac{3}{13}[/latex].

On parle alors de probabilité conditionnelle : il s’agit de la probabilité conditionnellement à une information donnée.

On écrit : [latex] mathbb{P}(T | C) = frac{mathbb{P}(T cap C)}{mathbb{P}(C)}/[/latex]

On sait que la carte est un cœur. Il y a au total 13 cartes cœur, dont 3 sont des têtes, on a donc une probabilité de [latex]frac{3}{13}[/latex] d’avoir tiré une tête en sachant que c’est un cœur.

Par le calcul :

[latex]begin{aligned} mathbb{P}(T | C) & = frac{mathbb{P}(T cap C)}{mathbb{P}(C)} \ & = frac{frac{3}{52}}{frac{1}{4}} \ & = frac{3}{13} end{aligned}[/latex]

À votre tour

On utilise un paquet de 52 cartes.

Quelle est la probabilité de ne pas tirer un 8 ?
Quelle est la probabilité de tirer un as ou un pique ?
Quelle est la probabilité de tirer un roi, sachant que la carte tirée n’est pas un trèfle ?

Vocabulaire et premières propriété

Espace de probabilité

On se place sur un espace probabilisé [latex](Omega, mathcal{A}, mathbb{P})[/latex] où :

[latex]Omega[/latex] est l’univers
[latex]mathcal{A}[/latex] est une tribu sur [latex]Omega[/latex]. C’est l’ensemble des évènements sur [latex]Omega[/latex]
[latex]mathbb{P}[/latex] est une mesure de probabilité sur [latex](Omega,mathcal{A})[/latex]

Quelques propriétés

Soient [latex]A[/latex] et [latex]B[/latex] deux évènements :

[latex]mathbb{P}(emptyset)=0[/latex] et [latex]mathbb{P}(Omega)=1[/latex]
[latex]mathbb{P}(A^C)= 1 – mathbb{P}(A)[/latex]
[latex]mathbb{P}(A cup B)=mathbb{P}(A) + mathbb{P}(B) -mathbb{P}(A cap B)[/latex]

Pour comprendre cette dernière égalité :

En calculant la probabilité de l’union de deux ensembles, on retire une partie qu’on pourrait compter deux fois : l’intersection [latex]Acap B[/latex], car [latex]Acap B[/latex] est inclus dans [latex]A[/latex] et est inclus aussi dans [latex]B[/latex].

Système complet d’événements

On appelle système complet d’évènements [latex]left(E_iright)_{i in I}[/latex] un ensemble de parties de [latex]Omega[/latex], avec [latex]I[/latex] fini ou dénombrable vérifiant :

[latex]bigcuplimits_{i in I} E_i = Omega[/latex]
[latex]forall left(i,jright) in I^2, quad i ne j Rightarrow E_i cap E_j = emptyset[/latex]

Formule des probabilités totales

On considère un système complet d’évènements [latex]left(E_iright)_{i in I}[/latex].

Alors pour tout évènement [latex]A[/latex], on a : [latex]begin{aligned} mathbb{P}left(Aright) &= sum limits_{i in I}{} mathbb{P}left(A cap E_iright) \ &= sum limits_{i in I}{} mathbb{P}left(A vert E_iright)mathbb{P}left(E_iright) \ end{aligned}[/latex]

Conditionnement

On considère un espace probabilisé [latex]left(Omega, mathcal{A}, mathbb{P}right)[/latex].

Probabilité conditionnelle

Soit [latex]A in mathcal{A}[/latex] un évènement tel que [latex]mathbb{P}left(Aright) ne 0[/latex]

On appelle probabilité conditionnelle sachant [latex]A[/latex] et on la note [latex]mathbb{P}left(cdotvert A right)[/latex] l’application définie sur [latex]mathcal{A}[/latex] par

[latex]forall B in mathcal{A} quad mathbb{P}left(B vert Aright) = frac{mathbb{P}left(B cap Aright)}{mathbb{P}left(Aright)}[/latex]

Découvrir la formation Data Scientist

Théorème de Bayes

On considère deux évènements [latex]A[/latex] et [latex]B[/latex] tels que [latex]mathbb{P}left(Bright) ne 0[/latex].

Alors [latex]mathbb{P}left(A vert Bright) = frac{mathbb{P}left(B vert Aright) mathbb{P}left(Aright)}{mathbb{P}left(Bright)}[/latex]

Exemple

Dans une population, une maladie affecte [latex]3[/latex] personnes sur [latex]100[/latex].

Lors du dépistage de cette maladie, il est possible que le test donne un résultat incorrect :

Lorsqu’une personne est malade, il y a [latex]2%[/latex] de risques que le test soit négatif
Si une personne n’est pas malade, il y a [latex]0,5%[/latex] de risques que le test soit positif.

Question

Quelle est la probabilité qu’une personne dont le test est positif soit effectivement malade ?

Réponse

Notons les évènements :

- [latex]M[/latex] : L’individu est malade
- [latex]T[/latex] : Le résultat du test est positif

Alors on connaît les probabilités suivantes :

- [latex]mathbb{P}left(Mright) = frac{3}{100}[/latex] (c’est la probabilité qu’un individu soit malade)
- [latex]mathbb{P}left(T^C | Mright) = frac{2}{100}[/latex] (c’est la probabilité que le test d’une personne malade soit négatif)
- [latex]mathbb{P}left(T | M^Cright) = frac{5}{1000}[/latex] (c’est la probabilité que le test d’une personne saine soit positif)

Il s’agit de calculer la probabilité [latex]mathbb{P}left(M | Tright)[/latex]

Calculons [latex]mathbb{P}left(M | Tright)[/latex]

[latex]begin{aligned} mathbb{P}left(M | Tright) &= frac{mathbb{P}left(Mcap Tright)}{mathbb{P}left(Tright)} \ &= frac{mathbb{P}left(T|Mright)mathbb{P}left(Mright)}{mathbb{P}left(Tright)} \ &= frac{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright)}{mathbb{P}left(Tright)}end{aligned}[/latex]

Le problème est qu’on ne connaît pas [latex]mathbb{P}left(Tright)[/latex]. Pour calculer cette valeur, il est possible d’utiliser la formule des probabilités totales. Alors les évènements [latex]Tcap M[/latex] et [latex]T cap M^C[/latex] forment un système complet d’événements dans [latex]T[/latex]. La formule des probabilités totales donne :

[latex]begin{aligned}mathbb{P}left(Tright) &= mathbb{P}left(Tcap Mright) + mathbb{P}left(Tcap M^Cright) \ &= mathbb{P}left(T|Mright)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)mathbb{P}left(M^Cright) \ &= left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)left(1 – mathbb{P}left(Mright)right)end{aligned}[/latex]

A présent, nous pouvons calculer [latex]mathbb{P}left(M | Tright)[/latex], puisque toutes les valeurs impliquées sont connues. [latex]begin{aligned} mathbb{P}left(M | Tright) &= frac{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright)}{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)left(1 – mathbb{P}left(Mright)right)} \ \ &= frac{left(1 – frac{2}{100}right)frac{3}{100}}{left(1 – frac{2}{100}right)frac{3}{100} + frac{5}{1000}left(1 – frac{3}{100}right)} \ \ &= frac{588}{685} \ mathbb{P}left(M | Tright) & approx 85,84 % end{aligned}[/latex]

Conclusion

L’objectif de cet article était de donner toutes les bases nécessaires en probabilité pour bien comprendre la partie 2 (qui ne devrait pas trop tarder 😉). Les probabilités sont utilisées de manière extensive dans plusieurs disciplines ainsi que dans beaucoup d’outils de Machine Learning et de Business Intelligence. Les concepts présentés ci-dessus sont des fondamentaux pour bien comprendre le fonctionnement de ces outils avec une meilleure compréhension de certains algorithmes.

Par ailleurs, les probabilités sont très importantes dans les métiers liés à la data et en particuliers pour les Data Scientists et Analystes. DataScientest peut non seulement vous permettre d’étoffer vos bases mais également vous accompagner dans votre montée en compétence à travers ses différents parcours dédiés. N’hésitez pas à visiter le site internet ou à nous contacter directement.

Découvrir nos offres de formation Data

Introduction aux Probabilités – Partie 1