introduction à la probabilité

Introduction aux Probabilités – Partie 1

Qu’est ce qu’une probabilité ?

Une probabilité quantifie la chance/le risque que se produise un évènement. Cette valeur est toujours comprise entre 0 et 1.

Quelques cas d’usage de la probabilité du quotidien

Le lancer d’un dé

Lorsqu’on lance un dé non pipé à 6 faces, on a 1 chance sur 6 d’obtenir un 3.

On définit l’événement [latex]A[/latex] : « On obtient un 3 », et on note [latex]mathbb{P}(A)[/latex] la probabilité de cet évènement dont la valeur est : [latex] mathbb{P}(A) = frac{1}{6}[/latex] On peut définir d’autres évènements comme :

  • [latex]B[/latex]: « Le nombre obtenu est impair »
  • [latex]C[/latex]: « Le nombre est supérieur ou égal à 5 »

On a alors : [latex]mathbb{P}(B) = frac{3}{6} = frac{1}{2}[/latex] [latex]mathbb{P}(C) = frac{2}{6} = frac{1}{3}[/latex]

On peut aussi calculer la probabilité que 2 évènements se produisent en même temps.

  • [latex]B cap C[/latex]: « Le nombre obtenu est impair » ET « Le nombre obtenu est supérieur ou égal à 5 ».

Donc [latex]B cap C[/latex] est l’événement « On obtient un 5 ».

La probabilité qu’il se produise est : [latex]mathbb{P}(B cap C) = frac{1}{6}[/latex]

De même, on peut calculer la probabilité qu’au moins un événement se produise parmi plusieurs.

L’événement [latex]D = B cup C[/latex] correspond à « Le nombre obtenu est impair » OU « Le nombre obtenu est supérieur ou égal à 5 », c’est-à-dire « Le nombre obtenu est 1, 3, 5, ou 6 ».

Dans ce cas : [latex]begin{aligned} mathbb{P}(D) &= mathbb{P}(B cup C) \ &= mathbb{P}(B) + mathbb{P}(C) – mathbb{P}(B cap C) \&= frac{1}{2} + frac{1}{3} – frac{1}{6} \mathbb{P}(D) &= frac{2}{3} \end{aligned} [/latex]

Un paquet de cartes

Un paquet de cartes classique est composé de 52 cartes avec :

  • 4 couleurs (pique, carreau, trèfle, coeur)
  • 13 cartes par couleur (du 2 au 10, valet, dame, roi, as)

On s’intéresse au résultat lorsqu’on tire une seule carte du paquet.

On définit les évènements :

  • [latex]C[/latex] : « La carte est un cœur »
  • [latex]T[/latex] : « La carte est une tête (valet, dame ou roi) »
  • [latex]A[/latex] : « La carte est un as »

Alors :

  • [latex]mathbb{P}(C) = frac{13}{52} = frac{1}{4}[/latex]
  • [latex]mathbb{P}(T) = frac{12}{52} = frac{3}{13}[/latex]
  • [latex]mathbb{P}(A) = frac{4}{52} = frac{1}{13}[/latex]

On a aussi :

  • [latex]mathbb{P}(T cap C) = frac{3}{52}[/latex]
  • [latex]mathbb{P}(T cap A) = 0[/latex]
  • [latex]mathbb{P}(A cap C) = frac{1}{52}[/latex]

Le complémentaire de ces évènements est :

  • [latex]C^C[/latex] : « La carte n’est pas un cœur »
  • [latex]T^C[/latex] : « La carte n’est pas une tête »
  • [latex]A^C[/latex] : « La carte n’est pas un as »

Dans ce cas, on a :

  • [latex]mathbb{P}(C^C) = 1 – mathbb{P}(C) = 1 – frac{1}{4} = frac{3}{4}[/latex]
  • [latex]mathbb{P}(T^C) = 1 – mathbb{P}(T) = 1 – frac{3}{13} = frac{10}{13}[/latex]
  • [latex]mathbb{P}(A^C) = 1 – mathbb{P}(A) = 1 – frac{1}{13} = frac{12}{13}[/latex]

Si on tire une carte et qu’on sait que c’est un cœur, alors la probabilité que la carte soit une tête vaut [latex]frac{3}{13}[/latex].

On parle alors de probabilité conditionnelle : il s’agit de la probabilité conditionnellement à une information donnée.

On écrit : [latex] mathbb{P}(T | C) = frac{mathbb{P}(T cap C)}{mathbb{P}(C)}/[/latex]

On sait que la carte est un cœur. Il y a au total 13 cartes cœur, dont 3 sont des têtes, on a donc une probabilité de [latex]frac{3}{13}[/latex] d’avoir tiré une tête en sachant que c’est un cœur.

Par le calcul :

[latex]begin{aligned} mathbb{P}(T | C) & = frac{mathbb{P}(T cap C)}{mathbb{P}(C)} \ & = frac{frac{3}{52}}{frac{1}{4}} \ & = frac{3}{13} end{aligned}[/latex]

À votre tour

On utilise un paquet de 52 cartes.

  • Quelle est la probabilité de ne pas tirer un 8 ?
  • Quelle est la probabilité de tirer un as ou un pique ?
  • Quelle est la probabilité de tirer un roi, sachant que la carte tirée n’est pas un trèfle ?

Vocabulaire et premières propriété

Espace de probabilité

On se place sur un espace probabilisé [latex](Omega, mathcal{A}, mathbb{P})[/latex] où :

  • [latex]Omega[/latex] est l’univers
  • [latex]mathcal{A}[/latex] est une tribu sur [latex]Omega[/latex]. C’est l’ensemble des évènements sur [latex]Omega[/latex]
  • [latex]mathbb{P}[/latex] est une mesure de probabilité sur [latex](Omega,mathcal{A})[/latex]

Quelques propriétés

Soient [latex]A[/latex] et [latex]B[/latex] deux évènements :

  • [latex]mathbb{P}(emptyset)=0[/latex] et [latex]mathbb{P}(Omega)=1[/latex]
  • [latex]mathbb{P}(A^C)= 1 – mathbb{P}(A)[/latex]
  • [latex]mathbb{P}(A cup B)=mathbb{P}(A) + mathbb{P}(B) -mathbb{P}(A cap B)[/latex]

Pour comprendre cette dernière égalité :

probabilités

En calculant la probabilité de l’union de deux ensembles, on retire une partie qu’on pourrait compter deux fois : l’intersection [latex]Acap B[/latex], car [latex]Acap B[/latex] est inclus dans [latex]A[/latex] et est inclus aussi dans [latex]B[/latex].

Système complet d’événements

On appelle système complet d’évènements [latex]left(E_iright)_{i in I}[/latex] un ensemble de parties de [latex]Omega[/latex], avec [latex]I[/latex] fini ou dénombrable vérifiant :

  • [latex]bigcuplimits_{i in I} E_i = Omega[/latex]
  • [latex]forall left(i,jright) in I^2, quad i ne j Rightarrow E_i cap E_j = emptyset[/latex]

Formule des probabilités totales

On considère un système complet d’évènements [latex]left(E_iright)_{i in I}[/latex].

Alors pour tout évènement [latex]A[/latex], on a : [latex]begin{aligned} mathbb{P}left(Aright) &= sum limits_{i in I}{} mathbb{P}left(A cap E_iright) \ &= sum limits_{i in I}{} mathbb{P}left(A vert E_iright)mathbb{P}left(E_iright) \ end{aligned}[/latex]

Conditionnement

On considère un espace probabilisé [latex]left(Omega, mathcal{A}, mathbb{P}right)[/latex].

Probabilité conditionnelle

Soit [latex]A in mathcal{A}[/latex] un évènement tel que [latex]mathbb{P}left(Aright) ne 0[/latex]

On appelle probabilité conditionnelle sachant [latex]A[/latex] et on la note [latex]mathbb{P}left(cdotvert A right)[/latex] l’application définie sur [latex]mathcal{A}[/latex] par

[latex]forall B in mathcal{A} quad mathbb{P}left(B vert Aright) = frac{mathbb{P}left(B cap Aright)}{mathbb{P}left(Aright)}[/latex]

Théorème de Bayes

On considère deux évènements [latex]A[/latex] et [latex]B[/latex] tels que [latex]mathbb{P}left(Bright) ne 0[/latex].

Alors [latex]mathbb{P}left(A vert Bright) = frac{mathbb{P}left(B vert Aright) mathbb{P}left(Aright)}{mathbb{P}left(Bright)}[/latex]

Exemple

Dans une population, une maladie affecte [latex]3[/latex] personnes sur [latex]100[/latex].

Lors du dépistage de cette maladie, il est possible que le test donne un résultat incorrect :

  • Lorsqu’une personne est malade, il y a [latex]2%[/latex] de risques que le test soit négatif
  • Si une personne n’est pas malade, il y a [latex]0,5%[/latex] de risques que le test soit positif.

Question

Quelle est la probabilité qu’une personne dont le test est positif soit effectivement malade ?

Réponse

Notons les évènements :

    • [latex]M[/latex] : L’individu est malade
    • [latex]T[/latex] : Le résultat du test est positif

Alors on connaît les probabilités suivantes :

    • [latex]mathbb{P}left(Mright) = frac{3}{100}[/latex] (c’est la probabilité qu’un individu soit malade)
    • [latex]mathbb{P}left(T^C | Mright) = frac{2}{100}[/latex] (c’est la probabilité que le test d’une personne malade soit négatif)
    • [latex]mathbb{P}left(T | M^Cright) = frac{5}{1000}[/latex] (c’est la probabilité que le test d’une personne saine soit positif)

Il s’agit de calculer la probabilité [latex]mathbb{P}left(M | Tright)[/latex]

Calculons [latex]mathbb{P}left(M | Tright)[/latex]

[latex]begin{aligned} mathbb{P}left(M | Tright) &= frac{mathbb{P}left(Mcap Tright)}{mathbb{P}left(Tright)} \ &= frac{mathbb{P}left(T|Mright)mathbb{P}left(Mright)}{mathbb{P}left(Tright)} \ &= frac{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright)}{mathbb{P}left(Tright)}end{aligned}[/latex]

Le problème est qu’on ne connaît pas [latex]mathbb{P}left(Tright)[/latex]. Pour calculer cette valeur, il est possible d’utiliser la formule des probabilités totales. Alors les évènements [latex]Tcap M[/latex] et [latex]T cap M^C[/latex] forment un système complet d’événements dans [latex]T[/latex]. La formule des probabilités totales donne :

[latex]begin{aligned}mathbb{P}left(Tright) &= mathbb{P}left(Tcap Mright) + mathbb{P}left(Tcap M^Cright) \ &= mathbb{P}left(T|Mright)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)mathbb{P}left(M^Cright) \ &= left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)left(1 – mathbb{P}left(Mright)right)end{aligned}[/latex]

A présent, nous pouvons calculer [latex]mathbb{P}left(M | Tright)[/latex], puisque toutes les valeurs impliquées sont connues. [latex]begin{aligned} mathbb{P}left(M | Tright) &= frac{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright)}{left(1 – mathbb{P}left(T^C|Mright)right)mathbb{P}left(Mright) + mathbb{P}left(T|M^Cright)left(1 – mathbb{P}left(Mright)right)} \ \ &= frac{left(1 – frac{2}{100}right)frac{3}{100}}{left(1 – frac{2}{100}right)frac{3}{100} + frac{5}{1000}left(1 – frac{3}{100}right)} \ \ &= frac{588}{685} \ mathbb{P}left(M | Tright) & approx 85,84 % end{aligned}[/latex]

Conclusion

L’objectif de cet article était de donner toutes les bases nécessaires en probabilité pour bien comprendre la partie 2 (qui ne devrait pas trop tarder 😉). Les probabilités sont utilisées de manière extensive dans plusieurs disciplines ainsi que dans beaucoup d’outils de Machine Learning et de Business Intelligence. Les concepts présentés ci-dessus sont des fondamentaux pour bien comprendre le fonctionnement de ces outils avec une meilleure compréhension de certains algorithmes.

Par ailleurs, les probabilités sont très importantes dans les métiers liés à la data et en particuliers pour les Data Scientists et Analystes. DataScientest peut non seulement vous permettre d’étoffer vos bases mais également vous accompagner dans votre montée en compétence à travers ses différents parcours dédiés. N’hésitez pas à visiter le site internet ou à nous contacter directement.

Liora (ex DataScientest) est un institut de formation technologique fondé en 2017, qui figure parmi les acteurs de référence du secteur. Liora propose des formations à distance, en bootcamp ou en temps partiel, dans les métiers de la data, du cloud, de l’intelligence artificielle, du développement informatique, de la cybersécurité et de la transformation digitale. La méthode pédagogie est basée sur 80% de pratique asynchrone via une plateforme propriétaire ready to code, et 20% d’accompagnement en direct avec mentors et coachs carrière. Les formations permettent de valider des certifications RNCP de niveau 6 ou 7, souvent accompagnées d’un certificat de reconnaissance délivré par de grandes institutions françaises (Mines Paris, La Sorbonne, ECE, INSEEC, etc.). Elles préparent également à des certifications officielles délivrées par des entreprises technologiques majeures comme Microsoft, AWS ou Google Cloud. À ce jour, Liora compte plus de 50 000 alumni, répartis à travers le monde.

Liora – Your future. Decoded.