Distributions de probabilité

3.1.2 La fonction de distribution de probabilité (FDP)

(Remarque : Dans la suite de ce module, nous utiliserons les termes distribution de probabilité et fonction de distribution de probabilité indifféremment.)

Pour décrire succinctement la distribution de probabilité d’un échantillon de données extrait d’un plus vaste ensemble de données, on emploie ce que l’on appelle une fonction de distribution de probabilité (ou fonction de densité de probabilité — FDP), avec les valeurs possibles des données sur l’axe des x et la probabilité pour qu’une telle valeur se produise d’après l’échantillon sur l’axe des y (voir l’exemple ci-dessous). La fonction de distribution de probabilité exhibe une forme caractéristique, une position caractéristique de son « milieu » et une variabilité ou une dispersion caractéristique des valeurs qu’elle prend.

Certaines données peuvent ne prendre que des valeurs discrètes, comme l’occurrence ou la non-occurrence de précipitations mesurables dans un intervalle de temps. Les distributions théoriques de probabilité discrète incluent les distributions binomiales, géométriques et de Poisson. D’autre part, certaines données peuvent prendre n’importe quelle valeur réelle dans un intervalle fini ou infini; elles sont décrites au moyen de distributions théoriques de probabilité continue. La distribution gaussienne ou « normale », la distribution bêta, la distribution gamma et la distribution des valeurs extrêmes en sont des exemples.

Dans le reste de cette sous-section, nous allons décrire la distribution théorique normale. Des précisions sur d’autres distributions théoriques courantes sont donnés dans la section En profondeur ci-dessous. Dans les trois sous-sections suivantes, nous allons examiner certains paramètres utilisés pour décrire les distributions de probabilité.

La distribution normale (gaussienne)

La distribution normale, ou gaussienne, est la forme la plus communément supposée pour faire une description statistique des données. Dans cette distribution, les valeurs proches de la moyenne sont les valeurs les plus fréquemment observées tandis que les valeurs extrêmes sont plus rares (ce que représente la courbe familière en forme de cloche). Deux paramètres statistiques, la moyenne et l’écart-type (une mesure de la distance par rapport à la moyenne, dont on discute plus loin) décrivent complètement des données dont la distribution est normale. Un autre avantage de la distribution normale est que même si un échantillon de données n’a pas une distribution normale, les moyennes de tous les échantillons de données tirés de la population auront une distribution normale. La figure suivante montre une distribution normale avec une moyenne de 0,0 et un écart-type de 1,0. (Remarquez que la valeur intégrée sous la courbe normale (de l’infini à + l’infini) doit être égale à 1. En d’autres mots, la somme de toutes les probabilités de résultats doit être de 100 %.

Distribution normale avec moyenne de 0,0 et écart-type de 1,0

La distribution normale s’applique aux grands échantillons de données météorologiques sans limites supérieure ou inférieure proches et qui tendent vers une valeur centrale, comme la température ou la hauteur d’une surface isobare. La figure ci-dessous (un histogramme) montre les fréquences des hauteurs de 500 hPa, par intervalles de 50 mètres, de la réanalyse des NCEP à 125° de longitude ouest et 42,5° de latitude nord pour tous les jours de novembre, de 1979 à 1995, en comparaison avec une distribution théorique normale ayant la même moyenne et le même écart-type. Remarquez l’étroite correspondance des deux courbes.

Histogramme des hauteurs de 500 hPa, réanalyse des NCEP 125W 42,5N

Les statistiques pour les prévisions d’ensemble supposent généralement une distribution normale. Il arrive, cependant, que les données des prévisions d’ensemble n’aient pas une distribution normale; par exemple, lorsque deux régimes différents ou plus sont prévus et qu’il y a donc deux prévisions ou plus de fréquence plus élevée. Dans un tel cas, les statistiques déduites des données de l’ensemble peuvent ne pas être représentatives de la population de prévisions et peuvent en fait induire le prévisionniste en erreur. Nous en reparlerons à la section Application des données.

Pour ce module, il suffit de comprendre les propriétés d’une distribution normale. Cependant, plusieurs autres distributions sont possibles. Cliquez sur le bouton En profondeur ci-dessous pour accéder à une section facultative donnant de brèves descriptions de quelques autres distributions utilisées en météorologie. Pour des renseignements détaillés sur les distributions de probabilité théoriques, nous suggérons l’ouvrage de Wilks (1995), mentionné dans la bibliographie.

En profondeur

Retour au haut de la page

Produit par le programme COMET®