S'abonner à un flux RSS
 

Classement fréquentiel (HU)

De Wikhydro

Traduction anglaise : Frequency analysis

Dernière mise à jour : 10/09/2021

Méthode statistique permettant par exemple de calculer la fréquence d'apparition d'un événement ou celle de dépassement d'un seuil pour une variable aléatoire.

Sommaire

Méthode de base

Considérons une série de $ P $ valeurs correspondant à des réalisations d'une variable aléatoire obtenues sur un échantillon représentatif. Il peut par exemple s'agir des tailles d'un échantillon de $ P $ personnes ou, dans le domaine de l'hydrologie, des débits maximum observés sur un échantillon de $ P $ crues.

L'objectif est de déterminer la fréquence avec laquelle la valeur de la variable dépasse une valeur donnée pour pouvoir en déduire une probabilité de réalisation. On commence donc par affecter à chaque valeur une fréquence empirique de dépassement

Pour ceci, on classe les $ P $ valeurs par ordre décroissant : depuis $ x_1 $ la plus grande, jusqu'à $ x_p $ la plus petite. Considérons la plus grande valeur $ x_1 $. Comme le nombre total de valeurs dans l'échantillon est $ P $, on peut considérer que cette valeur $ x_1 $ est atteinte ou dépassée $ 1 $ fois pour $ P $ réalisations. Sa fréquence empirique de dépassement est donc de $ 1/P $. La valeur classée au deuxième rang, $ x_2 $, est pour sa part atteinte ou dépassée $ 2 $ fois sur le même échantillon. Sa fréquence empirique de dépassement est donc de $ 2/P $. En généralisant ce raisonnement, la valeur $ x_i $classée au ième rang possède une fréquence empirique de dépassement égale à :


$ F_i = \frac{i}{P} \quad (1) $

Raffinement de la méthode

En fait, le raisonnement précédent doit être un peu compliqué. En effet, conduit sous la forme de base, il amène à un paradoxe : la valeur $ x_p $ classée dernière, donc au Pième rang, possède une fréquence empirique de dépassement de $ P/P $, c'est à dire de $ 1 $. Si l'on passe des statistiques aux probabilités, on serait donc certain d'observer, pour tout échantillon comportant P valeurs, au moins une valeur supérieure ou égale à cette valeur particulière, ce qui est bien évidemment illogique.

Pour éviter cet inconvénient, les statisticiens proposent de calculer la fréquence empirique de dépassement $ Fi $ en fonction du rang $ i $ par une formule de la forme :


$ F_i = \frac{i - a}{P + 1 - 2.a} $

$ a $ dépend de la fonction de répartition de la variable que, dans la pratique, on ne connaît pas.

On choisit généralement $ a = 0,5 $, qui correspond à une fonction de répartition exponentielle de la variable.

Passage aux périodes de retour

En hydrologie, ce type de traitement est surtout utilisé pour évaluer les risques de fréquence d'apparition ou de dépassement d'une valeur sur une période donnée. On cherche ainsi à répondre à des questions de la forme : "Combien de crues ont atteint ou dépassé la valeur de débit Qmax au cours du siècle passé ?". En pratique on raisonne souvent sur l'inverse de la fréquence temporelle que l'on appelle Période de retour.


$ T = \frac{1}{F} $

Pour ceci il suffit d'associer à l'échantillon une durée d'observation et de calculer les fréquences non pas par rapport au nombre $ P $ de réalisations dans l'échantillon mais par rapport à la durée totale d'observation $ D $.


$ F_i = \frac{i - a}{D + 1 - 2.a} $

Par exemple avec a = 0{,}5, si la durée d'observation est de 50 ans, la plus forte valeur (rang i = 1), aura une fréquence empirique de dépassement de 1/100, et donc une période de retour de 100 ans.



Intérêt en hydrologie

Historiquement les méthodes de classement fréquentiel

Outils personnels