Asymétrie (statistiques)

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes En théorie des probabilités et statistique, le coefficient d'asymétrie (Modèle:Langue en anglais) correspond à une mesure de l’asymétrie de la distribution d’une variable aléatoire réelle.

C’est le premier des paramètres de forme, avec le kurtosis (les paramètres basés sur les moments d’ordre 5 et plus n’ont pas de nom attribué).

En termes généraux, l’asymétrie d’une distribution est positive si la queue de droite (à valeurs hautes) est plus longue ou grosse, et négative si la queue de gauche (à valeurs basses) est plus longue ou grosse.

Définition

Étant donnée une variable aléatoire réelle Modèle:Mvar de moyenne Modèle:Mvar et d’écart type Modèle:Mvar, on définit son coefficient d’asymétrie comme le moment d’ordre trois de la variable centrée réduite :

lorsque cette espérance existe. On a donc :

avec Modèle:Mvar les moments centrés d’ordre Modèle:Mvar et Modèle:Mvar les cumulants d’ordre Modèle:Mvar.

Propriétés

Dimension

Les moments centrés Modèle:Mvar et cumulants Modèle:Mvar ayant pour dimension celle de la variable Modèle:Mvar élevée à la puissance Modèle:Mvar, le coefficient d’asymétrie Modèle:Math est une grandeur adimensionnelle.

Somme de réalisations indépendantes

Soient Modèle:Mvar une variable aléatoire réelle et la somme de Modèle:Mvar réalisations indépendantes de Modèle:Mvar (exemple : la loi binomiale de paramètres Modèle:Mvar et Modèle:Mvar, somme de Modèle:Mvar réalisations indépendantes de la loi de Bernoulli de paramètre Modèle:Mvar). Grâce à la propriété d’additivité des cumulants, on sait que Modèle:Math, donc :

Forme de la distribution

  • Un coefficient nul indique une distribution symétrique.
  • Un coefficient négatif indique une distribution décalée à droite de la médiane, et donc une queue de distribution étalée vers la gauche.
  • Un coefficient positif indique une distribution décalée à gauche de la médiane, et donc une queue de distribution étalée vers la droite.

Estimation de l'asymétrie

Estimateur non biaisé

Une application naïve de la définition théorique Modèle:Math du coefficient d’asymétrie produit une mesure biaisée. Un estimateur non biaisé pour la loi normale de l’asymétrie est :

et sont des estimateurs non biaisés respectivement de l’espérance et de la variance.

Mesures de l'asymétrie par d'autres paramètres

Comparaison de la moyenne, de la médiane et du mode de deux lois log-normales avec des asymétries différentes.

Karl Pearson a proposé d'autres estimations de l'asymétrie par des calculs plus simples[1], ne faisant pas appel aux moments mais à d'autres paramètres statistiques :

Premier coefficient d'asymétrie de Pearson (asymétrie de mode)

Le coefficient d'asymétrie de mode de Pearson est donné par [2]:

Modèle:Sfrac.
Deuxième coefficient d'asymétrie de Pearson (asymétrie de médiane)

Le coefficient d'asymétrie de médiane de Pearson est donné par [3]Modèle:,[4] :

Modèle:Sfrac.

Mesures par des quartiles

La mesure de l'asymétrie proposée par Bowley (en 1901)[5]Modèle:,[6], ou coefficient de Yule (de 1912)[7]Modèle:,[8], mesure de l'asymétrie de Galton[9] ou indice de Yule–Kendall[10] est définie par :

.

Par la deuxième forme, on voit que le numérateur est la différence entre la moyenne des premier et troisième quartiles (mesure de localisation) et la médiane, tandis que le dénominateur représente la déviation moyenne absolue de la dispersion (dans les cas symétriques).

Une formulation plus générale d'une fonction d'asymétrie a été décrite par Groeneveld et Meeden[11]Modèle:,[12]Modèle:,[13]ː

Modèle:Mvar est la fonction de répartition. On obtient ainsi une mesure générale de l'asymétrie[12] définie par le supremum de cette fonction pour Modèle:Math. Une autre mesure peut être obtenue avec les intégrales des numérateurs et dénominateurs de cette expression[11]. La fonction Modèle:Math vérifie Modèle:Math et est bien définie sans nécessiter l'existence de tous les moments de la distribution considérée[11]. Si les mesures de l'asymétrie par les quantiles sont simples à interpréter, elles ont cependant tendance à varier plus que les calculs par les moments. Par exemple, la loi uniforme a une asymétrie par quantiles plus grande.

Le coefficient de Yule correspond à Modèle:Math et la mesure de Kelley vaut Modèle:Math[14].

Voir aussi

Modèle:Autres projets

Notes et références

Modèle:Traduction/Référence

  1. Modèle:Lien web
  2. Modèle:MathWorld
  3. Modèle:MathWorld
  4. Doane, David P., and Lori E. Seward. "Measuring Skewness: A Forgotten Statistic?" Journal of Statistics Education 19.2 (2011): 1-18.
  5. Bowley, A. L. (1901). Elements of Statistics, P.S. King & Son, Laondon. Or in a later edition: BOWLEY, AL. "Elements of Statistics, 4th Edn (New York, Charles Scribner)."(1920).
  6. Kenney JF and Keeping ES (1962) Mathematics of Statistics, Pt. 1, 3rd ed., Van Nostrand, (page 102).
  7. Yule, George Udny. An introduction to the theory of statistics. C. Griffin, limited, 1912.
  8. Groeneveld, Richard A. "An influence function approach to describing the skewness of a distribution." The American Statistician 45.2 (1991): 97-102.
  9. Johnson et al (1994) p 3, p 40
  10. Wilks DS (1995) Statistical Methods in the Atmospheric Sciences, p 27. Academic Press. Modèle:Isbn
  11. 11,0 11,1 et 11,2 Modèle:Article
  12. 12,0 et 12,1 MacGillivray (1992)
  13. Hinkley DV (1975) "On power transformations to symmetry", Biometrika, 62, 101–111
  14. Modèle:Lien web

Articles connexes

Modèle:Palette Modèle:Portail