Formules de statistiques descriptives1. Mesures de tendance centrale a. Moyenne arithmétique Données en vrac Données regroupées ∑ ∑ = = = b. Médiane Au moins 50% des données sont inférieures ou égales à la médiane et au moins 50% des données sont supérieures ou égales à la médiane i. Données en vrac : Nombre pair de données : () + () é = Nombre impair de données : é = ( ) ii. Données regroupées : On repère la classe où se trouve la médiane [aM, bM[ puis on interpole en utilisant la formule suivante: − ∗ é = + ( − ) où nM est l'effectif de la classe contenant la médiane et f* est la somme des effectifs des classes qui précèdent celle où se trouve la médiane 1 Quartiles Au moins 25% des données sont inférieures ou égales à Q1 et au moins 75% des données sont supérieures ou égales à Q1 Données regroupées : Premier quartile : On repère la classe où se trouve le premier quartile Q1. d. associée le maximum des effectifs (ou des fréquences). Dernier quartile : On repère la classe où se trouve le dernier quartile Q3. [aQ3. Sinon.c. bQ3[ puis on interpole en utilisant la formule suivante: − ∗ = + − où nQ3 est l'effectif de la classe contenant le dernier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. classe qui "se détache" dans l'histogramme une fois qu'on a réajusté les hauteurs pour que les surfaces des rectangles soient proportionnelles aux effectifs (ou aux fréquences) 2 . bQ1[ puis on interpole en utilisant la formule suivante: − ∗ = + − où nQ1 est l'effectif de la classe contenant le premier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. classe à laquelle est des effectifs (ou des fréquences). [aQ1. Mode et classe modale Données en vrac Données regroupées Donnée à laquelle est associée le maximum Si les classes sont égales. Boîte à moustaches (BoxPlot) Li = max { minimum. Ls] est considérée extravagante (atypique) 3 .Q1) } Toute donnée qui déborde de [Li.e. Q1 – 1.5 (Q3 . Q3 + 1.5 (Q3 .Q1) } Ls = min { maximum. 5. Mesures de dispersion a.2. il y aura au plus 16% des données en dehors de ü ± 2.minimum b. Plage (Range) Plage = maximum .5·s (au moins 84% à l’intérieur) Remarque : On ne doit pas déborder ni du minimum ni du maximum des observations ! 4 . il y aura au plus 11% des données en dehors de ü ± 3·s (au moins 89% à l’intérieur) • si k = 2. Théorème de Tchebycheff La proportion des observations situées à l’extérieur de l’intervalle défini par ü ± k·s est d’au plus 1/k² ( k ≥ 1) Exemples : • si k = 2. il y aura au plus 25% des données en dehors de ü ± 2·s (au moins 75% à l’intérieur) • si k = 3. Variance Données en vrac Données regroupées Définition Définition )² ∑( − )² ∑( − ! = ! = − − Formule de calcul Formule de calcul (∑ ) (∑ ) ∑ − ∑ − ! = − ! = − c. Écart-type (standard deviation) ! = #! d. Coefficient de variation ! 34 = 5 5 ∙ 22% Critères d’homogénéité . Transformation linéaire =+∙ Si & = + ∙ alors & et !& = ||! b.3.pour ce cours: • Un phénomène industriel sera considéré homogène si son CV est inférieur à 10% • On considérera tout autre phénomène comme homogène si son CV est inférieur à 30% 5 . Cote-Z de X − 0 = ! Remarque : si |0 | > on concluera que X est une donnée extravagante. Remarque : la cote Z est une transformation linéaire de X où a = -ü/s et b = 1/s Remarque : =2 0 et !0 = (découle de la remarque précédente) c. Autres mesures a. e. l’asymétrie est modérée • Si |SK| > 2. l’aplatissement est prononcé 6 .é<= <. >?@A ) ( + ) ∑( − ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Données regroupées Données regroupées ) ( + ) ∑( − ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Interprétation .pour ce cours: On ne peut interpréter ce coefficient que lorsque le biais est négligeable i.pour ce cours: • Si SK < 0 il y a une asymétrie négative (ou un biais à gauche) • Si SK ≥ 0 il y a une asymétrie positive (ou un biais à droite) • Si |SK| ≤ 0. ni trop étirée (distribution mésokurtique) • Si 0.5 … • Si K < 0 la courbe est aplatie (distribution platykurtique) • Si K ≥ 0 la courbe est étirée (distribution leptokurtique) • Si |K| ≤ 0. Coefficient d'aplatissement (Kurtosis) 9:. l’asymétrie est prononcée e..5.5 < |SK| ≤ 2.d. pour |SK| ≤ 0. l’asymétrie est négligeable • Si 0. l’aplatissement est modéré • Si |K| > 2.5 la courbe n’est ni trop aplatie. Coefficient d'asymétrie (Skewness) Données en vrac Données regroupées ) ∑( − ) ∑( − 78 = 78 = ( − )( − )! ( − )( − )! Interprétation .5 < |K| ≤ 2.