Še boljša mera razpršenosti je varianca. Dobimo jo tako, da seštejemo kvadrate odmikov podatkov od srednje vrednosti in dobljeno vsoto delimo s številom podatkov. Dobimo povprečje kvadratov odmikov podatkov od srednje vrednosti:
Večja je varianca, bolj so podatki razpršeni.
Pri varianci nas moti kvadrat, zato za mero razpršenosti raje uporabljamo kvadratni koren iz variance ali standardni odklon (standardna deviacija):
Zgled 1
Zgled 2
Na diagramu je predstavljena mesečna prodaja avtomobilov dveh znamk. Kaj lahko sklepamo?
4 A B 0 8 12 16 20 24 28
• Prodaja avtomobila tipa B precej bolj niha kot prodaja avtomobila tipa A.
• V posameznih mesecih je bilo prodanih več avtomobilov tipa B.
• Oba tipa imata isto mediano m = 14 in isti tretji kvartil Q3 = 16. To pomeni, da 25 % prodaje predstavlja 14–16 prodanih avtomobilov obeh tipov.
• Polovica prodanih avtomobilov tipa A (8–14) je enaka četrtini prodanih avtov tipa B (8–14).
Pred novim letom so iz bolnišnice odpustili precej bolnikov. Pred odhodom so izpolnili vprašalnik, koliko dni so preživeli na zdravljenju. Tajnica je dobila naslednje podatke: 8, 14, 27, 17, 15, 14, 38, 35 in 12.
b) Zapišimo vse tri kvartile in izračunajmo medčetrtinski razmik.
Če podatke o dnevih zdravljenja uredimo po velikosti: 8, 12, 14, 14, 15, 17, 27, 35, 38, lahko preberemo kvartile: Q1 = 14, Q2 = Me = 15 in Q3 = 27.
Medčetrtinski razmik: IR = 27 – 14 = 13.
c) Izračunajmo še varianco in standardni odklon.
σ = √101,3 = 10,1
Osamelec je podatek, katerega vrednost je za več kot 3-kratnik
medčetrtinskega razmika nad tretjim kvartilom Q3 ali pod prvim kvartilom
Q1. Podatek je »pogojno osamelec«, če je za več kot 1,5-kratnik
medčetrtinskega razmika nad Q3 ali pod Q1
Zgled 3
