Miary dyspersji
Wśród klasycznych miar dyspersji wyróżnia się: wariancję, odchylenie standardowe, odchylenie przeciętne, klasyczny współczynnik zmienności. Klasyczne miary dyspersji pozwalają ocenić zmienność wyników względem średniej arytmetycznej.
Pozycyjne miary zmienności to: rozstęp, odchylenie ćwiartkowe, pozycyjny współczynnik zmienności.
Klasyczne miary dyspersji
Wariancja – jest średnią arytmetyczną kwadratów odchyleń wartości zmiennej od jej średniej arytmetycznej. Na podstawie samej wariancji trudno ocenić stopień dyspersji, gdyż jest miarą absolutną i rząd wielkości cechy decyduje o wielkości wariancji. Wielkość wariancji może oznaczać wielkość wartości cechy, a nie zróżnicowanie. Wariancja z próby dana jest wzorem:
Wariancję z populacji oblicza się ze wzoru, w którym od liczebności w mianowniku nie odejmuje się jednej wartości:
W badaniach społecznych zazwyczaj mamy do czynienia ze statystykami z próby, badanie całej populacji zdarza się rzadko. Przykładem badania pełnego może być Narodowy Spis Powszechny.
Własności wariancji:
- Jest wartością nieujemną
- Gdy wszystkie wartości są identyczne (brak dyspersji) wariancja przyjmuje wartość zero.
- Jest drugim momentem centralnym
- Równość wariancyjna, co oznacza że wariancja zbiorowości podzielonej na grupy jest sumą wariancji średnich grupowych oraz średniej wariancji w grupach
Odchylenie standardowe – przeciętne odchylenie wartości cechy od średniej arytmetycznej, określa o ile wartość danej cechy statystycznej odchyla się od średniej arytmetycznej. Odchylenie standardowe z próby obliczamy jako pierwiastek z wariancji, czyli według wzoru:
Typowy obszar zmienności (dyspersji) – przedział wartości cechy, które przyjmuje większość zbiorowości, czyli w zakresie jednego odchylenia standardowego od średniej. Typowy obszar zmienności dany jest wzorem:
Odchylenie przeciętne – jest to średnia arytmetyczna modułów (wartości bezwzględnych) odchyleń wartości cechy od średniej arytmetycznej. Obliczając odchylenie przeciętne zamiast podnoszenia do kwadratu (w celu pozbycia się wartości ujemnych) stosuje się wartość bezwzględną. W praktyce odchylenie przeciętne jest rzadko wykorzystywane. Odchylenie przeciętne z próby dane jest wzorem:
Klasyczny współczynnik zmienności (dyspersji) – jest ilorazem odchylenia standardowego i średniej arytmetycznej, przyjmuje wartości z zakresu (0-1), chyba że średnia arytmetyczna będzie większa, niż odchylenie standardowe mówimy wtedy o ekstremalnie dużej zmienności. Klasyczny współczynnik zmienności dany jest wzorem:
Wyniki interpretujemy według następujących progów:
- do 30% – mała dyspersja
- 31- 60% umiarkowana dyspersja
- powyżej 60% – znaczna dyspersja
Klasyczny współczynnik dyspersji pozwala również na porównanie zmienności między różnymi zbiorowościami, czego nie można robić na podstawie odchylenia standardowego, ponieważ zależy ono od średniej – która jest różna w różnych grupach.
Pozycyjne miary dyspersji
Rozstęp – jest różnicą między wartością minimalną i maksymalną, rozstęp określa całkowitą zmienność cechy statystycznej, czyli empiryczny obszar dyspersji cechy statystycznej
Rozstęp międzykwartylowy (rozstęp ćwiartkowy) – jest to różnica między pierwszym a trzecim kwartylem, określa obszar zmienności 50% centralnie położonych (środkowych) jednostek danej cechy statystycznej. Rozstęp międzykwartylowy dany jest wzorem.
Odchylenie ćwiartkowe – określa odchylenie wartości zmiennej od mediany, jest połową rozpiętości między pierwszym i trzecim kwartylem, odchylenie ćwiartkowe ocenia zróżnicowanie wartości dla 50% jednostek środkowych
Pozycyjny współczynnik zmienności – iloraz odchylenia ćwiartkowego i mediany, pokazuje jaką część mediany stanowi przeciętne odchylenie od mediany. Ocena zmienności dotyczy 50% środkowych jednostek. Interpretacja pozycyjnego współczynnika zmienności jest analogiczna jak klasycznego współczynnika zmienności. Pozycyjny współczynnik zmienności dany jest wzorem.
Wyniki interpretujemy według następujących progów:
- do 30% – mała dyspersja
- 31- 60% umiarkowana dyspersja
- powyżej 60% – znaczna dyspersja
Klasyczny współczynnik zmienności może przyjąć wartość większą od 100%, gdy odchylenie standardowe jest większe od średniej – ekstremalna dyspersja, podczas gdy pozycyjny współczynnik zmienności zawsze będzie zawierał się w przedziale 0-1, gdyż odchylenie ćwiartkowe nie przyjmie wartości większej, niż mediana.