Gdy zbiór danych ma kilka bardzo skrajnych przypadków.
Przykład: Mamy zbiór danych 1000, w którym większość wartości znajduje się wokół znaku 1000. Powiedzmy, że średnia i mediana wynoszą 1000. Teraz dodajemy jednego „milionera”. Średnia wzrośnie dramatycznie do prawie 2000, podczas gdy mediana tak naprawdę się nie zmieni, ponieważ będzie to wartość przypadku 501 zamiast pośredniego przypadku 500 i przypadku 501 (przypadki ułożone w kolejności wartości)
Średnia jest najczęściej używaną miarą środka, ale są chwile, kiedy zaleca się użycie mediany do wyświetlania i analizy danych. Kiedy może być właściwe użycie mediany zamiast średniej?
Gdy w zestawie danych jest kilka skrajnych wartości. Przykład: masz zestaw danych 1000 przypadków o wartościach niezbyt odległych. Ich średnia wynosi 100, podobnie jak ich mediana. Teraz zastępujesz tylko jeden przypadek przypadkiem, który ma wartość 100000 (tylko po to, aby był ekstremalny). Średnia wzrośnie dramatycznie (do prawie 200), podczas gdy mediana pozostanie niezmieniona. Obliczenie: 1000 przypadków, średnia = 100, suma wartości = 100000 Stracić 100, dodać 100000, suma wartości = 199900, średnia = 199,9 Mediana (= przypadek 500 + 501) / 2 pozostaje taka sama.
Mediana nazywana jest miarą oporności, podczas gdy średnia jest miarą nieodporną. Co to jest miara odporna?
Odporny w tym przypadku oznacza, że może wytrzymać ekstremalne wartości. Przykład: Wyobraź sobie grupę 101 osób, które mają średnią (= średnią) 1000 dolarów w banku. Zdarza się również, że środkowy człowiek (po posortowaniu na koncie bankowym) ma również 1000 dolarów w banku. Ta mediana oznacza, że 50 (%) ma mniej, a 50 więcej. Teraz jeden z nich wygrywa nagrodę loterii w wysokości 100000 $ i postanawia umieścić ją w banku. Średnia natychmiast wzrośnie z 1000 $ do blisko 2000 $, ponieważ jest obliczana przez podzielenie całkowitej kwoty przez 101. Mediana („środek rzędu”) będzie niezakłó
Mówimy, że mediana jest miarą oporną, podczas gdy średnia nie jest miarą oporną. Co to jest miara odporna?
Odporna miara to taka, na którą nie mają wpływu wartości odstające.Na przykład, jeśli mamy uporządkowaną listę liczb: 1, 3, 4, 5, 6, 8, 50 Średnia wynosi: 11 Mediana wynosi 5 Średnia w tym przypadku jest większa niż większość liczb na liście, ponieważ jest pod tak silnym wpływem 50, w tym przypadku silnego odstającego. Mediana pozostałaby 5, nawet jeśli ostatnia liczba na uporządkowanej liście była znacznie większa, ponieważ po prostu podaje środkowy numer na uporządkowanej liście numerów.