Średnia jest najczęściej używaną miarą środka, ale są chwile, kiedy zaleca się użycie mediany do wyświetlania i analizy danych. Kiedy może być właściwe użycie mediany zamiast średniej?

Średnia jest najczęściej używaną miarą środka, ale są chwile, kiedy zaleca się użycie mediany do wyświetlania i analizy danych. Kiedy może być właściwe użycie mediany zamiast średniej?
Anonim

Gdy w zestawie danych jest kilka skrajnych wartości.

Przykład:

Masz zbiór danych 1000 przypadków o wartościach niezbyt odległych. Ich średnia wynosi 100, podobnie jak ich mediana. Teraz zastępujesz tylko jeden przypadek przypadkiem, który ma wartość 100000 (tylko po to, aby był ekstremalny). Średnia wzrośnie dramatycznie (do prawie 200), podczas gdy mediana pozostanie niezmieniona.

Obliczenie:

1000 przypadków, średnia = 100, suma wartości = 100000

Stracić 100, dodać 100000, suma wartości = 199900, średnia = 199,9

Mediana (= przypadek 500 + 501) / 2 pozostaje taka sama.