Dlaczego wartość R-Squared nie wskazuje na związek przyczynowy?

Dlaczego wartość R-Squared nie wskazuje na związek przyczynowy?
Anonim

Odpowiedź:

R-kwadrat wskazuje, jak dobrze obserwowane dane pasują do oczekiwanych danych, ale podaje tylko informacje o korelacji.

Wyjaśnienie:

Wartość R-kwadrat wskazuje, jak dobrze obserwowane dane lub zebrane dane pasują do oczekiwanego trendu. Ta wartość mówi o sile związku, ale, jak wszystkie testy statystyczne, nie ma niczego, co mówi o przyczynie związku lub jego sile.

W poniższym przykładzie widzimy, że wykres po lewej stronie nie ma związku, na co wskazuje niska wartość R-kwadrat. Wykres po prawej stronie ma bardzo silną zależność, co wskazuje na wartość R-kwadrat równą 1. W żadnym z tych wykresów nie możemy powiedzieć, co ostatecznie powoduje tę relację.

Korelacja nie oznacza związku przyczynowego. Twoje wartości X mogą bardzo dobrze wpłynąć na twoje wartości Y, ale mogą występować inne czynniki lub związek może być spowodowany przypadkiem. Możesz wywnioskować związek przyczynowy, ale to jest twoja interpretacja i nie może być udowodniona przez testy statystyczne. Posiadanie wysokiej wartości R-kwadrat wciąż mówi tylko o sile związku, ale nie o jego przyczynie.

Udowodnienie związku przyczynowego jest bardzo dużym zadaniem. Jeśli chcesz zrozumieć przyczynowość, najlepszym rozwiązaniem są eksperymenty.