Jaki jest związek między R-Squared a współczynnikiem korelacji modelu?

Jaki jest związek między R-Squared a współczynnikiem korelacji modelu?
Anonim

Odpowiedź:

Zobacz. Kredyt dla Gaurav Bansal.

Wyjaśnienie:

Próbowałem wymyślić najlepszy sposób, aby to wyjaśnić, i natknąłem się na stronę, która robi naprawdę fajną pracę. Wolałbym dać temu facetowi uznanie za wyjaśnienie. W przypadku, gdy link nie działa dla niektórych, zamieściłem poniżej kilka informacji.

Mówiąc prosto: # R ^ 2 # wartość jest po prostu kwadratem współczynnika korelacji # R #.

The Współczynnik korelacji (# R #) modelu (powiedzmy zmiennymi # x # i # y #) przyjmuje wartości między #-1# i #1#. Opisuje jak # x # i # y # są skorelowane.

  • Jeśli # x # i # y # są w doskonałej jedności, wtedy ta wartość będzie dodatnia #1#
  • Jeśli # x # zwiększa się podczas # y # zmniejsza się dokładnie w odwrotny sposób, wtedy ta wartość będzie #-1#
  • #0# byłaby sytuacja, w której nie ma korelacji między # x # i # y #

Jednak to # R # wartość jest użyteczna tylko dla prostego modelu liniowego (tylko # x # i # y #). Kiedyś rozważymy więcej niż jedną niezależną zmienną (teraz mamy # x_1 #, # x_2 #, …), bardzo trudno zrozumieć, co oznacza współczynnik korelacji. Śledzenie, która zmienna przyczynia się do korelacji, nie jest tak jasne.

To gdzie # R ^ 2 # wartość wchodzi w grę. Jest to po prostu kwadrat współczynnika korelacji. Przyjmuje wartości między #0# i #1#, gdzie wartości są bliskie #1# implikują większą korelację (niezależnie od tego, czy są skorelowane dodatnio czy ujemnie) i #0# oznacza brak korelacji. Innym sposobem myślenia o tym jest zmienność ułamkowa zmiennej zależnej, która jest wynikiem wszystkich zmiennych niezależnych. Jeśli zmienna zależna jest silnie zależna od wszystkich zmiennych niezależnych, wartość będzie bliska #1#. Więc # R ^ 2 # jest o wiele bardziej użyteczny, ponieważ może być również używany do opisu modeli wielowymiarowych.

Jeśli chcesz omówić niektóre z pojęć matematycznych związanych z powiązaniem dwóch wartości, zobacz to.