잔류 분산을 계산하는 방법

차례:

Anonim

투자자는 자산 가격 움직임의 모델을 사용하여 특정 시점에 투자 가격이 어디인지 예측합니다. 이 예측을 만드는 데 사용 된 방법은 다음과 같은 통계의 필드의 일부입니다. 회귀 분석. 의 계산 잔류 분산 값의 집합은 모델의 예측이 실제 값과 얼마나 정확하게 일치 하는지를 측정하는 회귀 분석 도구입니다.

회귀선

그만큼 회귀선 변수의 변화로 인해 자산의 가치가 어떻게 변했는지를 보여줍니다. 일컬어 a 추세선회귀 직선은 자산 가격의 "경향"을 표시합니다. 회귀 직선은 선형 방정식으로 표현됩니다.

Y = a + bX

여기서 "Y"는 자산 값이고 "a"는 상수이며 "b"는 승수이며 "X"는 자산 가치와 관련된 변수입니다.

예를 들어, 모델이 한 침실 가정이 $ 300,000, 두 침실 주택이 $ 400,000, 세 침실 집이 $ 500,000에 판매된다고 예측한다면 회귀 직선은 다음과 같습니다.

Y = 200,000 + 100,000X

여기서 "Y"는 집 판매 가격이고 "X"는 침실 수입니다.

Y = 200,000 + 100,000 (1) = 300,000

Y = 200,000 + 100,000 (2) = 400,000

Y = 200,000 + 100,000 (3) = 500,000

산포도

에이 산포도 자산 값과 변수 간의 실제 상관 관계를 나타내는 점을 보여줍니다. "산점도 (scatterplot)"라는 용어는 이러한 점들이 그래프에 그려지면 회귀선에 완벽하게 눕히지 않고 "흩어져있는"것처럼 보입니다. 위의 예제를 사용하여 다음 데이터 포인트가있는 산점도를 만들 수 있습니다.

포인트 1: 1BR은 288,000 달러에 판매되었습니다.

포인트 2: 1BR은 315,000 달러에 팔렸습니다.

포인트 3: 2BR은 395,000 달러에 판매 됨

포인트 4: 2BR은 410,000 달러에 팔렸습니다.

포인트 5: 3BR은 492,000 달러에 팔렸습니다.

포인트 6: 3BR은 $ 507,000에 판매되었습니다.

잔류 분산 계산

잔여 분산 계산은 제곱의 합 회귀 직선의 자산 가치와 산점도의 해당 자산 가치 간의 차이점

차이점의 사각형이 여기에 표시됩니다.

포인트 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12,000)2 = 144,000,000

포인트 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (+15,000)2 = 225,000,000

포인트 3: $ 395,000 - $ 400,000 = (- $ 5,000); (-5,000)2 = 25,000,000

포인트 4: $ 410,000 - $ 400,000 = (+ $ 10,000); (+10,000)2 = 100,000,000

포인트 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8,000)2 = 64,000,000

포인트 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (+7,000)2 = 49,000,000

제곱의 합 = 607,000,000

잔류 분산은 제곱의 합계를 (n-2)로 나눔으로써 발견됩니다. 여기서 "n"은 산점도의 데이터 포인트 수입니다.

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

잔류 분산 사용

산점도의 모든 점은 회귀선과 완벽하게 일치하지 않지만 안정된 모델은 산점도가 회귀선 주위의 정규 분포를 갖습니다. 잔여 분산은 "오류 분산"이라고도합니다. 높은 잔차 분산은 원래 모델의 회귀선이 잘못되었을 수 있음을 보여줍니다. 일부 스프레드 시트 함수는 산점도 데이터에 더 가까운 회귀 선을 만드는 과정을 보여줄 수 있습니다.