Excel에서 잔차를 찾는 방법

차례:

Anonim

통계 분석에서 변화 데이터 세트의 구성원 중 데이터 포인트가 추세선과 얼마나 멀리 떨어져 있는지 보여줍니다. 회귀선. 분산이 높을수록 데이터 포인트가 더 넓어집니다. 분산 분석에 대한 연구는 분산의 어느 부분이 데이터의 특성에 의해 설명 될 수 있는지, 그리고 임의의 요인에 기인 할 수 있는지를 보여줍니다. 설명 할 수없는 분산의 부분을 잔차 분산이라고합니다.

Excel 스프레드 시트를 사용하여 잔차 계산

잔류 분산을 계산하는 수식에는 여러 복잡한 계산이 포함됩니다. 작은 데이터 세트의 경우 손으로 잔차 분산을 계산하는 과정이 지루할 수 있습니다. 대용량 데이터 세트의 경우 작업이 고갈 될 수 있습니다. Excel 스프레드 시트를 사용하면 데이터 요소를 입력하고 올바른 수식을 선택하기 만하면됩니다. 이 프로그램은 복잡한 계산을 처리하고 결과를 신속하게 전달합니다.

데이터 점수

새 Excel 스프레드 시트를 열고 두 개의 열에 데이터 요소를 입력하십시오. 회귀선은 각 데이터 요소에 두 개의 요소가 있어야합니다. 통계학자는 일반적으로 이러한 요소를 "X"및 "Y"로 분류합니다. 예를 들어, Generic Insurance Co.는 직원의 신장과 체중의 잔여 분산을 찾고 싶어합니다. X 변수는 높이를 나타내고 Y 변수는 가중치를 나타냄니다. A 열에 높이를 입력하고 B 열에 가중치를 입력하십시오.

평균 찾기

그만큼 평균 데이터 세트의 각 요소에 대한 평균을 나타냅니다. 이 예에서 일반 보험은 평균, 표준 편차 및 10 명의 직원의 높이와 공분산을 찾고자합니다. A 열에 나열된 높이의 평균은 셀 F1에 "= AVERAGE (A1: A10)"함수를 입력하여 찾을 수 있습니다. B 열에 나열된 가중치의 평균은 셀 "F3"에 "= AVERAGE (B1: B10)"함수를 입력하여 찾을 수 있습니다.

표준 편차와 공분산 찾기

그만큼 표준 편차 데이터 포인트가 평균에서 얼마나 멀리 떨어져 있는지 측정합니다. 그만큼 공분산 데이터 요소의 두 요소가 함께 변경되는 정도를 측정합니다. 높이의 표준 편차는 셀 F2에 "STDEV (A1: A10)"함수를 입력하여 찾을 수 있습니다. 분동의 표준 편차는 셀 "F4"에 "= STDEV (B1: B10)"함수를 입력하여 찾을 수 있습니다. 높이와 무게 사이의 공분산은 셀 "F5"에 "= COVAR (A1: A10; B1: B10)"함수를 입력하여 찾을 수 있습니다.

회귀선 찾기

그만큼 회귀선 는 데이터 요소의 추세를 따르는 선형 함수를 나타냅니다. 회귀 직선의 수식은 다음과 같습니다. Y = aX + b.

사용자는 평균값, 표준 편차 및 공분산에 대한 계산을 사용하여 "a"및 "b"값을 찾을 수 있습니다. "b"값은 회귀선이 Y 축을 가로 지르는 지점을 나타냅니다. 값은 공분산을 취하여 X 값의 표준 편차 제곱으로 나눔으로써 발견 할 수 있습니다. Excel 수식은 F6 셀로 들어가서 다음과 같이 보입니다. = F5 / F2 ^ 2.

"a"의 값은 회귀선의 기울기를 나타냅니다. Excel 수식은 F7 셀로 들어가서 다음과 같이 보입니다. = F3-F6 * F1.

회귀 직선의 수식을 보려면 다음 문자열 연결을 셀 F8에 입력하십시오.

ABS (ROUND (F7; 2))) = CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+";

Y 값 계산

다음 단계는 데이터 세트의 주어진 X 값에 대한 회귀 직선의 Y 값을 계산하는 것입니다. Y 값을 찾는 수식은 C 열로 이동하며 다음과 같습니다.

= $ F $ 6 * A (i) + $ F $ 7

여기서 A (i)는 행 (i)의 A 열에 대한 값입니다. 수식은 스프레드 시트에서 다음과 같습니다.

= $ F $ 6 * A1 + $ F $ 7

= $ F $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7 등등

열 D의 항목은 Y에 대한 예상 값과 실제 값의 차이를 보여줍니다. 수식은 다음과 같습니다.

= B (i) -C (i), 여기서 B (i)와 C (i)는 B 열과 C 열의 Row (i) 값입니다.

잔류 분산 찾기

그만큼 잔차 분산 수식 Cell F9에 들어가서 다음과 같이 보입니다.

= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)

여기서 SUMSQ (D1: D10)은 실제 Y 값과 예상 Y 값 사이의 차의 제곱의 합이며 (COUNT (D1: D10) -2)는 데이터 포인트의 수이며 데이터.