통계에서 가장 기본적인 개념 중 하나는 평균입니다. 산술 평균, 숫자의 집합. 평균은 데이터 세트의 중심 값을 의미합니다. 그만큼 변화 데이터 세트의 요소는 해당 데이터 세트의 요소가 평균에서 얼마나 멀리 퍼져 나가는 지 측정합니다. 숫자가 모두 평균에 가까운 데이터 세트는 분산이 낮습니다. 숫자가 평균보다 훨씬 높거나 낮은 세트는 높은 분산을 갖습니다.
데이터 세트의 평균 계산
제곱 된 차이 계산
다음 단계는 데이터 세트의 각 요소와 평균 간의 차이를 계산하는 것입니다. 일부 요소는 평균보다 높고 일부 요소는 더 낮을 것이므로 분산 계산은 차이의 제곱을 사용합니다.
첫날 판매 - 평균 판매: $ 62,000 - $ 65414.29 = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94
Day 2 Sales - Mean Sales: $ 64,800- $ 65414.29 = (- $ 614.29); (-614.29)2 = 377,346.94
Day 3 Sales - Mean Sales: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814.29)2 = 7,920,204.08
Day 4 Sales - Mean Sales: $ 69,200 - $ 65414.29 = (+ $ 3,785.71); (+3,785.71)2 = 14,331,632.65
Day 5 Sales - Mean Sales: $ 66,000 - $ 65414.29 = (+ $ 585.71); (+585.71)2 = 343,061.22
Day 6 Sales - Mean Sales: $ 63,900 - $ 65414.29 = (- $ 1,514.29); (-1,514.29)2 = 2,293,061.22
Day 7 Sales - Mean Sales: $ 69,400 - $ 65414.29 = (+ $ 3,985.71); (+3,985.71)2 = 15,885,918.37
노트: 제곱 된 차이는 달러로 측정되지 않습니다. 이 수는 다음 단계에서 분산을 계산하는 데 사용됩니다.
분산 및 표준 편차
분산은 차의 제곱의 평균으로 정의됩니다.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
분산은 차의 제곱을 사용하므로 분산의 제곱근은 실제 스프레드를보다 명확하게 나타냅니다. 통계에서 분산의 제곱근은 표준 편차.
SQRT (7,544,081.63) = 2,746,65 달러
분산 및 표준 편차에 대한 사용
분산과 표준 편차는 모두 통계 분석에 매우 유용합니다. 분산은 평균에서 데이터 세트의 전체적인 확산을 측정합니다. 표준 편차는 이상 치, 또는 평균에서 너무 멀리 떨어진 데이터 집합의 요소.
위의 데이터 세트에서 분산은 꽤 높으며 평균 하루 2 건의 판매 합계가 평균 1,000 달러 이내입니다. 데이터 세트는 일곱 가지 일일 판매 합계 중 두 개가 평균보다 1 표준 편차 이상 높고 다른 두 개는 평균보다 표준 편차가 두 개 이상 있음을 보여줍니다.