데이터의 정밀도를 계산하는 방법

차례:

Anonim

데이터 정밀도는 과학적 또는 통계적 분석을 수행 할 때 가장 중요한 고려 사항 중 하나입니다. 일반적으로 똑같이 중요한 정확성의 개념과 혼동을 일으키는 하와이 대학의 다트 보드 비유는 정확한 데이터 포인트가 평등 한 예상 결과와 평균을 이루는 반면 정확한 데이터 포인트는 가까운 곳에 있지 않더라도 밀접하게 함께 묶는 관계를 보여줍니다. 예상 결과. Dartmouth College에 따르면 정밀도는 일련의 결과의 재현성을 측정 한 것입니다. 텍사스 - 오스틴 대학 (University of Texas-Austin)의 Kenneth E. Foote와 Donald J. Huebner가 지리 정보 시스템 (Geographic Information Systems)을 분석 한 결과, 데이터 세트의 정확성은 기술 관련 노력에서도 중요한 개념입니다. 정밀도 계산은 다소 주관적인 운동이지만 상당히 간단합니다.

필요한 항목

  • 데이터 세트의 그래픽 표현

  • 데이터에 표현 된 관련 단위에 관한 정보

  • 실험에서 허용되는 최소 허용 오차

산점도와 같은 데이터 요소의 시각적 표현을 개발하십시오. 매우 단순한 시각적 표현에는 데카르트 좌표계에서 각 데이터 점에 대한 종속 변수 값과 독립 변수 값을 플로팅하는 것이 포함됩니다.

데이터 요소의 그룹을 평가하고 패턴을 찾습니다. 정확한 데이터는 데이터 포인트의 클러스터에 나타나며, 유사한 입력 변수가 유사한 출력 변수와 관련되어 있음을 나타냅니다.

데이터를 수집하는 데 사용 된 측정 단위에 정보를 적용하여 데이터 요소 간의 평균 간격을 결정합니다. 간단한 눈금자 측정을 사용하여 그래프의 점 사이의 거리를 결정한 다음 데이터 요소를 생성하는 데 사용 된 측정 단위에 해당하는 임의의 편리한 눈금을 사용하여 변환 할 수 있습니다. 이렇게하면 거리의 평균을 취하여 데이터 포인트의 상대적인 정밀도를 계산할 수 있습니다.

실험에서 허용 된 최소 오차 범위와 데이터 요소의 평균 정확도를 비교하여 실험의 상대적 전체 정확도를 결정합니다. 다른 유형의 실험에서는 오차 허용 범위가 더 크거나 작을 것입니다. 엔지니어링 프로젝트에서는 매우 작은 단위까지 정밀도가 요구되는 반면, 사회적 실험은 더 많은 분산을 허용 할 가능성이 높습니다.

  • 데이터 요소의 그래픽 표현을 만들기 전에 가능한 단위 스케일을 평가하십시오. 이렇게하면 특히 눈에 띄는 정확도 또는 부정확성이있는 영역을 식별하기 위해 시각적으로 정밀도를 쉽게 평가할 수 있습니다.

    시각적 표현에서 발생하는 명확한 데이터 패턴은 정밀도와 실험 반복성을 크게 나타냅니다. 계속되는 실험은 이미 존재하는 것과 가까운 정확한 클러스터에 데이터 포인트를 추가해야합니다.

경고

정확도를 정밀도와 혼동하지 마십시오. 실험의 목표가 모든 입력에 대한 평균 출력 값을 얻는 것이고 평균값이 -12에서 14까지의 평균 값으로 달성되는 경우 정확한 것일 수 있지만 정확한 측정은 아닐 것입니다. 정밀한 측정으로 인해 모든 데이터 포인트가 약 17 개의 클러스터링되는 결과를 초래할 수 있습니다. 정확하지는 않지만 정확하고 예측 가능합니다.

추천