티스토리 뷰

통계적 오류에는 1종 오류와 2종 오류가 있습니다. 여기서 통계적 오류는 오차가 랜덤 하고 예측할 수 없는 변동을 의미합니다. 반면 시스템적 오류는 오차가 시스템 상의 잘못으로 나타난 것이기 때문에 해결이 가능합니다.

 

 

1종 오류와 2종 오류 정의

 

  • 1종 오류

1종 오류는 귀무가설이 참일 때 귀무가설을 기각하는 오류입니다. 1종 오류는 "거짓 양성" 또는 알파 오류 (α error)와 같은 의미입니다.

 

  • 2종 오류

2종 오류는 귀무가설이 거짓이지만 귀무가설을 채택하는 오류입니다. 2종 오류는 "거짓 음성" 또는 베타 오류 (β error)와 같은 의미입니다.

 

  • 검정력

검정력은 대립가설이 참일 때, 이를 사실로 채택할 확률입니다.

 

따라서 만약 검정력이 95%라면 "대립가설이 참임에도 불구하고 귀무가설을 채택할 확률(2종 오류)"은 5%가 됩니다. 다르게 해석하자면 검정력이 좋아진다는 의미는 2종 오류를 범할 확률이 낮아진다는 의미입니다.

 

결과적으로 검정력 = (1-β)입니다.

 

 

1종 오류가 2종 오류보다 중요한 이유

 

만약 암 치료제를 개발하면서 약효가 있는지 확인하기 위해 동등성 검정을 한다고 가정하겠습니다.

 

귀무가설: 암 치료제가 효과가 없다.

대립가설: 암 치료제가 효과가 있다.

 

 

위와 같이 귀무가설과 대립가설을 세우게 될 경우, 1종 오류와 2종 오류를 다음과 같이 정의할 수 있습니다.

 

1종 오류: 암 치료제가 실제로 효과가 없지만 잘못 판단하여 암 치료제가 효과가 있다고 판단한다.

2종 오류: 암 치료제가 실제로 효과가 있지만 잘못 판단하여 암 치료제가 효과가 없다고 판단한다.

 

 

2종 오류를 범하게 되면 제약회사는 개발비, 인력, 소요된 시간 등 비용을 많이 잃게 됩니다. 하지만 만약 1종 오류를 범하게 되면 문제가 더 심각해집니다.

 

제약회사에서 1종 오류를 범하게 되면 실제로 약효가 없는 약을 판매하게 되는 것이고, 이는 곧 환자와 모든 사람들에게 신뢰를 잃게 됩니다.

 

따라서 통계학에서는 1종 오류를 더 엄격하게 통제합니다. 그 결과 1종 오류를 범하는 확률, 즉 p값을 0.05, 0.01 등 굉장히 작은 값으로 제한합니다.

 

 

검정력에 영향을 주는 요소

 

1. 유의 수준 (1종 오류)이 커질수록 검정력은 좋아집니다. 유의 수준이 커지면 신뢰도가 낮아지기 때문에 그만큼 신뢰구간이 길어져 검정력이 좋아지게 됩니다.

2. 표준편차와 검정력은 반비례합니다.

3. 두 모집단 간 차이가 작으면 검정력이 나빠집니다.

4. 표본 크기와 검정력은 비례합니다.

 

댓글
반응형