1. 왜 비모수 검정이 필요할까?
t-검정 같은 모수 검정은 보통 이런 가정을 합니다.
- 데이터가 정규분포를 따른다.
- 그 분포의 모수(평균, 분산 등)를 추정해서 검정한다.
현실 데이터는 정규분포를 안 따르는 경우가 많습니다. 이때
“정규성 가정이 깨졌는데도 t-검정을 써도 되나…?” 하는 걱정이 생기죠.
즉, 샘플 수가 충분히 크면 샘플 평균은 정규분포를 따르기 때문에(중심극한정리),
많은 샘플 데이터가 정규분포에서 온 것처럼 가정하고 분석하는 경우가 많습니다.
하지만, 이런 가정을 만족하지 못하는 경우!
이럴 때 쓸 수 있는 방법이 비모수(nonparametric) 검정입니다.
여기서는 그중에서도
1표본 t-검정의 비모수 버전
→ 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)
을 다룹니다.
즉, 한 표본의 모 중앙값에 대한 가설을, 정규성 가정 없이 검정하는 방법을 살펴보겠습니다.
2. 윌콕슨 부호-순위 검정의 가정
이 검정이 요구하는 가정은 딱 두 가지입니다.
- 모집단 분포가 대칭 분포이다.
- 데이터가 연속형 확률분포에서 왔다.
정규분포를 따라야 한다는 가정보다 훨씬 약한 가정입니다.
3. 우리가 알고 싶은 것
예시 상황:
- 학생 12명의 점수 데이터가 있다고 하자.
- 이 데이터의 모 중앙값이 10인지 알고 싶다.
가설은 이렇게 쓴다.
- 귀무가설 $H_0: \eta = 10$ (모 중앙값 = 10)
- 대립가설 $H_1: \eta \neq 10$
t-검정에서는 “모평균 $\mu = 10$?”을 묻지만,
여기서는 “모 중앙값 $\eta = 10$?”을 묻는다고 생각하면 된다.
4. 검정 통계량 $W^+$ 정의
윌콕슨 부호-순위 검정의 핵심 검정 통계량은
\[W^{+} = \sum_{i=1}^{n} \psi\bigl(X_i - \eta_0\bigr)\, R_i\]여기서
- $X_i$: $i$번째 관측값
- $\eta_0$: 가설에서 주장하는 중앙값 (예: 10)
- $R_i$: $i$번째 관측값에 대응되는 순위(rank)
- $|X_i - \eta_0|$ (거리의 절댓값)을 작은 것부터 정렬해서
1, 2, …, $n$까지 매긴 값
- $|X_i - \eta_0|$ (거리의 절댓값)을 작은 것부터 정렬해서
- $\psi(\cdot)$: 인디케이터(또는 부호) 역할을 하는 함수
- $X_i - \eta_0 > 0 \;\Rightarrow\; \psi = 1$
- $X_i - \eta_0 \le 0 \;\Rightarrow\; \psi = 0$
즉,
“$\eta_0$보다 큰 데이터들만 골라서, 그 애들의 순위를 전부 더한 값”
이 바로 $W^+$이다.
5. $W^+$ 계산 절차 (알고리즘 느낌으로)
데이터 $X_1, \dots, X_n$이 있고, 검정하고 싶은 중앙값이 $\eta_0$라고 하자.
-
차이 계산
\[d_i = X_i - \eta_0\] -
거리(절댓값) 계산
\[|d_i| = |X_i - \eta_0|\] -
절댓값 기준 순위 매기기
- $|d_i|$를 작은 순서대로 정렬해서
각 관측값에 순위 $R_i$ 를 부여한다. - 타이(tie)가 있으면 평균 순위 등을 사용.
- $|d_i|$를 작은 순서대로 정렬해서
-
$\eta_0$보다 큰 쪽만 골라내기
- $d_i > 0$ 이면 $\psi(d_i) = 1$
- $d_i \le 0$ 이면 $\psi(d_i) = 0$
-
검정 통계량 계산
\[W^{+} = \sum_{i=1}^{n} \psi(d_i)\, R_i\]→ 결국 “양수인 $d_i$ ($\eta_0$ 오른쪽에 있는 값)의 순위 합”
이 $W^+$를 가지고 p-value를 계산하고, 그 p-value로 귀무가설을 기각할지 말지를 결정한다.
여기서는 p-value 계산보다는 직관에 초점을 두고 보자.
6. $W^+$ 값이 말해주는 것 (직관)
먼저, $n$개의 순위 $1,2,\dots,n$의 합은
\[1 + 2 + \cdots + n = \frac{n(n+1)}{2}\]이다. 이게 “순위 합이 가질 수 있는 최대값”이다.
6.1 극단적인 세 가지 케이스
(1) $\eta_0$가 진짜 중앙값일 때 (귀무가설이 맞는 이상적인 상황)
데이터가 $\eta_0$ 기준으로 대칭이면
- $\eta_0$보다 큰 데이터와 작은 데이터가 대략 반반 섞여 있고,
- 순위도 왼쪽/오른쪽이 적당히 섞인다.
그러면 양쪽 순위 합도 비슷해질 것이므로
\[W^{+} \approx \frac{1}{2} \times \frac{n(n+1)}{2} = \frac{n(n+1)}{4}\]즉, 최대 순위 합의 절반 정도 값을 가지는 게 자연스럽다.
(2) $\eta_0$가 실제 값보다 너무 오른쪽일 때
- 모든 데이터가 $\eta_0$ 왼쪽에 있다고 생각해 보자.
(즉, $\eta_0$를 너무 크게 잡았다.)
이때는 $X_i - \eta_0 < 0$ 이므로 모두 음수이고,
- $\psi(d_i) = 0$ for all $i$
따라서
\[W^{+} = 0\]→ 가능한 값 중 가장 작은 값.
(3) $\eta_0$가 실제 값보다 너무 왼쪽일 때
이번에는 반대로, 모든 데이터가 $\eta_0$ 오른쪽에 있다고 해 보자.
- $X_i - \eta_0 > 0$ 이므로 전부 양수,
- $\psi(d_i) = 1$ for all $i$
따라서
\[W^{+} = 1 + 2 + \cdots + n = \frac{n(n+1)}{2}\]→ 가능한 값 중 가장 큰 값.
6.2 해석 정리
정리하면, $W^+$의 값이
- 0에 가까울수록
- 또는 $\dfrac{n(n+1)}{2}$ (최대값)에 가까울수록
데이터는 $\eta_0$의 한쪽으로 쏠려 있으므로
“$\eta_0$가 중앙값이라고 보기 어렵다”
→ 귀무가설 기각 방향으로 간다.
반대로,
- $W^+$가 $\dfrac{n(n+1)}{4}$ 근처에 있다면
데이터가 $\eta_0$ 기준으로 좌우 대칭에 가깝다는 뜻이므로
“$\eta_0$가 진짜 중앙값일 가능성이 높다”
→ 귀무가설을 지지하는 증거가 된다.
실제 분석에서는 이 분포를 정확히 고려해
$P(W^{+} \ge w_{\text{obs}})$ 같은 형태로 p-value를 계산한다.
7. 한 줄 요약
윌콕슨 부호-순위 검정은
“가설 중앙값 $\eta_0$보다 큰 데이터들의 순위 합 $W^+$”을 보고,
그 값이 가능한 범위의 정중앙(≈ $n(n+1)/4$)에 가까우면
$\eta_0$가 진짜 중앙값 같다고 보고,
양 끝(0, 최대값)에 가까우면 $\eta_0$가 중앙값이 아니라고 보는
직관적이고 정규성 가정이 필요 없는 1표본 비모수 검정이다.