비모수 검정

1. 왜 비모수 검정이 필요할까?

t-검정 같은 모수 검정은 보통 이런 가정을 합니다.

데이터가 정규분포를 따른다.
그 분포의 모수(평균, 분산 등)를 추정해서 검정한다.

현실 데이터는 정규분포를 안 따르는 경우가 많습니다. 이때
“정규성 가정이 깨졌는데도 t-검정을 써도 되나…?” 하는 걱정이 생기죠.

즉, 샘플 수가 충분히 크면 샘플 평균은 정규분포를 따르기 때문에(중심극한정리),
많은 샘플 데이터가 정규분포에서 온 것처럼 가정하고 분석하는 경우가 많습니다.

하지만, 이런 가정을 만족하지 못하는 경우!

이럴 때 쓸 수 있는 방법이 비모수(nonparametric) 검정입니다.

여기서는 그중에서도

1표본 t-검정의 비모수 버전
→ 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)

을 다룹니다.

즉, 한 표본의 모 중앙값에 대한 가설을, 정규성 가정 없이 검정하는 방법을 살펴보겠습니다.

2. 윌콕슨 부호-순위 검정의 가정

이 검정이 요구하는 가정은 딱 두 가지입니다.

모집단 분포가 대칭 분포이다.
데이터가 연속형 확률분포에서 왔다.

정규분포를 따라야 한다는 가정보다 훨씬 약한 가정입니다.

3. 우리가 알고 싶은 것

예시 상황:

학생 12명의 점수 데이터가 있다고 하자.
이 데이터의 모 중앙값이 10인지 알고 싶다.

가설은 이렇게 쓴다.

귀무가설 $H_0: \eta = 10$ (모 중앙값 = 10)
대립가설 $H_1: \eta \neq 10$

t-검정에서는 “모평균 $\mu = 10$?”을 묻지만,
여기서는 “모 중앙값 $\eta = 10$?”을 묻는다고 생각하면 된다.

4. 검정 통계량 $W^+$ 정의

윌콕슨 부호-순위 검정의 핵심 검정 통계량은

\[W^{+} = \sum_{i=1}^{n} \psi\bigl(X_i - \eta_0\bigr)\, R_i\]

여기서

$X_i$: $i$번째 관측값
$\eta_0$: 가설에서 주장하는 중앙값 (예: 10)
$R_i$: $i$번째 관측값에 대응되는 순위(rank)
- $|X_i - \eta_0|$ (거리의 절댓값)을 작은 것부터 정렬해서
  1, 2, …, $n$까지 매긴 값
$\psi(\cdot)$: 인디케이터(또는 부호) 역할을 하는 함수
- $X_i - \eta_0 > 0 \;\Rightarrow\; \psi = 1$
- $X_i - \eta_0 \le 0 \;\Rightarrow\; \psi = 0$

즉,

“$\eta_0$보다 큰 데이터들만 골라서, 그 애들의 순위를 전부 더한 값”
이 바로 $W^+$이다.

5. $W^+$ 계산 절차 (알고리즘 느낌으로)

데이터 $X_1, \dots, X_n$이 있고, 검정하고 싶은 중앙값이 $\eta_0$라고 하자.

차이 계산
\[d_i = X_i - \eta_0\]
거리(절댓값) 계산
\[|d_i| = |X_i - \eta_0|\]
절댓값 기준 순위 매기기
- $|d_i|$를 작은 순서대로 정렬해서
  각 관측값에 순위 $R_i$ 를 부여한다.
- 타이(tie)가 있으면 평균 순위 등을 사용.
$\eta_0$보다 큰 쪽만 골라내기
- $d_i > 0$ 이면 $\psi(d_i) = 1$
- $d_i \le 0$ 이면 $\psi(d_i) = 0$
검정 통계량 계산
\[W^{+} = \sum_{i=1}^{n} \psi(d_i)\, R_i\]
→ 결국 “양수인 $d_i$ ($\eta_0$ 오른쪽에 있는 값)의 순위 합”

이 $W^+$를 가지고 p-value를 계산하고, 그 p-value로 귀무가설을 기각할지 말지를 결정한다.
여기서는 p-value 계산보다는 직관에 초점을 두고 보자.

6. $W^+$ 값이 말해주는 것 (직관)

먼저, $n$개의 순위 $1,2,\dots,n$의 합은

\[1 + 2 + \cdots + n = \frac{n(n+1)}{2}\]

이다. 이게 “순위 합이 가질 수 있는 최대값”이다.

6.1 극단적인 세 가지 케이스

(1) $\eta_0$가 진짜 중앙값일 때 (귀무가설이 맞는 이상적인 상황)

데이터가 $\eta_0$ 기준으로 대칭이면

$\eta_0$보다 큰 데이터와 작은 데이터가 대략 반반 섞여 있고,
순위도 왼쪽/오른쪽이 적당히 섞인다.

그러면 양쪽 순위 합도 비슷해질 것이므로

\[W^{+} \approx \frac{1}{2} \times \frac{n(n+1)}{2} = \frac{n(n+1)}{4}\]

즉, 최대 순위 합의 절반 정도 값을 가지는 게 자연스럽다.

(2) $\eta_0$가 실제 값보다 너무 오른쪽일 때

모든 데이터가 $\eta_0$ 왼쪽에 있다고 생각해 보자.
(즉, $\eta_0$를 너무 크게 잡았다.)

이때는 $X_i - \eta_0 < 0$ 이므로 모두 음수이고,

$\psi(d_i) = 0$ for all $i$

따라서

\[W^{+} = 0\]

→ 가능한 값 중 가장 작은 값.

(3) $\eta_0$가 실제 값보다 너무 왼쪽일 때

이번에는 반대로, 모든 데이터가 $\eta_0$ 오른쪽에 있다고 해 보자.

$X_i - \eta_0 > 0$ 이므로 전부 양수,
$\psi(d_i) = 1$ for all $i$

따라서

\[W^{+} = 1 + 2 + \cdots + n = \frac{n(n+1)}{2}\]

→ 가능한 값 중 가장 큰 값.

6.2 해석 정리

정리하면, $W^+$의 값이

0에 가까울수록
또는 $\dfrac{n(n+1)}{2}$ (최대값)에 가까울수록

데이터는 $\eta_0$의 한쪽으로 쏠려 있으므로

“$\eta_0$가 중앙값이라고 보기 어렵다”
→ 귀무가설 기각 방향으로 간다.

반대로,

$W^+$가 $\dfrac{n(n+1)}{4}$ 근처에 있다면

데이터가 $\eta_0$ 기준으로 좌우 대칭에 가깝다는 뜻이므로

“$\eta_0$가 진짜 중앙값일 가능성이 높다”
→ 귀무가설을 지지하는 증거가 된다.

실제 분석에서는 이 분포를 정확히 고려해
$P(W^{+} \ge w_{\text{obs}})$ 같은 형태로 p-value를 계산한다.

7. 한 줄 요약

윌콕슨 부호-순위 검정은
“가설 중앙값 $\eta_0$보다 큰 데이터들의 순위 합 $W^+$”을 보고,
그 값이 가능한 범위의 정중앙(≈ $n(n+1)/4$)에 가까우면
$\eta_0$가 진짜 중앙값 같다고 보고,
양 끝(0, 최대값)에 가까우면 $\eta_0$가 중앙값이 아니라고 보는
직관적이고 정규성 가정이 필요 없는 1표본 비모수 검정이다.

이전T-value와 F-value

다음하모니 제어