최대 우도 추정량

 

도입부

요술 상자 껌상자를 가정하자(수많은 껌이 있다, 껌을 뺴도뺴도 계속 껌이 있음 )

껌 안에 숫자가 써있는데 자연수이다.

껌을 뽑을때마다 그 숫자가 적힌 껌을 뽑을 확률은 동일하다고 가정

도깨비와 내기를 시작한다.

하지만, 껌에 적힌 숫자는 1 ~ Max로 정해져 있다.

도깨비 : 만약 니가 이 숫자를 맞추면 껌을 주겠다

모수 -> 파라미터 > 내기에서 이기기 위해 맞춰야 하는 값 -> 껌통안의 최대숫자

현재 도깨비만 모수의 값을 알고 있으며, 3번의 기회가 있다고 가정한다.

내가 처음에 10을 뽑았을 때, 도깨비한테 5가 적혀있다고 말을 하는 것은 바보같은 짓이다.

모수가 5인 확률은 0이다.

왜냐하면 이미 10이 적혀있음

도깨비가 써놓은 최대값이 5일 확률은 0

12가 나옴 이번에는

관찰값 : 10, 12

12000이라고 도깨비한테 말함

제정신이 아니라고 볼 수 있으나, 5라고 생각한것보다는 괜찮다.

오히려 12000에 거는게 더 합리적이며, 12000일 가능성이 5일 가능성 보다는 높다.

5, 10 , 12 라고 관찰값을 가정했을 때, 14라고 답을 한다

좀 그럴싸한가?

5, 14, 12000 이라고 할때 어디에 걸래?

14에 거는게 합리적이라고 보인다.

본능적으로 그럴 가능성이 제일 높아보인다.

선택지가 3개라면 가장 가능성이 높은건 14이다.

주어진 선택지는 1 ~ 무한대이나 관찰값을 기준으로 확률이 가장 높은 숫자를 추정하는 것을 최대우도추정이라고 한다.

이런 경우에는 관찰값의 최대값을 보통 최대값으로 추정한다.

즉, 최대 우도 추정이란 관찰값이 주어졌을때 가장 그럴싸한 가장 확률이 높은 모수의 값을 추정하는것

직관적 정의

가장 그럴 듯한 확률밀도함수를 추정하는 것 ?이라고 직관적으로 이해할 수 있을 것 같다.

다양한 데이터 타입에 대한 다양한 분포가 존재한다.

정규분포에서는 대부분의 쥐의 무게가 평균에 충분히 가깝다는 해석이 가능하다.(만약 쥐의 몸무게를 해석한다고 가정)

또한, 관측이 평균을 중심으로 대칭이다.