귀무가설
귀무가설
가정, 가설
T-Test
그 귀무가설을 검정하는 방법
표본 크기가 30이상이 되어도 사용하는데 문제없음
표본 크기가 크면 T-test와 Z-test가 거의 같아진다.
T-test는 표본의 수보다는 모집단의 분산을 알고 있는지가 중요
즉, 표본의 수가 작고 모집단의 분산을 모를 때 유용한 검정방식이 T-test.
그 이유는 T-test가 사용하는 T-분포의 특징 때문이다.
정규분포는 평균 근처가 높고 꼬리가 얇은 반면에
T-분포는 평균 근처가 낮고 꼬리가 두꺼워 극단적인 값을 잘 반영한다.
즉, 작은 표본에서 발생할 수 있는 불확실성을 잘 반영하기 때문에 이런 상황에서는 T-test가 적...
Test Statistic
What Is a Test Statistic?
A test statistic is a numerical value calculated from sample data in order to decide whether to reject or not reject a statistical hypothesis.
It is computed from sample statistics (sample means, variances, proportions, etc.).
Often it is a transformation or “second processing” of those basic sample statistics, d...
검정 통계량
검정통계량
통계적 가설의 진위 여부 판단하기 위해서 표본으로 부터 계산하는 통계량
표본 통계량을 2차 가공한 것
T- Value
두 표본집단의 차이를 확인하기 위해서
표본 평균의 차이 비교할때 -> 검정 통계량으로 사용
평균값 차이를 계산하면서 표본그룹의 평균값들은 오차를 수반한다고 염두에 두어야함
차이와 확실성 두가지 변수를 염두에 두고 한게 T-VALUE
\[t \;=\; \frac{\overline{X}_1 - \overline{X}_2}{\,S_{\overline{X}_1-\overline{X}_2}\,}\]
충분히 큰 T-Value는 어떻게 정해지는가?
T-Value중 상위 2.5퍼...
FMA Score Prediction Model
Link
Project notebook (Colab / Jupyter):
https://github.com/superchd/AI/blob/main/FMA_Prediction.ipynb
Current Goal
Use FMA-UE scores at 7 days, 30 days, and 1 month to predict the FMA score at 1 year.
However, the current results are not satisfactory:
The difference between the predicted mean and the true mean is very large.
Ov...
FMA 점수 예측 모델
###
링크
https://github.com/superchd/AI/blob/main/FMA_Prediction.ipynb
현재 진행 상황
7일, 30일, 한달의 FMA 점수로 1년 뒤를 예측하려고 함
다만, 결과값이 다음과 같이 만족스럽지 않음
평균값의 차이가 엄청남
앞으로 해볼 시도는
LSTM 사용
30일 데이터로 3개월 뒤나 6개월 뒤 예측하는 것
안되면,….. 그냥 접어야 하나 싶다.
현재는 총점을 기준으로 예측을 하는데
FMA 32개 항목에 대해서 모든 항목을 예측하고 차후에 총점으로 합하는 방법은 어떨까?
를 생각해보다가 현재의 데이터로는 6개월뒤 점수를 예측할 수 ...
Maximum Likelihood Estimation
Introduction
Imagine a “magic” gum box that contains infinitely many pieces of gum.
Each gum has a natural number written inside it: (1, 2, 3, \dots).
Every time you draw a piece, each number in the box is equally likely.
You and a goblin start a betting game.
However, the goblin chose a maximum number in advance. All numbers on the g...
최대 우도 추정량
도입부
요술 상자 껌상자를 가정하자(수많은 껌이 있다, 껌을 뺴도뺴도 계속 껌이 있음 )
껌 안에 숫자가 써있는데 자연수이다.
껌을 뽑을때마다 그 숫자가 적힌 껌을 뽑을 확률은 동일하다고 가정
도깨비와 내기를 시작한다.
하지만, 껌에 적힌 숫자는 1 ~ Max로 정해져 있다.
도깨비 : 만약 니가 이 숫자를 맞추면 껌을 주겠다
모수 -> 파라미터 > 내기에서 이기기 위해 맞춰야 하는 값 -> 껌통안의 최대숫자
현재 도깨비만 모수의 값을 알고 있으며, 3번의 기회가 있다고 가정한다.
내가 처음에 10을 뽑았을 때, 도깨비한테 5가 적혀있다고 말을 하는 것은 바보같은 짓이다.
모수가 ...
Chi-square Test
Introduction
The chi-square test is a statistical test used for categorical data.
Example: in a survey about favorite fruits, responses fall into categories such as “apple,” “grape,” “banana,” etc.
Categorical example:
Favorite fruit → apple , grape, banana…
Continuous example:
Height, weight → often analyzed with t-tests, A...
67 post articles, 9 pages.