저번 시간의 모집단, 표본, 표본평균, 중심극한 정리 등 기술통계에 대해서 공부했다
이번에는 추론통계와 가설검정에 대해서 공부해 볼까 한다
역시 강의는 메타코드M에서 제공해주는 영상을 참고했다
https://mcode.co.kr/mypage/lecture_view?wm_id=993&lecture_id=8&lecture_num=4&lecture_sub=47
추론통계
1) 추정
-점 추정
-구간 추정
2) 가설검정
-대립가설/ 귀무사걸
-제1종오류 / 제2종 오류
-유의수준/ 유의확률 등
추정과 검정
1. 추정 : 표본 정보를 이용해서 모수의 실제값 추측
2. 검정 : 모수에 대해 가설 세우고 표본의정보(통계량)을 이용해서 수립한 가설이 타당한지 판정
점추정
1. 정의 : 모수가 특정한 값 일 것 이라고 추정하는 것
2. 점 추정량의 조건 4가지
1) 불편성 : 모든 가능한 표본에서 얻는 추정량의 기댓값 모집단의 모수와 편의(차이)가 없다
2) 효율성 : 추정량의 분산이 작을수록 좋다
3) 일치성 : 표본의 크기가 커지면 추정량이 모수와 같아진다
4) 충족성 : 추정량은 모수에 대해 모든 정보를 제공한다
3. 모평균u의 추정량 : 표본 평균을 추정량으로 이용
* 표본의 평균 = 확률표본의 평균값 = 1/n * 평균의합
4. 모평균 시그마제곱의 추정량 : 표본분을 추정량으로 이용
* 표본의 분산 = 1/n-1 * 편차 제곱의
구간추정
1. 정의 : 모수가 특정한 구간에 있을 것이라고 추정하는 것
2. 신뢰수준 : 모수가 구간 안에 있을 가능성의 크기로 신뢰수준 95%를 일반적으로 사용
3. 신뢰구간 : 신뢰수준 하에서 모수가 존재할 것이라고 생각되는 구간
4. 모평균 u의 신뢰구간 추정 방법
방법1) 모분산을 안다
모수표준편차 시그마를 사용
방법2) 모분산을 모른다
표본표준편차를 사용 => 통계량T는 표준정규분포 n(0,1)이 아닌 자유도 n-1인 t-분포를 따름
단, n이 30보다 큰 경우 근사적으로 n(0,1)을 사용
-n>30 인 경우
T ~ N(0,1) => z분포
-n<=30 인 경
T ~ t(n-1) => t분포
가설검정
~할 것이다 라는 잠정적 가설에 대해 통계적인 방식으로 검정하는 것(주로 모집단의 모수에 대해 설정)
1. 귀무가설과 대립가설
1) 귀무가설 = 영가설 (기존에 알려진 사실)
-차이가없다 = 서로 같다 = 영향을 안준다 등
2) 대립가설 = 연구가설 = 대안가설
-차이가 있다 = 서로 다르다 = 영향을 준다
### 가설검정은 귀무가설을 채택할 건지 기각할건지 판단하는 과정 ( 귀무가설이 기준임)
가설검정의 오류 (제1종오류와 제2종오류)
- 제1종오류
귀무가설이 참일 때 이를 기각하는 오류를 범할 확률
귀무가설이 참일 때 귀무가설을 기각할 최대 허용 한계 = 유의수준 = 0.05% = 알파로 표시
- 제2종오류
귀무가설이 거짓 일 때 이를 채택하는 오류를 범할 확률
- 가설검정 진행
1) 가설설정
-귀무가설 : 약을 먹기 전 후의 수면차이는 없다 / 즉 같다
-대립가설 : 약을 먹기 전 후의 수면차이는 있다 / 즉 다르다
2) 유의수준설정 / 보통 0.05
3) 귀무가설하에 검정통계량 계산
-z분포를 활용
4) 검정통계량으로 p-value계산
-z값에 해당하는 p-vlaue(면적) 계산
5) 귀무가설 기각여부 결정
-p-value > 0.05보다 크면 귀무가설 채택
-p-value < 0.05보다 작으면 귀무가설 기각