방송통신대학교 레포트

(1) (10점) 어떤 대학에서 학생의 40%는 통계학 전공이고, 나머지 60%는 경제학 전공이다. 통계학 전공 학생 중 70%는 수학 동아리에 가입해 있고, 경제학 전공 학생 중 20%가 수학 동아리에 가입해 있다. 한 학생을 무작위로 선택했더니, 그 학생이 수학 동아리 회원이었다. 이 학생이 통계학 전공일 확률은 얼마인가? (2) (10점) A회사와 B회사의 제품 불량률을 각각 θA, θB 라고 하자. A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다. B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다. 불량률 θA와 θB의 사전분포는 서로 독립이며, 각각 균등분포 U(0, 1)라고 가정한다. (3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다. • 백신 접종 그룹(A): 200명 중 12명이 질병에 걸림 • 비접종 그룹(B): 180명 중 18명이 질병에 걸림 각 집단의 발병 확률을 각각 θA와 θB 라 하자. 우리는 다음 두 가설을 비교하고자 한다. H0:θA=θB vs H1:θA≠θB

(1) (10점) 어떤 대학에서 학생의 40%는 통계학 전공이고, 나머지 60%는 경제학 전공이다.
 통계학 전공 학생 중 70%는 수학 동아리에 가입해 있고,
 경제학 전공 학생 중 20%가 수학 동아리에 가입해 있다.
 한 학생을 무작위로 선택했더니, 그 학생이 수학 동아리 회원이었다.
 이 학생이 통계학 전공일 확률은 얼마인가?
 
 (2) (10점) A회사와 B회사의 제품 불량률을 각각 θA, θB 라고 하자.
 A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다. B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다. 불량률 θA와 θB의 사전분포는 서로 독립이며, 각각 균등분포 U(0, 1)라고 가정한다.
 
 (3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다.
 • 백신 접종 그룹(A): 200명 중 12명이 질병에 걸림
 • 비접종 그룹(B): 180명 중 18명이 질병에 걸림
 각 집단의 발병 확률을 각각 θA와 θB 라 하자.
 우리는 다음 두 가설을 비교하고자 한다.
 H0:θA=θB vs H1:θA≠θB에 대한 상징적인 이미지

# 불확실한 세상에서 진실을 찾는 방법: 조건부 확률과 베이즈 추론의 힘

## 서론

우리가 일상에서 마주치는 모든 의사결정은 본질적으로 불확실성을 내포한다. 어떤 학생이 특정 전공일 가능성부터, 신제품의 실제 불량률이 얼마인지, 혹은 새로운 백신의 효과가 있는지에 이르기까지, 우리는 제한된 정보를 바탕으로 최선의 판단을 내려야 한다. 통계학은 이러한 불확실성 속에서 증거를 체계적으로 분석하고 우리의 믿음을 갱신하는 강력한 도구를 제공한다. 특히 베이즈 정리(Bayes' Theorem)와 이를 확장한 베이즈 추론(Bayesian Inference), 그리고 통계적 가설 검정(Hypothesis Testing)은 데이터 기반의 논리적 추론을 가능하게 하는 핵심적인 방법론이다. 본 칼럼에서는 주어진 세 가지 구체적인 사례를 통해, 어떻게 통계적 기법이 불확실한 데이터를 정제하고 유의미한 지식으로 전환하는지 깊이 있게 탐구한다.

## 본론

### 1. 증거를 통한 믿음의 갱신: 베이즈 정리의 적용

첫 번째 사례는 조건부 확률의 가장 대표적인 예시인 베이즈 정리를 활용하는 문제다. 특정 사건이 이미 발생했을 때, 그 사건의 원인이 무엇이었을 확률을 역으로 추정하는 방식이다. 이는 '사전 확률(Prior Probability)'을 관찰된 '증거(Likelihood)'를 통해 '사후 확률(Posterior Probability)'로 업데이트하는 과정이다.

우선 주어진 조건을 확률 변수로 정의한다. 통계학 전공($S$), 경제학 전공($E$), 수학 동아리 회원($M$)이라고 할 때, 사전 확률은 $P(S)=0.4$와 $P(E)=0.6$이다. 조건부 확률은 통계학 전공 중 수학 동아리 회원일 확률 $P(M|S)=0.7$과 경제학 전공 중 수학 동아리 회원일 확률 $P(M|E)=0.2$이다.

우리는 무작위로 선택된 학생이 수학 동아리 회원일 때, 이 학생이 통계학 전공일 확률 $P(S|M)$을 알고 싶다. 이를 계산하기 위해 먼저 전체 수학 동아리 회원일 확률 $P(M)$을 구해야 한다. 이는 전확률의 법칙(Law of Total Probability)에 따라 다음과 같이 계산된다.

$$P(M) = P(M|S)P(S) + P(M|E)P(E) = (0.7 \times 0.4) + (0.2 \times 0.6) = 0.28 + 0.12 = 0.40$$

따라서, 베이즈 정리에 따라 $P(S|M)$은 다음과 같이 계산된다.

$$P(S|M) = \frac{P(M|S)P(S)}{P(M)} = \frac{0.28}{0.40} = 0.70$$

놀랍게도, 전체 학생 중 통계학 전공의 비율은 40%였지만, 이 학생이 '수학 동아리 회원'이라는 강력한 증거를 관찰한 후에는 이 학생이 통계학 전공일 확률이 70%로 급격히 상승한다. 이는 베이즈 정리가 어떻게 새로운 증거를 통해 기존의 믿음을 합리적으로 조정하는지 명확하게 보여주는 사례다.

### 2. 새로운 데이터로 사전 지식을 정제하기: 베이즈 추론

두 번째 사례는 불량률 $\theta_A$와 $\theta_B$에 대한 베이즈 추론을 다룬다. 베이즈 추론은 미지의 모수(Parameter, $\theta$)를 확률 분포로 취급하며, 새로운 데이터(관측치)가 들어올 때마다 그 분포를 갱신한다.

문제에서는 불량률 $\theta$의 사전분포로 균등분포 $U(0, 1)$을 가정하는데, 이는 베이즈 통계에서 $\text{Beta}(1, 1)$ 분포와 같다. 이는 0%부터 100%까지 모든 불량률이 동일하게 발생할 가능성을 가진다는 '정보가 없는(non-informative)' 상태를 나타낸다.

관측된 데이터(우도, Likelihood)는 이항분포(Binomial Distribution)를 따른다. 이때, 이항분포의 켤레 사전분포(Conjugate Prior)가 베타 분포(Beta Distribution)이기 때문에, 사후분포(Posterior Distribution) 역시 베타 분포 형태를 유지한다.

**A회사의 경우:**

50개 중 8개 불량품이 관찰되었다.

$$\text{사후분포 } \theta_A \sim \text{Beta}(\text{사전 } \alpha + \text{성공 수}, \text{사전 } \beta + \text{실패 수})$$

$$\theta_A \sim \text{Beta}(1 + 8, 1 + 50 - 8) = \text{Beta}(9, 43)$$

**B회사의 경우:**

40개 중 3개 불량품이 관찰되었다.

$$\theta_B \sim \text{Beta}(1 + 3, 1 + 40 - 3) = \text{Beta}(4, 38)$$

이 사후분포는 이제 각 회사의 실제 불량률 $\theta$에 대한 우리의 모든 업데이트된 지식을 담고 있다. 예를 들어, $\text{Beta}(9, 43)$ 분포의 기댓값(평균)은 $9 / (9+43) \approx 0.173$이며, 이는 A회사의 불량률이 약 17.3%일 것이라는 우리의 새로운 중심 예측이 된다. 이처럼 베이즈 추론은 단순한 점추정치를 넘어, 모수가 가질 수 있는 모든 값에 대한 확률적 신뢰도를 제공하여 더욱 풍부한 통계적 해석을 가능하게 한다.

### 3. 현명한 의사결정을 위한 비교 분석: 가설 검정

세 번째 사례는 두 집단의 발병률을 비교하여 백신의 효과를 검증하는 통계적 가설 검정 문제다. 이는 빈도주의(Frequentist) 통계학의 주요 도구로서, 관찰된 차이가 우연히 발생했을 확률을 평가한다.

우리는 귀무가설($H_0: \theta_A = \theta_B$, 백신 효과 없음)과 대립가설($H_1: \theta_A \neq \theta_B$, 백신 효과 있음)을 비교한다.

먼저 각 집단의 표본 발병 확률($\hat{\theta}$)을 계산한다.

* 백신 접종 그룹(A): $\hat{\theta}_A = 12 / 200 = 0.06$ (6%)

* 비접종 그룹(B): $\hat{\theta}_B = 18 / 180 = 0.10$ (10%)

표본에서는 4%p의 차이가 관찰되었다. 가설 검정의 핵심은 '만약 백신 효과가 없다면($H_0$가 참이라면), 이 4%p의 차이가 우연히 발생할 확률(P-value)이 얼마나 되는가?'를 평가하는 것이다.

이러한 두 비율 비교 문제는 주로 Z-검정(Two-sample Z-test for Proportions)을 사용하여 분석한다. Z-검정은 두 표본 비율의 차이를 표준화하여 계산하며, 이 값이 임계치(예: 유의수준 5%에서 1.96)를 넘으면 귀무가설을 기각한다.

만약 계산 결과 p-value가 0.05보다 작다면, 우리는 백신 접종 그룹과 비접종 그룹 간의 발병 확률 차이가 통계적으로 유의미하며($H_1$ 채택), 백신이 발병률을 낮추는 효과가 있다고 결론 내릴 수 있다. 이러한 가설 검정 절차는 임상 시험 및 정책 결정 과정에서 객관적 증거를 제공하는 데 필수적이다.

## 결론

베이즈 정리부터 시작하여 사후분포를 도출하는 베이즈 추론, 그리고 두 집단의 차이를 객관적으로 평가하는 가설 검정에 이르기까지, 통계적 추론 방법은 불확실한 현실을 이해하는 데 있어 핵심적인 역할을 수행한다. 베이즈 접근법은 새로운 데이터를 통해 우리의 지식을 지속적으로 정제하는 유연성을 제공하는 반면, 빈도주의적 가설 검정은 현상의 차이가 순전히 우연에 의한 것인지 여부를 엄격하게 판별하는 기준을 제시한다. 통계학적 도구를 올바르게 이해하고 적용하는 것은, 단순한 계산 능력을 넘어, 증거에 기반한 합리적이고 현명한 의사결정을 내릴 수 있는 능력을 의미한다. 현대의 복잡한 사회 문제와 데이터 홍수 속에서, 이러한 추론 능력은 통찰력을 얻고 미래를 설계하는 데 결정적인 기반이 된다.

자주 묻는 질문 (FAQ)

레포트 작성은 어디로 문의하나요?+

문의하기(문의 남기기)' 혹은 '카카오 채널' 버튼을 눌러서 레포트 작업을 문의할 수 있습니다.

레포트 작성 기간과 비용은 어떻게 되나요?+

·모든 레포트를 매번 새로 작성하기 때문에 소요 시간이 다소 걸리는 편입니다. 납기 평균은 1건당 약 20시간 정도입니다. 작업이 몰리는 기간에는 이보다 더 소요될 수 있습니다. ·24시간 안에 제출해야 하는 급행작업도 가능합니다. 문의 주시면 가불여부 확인해 드리겠습니다. ·비용은 학점은행제 레포트 기준 11포인트 1페이지 5천원입니다.(카카오 채널 친구 추가시)