2.2 기본적인 확률 및 통계 이론

2.2.5 몇 가지 중요한 분포함수 (이산 랜덤 변수)
- 일반적인 사건의 발생이 어떠한 서로 다른 분포들로 표현될 수 있는지 알아본다.
- 확률 함수로부터 나온 확률들의 패턴
이산 랜덤 변수
- 질량 함수 → 이산형 확률분포(Discrete probability distribution)
분포 종류
- 베르누이 분포, Bernoulli distribution
- 바이노미얼 분포, Binomial distribution
- 푸아송 분포, Poisson distribution
- 지오메트릭 분포, Geometric distribution
- Negative Binomial distribution
- Hypergeometric distribution
Bernoulli Distribution (베르누이 분포)
- 확률 변수 X가 두 가지 값만 가지는 단순한 확률
- 1 = "success" or 0 = "failure"
- 0과 1을 확률로 바꾸는 확률 함수가 필요하며, 아래 확률 함수를 따르는 확률 분포를 베르누이 분포라 한다.
- 즉, 베르누이 분포는 위의 베르누이 확률 함수로부터 생성되는 확률들의 패턴을 그린 것
베르누이 확률 분포의 기대값과 분산
- 기대값 E[X] = p
- 분산 V[X] = p(1-p)
- 예) 1
- 동전을 던져서 앞 또는 뒤가 나올 경우와 같은 상황에서 사용
- 동전을 던져서 앞은 1, 뒤는 0이라 설정, 그 상황에서 나오는 확률은 1/2로 정의
Binomial Distribution (이항 분포)
- 베르누이 분포로 부터 나온 분포
- 베르누이를 한 번만 던지면 베르누이 시행(Bernoulli trial)이라 부름
- 그런 베르누이 시행을 독립적으로 n번 시도한 것
- 첫 번째 시행이 다음 시행에 영향을 주는 종속적인 관계가 아닌 것
- 이 때의 확률 변수 X를 정의한다.
- X는 n번 시행해서 나오는 총 성공의 횟수
- 여기서 X는 X={0, 1, 2, ... , n}으로 구성되며, 성공의 최대 횟수는 n번 모두 성공했을 때 즉, n이 된다.
- 해당 실수 값들을 확률로 변경 해야 하며, 그 확률 함수는 아래와 같음
- Parameter n and p: 위의 확률 함수로부터 나온 확률 분포의 모양을 결정하는데 영향을 주는 변수(or 모수)들
- Parameter에 의한 그래프 모양의 예)
베르누이 분포 - 위의 x들을 확률 함수에 넣으면 0~1 사이의 값으로 생성
- 이 함수의 분포는 이산형 확률 함수가 됨
- 이항 확률 함수의 모든 합이 1이 되는가?
- 확률 변수가 주어지고 parameter가 주어질 때의 기대값과 분산
- 기대값 E[X]
- 분산 V[X]
- 기대값 E[X]
- 예) 10 = 정상, 1 = 불량10개의 부품 중 2개가 불량일 확률은?
- 확률변수 정의
기대값 E[X]과 분산 V[X] - n = 10개의 부품, p=P[불량품]=0.1
- 불량의 갯수 파악
- 예) 2
- 불량률이 6%인 공정에서 매주 랜덤하게 50개를 뽑음
- 확률 변수 X는?
- 그 중에서 불량이 3개 일 때의 확률은?
- P(X>3)일 확률은?
- Binomial Distribution Proposition
- 이산 확률 변수 X와 parameter n과 p가 있다.
- 여기서 p는 0 < p < 1을 만족한다.
- X가 가질 수 있는 값이 k라 할 때, k는 0 ~ n까지 가진다.
- P{X=k}의 값이 증가했다 감소를 하게 되는 분포 그래프가 생긴다.
- 이 때, 가장 꼭대기(가장 큰)값이 (n+1)p로 정의 된다.
- 증명
Poisson distribution (푸아송 분포)
- 확률 변수 X={0, 1, 2, ...}와 같이 이산형 실수 값을 가지게 되며 아래의 확률 함수로부터 생성된 확률들의 패턴을 나타냄
- Parameter로 λ를 사용하게 되며 이 값은 0보다 큼
- 단위 시간(or 공간) 안에 특정 사건이 몇 번 발생할 것 인지를 표현한 확률 분포
- 푸아송 분포의 성질
- Parameter λ에 따른 푸아송 분포의 그래프

- 푸아송 분포와 Binomial 분포의 관계
- p(i; n, p) ≈ p(i; λ)
- 좌측: Binomial 분포, 우측: 푸아송 분포
- n이 무한대로 커지고, p가 작아질 때, λ = np 와 같아 지게 됨
- 증명
- 잠시 정리
- 잠시 정리
- 증명 이어서
- 예제
- 어떤 집단에서 사람 수 n중에 100세 이상인 사람의 수
- 책의 모든 페이지에서 오타의 갯수
- 매일 전화를 걸 때, 잘못 걸을 횟수
- 푸아송 확률 변수의 기대값과 분산
- 결과적으로 기대값과 분산은 parameter λ와 같음
- 기대값
- 분산
Geometric Distribution (기하 분포)
- 베르누이 시행에서부터 시작
- 확률 변수 X: 첫 번째 성공이 일어나기 까지 필요한 시행 횟수
- p = P[success]를 기반으로 아래 기하 확률 함수를 따름
- 예)
- 5번 시행에서 첫 번째 성공일 때를 가정
- Fail → (1-p)
- Fail → (1-p)
- Fail → (1-p)
- Fail → (1-p)
- Success → p
- p = P[success]를 기반으로 아래 기하 확률 함수를 따름
- 모든 확률의 합
- 첫 번째는 먼저 시행을 해야 함 즉, 시행 횟수는 1 부터 시작 됨
- X가 기하 확률 함수를 따르게 되며 기하 확률 분포는 parameter p를 가짐
- 기대값 E[X] = 1/p
- 팁) i 곱하기 k의 i-1제곱은 k에 대하여 미분한 것
- 분산
- 예)
- 항아리에 N개의 흰색 공과 M개의 검은색 공이 있다.
- 다음 공이 뽑힐 때는 뽑았던 공은 다시 넣는다. (복원 추출 or 독립 시행)
- 확률 변수 X: 검은색 공이 첫 번째 뽑힐 때 까지 필요한 시행 횟수(공 뽑기)
- n-1번째 까지는 흰색 공이 나와야 함
- 확률 변수 X가 k를 포함한 횟수 이상을 시행
- 공을 랜덤하게 선택하는데, 검은색 공이 뽑힐 때 까지 시행한다.
'DAN lab. > DAN lab. Master's 1 Summer' 카테고리의 다른 글
04-01. Channel Coding and Error Control (0) | 2021.07.14 |
---|---|
03-01. Mobile Radio Propagation (0) | 2021.07.12 |
02-02. 확률, 통계 및 트래픽 이론 (0) | 2021.07.07 |
02-01. 확률, 통계 및 트래픽 이론 (0) | 2021.07.07 |
2021 하계 세미나 스케쥴 (0) | 2021.07.07 |