DAN lab./DAN lab. Master's 1 Summer

02-01. 확률, 통계 및 트래픽 이론

김야키 2021. 7. 7. 19:56

2.1 개요


무선 및 이동 통신망의 성능에 영향을 주는 요인들

  • Cell 내에서 MS(Mobile Station)의 밀도가 얼마인지
  • MS의 이동 속도와 방향은 어떠한지
  • 호는 얼마나 자주 발생하는지
  • 얼마나 많은 MS가 호를 발생 시키는지
  • 통화 시간은 얼마인지
  • BS(Base Station) 또는 다른 MS들 대비 MS들의 상대적인 위치는 어떻게 되는지
  • 호(Cell) 내에서의 트래픽 종류(실시간 또는 비실시간)는 어떠한지
  • 인접 Cell에서의 트래픽은 어떠한지 등

2.2 기본적인 확률 및 통계 이론


2.2.1 랜덤 변수


  • 랜덤 변수(Random Variable) (= 확률 변수)
    • 표본 공간(Sample Space)에 있는 원소들이 실수(Real Number)로 대응 시키는 함수
    • 확률 함수(Probability Function): 원소를 실수 값으로 변환 시키는 함수
      • 이산 랜덤 함수
      • 연속 랜덤 함수
    • 연속 랜덤 변수 → 확률 밀도 함수(PDF, Probability Density Function)
    • 이산 랜덤 변수 → 확률 질량 함수(PMF, Probability Mass Function)
    • 예제)
  • 이산 랜덤 변수
    • Discrete Random Variable
    • 유한의 셀 수 있는 값을 랜덤 변수로 표현한 것
    • 이산 랜덤 변수 X에 대해 X의 pmf $$p(k)$$는 랜덤 변수 X의 값이 k가 될 확률이며, 다음과 같이 표현
      $$
      p(k) = P(X=k)\quad \mbox{for} \quad k=0,1,2,...\quad\quad\quad식(2.1)
      $$
    • 아래 조건을 만족 해야 함
      $$
      1. 0 \leq p(k) \leq 1, 모든 k에 대해 \\
      2. \sum p(k) = 1, 모든 k에 대해 \\
      $$
      • 예제 1) 동전을 2개 던졌을 때 앞면이 나올 확률
        • Sample space (S) = {(HH), (HT), (TH), (TT)}
        • 확률 변수 X = 앞면의 개수
        • X = {0(앞면이 없음), 1(앞면이 1개), 2(앞면이 2개)}
        • 확률 함수는?
          • P(X = 0) = 1/4
          • P(X = 1) = 2/ 4
          • P(X = 2) = 1/4
      • 예제 2) 매년 공장에서 일어나는 낙상 사고가 얼마나 많이 일어나는가
        • 확률 변수 X = 사고가 일어난 개수
          • X = {0, 1, 2, ...}
        • 확률 함수는 P(X = k) = 1/2^(k+1) 로 주어짐.
          • P(X = k)는 확률 함수 인가?
            • 식 (2.1)의 조건 1을 만족 하는지 확인
              • x = 0, P(0) = 1/2
              • x = 1, P(1) = 1/2^2
              • x = 2, P(2) = 1/2^3
              • ... -> 조건 1 만족
            • 식 (2.1)의 조건 2를 만족하는지 확인
              • 무한 급수 더하기 = (1/2)/(1-1/2) = 1
            • 식 (2.1)의 조건 1, 2를 모두 만족 하므로 확률 함수가 맞음
  • 연속 랜덤 변수
    • Continuous Random Variable
    • 확률 밀도 함수를 가짐
      • 예제 1) 골프를 칠 때 18홀을 도는데 걸리는 시간
      • 예제 2) 서울 주민들의 평균 연봉
    • 연속 랜덤 변수 X에 대해, pdf $f_X(x)$는 전체 실수 값(-∞, ∞)를 독립 변수로 한 음수가 아닌 함수로 표현
    $$
    P(X\subset S) = \int_S f_X(x)\quad\mathrm{d}x \quad\quad\quad\quad 식(2.2)
    $$
    • x는 적분 변수로만 정의되며, 아래 조건을 만족해야 함
    $$
    1. f_X(x) \geq 0,\quad 모든 x에 대해\\
    2. \int_{-\infty}^\infty f_X(x)dx =1
    $$

2.2.2 누적 분포 함수


  • Cunmulative Distribution Function
  • P(k) 또는 F_X(x)로 표현 되며, k 또는 x의 모든 값에 대해 이는 랜덤 변수 X가 k또는 x보다 작거나 같은 확률을 정의

$$
P(k) = P(X \leq k), \mbox{모든},k\mbox{에 대해} \quad\quad\quad\quad\quad\quad \cdots (2.3)\\
\mbox{또는}\\
F_X(x) = P(X \leq x),\quad {-\infty} < x < \infty \quad\quad\quad\quad \cdots (2.4)
$$

  • 이산 랜덤 변수의 경우 CDF는 다음과 같음

$$
P(k) = \sum_{all,k} P(X=k)\quad\quad\quad\quad \cdots (2.5)
$$

  • 연속 랜덤 변수의 CDF는 다음과 같이 해당 pdf들의 적분으로 표현

$$
F_X(x) =\int_{-\infty}^x f_X(x),\mathrm{d}x \quad\quad\quad\quad \cdots (2.6)
$$

  • $$F_X(x) = P(X \leq x)$$ 이므로 다음과 같은 관계가 성립 함

$$
FX(a \leq x \leq b) = \int_a^b f_X(x)dx \\
\quad\quad\quad\quad\quad\quad\quad = F_X(b) - F_X(a) \\
\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad = P(a \leq X \leq b)\quad\quad\quad\quad \cdots (2.7)
$$


2.2.3 확률 밀도 함수


  • 연속 랜덤 변수의 확률 밀도 함수를 일정 구간에 대해 적분할 경우, 해당 랜덤 변수가 특정 구간에서 값을 가질 확률을 표현
  • pdf f_X(x)는 CDF인 F_X(x)의 미분으로 나타냄
    $$
    f_X(x) = \frac{dF_X(x)}{dx} \quad\quad\quad\quad \cdots (2.8)
    $$

예제) 2.1

어떤 연속 랜덤 변수 X의 pdf가 아래와 같다.
$$
f_X(x)=\begin{cases}a\sqrt x, & 0 \leq x \leq 1\\0, & \mbox{그 외}\end{cases} \
$$
(1) 상수 α를 구하시오.

  • 연속 랜덤 변수의 요건에 근거하여 아래와 같이 계산이 가능

$$
\int_{-\infty}^\infty f_X(x)dx = \int_0^1{\alpha \sqrt{x}} dx = \frac{2\alpha}{3}=1 \\
\therefore \alpha \mbox{는} \frac{3}{2} = 1.5 \mbox{와 같이 구해짐}
$$

(2) X의 CDF를 구하시오.

  • 식 (2.6)으로부터 랜덤 변수 X의 CDF는 그 변수의 pdf의 적분으로 나타낸다.

$$
F_X(x) =\int_{-\infty}^x f_X(x) =
\begin{cases}
0, & \mbox{for}x < 0 \\
x^{\frac{3}{2}}, & \mbox{for} 0 \leq x \leq 1\\
1, & \mbox{for} 1 \leq x
\end{cases}
$$

(3) 확률 P(X > 0.25)을 구하시오.

  • CDF의 개념에 근거하여 아래와 같이 확률을 구할 수 있다.

$$
P(X > 0.25) = 1-F_X(0.25) =0.875
$$


2.2.4 기대치, n차 모멘트, n차 중심 모멘트 및 분산


  • 랜덤 변수의 기대치(Expected value)
    • 변수의 평균 또는 중심 값
    • 기대치는 그 변수의 분포를 요약하는 값
  • 랜덤 변수의 분산
    • 그 랜덤 변수의 실제 값이 어느 정도 퍼져 있는 정도를 표현하는 음수가 아닌 실수
    • 분산이 크면 관측값이 평균적으로 더 많이 퍼졌다는 뜻
    • Cell 내의 서로 다른 지역에 있는 가입자들의 호 발생 유형이 어떠한 가를 표현할 때 유용함
    • 해당 값을 알면 그 Cell에서의 동시 통화수를 예측하는데 이용 됨
    • 또, 새로운 호는 서로 다른 시간에 발생하고, 따라서 호 발생은 연속 랜덤 변수가 아닌 이산 랜덤 변수로 표현
  • 호 지속 시간(가입자의 통화 시간)은 가변적
    • 어느 한 채널이 통화 중인 시간의 비율은 호 발생률과 호 지속 시간의 가중치에 좌우 됨
  • 인접 채널들 간의 간섭
    • 각 채널이 얼마나 긴 시간 동안 사용되었는가 에 좌우 됨
  • 트래픽의 특성을 표현하기 위해서는 해당 모멘트 함수(Moment Function)들을 모두 계산해야 함
    • 변수들을 정량화함으로써 시스템 성능에 대한 영향을 이해할 수 있게 됨

이산 랜덤 변수

- 기대치 또는 평균값

$$
E[X] = \sum_{\mbox{all} k}{k^nP(X=k)}\qquad\qquad\cdots (2.9)
$$ {2.9}

  • 이산 랜덤 변수 Χ로 정의된 함수 g(X)의 기대치는 X의 분포에 의거하여 g(X) 값으로 새로이 정의된 또 다른 변수 Y의 평균값이다.
  • 이 값은 E[g(X)]로 표현하고, 식(2.10)과 같이 구할 수 있다.

$$
E[g(x)] = \sum_{\mbox{all} k}{g(k)P(X=k)}\qquad\qquad\cdots (2.10)
$$ {2.10}

- n차 모멘트

$$
E[X^n] = \sum_{\mbox{all} k}{k^nP(X=k)} \qquad\qquad\cdots (2.11)
$$

  • X의 1차 모멘트는 바로 X의 평균이 된다.
- n차 중심 모멘트
  • 중앙 평균은 평균값을 중심으로 한 평균을 말하며, 아래와 같이 표현된다.

$$
E[(X-E[X])^n] = \sum_{\mbox{all} k}{(k-E[X])^nP(X=k)} \qquad\qquad\cdots (2.12)
$$

  • 1차 중심 모멘트의 값은 0이다.
- 분산 또는 2차 중심 모멘트

$$
\sigma^2 = \mbox{Var}(X) = E[(X-E[X])^2] = E[X^2] - (E[X])^2 \qquad\qquad\cdots (2.13)
$$

  • 이 식에서 σ는 표준편차라 부름

연속 랜덤 변수

- 기대치 또는 평균값

$$
E[X] = \int_{-\infty}^\infty {xf_X(x)} {dx}\qquad\qquad\cdots (2.14)
$$

  • 연속 랜덤 변수 X로 정의된 함수 g(X)의 기대치는 X의 분포에 의거하여 g(X) 값으로 정의된 또 다른 변수 Y의 평균값이다.
  • 이 값은 E[g(X)]로 표현하고, 아래 식과 같이 구할 수 있다.

$$
E[g(X)] = \int_{-\infty}^\infty {g(x)f_X(x)} {dx}\qquad\qquad\cdots (2.15)
$$

- n차 모멘트

$$
E[X^n] = \int_{-\infty}^\infty {x^nf_X(x)} {dx}\qquad\qquad\cdots (2.16)
$$

- n차 중심 모멘트

$$
E[(X-E[X])^n] = \int_{-\infty}^\infty {(x-E[X])^nf_X(x)} {dx}\qquad\qquad\cdots (2.17)
$$

- 분산 또는 2차 중심 모멘트

$$
\sigma^2 = \mbox{Var}(X) = E[(X-E[X])^2] = E[X^2] - (E[X])^2\qquad\qquad\cdots (2.13)
$$