1. 확률변수(Random Variable)
원래 숫자의 의미가 있는 자료나 원래 숫자의 의미가 없는 다른 형태의 자료에 수치를 부여한 것을 의미한다. 다시 말해, 사건의 시행의 결과(확률)를 하나의 수치로 대응시킬 대의 값(확률값)을 의미한다.
※ 확률변수의 종류
- 이산확률변수(Discrete Random Variable) : 확률변수가 취할 수 있는 값의 수가 유한한 변수이다.
- 연속확률변수(Continuous Random Variable) : 확률변수가 취할 수 있는 값의 수가 무한한 변수이다.
2. 확률분포
확률분포는 수치로 대응된 확률변수의 개별 값들이 가지는 확률 값의 분포이다.
확률변수가 취할 수 있는 구체적인 값을 확률공간상의 확률값으로 할당한다.
① 이산확률분포(Discrete Probability Distribution)
: 확률변수가 취할 수 있는 값의 수가 유한한 확률분포이다.
- 확률질량함수(Probability Mass Function) : 이산확률변수에서 특정 값에 대한 확률을 나타내는 함수
* 확률질량함수는 음수를 함숫값으로 가질 수 없으며, 함숫값을 모두 더하면 1이다.
② 연속확률분포(Continuous Probability Distribution)
: 확률변수가 취할 수 있는 값의 수가 무한한 확률분포이다.
- 확률밀도함수(Probability Density Function) : 확률 변수의 분포를 나타내는 함수이다.
③ 확률분포함수(Probability Distribution Function, 확률함수)
: 확률변수가 취할 수 있는 구체적인 값 하나하나를 확률공간상의 확률값으로 할당해주는 함수를 의미한다.
- 이산확률분포함수(Discrete Probability Distribution Function) : 확률변수가 이산적인 확률분포를 가지는 함수이다.
- 연속확률변수함수(Continuous Probability Distribution Function) : 확률변수가 연속적인 확률분포를 가지는 함수이다.
3. 확률변수의 기댓값과 분산
① 기댓값(Expected Value)
각 확률변수가 특정 값을 가질 확률을 가중치로 확률변수의 결과값을 평균화한 값으로 표시한다.
② 기댓값의 성질
③ 분산(Variance)
확률분포의 산포도(퍼짐정도)를 나타내는 측도로 기댓값에서 떨어진 거리의 제곱의 기댓값(평균)이며 Var(X)로 표시한다.
④ 분산의 성질
※ 분산은 음의 값을 가질 수 없으며 분산이 클수록 확률분포는 평균에서 멀리 퍼져 있고 0에 가까워질수록 평균에 집중된다.