IT/빅데이터분석기사

[2과목] 통계기법의 이해 - 확률분포2

김비서 2021. 8. 31. 23:11
728x90

1. 확률변수(Random Variable)

원래 숫자의 의미가 있는 자료나 원래 숫자의 의미가 없는 다른 형태의 자료에 수치를 부여한 것을 의미한다. 다시 말해, 사건의 시행의 결과(확률)를 하나의 수치로 대응시킬 대의 값(확률값)을 의미한다.

 

※ 확률변수의 종류

- 이산확률변수(Discrete Random Variable) : 확률변수가 취할 수 있는 값의 수가 유한한 변수이다.

- 연속확률변수(Continuous Random Variable) : 확률변수가 취할 수 있는 값의 수가 무한한 변수이다.

 

 

2. 확률분포

확률분포는 수치로 대응된 확률변수의 개별 값들이 가지는 확률 값의 분포이다.

확률변수가 취할 수 있는 구체적인 값을 확률공간상의 확률값으로 할당한다.

 

① 이산확률분포(Discrete Probability Distribution)

: 확률변수가 취할 수 있는 값의 수가 유한한 확률분포이다.

- 확률질량함수(Probability Mass Function) : 이산확률변수에서 특정 값에 대한 확률을 나타내는 함수

  * 확률질량함수는 음수를 함숫값으로 가질 수 없으며, 함숫값을 모두 더하면 1이다.

[출처 : 이기적스터디카페]

 

② 연속확률분포(Continuous Probability Distribution)

: 확률변수가 취할 수 있는 값의 수가 무한한 확률분포이다.

- 확률밀도함수(Probability Density Function) : 확률 변수의 분포를 나타내는 함수이다.

[출처 : 이기적스터디카페]

 

③ 확률분포함수(Probability Distribution Function, 확률함수)

: 확률변수가 취할 수 있는 구체적인 값 하나하나를 확률공간상의 확률값으로 할당해주는 함수를 의미한다.

- 이산확률분포함수(Discrete Probability Distribution Function) : 확률변수가 이산적인 확률분포를 가지는 함수이다.

- 연속확률변수함수(Continuous Probability Distribution Function) : 확률변수가 연속적인 확률분포를 가지는 함수이다.

 

 

3. 확률변수의 기댓값과 분산

① 기댓값(Expected Value)

각 확률변수가 특정 값을 가질 확률을 가중치로 확률변수의 결과값을 평균화한 값으로 표시한다.

기댓값 [출처 : 이기적 빅데이터분석기사 필기]

 

② 기댓값의 성질

기댓값의 성질 [출처 : 이기적 빅데이터분석기사 필기]

 

③ 분산(Variance)

확률분포의 산포도(퍼짐정도)를 나타내는 측도로 기댓값에서 떨어진 거리의 제곱의 기댓값(평균)이며 Var(X)로 표시한다.

분산 [출처 : 이기적 빅데이터분석기사 필기]

 

④ 분산의 성질

분산의 성질 [출처 : 이기적 빅데이터분석기사 필기]

 

 

※ 분산은 음의 값을 가질 수 없으며 분산이 클수록 확률분포는 평균에서 멀리 퍼져 있고 0에 가까워질수록 평균에 집중된다.

반응형