하나의 분포가 있다고 하자

그 분포는 표준정규분포(Standard Normal Distribution)이라고 하자.

그렇다면 그 분포의 모양은 요렇게 생겼을 것이다.(표준정규분포에 대한 개념은 나중에 다시 공부해보자.)

 

왜도(Skewness)

 위의 분포에서 왜도는 중심축을 기준으로 어느 한쪽으로 치우친 정도를 나타낸다.

왜도가 0이면 분포가 좌우대칭이 된다는 말이다.

 

좌우대칭이면 왜도가 0인 건 맞는데, 왜도가 0이라고 해서 반드시 좌우대칭은 아니라고 하는데, 이 부분은 저도 잘 모르겠네요..

wldnjs1682 님이 계축문화사 보건통계학에 나온다고 하시네요. .이 부분은 더 살펴봐야 할거 같습니다.

 

왜도 = 0인 분포, 좌우대칭


왜도 > 0인 분포, 우측으로 긴 꼬리 (정적 비대칭 : positive skew)

 왜도 < 0인 분포, 좌측으로 긴 꼬리 (부적 비대칭 : negative skew)

왜도 구하는 식

 

일반적으로 정적 비대칭의 분포에서는 평균이 가장 크며, 중앙값이 그 다음, 최빈값이 가장 작다.

부적 비대칭의 경우에는 이와 반대 순서가 된다.

평균은 개별사례의 값을 모두 포함하는 가중된 값이므로 극단치의 영향을 받지만, 중앙치는 그렇지 않다.

소득과 같이 심하게 비대칭인 분포의 집중경향을 보기 위해서는 평균대신 중앙값을 사용한다.

 

집중경향

한 집단의 점수분포에 있어서 주로 어떤 점수에 집중적으로 분포되어 있느냐를 하나의 값으로 요약 기술해 주는 지수

[출처 : 네이버 지식백과]

 

헐..

인터넷에서 개인소득 분포를 찾으려고 하니 자료가 드럽게 안나온다.

통계청, 국세청 홈페이지를 뒤져도 난 못찾겠다..

제길.

굳이 그리자면 아마 이런 모양으로 생겼을 것이다.

우리가 흔히 중산층이라고 하면 저 분포의 꼭대기에 있는 사람들이라고 할 수 있을 것이다.

근데 이제 우리나라는 중산층이 없어지면서 빈곤층만 늘어나고 있다.

즉 우리나라 개인 소득분포는 정적비대칭이며 앞으로 더욱 심해질 것이다.

그러므로 우리나라 개인 소득 분포의 왜도는 0보다 크며 앞으로 그 크기는 더 커질 전망이라 할 수 있겠다.

 

다시 교과내용으로 넘어와서

소득과 같이 심하게 비대칭적인 소득분포의 집중경향을 보기 위해서 평균보다는 중앙값을 사용한다고 했는데

한번 살펴보자.

개인 소득의 분포가 다음과 같다고 가정하자.

총 인구는 1000명이다.

 계급(금액:만원)

인구비중 

 인구(명)

 인구x금액

100 

0.1 

100 

10000 

200 

0.2 

200 

40000 

300 

0.3 

300 

90000 

400 

0.15 

150 

60000 

500 

0.05 

50 

25000 

600 

0.04 

40 

24000 

700 

0.033 

33 

23100 

800 

0.032 

32 

25600 

900 

0.03 

30 

27000 

1000 

0.02 

20 

20000 

1100 

0.012 

12 

13200 

1200 

0.013 

13 

15600 

1300 

0.01 

10 

13000 

1400 

0.005 

7000 

1500 

0.005 

7500 

 

 

위에 분포처럼 한쪽으로 치우친 아주 슬픈 현실이라고 가정하자..

 

위의 자료에서 총 인구는 1000명

평균은 401만원

중앙값은 1000명의 499,500번째인 300만원

 

여기서 이 소득분포의 평균은 401만원이다.

그렇다면 이분포의 집중경향을 401만원로 볼 수 있는가?

다수의 사람들이 401만원을 번다고 볼수 있는가?

위 그래프에서 최빈도는 300만원일때 나타난다.

가장 많은 계급의 사람들이 300만원을 번다.

평균인 401만원을 집중경향으로 봤을 때 이 1000명의 인구의 다수가 401을 번다고 생각하기에는 좀 이해하기 어려운 부분인거 같다.

이때는 중앙값을 사용하여 이해해보자

중앙값은 300만원

즉 다수의 사람들이 300만원을 번다고 생각할 수 있다.

 

첨도(Kurtosis)

 

첨도는 무엇이냐?

왜도가 높이는 같고 왼쪽, 오른쪽 어느쪽으로 몰렸냐를 따질 때, 첨도는 정점의 x좌표는 같고 정점의 y좌표가 얼마나 높고 낮은가를 보여주는 척도이다.

즉, 얼마나 더 뾰족하고 뭉퉁스럽나를 보여주는 척도라 할 수 있겠다.

한번더 말하자면, 척도는 분포모양이 중간위치에서 뽀족한 정도를 나타내는 척도이다.

 

첨도의 값은 뽀죡할수록 크다.

첨도의 값이 0이면 집단의 분포가 표준정규분포와 뾰족한 정도가 같음을 의미하며, 0보다 크면 표준정규분포보다 뾰족한 분포임을 의미한다.

 

첨용(Leptokurtic)

 첨도의 값이 0보다 클 경우에는 첨용이라 한다. ( K > 0 )

평용(Platykurtic)

첨도의 값이 0보다 작을 경우에는 평용이라 한다. ( K < 0 )

정상분포(mesokurtic = bell - shaped)

첨도의 값이 0과 같을 경우에는 정상분포이라 한다. ( K = 0 )

 

정상분포( 첨도 = 0 )


첨도가 0보다 큰 분포( 첨도 > 0 ), 붉은색 선

첨도가 0보다 작은 분포( 첨도 < 0 ), 초록색 선

 

 

첨도 구하는 식

 

K =  0  : 표준정규분포와 뾰족한 정도가 같다.

K < 0  : 표준정규분포보다 납작하다.

K > 0  : 표준정규분포보다 뾰족하다.

 

※ 경우에 따라서는 첨도의 계산식에서 3을 빼지 않고 정의하기도 한다. 이 정의에 따르면 정규분포의 첨도는 3이며, 첨도가 3보다 크면 첨용(leptokurtic)하다고 한다.

Posted by 시골청년
,