QQ plot에 대해서 생각해보다가... 일일이 예제를 만드는 것은 귀찮은 일이다...
그래서 구글이미지를 그냥 넣었다...의미는 없으니 자세히 볼 필요도 없다.
각설하고...
QQ plot은 이름 그대로 quantile vs. quantile 의 그림이고... 일반적으로 다른 두 sample을 비교하여 동등한 분포를 갖는지..같은 모집단을 갖는지...
등등을 알 수 있지만.. 정규분포와 비교시 정규성을 판단하는데 이용될 수 있다. 때로 PP plot이라고도 불린다.
Theoretical normal quantile을 x 축에 놓고~ obsersved quantile을 y축에 놓았을때~
<정규성의 여부는...>
1.Line of identity를 잘 따라가면 OK
2. 그렇지 않더라도... 어느쪽으로 휘지 않고? 직선성을 유지하면 정규성 OK. 이것을 확인하려면 수평선을 추가로 그려서 자료의 분포를 보면 쉽게 구분된다.
<만약 위 아래 모두 세로로 길게 늘어섰다면...>
다시 말해 기울기가 45도 이상인 경우, 이론적인 정규분포보다 넓게 분포함을 의미한다. 그래도 정규성이긴 하지.. 위에 두번째에 해당하니..
<만약 위 아래 모두 가로로 길게 늘어섰다면...>
다시 말해 기울기가 45도 이하인 경우, 이론적인 정규분포보다 좁게 분포함을 의미한다. 마찬가지로 정규성이긴 하지.. 위에 두번째에 해당하니..
<만약 위 아래 중 특정 부분이 세로로 길게 늘어섰다면...>
늘어선 쪽에 길게 long tail을 갖는다는 것을 의미한다.
<만약 위 아래 중 특정 부분이 가로로 길게 늘어섰다면...>
관측치에서의 자료 변화가 없고, 그 쪽에 자료가 많이 분포하는 것이다.
응용하면....
<만약 위는 세로, 아래는 가로로 늘어섰다면...>
그러니까 비틀어서 U 모양으로 보이면, 말로하려니... 힘들다.. 차라리 시뮬레이션이라도 할까...싶은데..
Positive skewed, 다시 말해 long right tail을 갖는다.
<만약 위는 가로, 아래는 세로로 늘어섰다면...>
그러니까 비틀어서 뒤집어진 U 모양으로 보이면..
Negative skewed, 다시 말해 long left tail을 갖는다.
참고를 위해 Wikipedia 그림과 링크를 따온다.
[Img source : http://en.wikipedia.org/wiki/Skewness ]
'ML/PM/Stat > Statistics' 카테고리의 다른 글
Joint, Marginal, and Conditional Probability / Bayes's Law (0) | 2014.01.28 |
---|---|
Chi-suqare & Fisher's Exact test와 기대빈도 (0) | 2014.01.28 |
Multiple Comparisons (0) | 2013.12.18 |
PDF vs PMF & Other Distributions (0) | 2010.12.06 |
유의수준? 유의하다? (0) | 2010.01.10 |