본문 바로가기

ML/PM/Stat/Statistics

QQ plot



QQ plot에 대해서 생각해보다가... 일일이 예제를 만드는 것은 귀찮은 일이다...

그래서 구글이미지를 그냥 넣었다...의미는 없으니 자세히 볼 필요도 없다. 


각설하고...

QQ plot은 이름 그대로 quantile vs. quantile 의 그림이고... 일반적으로 다른 두 sample을 비교하여 동등한 분포를 갖는지..같은 모집단을 갖는지...

등등을 알 수 있지만.. 정규분포와 비교시 정규성을 판단하는데 이용될 수 있다. 때로 PP plot이라고도 불린다.


Theoretical normal quantile을 x 축에 놓고~ obsersved quantile을 y축에 놓았을때~


<정규성의 여부는...>

1.Line of identity를 잘 따라가면 OK

2. 그렇지 않더라도... 어느쪽으로 휘지 않고? 직선성을 유지하면 정규성 OK. 이것을 확인하려면 수평선을 추가로 그려서 자료의 분포를 보면 쉽게 구분된다.


<만약 위 아래 모두 세로로 길게 늘어섰다면...>

다시 말해 기울기가 45도 이상인 경우, 이론적인 정규분포보다 넓게 분포함을 의미한다. 그래도 정규성이긴 하지.. 위에 두번째에 해당하니..


<만약 위 아래 모두 가로로 길게 늘어섰다면...>

다시 말해 기울기가 45도 이하인 경우, 이론적인 정규분포보다 좁게 분포함을 의미한다. 마찬가지로 정규성이긴 하지.. 위에 두번째에 해당하니..


<만약 위 아래 중 특정 부분이 세로로 길게 늘어섰다면...>

늘어선 쪽에 길게 long tail을 갖는다는 것을 의미한다.


<만약 위 아래 중 특정 부분이 가로로 길게 늘어섰다면...>

관측치에서의 자료 변화가 없고, 그 쪽에 자료가 많이 분포하는 것이다.


응용하면....


<만약 위는 세로, 아래는 가로로 늘어섰다면...>

그러니까 비틀어서 U 모양으로 보이면, 말로하려니... 힘들다.. 차라리 시뮬레이션이라도 할까...싶은데..

Positive skewed, 다시 말해 long right tail을 갖는다.


<만약 위는 가로, 아래는 세로로 늘어섰다면...>

그러니까 비틀어서 뒤집어진 U 모양으로 보이면..

Negative skewed, 다시 말해 long left tail을 갖는다.


참고를 위해 Wikipedia 그림과 링크를 따온다.



[Img source : http://en.wikipedia.org/wiki/Skewness ]