Q. points ํ ์ด๋ธ์ ํ๋์์ค ์ค์ค์ปด์ด ๋ง๋ Anscombe's quartet ๋ฐ์ดํฐ๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ์ด ๋ฐ์ดํฐ๋ quartet ์ปฌ๋ผ์ ์ํด 4๊ฐ์ ์๋ธ์ ์ผ๋ก ๋๋์ด์ง๊ณ , ๊ฐ ์๋ธ์ ์ ํ๊ท , ํ๋ณธ ๋ถ์ฐ, ์๊ด๊ณ์ ๋ฑ์ด ๊ฑฐ์ ๋์ผํ๋ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์๊ฐํํ๋ฉด ์ ํ ๋ค๋ฅธ ๋ถํฌ๋ฅผ ๊ฐ์ง๋ ํน์ง์ด ์์ต๋๋ค.
points ํ ์ด๋ธ์ ์ฟผ๋ฆฌ๋ฅผ ์ํํด quartet์ผ๋ก ๊ตฌ๋ถ๋๋ ๊ฐ ์๋ธ์ ๋ฐ์ดํฐ์ ๋ํด์ ์๋ ํต๊ณ๋์ ๊ณ์ฐํ๋ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํด์ฃผ์ธ์. ๊ณ์ฐ๋ ๊ฐ์ ์์์ ์๋ ์ ์งธ ์๋ฆฌ์์ ๋ฐ์ฌ๋ฆผ ํด์ผ ํฉ๋๋ค. ๊ฒฐ๊ณผ ๋ฐ์ดํฐ์๋ ์๋ 5๊ฐ์ ์ปฌ๋ผ์ด ์กด์ฌ ํด์ผ ํฉ๋๋ค.
- quartet - ์ฝฐ๋ฅดํ
- x_mean - x ํ๊ท
- x_var - x ํ๋ณธ ๋ถ์ฐ
- y_mean - y ํ๊ท
- y_var - y ํ๋ณธ ๋ถ์ฐ
select quartet, avg(X) AS "x_mean", ROUND(VARIANCE(x),3) AS "x_var", ROUND(AVG(y),2) AS "y_mean", ROUND(VARIANCE(y),2) AS "y_var"
FROM POINTS
GROUP BY quartet
๐๐ผ ํ๋ณธ ๋ถ์ฐ ๊ตฌํ๋ ํจ์๋ ‘VARIANCE’
์ ์งธ ์๋ฆฌ์์ ๋ฐ์ฌ๋ฆผ ํ๋ผ๋ฉด์ Y ์ปฌ๋ผ ๊ฐ์ด ํ๋ ธ๋ค๊ณ ์ ๋ต ๊ณ์ ์ค๋ฅ๋์, ๊ฐ์ ๋ก 2๋ก ๋ณ๊ฒฝํ๋ค;;;;