Hypothesis Test
Student t
n: Degree of Freedom, t ๋ถํฌ์ ๋ชจ์ ๊ฒฐ์
Z์ V๋ independent
x^2: ์นด์ด ์ ๊ณฑ ๋ถํฌ
Then
Properties
symmetric distribution
n=1 โ Cauchy distribution(ํ๊ท ์กด์ฌx)์ ์ผ๋ฐํ
nโฅ2 โ ํ๊ท ์ด 0
Heavier-tailed than Normal Distribution: ๊ทน๋จ์ ์ธ ๊ฐ์ด ๋ฐ์ํ ํ๋ฅ ์ด ๋์์ง
For n large, t_n looks very much like N(0,1)
= Distribution of t_n goes to N(0,1) as n โโ
์ฆ๋ช )
Binomial Distribution
๋ฒ ๋ฅด๋์ด ์ํ: ์ฑ๊ณต/์คํจ๋ก๋ง ๋ํ๋๋ ์ํ, ๊ฐ ์ํ์ ๋ ๋ฆฝ
์ฑ๊ณตํ ํ๋ฅ p, ์คํจํ ํ๋ฅ q=1-p โ ๋ฒ ๋ฅด๋์ด ์ํ์ n๋ฒ ํ์ ๋์ ํ๋ฅ ๋ถํฌ
ํ๋ฅ ์ง๋ํจ์
T-test
๋ชจ์ง๋จ์ ๋ถ์ฐ์ ๋ชจ๋ฅผ ๋ ๋ ๋ฆฝ๋ ๋ ์ง๋จ์ ํ๊ท ๊ฐ์ ์ฐจ์ด๋ฅผ ๋น๊ต(= ์ผ๋ง๋ถํฐ ์ ์ํ๊ฐ?)
ex) 2010๋ ๋จ์ ํ๊ท ํค vs 2020๋ ๋จ์ ํ๊ท ํค 175
โ ์ ์ฝ์ ๋จน๊ธฐ ์ ๊ฐ ์์น vs ๋จน์ ํ์ ๊ฐ ์์น
Null Hypothesis: ์ฐจ์ด๊ฐ ์๋ค๋ ๊ฐ์ค(= ๋ ์ง๋จ์ ํ๊ท ์ด ๊ฐ๋ค)
Alternative Hypothesis: ์ฐจ์ด๊ฐ ์๋ค๋ ๊ฐ์ค(= ๋ ์ง๋จ์ ํ๊ท ์ด ๋ค๋ฅด๋ค)
๊ฐ์ : ๋ ๋ฆฝ์ฑ, ์ ๊ท์ฑ, ๋ฑ๋ถ์ฐ์ฑ(H0์ ๋ฐ์๋ค์ฌ์ผ ํจ)
๋จ์ผํ๋ณธ: ๋ชจ์ง๋จ vs ํ๋ณธ์ง๋จ
โ ฮฑ ๊ฐ๊ณผ t ๊ฐ์ ๋น๊ต, ํน์ p ๊ฐ๊ณผ ๊ฐ์ ๋น๊ต
ํ๋ณธ 2๊ฐ
Multiple Testing
์ฌ๋ฌ ๊ฐ์ ํ๋ณธ์ง๋จ๋ผ๋ฆฌ ๋น๊ตํ ๋ ๋จ์ํ Hypothesis test๋ฅผ ์ฌ๋ฌ ๋ฒ ํด์๋ ์๋๋ค: Hypothesis test๋ฅผ ๋ง์ด ํ ์๋ก type 1 error๊ฐ ์ ์ด๋ 1๋ฒ ๋์ฌ ํ๋ฅ ์ด ์ฌ๋ผ๊ฐ๊ธฐ ๋๋ฌธ
n๋ฒ testํ์ ๋ error๊ฐ ํ๋ฒ๋ ์ ๋์ฌ ํ๋ฅ P(0):
๋ฐ๋ผ์ Multiple testing์ ํ ๋๋ ํต๊ณ์ ์์ ์ ์ฐจ๊ฐ ํ์ํจ
Bonferroni Correction: ๊ฐ๋จํ์ง๋ง ์ํ ์๊ฐ ๋ง์์ง์๋ก ๋ถ์ ํํด์ง
์ฆ n๋ฒ ์ํํ ๋ ์ ์ํ๋ฅ ์ ฮฑ/n
Dunnet test: ์ ํ๋๊ฐ ๋๊ณ ์์ ๋ t-distribution์ ์ฌ์ฉํจ. ๋์กฐ๊ตฐ์ด 1๊ฐ์ผ ๋ ์ ์ฉํจ
ex) ๋์กฐ๊ตฐ A, ์คํ๊ตฐ B, C, D์ผ ๋
โ A-B, A-C, A-D ๋น๊ต ok
โ A-B, B-C, C-D ๋น๊ต no
ANOVA(Analysis of Variance)
[https://www.youtube.com/watch?v=HlSyvMRLu4w&ab_channel=SapientiaaDei]:
T-test๋ ๋ ๊ทธ๋ฃน์ ํ๊ท ์ด ๊ฐ์์ง ๋น๊ตํ๋ค๋ฉด, ANOVA๋ ์ฌ๋ฌ ๊ทธ๋ฃน์ ํ๊ท ์ ๋น๊ตํจ
Multiple testing์ type 1 error๊ฐ ๋ฐ์ํ ํ๋ฅ ์ด ๋์์ง๊ธฐ ๋๋ฌธ์ ANOVA๋ฅผ ์ฌ์ฉํ๋ ๊ฒ
ANOVA๋ฅผ ํ๊ธฐ ์ ์ ์์์ผ ํ๋ ๋ณ์๋ค
๋ ๋ฆฝ๋ณ์: ์ธ๊ณผ๊ด๊ณ์์ ์์ธ์ธ ๋ณ์
์ข ์๋ณ์: ์ธ๊ณผ๊ด๊ณ์์ ๊ฒฐ๊ณผ์ธ ๋ณ์
ํต์ ๋ณ์: ๊ธฐ๋ณธ์ ์ผ๋ก๋ ๋ ๋ฆฝ๋ณ์์ด๋ ์ฐ๊ตฌ์ ๊ด์ฌ์ฌ๊ฐ ์๋ ๋ณ์
ex) ๊ณ ๊ฐ๋ง์กฑ๋(๋ ๋ฆฝ), ๋ค๋ฅธ ์์ธ1(ํต์ ), ๋ค๋ฅธ ์์ธ2(ํต์ ), .... โ ์ฌ๋ฐฉ๋ฌธ์จ(์ข ์)
ํต์ ๋ณ์๋ฅผ ํ๋๋ ๊ณ ๋ คํ์ง ์์ผ๋ฉด model misspecification ์ด ๋ฐ์ํจ(๋ชจ๋ธ์ด ์๋ชป๋์๋ค๋ ์๋ฏธ)
One-way ANOVA: ๋ ๋ฆฝ๋ณ์๊ฐ 1๊ฐ์ธ ANOVA
One-way ANOVA์ ์ฌ์ฉ๋๋ ๋ณ์์ ํน์ฑ
์ข ์๋ณ์: Continuous ํด์ผํจ
๋ ๋ฆฝ๋ณ์: Discrete/Categorical ํด์ผํจ
ex) ์ด๋ฆฐ ์์ด๋ค์ ํญ๋ ฅ์ฑ ์คํ
โ ์์์ ์ข ๋ฅ(๋ ๋ฆฝ ๋ณ์) - ํญ๋ ฅ์ํ/๋๋ผ๋ง/๊ณต์ต๊ด๊ณ
โ โ ์ ์ํ๋ ์์ด๋ค์ ํญ๋ ฅ์ ์ธ ํ๋(์ข ์ ๋ณ์)
ANOVA์์ ๋ ๋ฆฝ๋ณ์๋ ๋ฐ๋์ 1๊ฐ์(์์์ ์ข ๋ฅ) ์ ๋ 3๊ฐ(ํญ๋ ฅ์ํ, ๋๋ผ๋ง, ๊ณต์ต๊ด๊ณ )๊ฐ ์๋!
Formula
์ด๋ฐ ์์์ ๋ณดํต์ ์ฐ๋ณ์ ๋ ๋ฆฝ๋ณ์ ์ข๋ณ์ ์ข ์๋ณ์
F-values ~ F-distribution: F-value๋ F-distribution์ ๋ฐ๋ฅธ๋ค
๋ค๋ฅธ test๋ค์ฒ๋ผ F-value๋ฅผ ๊ตฌํด์ F-distribution์์ ฮฑ๊ฐ๊ณผ ๋น๊ตํ๋ฉด ๋จ
F-value: ๋ ๊ฐ์ ๋ถ์ฐ์ ๋น์จ์ ๋ํ๋
Between Variance: GM(์ ์ฒด ํ๊ท )๊ณผ ๊ฐ ๊ทธ๋ฃน๊ฐ์ ๋ถ์ฐ์ ๋ค ํฉ์น ๊ฐ
BV๊ฐ ํฌ๋ฉด ์ ์ด๋ ํ ๊ทธ๋ฃน์ด ๋ค๋ฅธ ๊ทธ๋ฃน์ ํ๊ท ์์ ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์์(ANOVA์ ๋ชฉ์ : ์ฌ๋ฌ ๊ทธ๋ฃน์ ํ๊ท ์ด ๊ฐ์๊ฐ?)
Within Variance: ๊ทธ๋ฃน ๋ด์ ๋ถ์ฐ
โ BV๊ฐ WV๋ณด๋ค ์ถฉ๋ถํ ์ปค์ผ "BV๊ฐ ํฌ๋ค"๋ผ๊ณ ๋งํ ์ ์๋ค(WV๋ ๋๋คํ ๋ณ๋๊ฐ์ ์๋ฏธ)
F-value
Hypothesis
Two-way ANOVA: ๋ ๋ฆฝ ๋ณ์ ๋๊ฐ
Main effect: ๋ ๋ฆฝ๋ณ์๊ฐ ๊ฐ์ง๋ ํจ๊ณผ + interaction effect
๋ ๋ฆฝ๋ณ์์ ์ข ์๋ณ์๊ฐ linear(์ง์ )์ด๋ผ๊ณ ๊ฐ์
f-value
์ฒซ ๋ฒ์งธ ๋ ๋ฆฝ๋ณ์ main effect๋ฅผ ์ธก์ ํ๊ธฐ ์ํ f-value
๋ ๋ฒ์งธ ๋ ๋ฆฝ๋ณ์ main effect๋ฅผ ์ธก์ ํ๊ธฐ ์ํ f-value
interaction ํจ๊ณผ๋ฅผ ์ธก์ ํ๊ธฐ ์ํ f-value
โ 3๊ฐ์ BV์ 1๊ฐ์ WV๋ฅผ ๋น๊ต
Hypothesis๋ 3๊ฐ ํ์
์ฒซ ๋ฒ์งธ main effect์ ๋ํ ๊ฐ์ค
๋ ๋ฒ์งธ main effect์ ๋ํ ๊ฐ์ค
interaction effect์ ๋ํ ๊ฐ์ค
Last updated
Was this helpful?