Skip to content

Margus Roo –

If you're inventing and pioneering, you have to be willing to be misunderstood for long periods of time

  • Cloudbreak Autoscale fix
  • Endast

t.test

Posted on November 5, 2013 - December 19, 2013 by margusja
  • Kui meil on andmehulk ja me soovime ümber lükata hüpoteesi, et antud andmehulga keskväärtus (EX) ei ole x, siis saame seda R keskkonnas teha alljärgnevalt:

> t.test(test, mu=33) # Mina väidan, et test andmehulga keskmine on 33


One Sample t-test

data: test
t = 1.6949, df = 363, p-value = 0.09095
alternative hypothesis: true mean is not equal to 33
95 percent confidence interval:
32.86101 34.87369
sample estimates:
mean of x
33.86735

On näha, et p-value on suurem, kui 0.05, siis võime väga suure tõenäosusega alternatiivse hüpoteesi, et 33 ei ole antud andmehulga keskväärtus, tagasi lükata.

 

  • Kui meil on kaks sõltumatut andmehulka ja me soovime võrrelda kahe andmehulga keskväärtusi. Alternatiivne hüpotees oleks: H1: EX <> EY

R keskkonnas:

> t.test(test, test2)


Welch Two Sample t-test

data: test and test2
t = -0.2466, df = 724.868, p-value = 0.8053
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.631842 1.267641
sample estimates:
mean of x mean of y
33.86735 34.04945

Siin on näha, et võme H1 tagasi lükata, kuna p-value on suurem kui 0.05 – lausa 0.8

Toome veel teise näite, kus on kasutatud väga erinevate keskväärtustega andmehulkasid

> t.test(test,test3)


Welch Two Sample t-test

data: test and test3
t = 8.8283, df = 652.406, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
6.096112 9.583644
sample estimates:
mean of x mean of y
33.86735 26.02747

Siinkohal on H1’e vastu võtmine õigustatud, kuna p-value on väiksem, kui 0.05.

  • Miks on t.test vajalik?

Juhul, kui me võtame mingist suuremast hulgast uurimiseks väiksema näidishulga, siis on t.test abil võimalik kontrollida, kas nädishulk esindab suuremat hulka, mille kohta soovitakse näidishulga najal järeldusi teha.

Samuti saab jaotusi võrrelda. Luues ideaalse normaaljaotusega andmehulga ja võrredes t.test abil andmehulkasid, saame võrreldava adnmehulga jaotuse kohta kinnitust.

Lisaks on võimalik kahte rühma (rühmitatud mingi teguri järgi) võrrelda ja prognoosida, kas rühmitamise aluseks olev tegur avaldab olulist mõju rühmakeskmistele.

H0: EX = EY
H1: EX != EY

> t.test(r1, r2)

Welch Two Sample t-test

data: r1 and r2
t = 5.0673, df = 7.58, p-value = 0.001141
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
5.405005 14.594995
sample estimates:
mean of x mean of y
109 99

kuna p-value on väiksem, kui 0.05, siis on alust H0 kummutada ja vastu võtta H1 e rühmitamise aluseks olev tegur avaldab rühmakeskmistele olulist mõju.

Posted in Machine Learning

Post navigation

boxplot funktsioon R keskkonnas
Shapiro-Wilk normality test

The Master

Categories

  • Apache
  • Apple
  • Assembler
  • Audi
  • BigData
  • BMW
  • C
  • Elektroonika
  • Fun
  • Hadoop
  • help
  • Infotehnoloogia koolis
  • IOT
  • IT
  • IT eetilised
  • Java
  • Langevarjundus
  • Lapsed
  • lastekodu
  • Linux
  • M-401
  • Mac
  • Machine Learning
  • Matemaatika
  • Math
  • MSP430
  • Muusika
  • neo4j
  • openCL
  • Õpetaja identiteet ja tegevusvõimekus
  • oracle
  • PHP
  • PostgreSql
  • ProM
  • R
  • Turvalisus
  • Varia
  • Windows
Proudly powered by WordPress | Theme: micro, developed by DevriX.