Mingi juhusliku suuruse visuaalset analüüsi aitab läbi viia R keskkonnas boxplot funktsioon. Oletame, et meil on andmehulk, milles sisaldub uuritavate vanus ja nendele vastavate laste arv.
kasutades boxplot funktsiooni
> boxplot(andmed$vanus, horizontal=T, main=”Vanuse jaotus”)
saame:
toome ka võrdluse summary funktsiooniga:
> summary(andmed$vanus)
Min. 1st Qu. Median Mean 3rd Qu. Max.
19.00 26.00 32.00 34.05 40.00 66.00
On näha, et graafiline joonis annab edasi mean min ja max parameetrid. Lisaks on olemas ka esimene ja kolmas kvantiil, mille vahel olev andmehulk on kõige kvaliteetsem. Samuti on näha kaks nn outlaierit.
Joonistame, kasutades boxplot funktsiooni, vanuse jaotused ülalpeetavate suhtes
> boxplot(andmed$vanus ~ andmed$lapsi, horizontal=T, main=”Vanuse jaotus grupeeritud ylalpeetavate j2rgi”)
Ülalpeetavate gruppide kaudu nüüd toodud min, max, kvantiilid, mediaanid ja ka vastavate ülalpeetavate gruppide outlierid.
On näha, et null ülalpeetavatega andmehulk on kõige suurem, millele järgneb ühe, kahe ja kolme ülelpeetavaga vanusegrupid.