Oikean kokoisella otoksella onnistumiseen
Tutkimusta suunniteltaessa nousee keskustelu oikeasta tai tarkoituksenmukaisesta otoskoosta. Montako vastaajaa me tarvitsemme? Onko 100 vastaajaa tarpeeksi? Riittääkö 300? Tarvitaanko tähän monta tuhatta vastaajaa? Sopiva otoskoko löytyy usein varsin helposti nojaamalla tilastotieteen perusperiaatteisiin.

Kyselytutkimusten suunnittelu ja toteutus on toimintaa, joka tarjoaa monipuolisia mahdollisuuksia epäonnistumiseen. Voi olla, ettet onnistu kysymään oikeita kysymyksiä oikeilta ihmisiltä. Joskus vastaajaryhmä (otos) ei edusta riittävän hyvin sitä ryhmää, jota tulosten on tarkoitus kuvata (perusjoukko). Otoksen koko taas voi olla liian pieni tai tarpeettoman suuri.
Ei ole lainkaan tavatonta, että tutkimusta suunniteltaessa nousee keskustelu oikeasta tai tarkoituksenmukaisesta otoskoosta. Montako vastaajaa me tarvitsemme? Onko 100 vastaajaa tarpeeksi? Riittääkö 300? Tarvitaanko tähän monta tuhatta vastaajaa?
Sopiva otoskoko löytyy usein varsin helposti nojaamalla tilastotieteen perusperiaatteisiin. Suurten lukujen lain mukaisesti otoksesta saatava keskiarvo lähestyy perusjoukon todellista keskiarvoa otoskoon kasvaessa. Keskeinen raja-arvolause osoittaa, että eri otoksista saatavien vastausten keskiarvo jakaantuu normaalijakauman mukaisesti. Näitä soveltava Cochranin kaava on yksi tapa määrittää otoskoko täsmällisesti. Cochranin kaavaa soveltaviin nettilaskureihin pääsee käsiksi tekoälyn ja hakukoneiden avulla.
Yksinkertaistettuna voi sanoa, että valtakunnalliseen edustavuuteen tarvitaan Suomessa hieman yli 1000 vastaajan edustava otos. Tällä päästään kolmen prosenttiyksikön virhemarginaaliin 95% luotettavuudella.
Silloin kun on tarve päästä tarkempaan mittaukseen (pienempään virhemarginaaliin) otoskokoa on kasvatettava. Kahden prosenttiyksikön virhemarginaali edellyttää Suomessa jo noin 2400 vastaajan otosta. Vastaavasti 384 vastaajan otoksella ajaudutaan väljään viiden prosenttiyksikön virhemarginaaliin 95% luotettavuudella.
Kyselytutkimuksissa halutaan usein varmistua, että vastaukset ovat riittävän luotettavia erilaisissa vastaajien osajoukoissa, ryhmissä tai segmenteissä. Sen vuoksi otannan suunnittelussa on muistettava huolehtia siitä, että tärkeisiin vastaajaryhmiin saadaan riittävästi vastaajia.
Tässä kohdassa suunnittelu muuttuu pykälän verran mutkikkaammaksi. Otoskokoon vaikuttaa alaryhmän tai segmentin todellinen koko – asia, jota voi olla vaikea arvioida ennakkoon. Olennaista on, että kustakin alaryhmästä kerätään otos, jolla saavutetaan haluttu luotettavuus.
Mitä enemmän erilaisia tarkasteltavia alaryhmiä on, sitä suuremmaksi otoskoko kasvaa. Karkeasti voi sanoa, että tavanomaisia väestöryhmiä analysoitaessa tarvitaan usein lähes 1500 vastaajan otos. Kun tarkasteltavien ryhmien määrä kasvaa päädytään helposti yli 2000 vastaajan otoksiin.
Miksi tällä kaikella on ylipäätään väliä? Siksi, että tarkoituksenmukaisen otoskoon ansiosta pystymme pitämään tutkimuksen virhemarginaalin kurissa ja saamme riittävän luotettavia tuloksia. Liian pieni otos heikentää luotettavuutta, turhan suuri otos kasvattaa usein kustannuksia. Oikea otoskoko auttaa onnistumaan.
Seppo Roponen