Všetko o stratifikovaných náhodných vzorkách
Čo je stratifikovaný náhodný výber vzoriek?
Vzorka je mini reprezentácia väčšej populácie.
Vzorky sa dajú určiť neformálne alebo formálne. Ale vzorky, ktoré sú systematicky rozvíjané podľa určitých vedeckých metód, sú všeobecne vnímané ako užitočné pri generalizácii väčšej populácie.
Čo znamená stratifikácia?
Stratifikované vzorky pozostávajú z homogénnych podskupín, ktoré sa považujú za dôležité. Zbierka týchto homogénnych podskupín sa označuje ako vrstvy. Táto metóda odberu vzoriek umožňuje rozdeliť populáciu na homogénne podskupiny, z ktorých možno vybrať jednoduché náhodné vzorky.
Prečo je stratifikovaná vzorka užitočná?
Cieľom stratifikovaného náhodného výberu je vybrať účastníkov z rôznych podskupín, o ktorých sa predpokladá, že sú relevantné pre výskum, ktorý sa uskutoční. Napríklad výsledky štúdie môžu byť ovplyvnené atribútmi subjektov , ako sú ich vek, pohlavie, úroveň pracovných skúseností, rasová a etnická skupina, ekonomická situácia, dosiahnutá úroveň vzdelania atď.
Štruktúrovaná vzorka je zostrojená tak, aby sa dali odôvodnene predpokladať, že tieto potenciálne ovplyvňujúce charakteristiky odrážajú štruktúru týchto charakteristík v celkovej populácii. Týmto spôsobom vzorka odráža počet obyvateľov, z ktorých bol odobratý, ale vzorku nemožno považovať za reprezentatívnu pre väčšiu populáciu .
Nezabudnite, že výber členov stratifikovanej vzorky nie je náhodný proces. To znamená, že po vytvorení vrstiev sa na výber jednotlivých členov vzoriek použije jednoduchý náhodný výber vzoriek pre každú vrstvu .
Čo pravdepodobne znamená?
Stratifikovaná náhodná vzorka je pravdepodobná, pretože každá metóda použitá na výber populácie vzorky poskytuje rozumne spoľahlivý spôsob, ako odhadnúť, ako je reprezentatívna populácia vzorky pre väčšiu (vesmírnu) populáciu, z ktorej bola vybraná vzorka. Inými slovami, pravdepodobnostná vzorka umožňuje výskumníkovi odhadnúť, že vybraná vzorka predstavuje alebo nepredstavuje väčšiu populáciu, z ktorej bola vzorka nakreslená.
Príklady
Použite stratifikované metódy náhodného výberu vzorky, ak existuje záujem o rozdiely medzi homogénnymi podskupinami a väčšou populáciou vzoriek ako celku.
Povedzme, že populácia obchodných klientov sa dá rozdeliť do troch skupín: Gen-Xers, Gen-Yers (Millennial) a Baby Boomers. Okrem toho máme dôvod domnievať sa, že Gen-Xers aj Gen-Yers sú relatívne menšie menšiny celkovej podnikateľskej klientely. Gen-Xers tvorí asi 5 percent celkovej populácie klientely a Gen-Yers tvorí asi 10 percent klientely.
Jednoduchá náhodná vzorka 100 členov (n = 100) by mohla generovať 5 Gen-Xers a 10 Gen-Yers, ak by sme použili odberovú vzorku 10 percent. Bolo by možné získať ešte menej Gen-Xers a menej Gen-Yers ako to vo vzorke - len náhodou. Stratifikácia pravdepodobne prinesie reprezentatívnejšie výsledky. Povedzme, že chceme mať aspoň 25 ľudí v každej skupine. Ak ešte vezmeme vzorku 100 (n = 100), potom môžeme vyskúšať 25 Gen-Xers, 25 Gen-Yers a 50 Baby Boomers.
Vieme, že 10% populácie je Millennials alebo Gen-Yers (alebo asi 100 našich klientov) Náhodná vzorka 25 klientov dá vzorkovacia frakcia v rámci vrstvy 25/100 alebo 25% a tiež vieme, že 5% z 50 klientov, ktorí nie sú Baby Boomers sú Gen-Xers, čo znamená, že frakcia v rámci vrstvy bude 25/50 alebo 50%.
Takže 50 Gen-Xers plus 100 Gen-Yers je celkovo 150 vzoriek našich klientov. Keďže celková populácia klientov je 1000, odčítavame Gen-Xers plus Gen-Yers (celkovo 150 klientov), čo zanecháva 850 klientov, ktorí sú Baby Boomers. Fragment vzorkovania v rámci vrstvy pre Baby Boomers je 50/850 alebo okolo 5,88%.
Dve veci sú zrejmé: (1) Tri skupiny sú homogénnejšie v rámci skupiny ako v celej populácii. To znamená, že existuje menšia rozdielnosť, ktorá poskytuje príležitosť na väčšiu štatistickú presnosť . (2) A keďže vzorka bola rozvrstvená, bude mať dostatok členov z každej skupiny, aby bolo možné urobiť zmysluplné závery podskupín .
Štruktúrovaný odber vzoriek by mohol byť uprednostňovaný pred jednoduchým náhodným odberom vzoriek, ak je dôležité reprezentovať celkovú populáciu a reprezentovať kľúčové podskupiny obyvateľstva, najmä ak sú podskupiny pomerne malé, ale dôležité. Pomocou stratifikovaných metód odberu vzoriek môže výskumník efektívne zaistiť, aby sa podskupiny mohli rozlíšiť pri diskusii o výsledkoch výskumu.