样本量是问卷调研的基本问题
开始问卷调研前,几乎每个研究者都会问:我需要收集多少份问卷?这个问题看似简单,但答案取决于多个因素。样本量太大浪费资源,太小则结论不可靠。
影响样本量的关键因素
总体规模——目标总体越大,需要的样本量越大,但增长不是线性的。当总体超过一定规模后,样本量的增长对精度的提升非常有限。
可接受的误差范围——你愿意接受多大的抽样误差?通常调研使用5%的误差范围。如果需要更精确的结论(如3%),样本量需要显著增加。
置信水平——通常使用95%的置信水平。如果需要99%的置信水平,样本量需要增加约74%。
预期的变异程度——总体中回答的异质性越大,需要的样本量越大。如果不确定,假设50%的变异(最保守的假设)。
简单随机抽样的样本量公式
n = (Z的平方 x p x (1-p)) / E的平方。其中Z是置信水平对应的Z值(95%对应1.96),p是预期比例(不确定时用0.5),E是误差范围。按95%置信水平和5%误差计算,需要约385份样本。
不同研究类型的样本量建议
探索性研究——100到200份通常足够。
描述性研究——至少300份,建议500份以上。
因果推断研究——需要功效分析来确定。通常需要较大的样本量。
结构方程模型——建议样本量是观测变量数的10到20倍。
常见误区
误区一:样本越大越好——超过一定规模后,边际收益递减。与其收集5000份低质量问卷,不如收集500份高质量问卷。
误区二:忽视有效样本率——不是所有收集到的问卷都是有效的。通常需要在目标样本量的基础上增加20%到30%的余量。
结语
样本量的确定应该基于统计学原理和实际资源条件,而不是拍脑袋。花10分钟算一下,比事后发现样本不够要好得多。