问卷调查的样本量到底需要多少？

样本量是问卷调研的基本问题

开始问卷调研前，几乎每个研究者都会问：我需要收集多少份问卷？这个问题看似简单，但答案取决于多个因素。样本量太大浪费资源，太小则结论不可靠。

总体规模——目标总体越大，需要的样本量越大，但增长不是线性的。当总体超过一定规模后，样本量的增长对精度的提升非常有限。

可接受的误差范围——你愿意接受多大的抽样误差？通常调研使用5%的误差范围。如果需要更精确的结论（如3%），样本量需要显著增加。

置信水平——通常使用95%的置信水平。如果需要99%的置信水平，样本量需要增加约74%。

预期的变异程度——总体中回答的异质性越大，需要的样本量越大。如果不确定，假设50%的变异（最保守的假设）。

n = (Z的平方 x p x (1-p)) / E的平方。其中Z是置信水平对应的Z值（95%对应1.96），p是预期比例（不确定时用0.5），E是误差范围。按95%置信水平和5%误差计算，需要约385份样本。

探索性研究——100到200份通常足够。

描述性研究——至少300份，建议500份以上。

因果推断研究——需要功效分析来确定。通常需要较大的样本量。

结构方程模型——建议样本量是观测变量数的10到20倍。

误区一：样本越大越好——超过一定规模后，边际收益递减。与其收集5000份低质量问卷，不如收集500份高质量问卷。

误区二：忽视有效样本率——不是所有收集到的问卷都是有效的。通常需要在目标样本量的基础上增加20%到30%的余量。

样本量的确定应该基于统计学原理和实际资源条件，而不是拍脑袋。花10分钟算一下，比事后发现样本不够要好得多。