第十三章抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定.

第十三章抽样原理和方法

本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定

第一节抽样的概念

前面已经介绍，总体在很多情况下，往往是很大的，有时是无限的，因此，对总体的研究往往是不可行的而生物统计学的特点之一是其概率归纳原理，即通过对某一特定的、具体的样本进行分析，在一定概率保证下进行总体的推断例如，对水体污染进行检查，对空气质量检查，不需要也不可能对整个水体、整个空气逐一进行检查，只需要抽取一小部分的水、空气进行分析

被抽取的这一小部分水、空气就是样本抽取水和空气的这一过程就是抽样的过程如何抽样？抽样应当遵循什么原则？什么样的样本才能认为符合标准？这是本章要讨论的问题

抽样需遵循的总的原则是：样本必须来自于所研究的总体样本必须能代表所研究的总体抽样方法必须与抽样目的相一致抽样认真、抽样方法正确、客观，样本就具有代表性；反之，抽样马虎、草率、武断、主观、弄虚作假，样本就差，就不具有代表性

第二节抽样方法

试验、调查的目的不同，试验、调查的方法不同、抽样的方法也不同

一、随机抽样法总体比较整齐、变异程度小、群体分布均匀，可用随机抽样法随机抽样法的原则是：总体内每一个体（数据）都有同等的机会进入样本样本中每一个体（数据）进入任何一个组的机会也是相等的随机抽样法可以完全排除个人的主观性随机抽样法是最简单、最常用的抽样方法

随机抽样法有以下几种方法：抓阄法随机数字法伪随机数字法通过随机抽样法得到样本后，一般需计算样本的特征值，用以估计总体参数几乎所有调查和试验都可以采用随机抽样法进行抽样

二、整群抽样和多层次抽样法从总体中抽取数个样本单位群，对单位群内的全部个体作全面调查，或用整个单位群进行试验样本单位群的抽取既可以用随机抽样法得到，也可以有选择地取得在整群抽样的基础上，对抽得的样本单位群不作全面调查，或不是整个样本单位群进入试验，而是在样本单位中继续抽取一定量的个体（数据）组成样本，这就是二级抽样

如果二级抽样得到的不是个体（或数据），而是更小的单位群，再从中进行抽样，这就是三级抽样以此类推二级及二级以上的抽样就称为多层次抽样多层次抽样方法适合于资源调查、传染病（寄生虫病）调查、流行病学调查、经济学调查、遗传学试验、育种学试验，等

三、顺序抽样法顺序抽样法适合于总体不是很大、且较均质的情况将总体内的个体或数据按一定的规则顺序排列，根据总体和样本的关系按一个比例从总体中抽取一批个体或数值组成样本例如，总体编号后按凡能被 15 除尽的个体或数据抽取出来组成样本

当总体比较整齐、均质，而编号又是按随机的原则进行的，则这一差异方法可最大限度地避免人为的影响和干扰但顺序抽样法所得到的样本其统计量是没有统计学意义的，也不能原来估计参数且当总体的排序具有周期性变化，而这种周期性变化恰好与抽样相重时，所得样本将严重失实因此顺序抽样法一般不单独使用，而是与其他方法结合，如可以和随机抽样法结合、与整群抽样法结合，等等

四、分层按比例抽样法当总体不均质、而且可以被分成几个子总体，每一个子总体与其他子总体的差距较大，每一个子总体在总体中的比例比较清楚，可以使用这一抽样方法首先对总体有一个全面的初步的了解：总体有哪几部分组成，各个子总体在总体中占多大的比例然后确定样本的大小，样本与总体的比例然后确定每一个子总体中的抽样比例最后将各个子样本汇总

这种抽样方法如果操作得当所得样本比较精确从样本得到统计量后用以估计参数比较可靠但这种抽样方法比较繁琐，且一旦对总体的了解不够全面，反而容易发生导向性错误分层次按比例抽样法适合于社会学调查、经济学调查、疫病调查、饲养学试验、牧草学试验、遗传学试验、育种学试验例如，调查某一城市居民的消费情况，可以将人群按年龄分成几个子总体进行调查，也可以按文化层次分组，也可以按职业分组，更详细的分组可以将几个因素同时考虑，等等

五、双重抽样法当所研究的性状比较复杂，或所需经费较多，或须将试验动物宰杀后才能测定，因而不大可能进行重复性试验，或采用直接抽样试验，或试验有较大的难度，可采用双重抽样法采用双重抽样法，首先需将所需要进行研究的性状定为目标性状（或称为靶性状），用 y 表示，然后根据文献或其他方法确定一个或几个简单易测、不具破坏性、与靶性状相关性比较紧密的性状，这些性状称为辅助性状，用 x i 表示

从总体中抽取两个样本，一个大样本，一个小样本先对小样本进行调查，或先用小样本进行试验，对这一小样本既测 y 性状，同时也测 x i 性状，获得 n 对 y 和 x i ，并建立 x i 与 y 的回归方程，最简单的回归方程就是只有一个 x i 的简单回归方程，也可以是曲线回归方程，也可以建立多元回归方程建立回归方程的原则是其 r （或其绝对值）或 R 必须很大，以表明用 x 或 x i 估测 y 其效果比较好而较大的样本在调查或试验中仅测 x i 性状，并将这一样本中所有被测个体的 x i 代入上述回归方程中以求得相应的 y 估计值

这样获得的较大样本 y 的估计值，能达到一定的精度这一抽样方法即为双重抽样法双重抽样法的优点是：对于复杂性状的调查或试验仅需破坏较小的样本即能获得较大样本的精确性当目标性状为破坏性性状时，这是唯一行之有效的方法

双重抽样法的适用范围：遗传学试验、育种学试验、繁殖学试验、生理生化学试验、疾病防治试验，等双重抽样法示意图： x y y=b 0 +Σb i x i x 总体 μ y i 小样本大样本

第三节样本容量

样本容量越大，试验结果就越具有代表性，调查的精确性、准确性也越高但随着样本容量的增大，抽样或试验的成本也越大，当样本容量大到一定程度时，再增大样本容量，试验或调查其精确性的提高就渐趋缓慢：当标准差一定时，标准误的大小与样本容量的平方根成反比，样本容量较小时，随着样本容量的增长，标准误会急剧减小，但当样本容量大到一定程度后再增大样本容量，标准误的减小将会变得越来越慢，即继续增大样本容量，试验精确性的提高其效能将逐步下降

但随着样本容量的增大，试验或调查所需成本、时间、人力、物力等则可能会成倍地增长因此确定一个合宜的样本容量，使得试验或调查既有一个较好的精确度，又能最大限度地节省人力和时间、财力、物力，是试验或调查必须要考虑的问题

样本容量的确定原则和确定方法总体有限、且很大时，同时主要抽样的代表性，样本可占总体的千分之一到百分之一总体不很大时，样本占总体的百分之五率的计算，一般要求大样本在试验中，同一水平或同一组合的变异情况越严重，所需样本越大，同一组合的供试动物越整齐，可适当减少动物数试验越规范，试验结束后使用的统计方法越严格，所需动物数可适当减少

小家畜的供试数应多一些，大家畜的供试数可适当少一些试验时，考虑的因子数越多，每一组合内的供试动物数可少一些，单因子试验则每一水平内的供试动物数应多一些在不知道总体的大小和情况时，可以从试验要求的精确性来考虑样本容量：

根据参考文献、他人或自己的经验、专业知识等人为地定出一个样本平均值与总体平均值的离差，即允许误差 L ：而其中，一般取 1.96 （置信度为 95% ）因此：显然，人为定出的允许误差越大，所需样本量就小

反之，人为定出的允许误差越小（即对试验的要求的精确度越高），所需的样本量就越大一般来讲，当所需要的样本量不大时（ n<100 ），应当进行反复试求，最后使得 n 稳定在某一个值上，如果发现所得 n 偏大或偏小，还应当调整 L 值重求 n 例：已知一总体大致的标准差为 9.7 ，若规定在抽样时允许存在 L = 2.5 的误差，求抽样时的样本容量

又例：总体的大致标准差为 15.9 ，调查允许误差为 L = 10 ，求调查所需样本容量暂设则由于 n 较小，因此应重求 n 值，查 t 值表，得则所求样本容量已稳定在 n = 12 ，即该次抽样的样本容量为 n = 12

当调查或试验的对象是质量性状，因而所得结果为率、百分数等，其所需样本量也是先设一个 L 值应注意允许误差的取值应小于百分率应注意调查成数性状时，样本一定不能太小例：设总体率 p = 0.7 ，规定调查时的允许误差为 L = 0.075 ，求所需样本容量

关于允许误差 L 的取值允许误差 L 即为置信半径，如何确定允许误差，这关系到样本容量的大小，也决定了试验或调查的成败因此允许误差的确定是试验或调查前需要慎重考虑的问题从前面所介绍的公式和例题中我们已经看出，当总体方差（标准差）基本确定后，样本容量（即试验规模）与允许误差的大小是有直接的关系的而总体方差的大小可以根据前人的结果所得到

那允许误差又如何确定？一是需要查阅大量的文献，从类似的试验或调查中确定本次试验或调查的规模二是根据自身试验或规模的大小来确定，这里需要考虑的一个主要问题是试验或调查的资金来源和经费的充裕程度三是需要考虑试验或调查的精确程度：允许误差实际就是样本平均值与总体平均值的差距最大不超过的某一界限，因此它决定了试验或调查的精确程度

一旦确定了允许误差，就可以用试验或调查结束后得到的样本平均值来告诉人们总体平均值在哪一个可能的范围里面，这一个结论就有了理论依据，不致被人所诘难或质疑因此确定允许误差得到的样本容量不宜太小（样本容量太小试验或调查的结果比较粗糙，也易引起别人的质疑），但也不需要太大（太大需要大量的经费和人力、物力、时间）由于求率、成数等所需要的样本容量还是尽可能大一些为好

第四节抽样误差的估计

抽样误差，一般用标准误来表示，因此，估计抽样误差，就是求标准误的大小标准误既与标准差有关，也与样本容量有关样本不同，所得到的误差不同抽样方法不同，所得到的抽样误差也不同由于抽样误差表示的是样本平均数与总体平均数之间的差异，因此，为了使总体平均数的估计更可靠、更精确，应当使用合适的抽样方法标准误求得以后，应计算总体平均值的置信区间 (*)

第十三章抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定.

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "第十三章抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定."— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια

Είσοδος

Σύνδεση μέσω των κοινωνικών δικτύων:

第十三章 抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原 则、几种主要的抽样方法；样本含量 的确定.

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "第十三章 抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原 则、几种主要的抽样方法；样本含量 的确定."— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια

第十三章抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定.

Παρουσίαση με θέμα: "第十三章抽样原理和方法. 本章主要讨论了抽样的概念、抽样的原则、几种主要的抽样方法；样本含量的确定."— Μεταγράφημα παρουσίασης: