田间试验与统计方法复习题
东北农业大学网络教育 田间试验与统计方法作业题(一)
一、名词解释(10分)
1 边际效应 :指种植在小区或试验地边上的植株因其光照、通风和根系吸收范围等生长条件与中间的植株不同而产生的差异。
2 唯一差异性原则 :指在试验中进行比较的各个处理,其间的差别仅在于不同的试验因素或不同的水平,其余所有的条件都应完全一致。 3 小概率实际不可能性原理 :概率很小的事件,在一次试验中几乎不可能发生或可以认为不可能发生。 4 统计假设 :就是试验工作者提出有关某一总体参数的假设
5 连续性矫正:χ分布是连续性变数的分布,而次数资料属间断性变数资料。研究表明,当测验资料的自由度等于1时,算得的χ值将有所偏大,因此应予以矫正,统计上称为连续性矫正。 二、填空(22分)
2
2
1、试验观察值与理论真值的接近程度称为(准确度 )。
2、试验方案中的各处理间应遵循(唯一差异性 )原则才能正确地进行处理效应的比较。
3、统计假设测验中是根据(小概率实际不可能)原理来确定无效假设能否成立。
4、A 、B 二因素试验结果分析中处理平方和可以分解
为(A 因素的平方和)、(B 因素的平方和)和(A ×B 互作的平方和)3部分。
5、用一定的概率保证来给出总体参数所在区间的分析方法称为(区间估计),保证概率称为(置信度)。 6、试验设计中遵循(重复)和(随机排列)原则可以无偏地估计试验误差。
s =7、样本标准差s =(
∑(x -)
n -1
2
s 1. 7244
==。),样本均数标准差s s =()
x
x
=0. 5453
n 10
=∑8、次数资料的χ测验中,χ=χ(
2
2
2
k 1
(O -E )
E
2
),当自由度为
=∑(1),χ=χ(
2
2
k
(i -E i -
E i
1)
2
c
C
i =1
)。
9、在A 、B 二因素随机区组试验的结果分析中已知总自由度为26,区组自由度为2,处理自由度为8,A 因素自由度为2,则B 因素的自由度为(2),A 、B 二因素互作的自由度为(4),误差的自由度为(16 )。 10、统计假设测验中直接测验的是(无效)假设,它于与(备择)假设成对立关系。
11、相关系数的平方称为(决定系数),它反映了(由
x 不同而引起的y 的平方和U =∑(ˆy -) 占y 总平方和
2
SS
y
=∑(y -ˆy )
2
)的比例。
三、简答(15分)
1 简述试验设计的基本原则及作用。 答:田间试验的设计要遵循3个原则。
1). 重复
试验中同一处理种植多个小区或种植多次称为重复,种植的小区数目称为重复次数。重复最主要的作用是估计试验误差,同时也能降低试验误差。 2). 随机排列
随机排列指试验方案所规定的每一个处理安排在试验地的哪一个小区上要排除主观因素的影响,采取随机的方式来确定。随机排列的作用是使试验结果得到无偏的估计。 3). 局部控制
局部控制是分范围分地段地控制非处理因素,使非处理因素对各处理的影响趋向最大程度的一致。局部控制的作用是减少试验误差。 2 简述试验误差来源及其控制。 答:田间试验的误差有以下几种来源: 1).试验材料固有的差异
2).试验过程中田间操作质量不一致所引起的差异 3).进行试验的外界条件的差异 试验误差的控制:
1).选择同质、一致的试验材料
2).改进农事操作和管理技术,使之标准化 3).控制引起差异的外界主要因素 3 简述方差分析的基本假定。
答:方差分析的合理性和所得结果的可靠性是建立在以下三个基本假定之上的。即:(1)对试验所考
察性状有影响的各变异来源的效应(包括环境效应)应满足“可加性”;(2)试验误差应是随机的、彼此独立的,而且作正态分布,即满足“正态性”;(3)所有试验处理必须具有共同的误差方差,即满足误差的“同质性”。
四、计算(53分)
1、有一大豆品种在A 、B 两地种植,A 地在8个点取样,测定蛋白质含量如下:41.5、42.0、41.9、41.6、41.8、41.7、41.8、41.3,B 地在6个点取样,测定蛋白质含量如下:40.5、41.0、40.8、40.7、39.9、40.4。试测验两地点的蛋白质含量差异是否显著。(t
0.05,12
=2.179)
解:(1)H 0:μ1 = μ2(即该大豆品种在A 、B 两地种植,蛋白质含量无显著差异),对H A :μ1 ≠ μ2。 (2)α =0.05。 (3)测验计算
x 1=12. 74(%)
41.7
x 2=13. 03(
%) 40.55
SS 1=∑x -
2
(∑x ) n
2
=41. 5+42. 0+ +41. 3-
222
336. 88
2
=0. 36
SS
2
=∑x -
2
(∑x ) n
2
=40. 5+41. 0+ +40. 4-
222
243. 36
2
=0. 735
故
s e =
2
SS 1+SS v 1+v 2
2
=
0. 36+0. 735
7+5
=0. 09125
s x
=
s
2e
1-x 2
(
1n 1
+
1n 2
) =0. 09125⨯(
18
+
16
) =0. 1631
t =
x 1-x 2s x
1-x 2
=
41. 7-40. 550. 1631
=7. 05
(4)推断:根据t 0.05,12=2.179,实得|t |>t 0.05,故否定H 0,即该大豆品种在甲、乙两地种植,蛋白质含量显著差异。
2、有一大豆品种比较试验,k = 6,采取随机区组设计,n = 3,产量结果如下表,试作方差分析。(F 0.05,
5,10
=3.33)
处理 A B C D E F
Ⅰ 2.3 1.9 2.5 2.8 2.5 1.6
Ⅱ 2.5 1.8 2.6 2.9 2.8 1.7
Ⅲ 2.6 1.7 2.7 2.8 2.6 1.6
解:自由度和平方和的分解
(1)自由度的分解
总变异 1DF =
T
nk -1=(3⨯6) -1=17
区组 DF r =n -1=3-1=2
品种 DF t =k -1=6-1=5 误差 DF =(n -1)(k -1) =(3-1) ⨯(6-1) -DF -DF =17-2-5=10 (2)平方和的分解
e
=DF T
r t
矫正数 C
k
n
2
=
T
2
nk
=
41. 9
2
3⨯6
=97. 534
总
nk
SS T =∑∑(x -) =∑x -C =101. 29-97. 534=3. 756
1
1
1
2
区组
n
SS
r
=k ∑(
j -) =
1
2
∑T j
k
2
-C
=
585. 456
k
t
1
k
n
j
-97. 534=0. 041
2
品种SS 误差SS
e
1
1
=n ∑(i -)
=
∑T
n
2i
-C =
303. 433
-97. 534=3. 609
=∑∑(x --x +) =
i
2
总SS
T
-区组SS
r
-品种SS
t
=3. 756-0. 041-3. 609=0. 106
2. 方差分析表—F 测验
表9-20 表9-19结果的方差分析
变异来源 区组间 品种间 误 差 总变异
DF
2 5 10 17
SS
0.401 3.609 0.106 3.756
MS
0.20 0.72 0.01
F
20.0* 72.0
*
F 0. 05
4.10 3.33
F 测验结果表明,区组间和品种间的F 值都显著。
3. 品种间比较
新复极差测验(LSR )
SE =
s e n
2
=
0. 013
=0. 0578
资料新复极差测验的最小显著极差
P 2 3 4 5 6 3.15 3.30 3.37 3.43 3.46
0. 05, 14
SSR
LSR
0. 05, 14
0.180.190.190.190.20
2 1 5 8 0
4. 试验结论
资料的新复极差测验 品 种 D E C A B F
产量()
i
5%差异显著
性 a b bc c d e
8.5 7.9 7.8 7.4 5.4 4.9
结果表明:D 品种显著高于其他品种,E 品种显著高于A ,B ,F 品种,C ,A 品种显著高于B ,F 品种,B 品种显著高于F 品种。
3、7个大豆品种的生育日数与收获指数数据如下,试建立生育日数与收获指数的回归方程并测验其显著性(r 0.05,5=0.754)。
生育[1**********]212日数 8 9 2 5 1 1 3 收获50 49 47 43 41 43 40 指数
解:回归分析所必须的6个一级数据(即由观察值直
接算得的数据);
n =7
∑x =809∑x =93725∑y =313
2
∑xy =36034
由一级数据算得5个二级数据:
∑y =14089
2
SS x =∑x -
SS
=∑y -
2
2
(∑x ) n
(∑y ) n
2
2
=93725-
=14089-
(809) 7
2
2
=227. 714
(313) 7
y
=93. 429
SP =∑xy -==
∑x n ∑y n
∑x ∑y n
=36034-
809⨯313
7
=-139. 357
=115. 571=44. 714
因而有
b =
SP SS
x
=
-139. 357227. 714
=0. 611
a =-b =44. 714-(0. 611⨯115. 571) =-25. 4
故回归方程为
ˆ=-25. 4+0. 611x •y
r =
SP SS x ⋅SS
y
=
-139. 357227. 714⨯93. 429
=-0. 955
因r
=0. 955>r 0. 05
,所以回归方程有意义,a 的意义为
生育日数为0时,大豆收获指数为-25.4;b 为生育日数每增加1 天时,大豆收获指数增加0.611。
田间试验与统计方法作业(二)
一、名词解释(5×2)
1 离回归平方和 :满足Q =∑(y -y ˆ) 为最小的直线回归方
2
程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。Q 就是误差的一种度量,称之为离回归平方和或剩余平方和。
2 总体:具有共同性质的个体所组成的集团,称为总体,总体也就是研究对象的全体
3次数资料 :凡是试验结果用某种类型出现的次数表示的,都叫做次数资料或计数资料。
4. 否定区域 :x 的抽样分布落在(x ≤μ-1. 96σ和x ≥
x
μ+1. 96σx )
区间,则为否定假设的区域,简称否定区域。
2
5. 连续性矫正:χ分布是连续性变数的分布,而次数资料属间断性变数资料。研究表明,当测验资料的自由度等于1时,算得的χ值将有所偏大,因此应予以
2
矫正,统计上称为连续性矫正。 二、填空(20×1)
1. 试验资料不符合方差分析三个基本假定时,可采取(剔除特殊值 )、(分解为若干个同质误差的方差)、(进行数据转换 )等方法补救。
1.测验若干个处理平均数间的差异显著性的多重比较一般用(SSR 测验法),测验若干个处理平均数与某一
“对照”平均数的差异显著性的多重比较一般用(PLSD 测验法)。
2. 描述样本的特征数叫(统计数),描述总体的特征数叫(参数)。
3. 当样本容量增加时,样本平均数的分布趋于(正态分布)
4. 为了测验两个样本所属的总体平均数有无显著差异,一般会因设计的不同分为(成组比较)和(成对比较)两种。
5. 已知Y 1~N (1, 12 ),Y 2~N (2,22),且Y 1和Y 2独立,则Y 1-Y 2~(-1,34 ),则Y 1+Y2~(3,34),5Y 1+Y2+2~(9,322)。
6. 某水稻品种的单株籽粒产量(克)遵循N (5,25),如以n =16x 的95%置信度的置信区间为([2.55,7.45] )。
7. 试验环境设计的基本思想是(重复、随机排列、局部控制)。
8. 试验中观察所得的数据因性状、特性不同,一般为数量性状资料和(质量性状)资料两大类,其中数量性状又分为间断性变数和连续性变数。
10. 设一样本有5个观察值,6、8、9、12、13,则x =(9.6),s =(2.88),s =(1.29 ),CV =(30%)。
x
三、简答(3×5)
1. 什么是统计假设?统计假设有哪两种?其含义分别是什么?
答:所谓统计假设就是试验工作者提出有关某一总体参数的假设。
统计推断包括统计假设测验和参数估计两个方面。统计假设测验是根据某种实际需要对未知的或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假设的测验。参数估计是指由样本统计数对总体参数做出点估计和区间估计。
2. 简述制作次数分布表的基本步骤。 答:① 求极差 ② 确定组数和组距离 ③ 确定各组的组限 ④ 计算组中值
⑤ 各观察值归组并统计各级次数 3.简述随机区组试验设计及其优缺点。
答:随机区组设计全面遵循了试验设计的3项基本原则,是一种比较精确的优良的试验设计方法。 随机区组设计的优点是:(1)能获得无偏的试验误差估计进而对试验结果进行差异显著性测验;(2)通
过局部控制能控制单方向的土壤肥力差异,有效地减少试验误差;(3)设计简单易行,单因素试验和多因素试验均可采用;(4)对试验地的要求不高,必要时不同的区组可分散设置。随机区组设计的不足之处是处理数不能太多,一般在10个左右,不超过20个。 实践中应用随机区组设计时应注意以下3个问题:(1)重复的次数要足够,一般不应少于
12 处理数-1
即4个处理时不少于5次,5个处理时不少于4次,依此类推;(2)区组的排列方向应符合局部控制原则,将土壤肥力和地势等的较大差异留在区组之间,使同一区组的各处理小区处于肥力条件较为均匀的地段,即沿肥力梯度排列区组,使区组内小区的排列方向与肥力梯度垂直;(3)设计应符合正交要求,各区组内必须包含相同的处理数,这样可以分别独立地估算处理效应和区组效应,互不混杂。
四、计算题(55)
1.从两个小麦新品系中各抽取一个随机样本,测量株高(cm )。其中一个品系的样本容量n l =40,样本平均数=83.26,样本方差S =69. 22;另一个品系的样本容量n 2 =50,样本平均数=78.22,样本方差S =49. 26。经方差同质性测验,两个品系的方差同质。试测验这两个小麦新品系的株高有无显著差异。
2
+1
11
2
2
2
解:第一步,本例只要求测验其株高有无差异,而不管孰高孰低,所以可使用两尾测验。设置H 0:
μ1=μ2
,对H A :μ
1
≠μ2
。
第二步,本例两个样本均为大样本,所以可使用两尾u 测验,显著水平α取0.05。
第三步,计算u 值。
S e =
2
(n 1-1) S 1+(n 2-1) S 2
n 1+n 2-2
2
22
=
(40-1) ⨯69. 22+(50-1) ⨯49. 26
40+50-2
=58. 1059
S 1-2=S e (
1n 1
+
1n 2
) =58. 1059⨯(
140
+
150
) =1. 6170
u =
1-2S 1-2
=
83. 26-78. 22
1. 6170
=3. 12**
1
21
2
第四步,由于u > u 0.01=2.58,则P( H0:μ=μ) 0.99;所以应否定H 0:μ=μ,接受H A :μ≠μ。推断:这两个小麦新品系的株高在1%水平上差异显著,即存在极显著的差异。
2.有一水稻品比试验,有A 1、A 2、A 3、A 4、A 5、A 6、A 7、
1
2
1
2
A 8,8个品种(k =8),采用随机区组设计,重复3次(r =3),小区计产面积40m 2,其产量结果列于表8.13,试作分析。
表8.13 水稻品比试验产量结果(kg )
品 种
I
A 1 A 2
区 组 Ⅱ 22.3 21.8
Ⅲ 23.5 22.9
20.8 22.8
A 3 A 4 A 5 A 6 A 7 A 8
21.3 20.1 26.8 21.1 19.4 20.5
23.2 19.8 25.2 22.1 18.9 22.3
25.3 22.2 27.5 18.9 23.1 20.8
表8.15水稻品比试验产量平均数的LSR 值表
p 2 3 4 5 6 7 8 SS
4. 4. 4. 4. 4. 4. 4. 3. 3. 3. 3. 3. 3. 3.
R 0.003 18 27 33 37 39 41
5
SS
R 0.021 42 55 63 70 78 83
1
解:(1)平方和与自由度的计算
总自由度 df T =kn-1=8×3-1=23 品种间自由度 df t =k-1=8-1=7 区组自由度 df r =n-1=3-1=2
误差自由度 df e =(k-1)(n -1)=(8-1)×(3-1)=14
矫正数C =kn =8⨯3=11819. 2817
T ..
2
532. 6
2
总平方和SS T =Σx -C =20.8+22.8+„„
222
+20.82-C=121.0183 区组平方
SS
r
=
∑T
k
2r
-C =
172. 8+175. 6
22
+ +184. 2
2
8
-11819. 2817=8. 8233
和
处
SS
t
理
2t
平
2
2
方
=
∑T
n
-C =
66. 6
2
+67. 5+ +63. 6
3
-11819. 2817=84. 665
误997
差平方和
SS e =SST -SS t -SS r =121.01830-84.66500-8.82333=27.52
(2)列出方差分析表,进行F 检验
表8.14 水稻品比试验产量结果的方差分析表 变 源 区组间 处
2
DF SS MS F
F 0.0
5
F 0.01
8.824.41333 1665
-
7 84.612.06.152. 4.2
理间 误 差 总变异
23 14
65 9500 1** 77 8 27.51.962997 6426 121. 0183
F 检验结果表明,8个水稻品种的小区产量间差异
极显著。因而,有必要进行水稻品种小区平均产量间的多重比较。
(3)采用SSR 法(新复极差测验)进行品种平均数间的多重比较
因为小区均数的标准误S
=
S e n
2
=
1. 966426
3
=0. 809614
根据df e =14,秩次距p =2,3,4,5,6,7,8,查SSR 临界值表计算LSR 值,结果列于表8.15。
表8.15水稻品比试验产量平均数的LSR 值表
p SSR 0.05 SSR 0.01
2 3 4 5 6 7 8 3. 3. 3. 3. 3. 3. 3. 03 18 27 33 37 39 41 4. 4. 4. 4. 4. 4. 4. 21 42 55 63 70 78 83
LSR 0.05 (小2. 2. 2. 2. 2. 2. 2.
区均数) 区均数)
45 58 65 70 73 75 76 41 58 68 75 81 87 91
表8.16 水稻品比试验品种平均产量比较表(kg ) 品种 小区平
均产量 A 5 A 3 A 2
(CK )
A 1 A 8 A 4 A 6 A 7
22.2 21.2 20.7 20.7 20.5
bc bc bc bc c
B B B B B
26.5 23.3 22.5
差 异 显 著 性 0.05 a b bc
A AB B 0.01
LSR 0.01 (小3. 3. 3. 3. 3. 3. 3.
(4) 试验结论
试验结果表明,A 5品种除与A 3品种小区平均产量无显著差异外,显著高于对照A 2和A 1品种,极显著高于其它品种,而其它品种产量间均无显著差异。本试验只有A 5品种的小区平均产量显著高于对照,其他品
种与对照均无显著差异。
3.江苏武进县测定1956—1964年间,3月下旬至4月中旬,旬平均温度累积值(x ,单位:旬·度)和一代三化螟蛾盛发期(y ,以5月10日为0)的关系列于下表。试计算其直线回归方程并测验其显著性。
解:首先由表10.1算得回归分析所必须的6个一级数据:
∑∑∑∑∑
x =35. 5+34. 1+ +44. 2=333. 7
x
2
=35. 5
2
+34. 1+ +44. 2
22
=12517. 49
y =12+16+ +(-1) =70
2
2
2
2
=794
y =12+16+ +(-1)
xy =(35. 5⨯12) +(34. 1⨯16) + +
[44. 2⨯(-1)]=2436. 4
和 n = 9
然后,由一级数据算得5个二级数据:
SS
x
=12517. 49-
19
19
2
(333. 7)
2
=144. 6356
SS
y
=794-(70) 19
=249. 5556
SP =2436. 4-
333. 79709
(333. 7⨯70) =-159. 0444
==37. 0778
==7. 7778
因而有三级数据:
b =
-159. 0444144. 6356
=-1. 0996
(天/旬·度)
(天)
a =7. 7778-(-1. 0996⨯37. 0778) =48. 5485
故得表10.1资料的直线回归方程为
ˆ=48. 5485-1. 0996x y
或化简为
ˆ=48. 5-1. 1x y
249.5556,
试测验例10.1资料回归关系的显著性。 解:由例10.1和例10.2已算得SS
SS
x
y
=
=
144.6356,SP = - 159.0444,Q = 74.6670,故
y
U =SS -Q
= 249.556 – 74.6670 = 174.8886,作F 测
验于回归关系的方差分析表10.2。
表10.2 例10.1资料的回归关系显著性测验 变异来源 回 归 离回归 总变异
现求出的F =16. 40>F
0. 01, 1, 7
DF
1 7 8
SS
174.8886 74.6670 249.5556
MS
174.8886 10.6667
F
16.40
*
F 0.01
12.25
=12. 25
,表明积温和一代三化
螟蛾盛发期是有真实直线回归关系的。
田间试验与统计方法作业(三)
一、名词解释(5×2)
1. 试验误差:田间试验的观察值中既包含了处理本身的效应,也包含了许多非处理因素的效应,我们称试验观察值中非处理因素的效应为试验偏差。
2.局部控制 :是分范围分地段地控制非处理因素,使非处理因素对各处理的影响趋向最大程度的一致。 3. 唯一差异性原则 :指在试验中进行比较的各个处理,其间的差别仅在于不同的试验因素或不同的水平,其余所有的条件都应完全一致。
4.生长竞争 :指不同处理的相邻小区之间的影响。 5. 适合性测验:这一假设测验是测验某一次数资料的样本结果是否符合假设的理论次数分布。 二、填空(21分)
1. 某样本观察值为12,14,15,15,16,17,18,15,则该样本的算术平均数为 (15.25 ),几何平均数为 (15.16 ) ,中数为 (15.5),众数为 ( 15 ). 2. 某水稻品种株高的观察值为13,15,16,16,17,17,19,16,则该样本的标准差s =(1.74),样本均数标准差s =(0.62),该水稻株高的总体平均数的
x
置信度为95%的置信区间为([ 14.91,17.34]) 。 3. 已知甲,乙两批水稻品种种子的发芽率分别为0.7和0.6, 甲,乙种子各取一粒,做发芽试验,试问有两粒发芽的概率为(0.42 ) ,至少有一粒发芽的概率为(0.88),恰好有一粒发芽的概率为(0.46 ) ,两粒都不发芽的概率为(0.12) 。
4. 在A 、B 二因素随机区组试验的结果分析中已知总自由度为26,区组自由度为2,处理自由度为8,A 因素自由度为2,则B 因素的自由度为(2),A 、B 二因素互作的自由度为( 4 ),误差的自由度为( 16 )。
5. 试验设计的三个基本原则有(重复)、(随机排列)、(局部控制)。
6. 二项总体分布的平均数和方差为(
2
σ=pq
μ=p
,
)、二项成数总体分布的平均数和方差为 ,
σx =
2
(μ
x
=p
pq n
)、二项总和数总体分布的平均数和
2∑x
方差为(μ
∑x
=np
,σ
=npq
)。
三、简答题(15分)
1. 在田间试验中,控制试验误差的主要途径有哪些? 答:试验误差的控制: 1).选择同质、一致的试验材料
2).改进农事操作和管理技术,使之标准化 3).控制引起差异的外界主要因素
2. 对比法试验,为何只能采用百分数方法进行分析?
答:对比法试验,属于顺序排列的试验设计,不能正确地估计出无偏的试验误差,因而试验结果不能采用方差分析的方法进行显著性测验,一般采用百分比法,即设对照(CK )的产量(或其它性状)为100,然后求出各处理的百分数和对照相比。 3. 简述假设测验的基本步骤。 答:(一)提出统计假设
一般讲,无效假设必须是有意义的,即在假设测验的前提下可以确定试验结果的概率。对应假设(备择假设)H A 是与H 0对立的假设。 (二)确定一个否定H 0的概率标准
这个标准叫显著(性)水平(significance level ),记作α。
(三)在“无效假设是正确的”假定下,研究样本平均数的抽样分布 (1)计算概率的方法
(2)划接受区与否定区的方法
(四)根据“小概率实际不可能性原理”接受或否定
假设
“小概率实际不可能性原理”的基本内容为:概率很小的事件,在一次试验中几乎不可能发生或可以认为不可能发生。 五、计算(54分)
1. 分别计算以下两个玉米品种的10个果穗长度(cm )的标准差和变异系数,并解释所得结果。(8分)
BS24:19、21、20、20、18、19、22、21、21、19。 金黄后:16、21、24、15、26、18、20、19、22、19。
12. 74(%)解:x =20
1
∑
s =
x
2
(-
∑
n
x )
2
n -1
s =
=
4014-
200
2
10
10-1
=1.25
x 2=13. 03(%)
18.3
∑
x
2
(-
∑
n
x )
2
s =
n -1
s =
=
3387-
183
2
1010-1
=2.06
1. 2520
⨯100%=6. 25%
BS24玉米品种:CV
=
s ⨯100CV %=s
金黄后玉米品种:CV
=⨯100CV %=
2. 0618. 3
⨯100%=11. 26%
经计算CV 比较,实际上BS24品种玉米果穗长度的整齐度好于金黄后品种。
2. 调查某农场每667m 30万苗和35万苗的稻田各5
2
块,得667m 产量(单位:kg )于下表,测验两种密度下667m 2产量的差异显著性(t 8,0.05=2.306)。(12分)
30万
4
420 440
435 445
460 445
425 420
2
苗 00 35
4
万苗 50
解:(1)H 0:μ1 = μ2(即该稻田在两种密度下,产量无显著差异),对H A :μ1 ≠ μ2。 (2)α =0.05。 (3)测验计算
x 1=12. 74(%)
428
2
x 2=13. 03(
2
440 %
3 0
)
SS 1=∑x -
2
(∑x ) n (∑x ) n
=9
2
1
2140
7-=19
5-22005
2
SS
2
=∑x -
2
=968550=550
故
s
2e
=
SS 1+SS v 1+v 2
2
=
1930+550
4+41n 2
=310
15+15
) =11. 14
s
x 1-x 2
=s
2e
(
1n 1
+) =310⨯(
t =x s -x
1x 1-x 2
2
=
428-44011. 14
=-1. 08
(4)推断:根据t 8,0.05=2.306,实得|t |<t 0.05,故接受H 0,即该稻田在两种密度下种植,产量无显著差异。
3. 有一小麦品比试验,有8个品种,采用随机区组设计,重复3次,产量列于下表,试作分析(F 0.05=2.77)。(15分)
品种 Ⅰ Ⅱ Ⅲ A 109. 12.9 1 .2 B 101214.8 .3 .0 C 111210.1 .5 .5 D 9. 10101 .7 .1 E 111316.8 .9 .8 F 101011.1 .6 .8 G 101114.0 .5 .1 H
9. 10143
.4
.4
p SSR 0
.05,14
2 3.03
3 3.18
4 3.27
5 3.33
6 3.37
7 3.39
8 3.41
解:1. 自由度和平方和的分解
(1)自由度的分解
总变异 DF =nk -1=(3⨯8) -1=23 区组 DF =n -1=3-1=2 品种 DF =k -1=8-1=7
误差 DF =(n -1)(k -1) =(3-1) ⨯(8-1)
=DF -DF -DF =23-2-7=14
(2)平方和的分解 矫正数 C =T =278. 0=3220. 16
T
r
t
e
T r t
22
nk 3⨯8
总
k 1
n 1
SS T =∑∑(x -) =∑x -C =3304. 78-3220. 16=84. 61
1
2
nk
2
t
区组SS 品种SS 误差SS
n
r
=k ∑(j -)
1k
2
=
∑T
k
2j
-C =
25981. 82
8
-3220. 16=27. 57
t
=n ∑(i -)
1
k
n
j
2
=
∑T
n
i
2i
-C =
2
9769. 19
3
T
-3220. 16=34. 08
e
=∑∑(x --x +) =
1
1
总SS
-区组SS
r
-品种SS
=84. 61-27. 56-34. 08=22. 97
2. 方差分析表—F 测验
方差分析
变异来源 区组间 品种间
DF
2 7
SS MS F
*
F 0. 05
27.56 13.78 9.40 34.08
4.87
2.97*
3.74 2.77
误 差 总变异
14 23
22.97 84.61
1.64
3. 品种间比较
新复极差测验(LSR )
SE =
s e n
2
=
. 643
=0. 74
资料新复极差测验的最小显著极差
P
SSR
0. 05, 14
2 3 4 5 6 7 8
LSR
0. 05, 14
3.03 3.18 3.27 3.33 3.37 3.39 3.41 2.24 2.35 2.42 2.46 2.49 2.51 2.52
资料的新复极差测验
差异显著性
5% a ab ab b b b b b
品 种 E B G H C F A D
产量()
i
14.2 12.4 11.9 11.4 11.4 10.8 10.7 10.0
结果表明:E 品种与H ,C ,F ,A ,D 五品种有5%
水平上的显著性,其余各品种之间都没有显著差异。 4. 某地7块麦田的基本苗数与有效穗数的观察结果如下表。试建立回归方程。(F 0.05=16.26)(15分) 基本苗数 15 x 有效穗数 y
解:回归分析所必须的6个一级数据(即由观察值直接算得的数据);
n =7
∑x =15+20+⋅⋅⋅+45=210∑x =15
2
2
20 25 30 35 40 45
39.4 40.5 42.9 41.0 43.1 45.7 49.2
+20
2
+⋅⋅⋅+45
2
=7000
∑y =39. 4+40. 5+⋅⋅⋅+49. 2=301. 8∑y =39. 4+40. 5+⋅⋅⋅+49. 2=13080. 76
2
2
2
2
由一级数据算得5个二级数据:
(∑x ) (210)
SS =∑x -=7000-=700 n 7
∑xy =(15⨯39. 4) +(20⨯40. 5) +⋅⋅⋅+(45⨯49. 2)=9254
2
2
2
x
SS
y
=∑y -
2
(∑y ) n
2
=13080. 76-
(301. 8)
7
2
=68. 3686
SP =∑xy -==
∑x n ∑y n
=30
∑x ∑y n
=9254-
210⨯301. 8
7
=200
=43. 114
因而有
b =
SP SS
x
=
200700
=0. 2857
a =-b =43. 114-(0. 2857⨯30) =34. 543
故回归方程为
ˆ=34. 543+0. 2857x •y
SP SS x ⋅SS
y
r ==
200700⨯68. 3686
=0. 914
因r =0. 914
>r 0. 05
,所以回归方程有意义,a 的意义为田间基
本苗数为0时,有效穗数为34.543;b 为田间基本苗数每增加1株时,有效穗数增加0.2857个。
田间试验与统计方法作业(四)
一、名词解释(10分)
1. 系统误差 :由于试验处理以外其他条件明显而有规律、有方向的不一致造成的定向性偏差,称之为系统误差或片面误差。
2.对照 :是试验中作为优劣比较标准的处理 3. 统计推断 :所谓统计推断,就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总体特征(参数)。
4.边际效应 :指种植在小区或试验地边上的植株因其光照、通风和根系吸收范围等生长条件与中间的植株不同而产生的差异。
5. 独立性测验:当次数资料每一变数均具有两种不同的调查目标性状时,测验两类目标性状之间的关联性,称为独立性进行测验。 二、填空(20分)
1. 把试验中某一性状的观察值与相应的理论真值接近的程度称为(准确度),把试验中某一性状的重复观
察值彼此接近的程度称为(精度度)。
2. 效应可分为(简单效应)、(平均效应)和(互作效应)。
3. 顺序排列试验设计包括(对比法)和(间比法)。 4. 每一个体某性状的测定值叫作(观察值),其若干有变异的观察值叫作(随机变数或变数)。
5. 在总体方差已知时,总体平均数μ的1-α置信区间为([x -u
α
σx , x +u ασ
x
]),在总体方差未知但为大样本时,
α
x
总体平均数μ的1-α置信区间为([x -u s , x +u s ]),在总
α
x
体方差未知且为小样本时,总体平均数μ的1-α置信区间为([x -t s , x +t s ])。
α
x
α
x
6. 某大豆品种的6株的单株荚数分别为26,31,29,39,42,49,其平均数为( 36 ),方差为( 77.6),标准差为(8.81),均数标准误为( 3.6 ),变异系数为(24.47%)。
7. 以计算(回归方程)为基础的统计方法称为回归分析,以计算(相关系数)为基础的统计方法称为相关分析。
8. 相关系数r 的取值范围为([-1,1),决定系数r 2的取值范围为([0,1)。 三、简答(15分)
1. 简述试验方案设计的要点。
答:1.根据试验目的来决定采用简单或复杂的试验方案
2.各因素水平间的差异要适当 3.试验方案中应包括对照
4.试验处理之间要遵循唯一差异原则 5.对试验结果有一定的预见性 2. 试验设计的原则及其作用。
答:田间试验的设计要遵循3个原则。 1). 重复
试验中同一处理种植多个小区或种植多次称为重复,种植的小区数目称为重复次数。重复最主要的作用是估计试验误差,同时也能降低试验误差。 2). 随机排列
随机排列指试验方案所规定的每一个处理安排在试验地的哪一个小区上要排除主观因素的影响,采取随机的方式来确定。随机排列的作用是使试验结果得到无偏的估计。 3). 局部控制
局部控制是分范围分地段地控制非处理因素,使非处理因素对各处理的影响趋向最大程度的一致。局部控制的作用是减少试验误差。 3. 论述区间估计与假设测验的关系。
答:区间估计与假设之间存在着密切的关系,区间估计亦可用与假设测验。因为置信区间是一定置信度下总体参数的所在范围,故对参数所作假设若恰恰落在该范围内,则这个假设与参数就没有真实的不同,
因而接受H 0 ;反之,如果读参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定H 0接受H A 。
区间估计与假设测验的关系可以总结为以下几点:
1.若在1-α置信度下,两个置信限的符号相同(同正或同负),则H 0:μ=μ0,H 0:μ1=μ2, H 0:μd =0,H 0:σ=0,„等皆在α水平上被否定而被接受H A ;
2.若在1-α置信度下,两个置信限为异号(一正一负),即其区间包括0,则H 0:μ=μ0,H 0:μ1=μ
2
2
, H0:μd =0,H 0:σ=0,„等皆在α水平上被接受;
3.若两个置信限皆为正号,则有μ1>μ2; 4.若两个置信限皆为负号,则有μ1
2
四、计算(55分)
1. 测定前作喷过某种有机砷杀雄剂的麦田植株样本4次,得植株体内的砷残留量为7.5,9.7,6.8,6.4(毫克);测定对照(前作未用过有机砷杀雄剂)的植株样本3次,得植株体内的砷残留量为4.2,7.0,4.6(毫克)。试测验喷洒有机砷杀雄剂是否使后作株体的砷含量显著提高。(t 5,0.05=2.015,提示:一尾测验)。(15分)
解:(1)H 0 :μ1≤μ2 ,对H A :μ1>μ2。
(2)α = 0.05。
(3)测验计算
x =7. 6 x =5. 27 SS =6. 5 SS =4. 59 s =6. 53++42. 59=2. 218
1
2
1
2
2
e
故 s
x 1-x 2
=2. 218⨯(
14
+
13
) =1. 137
-5. 27
t =7. 6
1. 137
=2. 05
(4)推断:t 5,0.05=2.015,实得|t |>t 0.05,故否定H 0,接受H A ,即喷洒有机砷杀雄剂使后作株体的砷含量显著提高。
2. 有一马铃薯品比试验,有7个品种,采用随机区组设计,重复3次,产量列于下表,试作分析(F 0.05=3.88,F 0.01=6.93)。(22分)
品 种 A B C D E
区 组 Ⅰ
Ⅱ
Ⅲ
74.0 72.0 70.0 39.0 36.0 45.0 69.0 55.0 56.5 60.0 70.0 65.2 69.0 78.1 65.5
F G
70.0 69.0 68.2 42.5 47.0 38.7
解:1. 自由度和平方和的分解 (1)自由度的分解
总变异 DF T
=nk -1=(3⨯7) -1=20 区组 DF r
=n -1=3-1=2 品种 DF t
=k -1=7-1=6
误差 DF e
=(n -1)(k -1) =(3-1) ⨯(7-1)
=DF T -DF r -DF t
=20-2-6=12(2)平方和的分解
矫正数 22
C =T =1239. 7=73183. 62nk 3⨯7
总k
n
SS
2
nk
2
T
=∑∑(x -) =∑x -C =3703. 71
1
1
1
区组n
SS r
=k ∑(2
T
2j
j -)
=
∑-C =
513165. 47
7
-73183. 62=125. 73
1k
品种k
2SS t
=n ∑(2
i -)
=
∑T
i
=
223201. 13
1
n
-C 3
-73183. 62=2883. 42
误差k
n
SS
--x +) 2
e
=∑∑(x j
i
=
SS
T
-区组SS
r
-品种SS
t
1
1
总
= 693.95
2. 方差分析表—F 测验
方差分析
变异
DF SS MS F
F 0. 05
来源 区组间 2 125. 62.873 7 1.09 品种8.31
间 6 2883480. .42 57 *
误 差 12 693. 57.895 3 总变异
20
3. 品种间比较
新复极差测验(LSR )
2
SE =
s e 57. 83n
=
3
=4. 39
资料的新复极差测验
品 种
产量(i )
差异显著性3.88 6.93
5%
A F D E C G B
72 69.1 65.1 64.2 60.2 42.7 40
a a a a a b b
1%
A
A A A A
B B
结果表明:A ,F ,D ,E , C,品种与G 和B 品种有1%水平上的显著性,A ,F ,D ,E , C,品种之间差异不显著。
3. 山东临沂10年间7月下旬的温雨系数(雨量mm/平均温度℃)和大豆第二代造桥虫发生量(每百株大豆上的虫数)的关系如下表。试建立回归方程。(r 0.05=0.632)(18分)
温雨系1.59.99.41.20.32.411. 1.86.05.9数x
8
8
2
5
1
01 5
4
2
虫口密180 28 25 117 165 175 40 160 120 80 度y
解:回归分析所必须的6个一级数据(即由观察值直接算得的数据);
n 10
∑x =1. 58+9. 98+⋅⋅⋅+5. 92=49. 76∑x =1. 58
2
2
+9. 98
2
+⋅⋅⋅+5. 92
2
=394. 46
∑y =180+28+⋅⋅⋅+80=1090∑y =180
2
2
+28
2
+⋅⋅⋅+80
2
=153348
∑xy =(1. 58⨯180) +(9. 98⨯28) +⋅⋅⋅+(5. 92⨯80)=3351. 64
由一级数据算得5个二级数据:
(∑x ) (49. 76)
SS =∑x -=394. 46-=145. 85 n 10
2
2
2
x
SS
y
=∑y -
2
(∑y ) n
2
=153348-
(1090) 10
2
=34538
SP =∑xy -==
∑x n ∑y n
∑x ∑y n
=3351. 64-
49. 76⨯1090
10
=-2072. 2
=4. 976=109
因而有
b =
SP SS
x
=
-2072. 2145. 85
=-14. 21
a =-b =109-(-14. 21⨯4. 976) =179. 71
故回归方程为
ˆ=179. 71-14. 21x •y
r =
SP SS x ⋅SS
y
=
-2072. 2. 85⨯34538
=-0. 923
因r =0. 923>r ,所以回归方程有意义,a 的意义为7月下
0. 05
旬的温雨系数为0时,大豆第二代造桥虫发生量为179.71;b 为7月下旬的温雨系数每增加1 mm/℃时,大豆第二代造桥虫发生量减少14.21个。
田间试验与统计方法作业(五)
一、名词解释(10分)
1 试验方案 :是根据试验目的和要求所拟定的将在试验中进行研究比较的试验材料或方法的统称。 2 误差:试验误差都是指由偶然因素造成的试验观察值与处理理论真值之间的无规律的偏差。 3概率 :设事件A 在n 次试验中出现了m 次,随着n 的增加,事件A 出现的频率m/n所稳定趋近的数值为事件的概率。
4 无效假设 :假设总体参数与某一指定值相等或假设两个总体参数相等,即假设其没有效应,这一假设称为无效假设,记作H 0。
5 成组数据:如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论两处理的样本容量是否相同,所得数据皆称为成组数据。以组(处理)平均数作为比较的标准。 二、填空(20分)
1. 根据非处理效应产生的原因不同,可将试验误差分为(系统误差)和(随机误差)。
2. 效应可分为(简单效应)、(平均效应)和(互作效应)。
3. 由总体的全部观察值算得的描述总体特征的数值,
称为( 参数),由样本的全部观察值算得的描述样本特征的数值,称为(统计数)。
4. 变数资料的性质有集中性和分散性,其中表示集中性的统计数为(平均数),表示分散性的统计数为(变异数) )。
5. 参数估计包括(点估计)和(区间估计)
6. 根据否定区间的个数,假设测验可分为((一尾测验)和(两尾测验)
ˆ 0. 4,当调查7. 白菜蚜虫的田间为害率的统计概率为p
的样本容量为100株时,则抽样成数分布的总体平均值为( 0.4)、总体方差为(0.0024),抽样次数分布的总体平均值为(40)、总体方差为(24)。
8. 随机区组试验设计的原则为重复)、(随机排列)、(局部控制) 三、简答题(15分) 1. 简述方差分析的基本原理。
答:方差分析的基本原理是将总变异分裂为来源于各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度;除了可控因素所引起的变异外,用其他剩余变异来准确而无偏的估计试验误差,作为统计假设测验的依据;再通过显著性检验—F 测验,发现各个因素在变异中所占的重要程度,
进而对无效假设H :μ=μ= =μ(各样本的总体平均数相
1
2
k
等)作出统计推断。
2. 简述回归分析与相关分析的异同。
答:对两个变数进行回归分析就是定量地研究X 和Y 的数值变化规律,根据这种规律可由一个变数的变化来估计另一个变数的变化。在回归模型中,两个变数有因果关系,原因变数称自变数(independent variable ),一般用X 表示;结果变数称依变数(dependent variable ),以Y 表示。X 是已知的或是可控制的,没有误差或误差很小,而Y 则不仅随X 的变化而变化,还要受到随机误差的影响。
X 和Y 间数值变化关系用回归方程来描述。回归分析就是用试验或调查得到的样本数据,建立回归方程并对其进行测验显著后,应用该方程根据X 的变化来估计Y 的变化,从而达到预测(报)的目的。
对两个变数进行相关分析,其目的是研究X 和Y 间有无相关以及相关程度、相关性质(方向)。在相关模型中,两个变数是平行的,没有因果关系的自变数和依变数之分,且皆有随机误差。
X 和Y 间的相关与否,用表示相关特征的统计数r 来反映,r 称相关系数。相关分析就是用样本数据计算出r ,并对其进行测验后,就可以回答X ,Y 间有无相关和相关程度等问题。
3. 简述方差分析的基本假定及对于不符合方差分析基本假定的试验资料的补救办法。
答:方差分析的合理性和所得结果的可靠性是建立在以下三个基本假定之上的。即:(1)对试验所考察性
状有影响的各变异来源的效应(包括环境效应)应满足“可加性”;(2)试验误差应是随机的、彼此独立的,而且作正态分布,即满足“正态性”;(3)所有试验处理必须具有共同的误差方差,即满足误差的“同质性”。
对于一些不符合方差分析基本假设的试验资料,在进行分析之前,一般可采用以下补救方法: (1)剔除某些表现“特殊”的观察值、处理或重复;
(2)将总的试验的方差分裂为几个较为同质的试验误差的方差;
(3)针对数据的主要缺陷,采用相应的数据转换;再用转换后的数据进行方差分析。 四. 计算题(45分)
1. 甲、乙两个大豆品种,在6个地点进行对比试验,产量如下(KG/小区),试作差异显著性测验。(成对法,t 0.05=2.571) (10分) 地点
1
2
3
4
甲品种 2
8
5 56
6 35
70
27
30
乙品种 2
6
解:(1)H 0:μ
H A :μ
d
d
50
=0
30
25
44
29
, 即甲乙两品种的产量差异不显著;
≠0
。
(2)α=0.05 (3)测验计算
差值为2,20,-3,5,12,6
d =7
∑d -
2
(
∑
d n
)
2
618-=
427
2
s =
n -1s n
7. 817
7-1
=7. 81
s d =
==2. 951
t =
d s d
=
72. 951
=2. 372
d
(4)因t
,接受H 0:μ
=0
, 即甲乙两品种的产量差异
不显著。
2. 5个小麦品种比较的随机区组试验,试验结果如下(KG/小区),试作方差分析。(F 0.05=3.26)。(20分) 品种 A B C
区组
Ⅰ 4 3 6
Ⅱ 5 2 7
Ⅲ 4 3 6
Ⅳ 4 2 4
D 4 3 5 4 E 2
3
3
3
p 2 3 4 5 p
SSR 0.03.03.23.33.3SSR
5
8 3 3 6
0.05
解:2
C =
T
77
2
nk
=
4⨯5
=296. 45
SS 2
T =∑x -C =333-296. 45=36. 55
v
T
=19 SS ∑T 2
i
t =n -C =
12954-296. 45=27. 3 v
t
=4
2
SS ∑T
j
1491
r =
k -C =
5
-296. 45=1. 75
v r
=3
SS
e
=7. 5 方差分析表
变异来源 DF SS MS 区组间 3 1.75 0.583 处理间 4 27.3 6.825 误差 12 7.5 0.625 总变异
19
36.55
结论:不同品种间差异显著。 (2)多重比较
2
SE =
S e n
=
0. 6254
=0. 395
LSR 值表
p
2 3 4 5
v
e
=12
F *
10.92
SSR 0.03.03.23.33.3
5
8 3 3 6
LSR 0.01.21.21.31.3
5
2 8 2 3
新复极差测验表 处理 平均
数 C A D E B
异不显著。
3. 某地六年测得大豆产量(Y )与大豆鼓粒期土壤温度(X )的关系,试建立二者的回归方程,并测验方程的显著性。(r 0.05=0.847) (15分) X (%) 29 Y (KG/138 亩)
解:回归分析所必须的6个一级数据(即由观察值直接算得的数据);
5%差异显著
性 a b b b b
4.75 3.25 3 2 2
结论:C 品种产量显著高于其他品种,其他品种间差
19 71
24 110
24 98
23 91
19 83
n =6
2
∑x =138∑x =3244∑y =591
∑xy =14013
由一级数据算得5个二级数据:
∑y =60959
2
SS x =∑x -
SS
=∑y -
2
2
(∑x ) n
(∑y ) n
2
2
=3244-
=60959-
(138) 6
(591) 6
2
2
=70
y
=2745. 5
SP =∑xy -==
∑x n ∑y n =23
∑x ∑y n
=14013-
138⨯591
6
=420
=98. 5
因而有
b =
SP SS
x
=
42070
=6
a =-b =98. 5-(6⨯23) =-39. 5
故回归方程为
ˆ=-39. 5+6x •y
r =
SP SS x ⋅SS
y
=
42070⨯2745. 5
=0. 958
因r
=0. 958>r 0. 05
,所以回归方程有意义,a 的意义为大豆
鼓粒期土壤温度为0时,大豆产量为-39.5公斤;b 为大豆鼓粒期土壤温度每增加1℃时,大豆产量增加6公斤。