您好!欢迎访问宁波市农科院网站,今天是2017年10月20日
加入收藏 设为首页 个性化定制 纯文字索引 Institute 繁体中文 RSS 微信二维码  移动版
 
天气预报  
本站 Web搜索 网站群  
 
本院期刊
    返回     上一篇     下一篇
 
您的位置:首页 | 本院期刊 | 《宁波农业科技》  
  《宁波农业科技》
主成分和聚类分析在 蟹爪兰资源评价和育种中的应用
作者:赵天荣    更新时间:2017-03-29 点击数:1262
 主成分和聚类分析在

蟹爪兰资源评价和育种中的应用 *

赵天荣,徐志豪,蔡建岗

( 宁波市农业科学研究院  315040 )

摘要:应用DPS 统计软件25个蟹爪兰品种(系)资源的16个生物学性状进行了主成分分析和聚类分析按照方差累计贡献率88.2% 提取了7 个主成分通过计算各品种的主成分得分和综合得分值分析出综合性状优良和主要性状突出的品种另外通过16个性状的相关矩阵R分析得出各个性状间的相关性,以利于亲本和杂交后代的筛选。根据聚类分析结果25个供试品种(系)从株高、冠幅、茎节长等主要生物学性状的差异聚为3大类,并细分为7小类,为蟹爪兰的分类和良种选育与利用提供理论依据。

关键词:蟹爪兰;品种资源;主成分分析聚类分析;生物学性状

     传统的花卉品种资源分类习惯以单一性状归类如大花型、早花型等,这种分类方法便于保存和查找品种资源。但是单一性状选择存在许多弊端如性状间不同程度的相关性以及某些性状遗传力很低等都会影响选择的效果[1]。由于蟹爪兰是一种多性状的观赏植物且绝大多数性状是生物学性状,凭单一性状难以准确区别材料之间的遗传差异,不可避免地使杂交育种和杂优利用的亲本选配工作具有盲目性。另外蟹爪兰从杂交授粉到杂交子代开花要3~4年的时间[2],盲目选配无疑会造成人力、物力和时间的浪费,因而人们寻求新的技术并进行多性状的综合选择如主成分分析法,选择指数法,典范性状独立地方向性选择法等。主成分分析法在黄瓜、胡麻、棉花、南瓜、番茄等作物育种中成功应用[1,3,4,5,6]主成分分析采用客观赋权法,克服了主观赋权的随意性,使权重系数更客观合理[7]主成分分析是在不损失过多信息基础上的一种降维思想,这使得人们在育种过程中可以把分散在多个单一性状的注意力集中到少数几个主分量性状上分析,降低了自交系选择及杂交组合评价时的难度[1]聚类分析是研究资源分类和亲缘关系的常用方法之一[8-9],在大豆、花椰菜、百合等植物中均有报道[10-13]该文对蟹爪兰的主要观赏性状进行了调查研究,并分别运用主成分分析法和系统聚类法进行分析,进一步探讨蟹爪兰亲本及杂交后代选优的数量化方法,为蟹爪兰的分类和良种选育与利用提供理论依据。

1 材料与方法

试验地点为宁波市高新农业实验园区智能温室,海拔4.0~5.8m年最低气温-8.5 ℃,年最高气温39.5 ℃;年平均降水1440.37mm。宁波地区春、秋和冬季雨水充足,气候湿润,夏季温度较高,光照较强且干旱少雨[14]。以栽培2年的25个蟹爪兰品种()资源为试验材料,采用节能栽培模式,冬季不加温,温度低于5℃时用内保温幕保温;夏季进行适当遮光,防止其灼伤。

各材料均考察16个性状,x1-株高、x2-冠幅、x3-茎节长、x4-茎节宽、x5-茎节厚、x6-主枝数、x7-分枝数、x8-茎节裂刻数、x9-花长、x10-花冠宽、x11-花瓣数、x12-雌蕊长、x13-雄蕊长、x14-雄蕊数、x15-单花期、x16-着蕾量。以1号为对照种,随机区组设计,3次重复。每小区随机抽样10株观察记载必要的性状。

 应用统计分析软件DPS对测量的25个蟹爪兰品种(系)的16个生物学性状进行主成分分析并根据计算出的各品种(系)的主成分值进行聚类分析。

2  结果与分析

2.1 主成分分析

2.1.1 主要性状的主成分贡献率和累计方差贡献率

 本文对25分蟹爪兰品种(系)的16个生物学性状作主成分分析主要用于简化数据结果寻找综合因子。25个蟹爪兰品种(系)生物学性状的主成分分析结果见表1。由蟹爪兰主要性状相关矩阵的特征根计算其方差贡献率和累计方差贡献率。由表1可知,前7个主成分的累计方差贡献率为88.2%,表明前7个主成分代表了蟹爪兰性状88.2%的综合信息,而其他主成分在蟹爪兰性状分析中所起的作用仅为11.8%。因此,选用前7个主成分作为蟹爪兰综合性状的重要主成分。这里取前7个主成分是满足i/i0.85的最小个数[15],因子负荷量反映原变量与主成分之间的关系, 这里表示各品种资源各性状所对应的综合指标贡献的大小。

1  25个蟹爪兰品种(系)主要性状的主成分贡献率和累计贡献率

主成分

特征根

贡献率/%

累计贡献率/%

1

4.7394

29.6213

29.6213

2

2.8242

17.651

47.2723

3

1.8722

11.7013

58.9736

4

1.5009

9.3807

68.3542

5

1.3946

8.716

77.0702

6

1.1578

7.2365

84.3067

7

0.6235

3.8968

88.2034

2.1.2 主要性状相关矩阵的特征向量及其相关系数

由表2 蟹爪兰主要性状相关矩阵的特征向量看出,主成分1中,茎节长、茎节宽、雄蕊长和雄蕊数具有较大的正系数,表明主成分1 主要反应了蟹爪兰茎节性状和雄蕊性状的综合指标;主成分2中,花长、花冠宽、分枝数和着蕾量具有较大的正系数,表明主成分2主要是反应了蟹爪兰的花部性状和多花性状的综合指标;主成分3中茎节厚、茎节裂刻数、雄蕊数具有较大的正系数,表明主成分3主要反应了蟹爪兰茎节性状和雄蕊性状的综合指标;主成分4中,株高、冠幅、和主枝数具有较大的正系数,表明主成分4主要反应了蟹爪兰生长情况的综合指标;主成分5中,茎节裂刻数和主枝数具有较大的正系数,表明主成分5主要反应了蟹爪兰茎节性状和生长情况的综合指标;主成分6中,花瓣数、茎节厚和株高具有较大的正系数,表明主成分6主要反应了蟹爪兰花瓣性状、茎节性状和生长情况的综合指标;主成分7中,花瓣数和株高具有较大的正系数,表明主成分7主要反应了蟹爪兰花瓣性状和生长情况的综合指标。

2  25个蟹爪兰品种(系)主要性状的特征向量

性状

1主成分

2主成分

3主成分

4主成分

5主成分

6主成分

7主成分

x1

0.2061

0.1934

0.2855

0.4283

0.0217

0.3071

0.3187

x2

0.0455

0.2768

0.1531

0.5189

-0.3194

0.1026

-0.4056

x3

0.3575

-0.0779

-0.1966

0.1959

0.2424

0.0643

-0.029

x4

0.34

-0.0053

-0.1867

0.2838

-0.1235

-0.0815

-0.4156

x5

0.1485

-0.3352

0.3217

-0.0215

0.3031

0.3363

-0.0018

x6

0.0393

-0.1498

-0.1221

0.4481

0.3568

-0.5165

0.2621

x7

-0.3578

0.2986

0.1804

0.1158

0.0101

-0.0129

0.2205

x8

0.1607

0.2282

0.3484

-0.1819

0.4321

0.1809

-0.2894

x9

0.2496

0.4002

-0.1374

-0.1487

0.0218

-0.0127

0.2122

x10

0.0055

0.3752

-0.3545

-0.1585

0.2929

0.2114

-0.0986

x11

0.209

-0.119

-0.3605

0.0917

-0.1391

0.5045

0.4201

x12

0.3515

0.1707

0.1158

-0.0664

0.0079

-0.3386

0.2401

x13

0.3366

0.2255

0.2347

-0.1555

0.0825

-0.2222

0.0476

x14

0.1673

-0.2702

0.4366

-0.0793

-0.2803

-0.0025

0.154

x15

0.2277

0.1844

-0.0317

-0.2418

-0.4743

-0.0658

0.0812

x16

-0.3345

0.319

0.1207

0.1775

0.0391

0.0622

0.1945

根据7个主成分的因子负荷量的大小,筛选出贡献率较大的7组性状因子即

x3x4x12x13}、{x7x9x10x16}、{x5x8x14}、{x1x2x6}、{x5x6x8}、{x1x5x11}、{x1x11}。

2.1.3  16个性状的相关矩阵R

由表3(见尾页)可以得出:株高与冠幅、雄蕊长、雌蕊长具有较强的相关性,相关系数分别为0.50270.42720.3505;冠幅除了与株高紧密相关外还与茎节宽、着蕾量、分枝数具有一定的相关性,相关系数分别为0.33420.27840.2361;茎节长和茎节宽、花瓣数、雌蕊长、雄蕊长、花长具有较强的相关性,相关系数分别为0.57510.48150.47470.35850.3389;茎节宽除了与茎节长紧密相关外还与雌蕊长、花瓣数、雄蕊长具有一定的相关性,相关系数分别为0.45710.40000.3862;茎节厚与雄蕊数、裂刻数具有较强的相关性,相关系数分别为0.57420.3120;主枝数与其他性状均无较强的相关性;分枝数与着蕾量有较强的相关性,相关系数高达0.9384;裂刻数除与茎节厚具有一定的相关性外,还与雄蕊长、雌蕊长、花长具有一定的相关性,相关系数分别为0.56790.36640.3035;花长除了与茎节厚、分枝数具有一定相关外还与雌蕊长、雄蕊长、花冠宽、单花期具有较强的相关性,相关系数分别为0.62300.60730.58790.4208;花冠宽除了与花长紧密相关外还与着蕾量有一定的相关性,相关系数为0.2819;花瓣数仅与茎节宽具有较强的相关性;雄蕊长与雌蕊长具有较强的相关性,相关系数高达0.7716,另外两性状还同时和株高、茎节宽、裂刻数、花长、单花期等性状具有一定的相关性;雄蕊数仅与茎节厚具有较强的相关性;单花期与雄蕊长、雌蕊长、花长具有较强的相关性;着蕾量与分枝数的相关性最强,另外还与冠幅、花冠宽具有一定的相关性。

2.1.4 主要性状的主成分值与综合评价指数

经过对计算结果标准化转换,得到每个品种(系)资源的重要主成分值(表4),可根据其主成分值选择符合育种目标的优良母本。从表4 看出,N20N22N7茎节性状和雄蕊性状的综合指标较高,可作大茎节良种选育;N12N11N14 花部性状和多花性状的综合指标较高,可作为大花、多花型良种选育;N16N25生长情况的综合指标较高,可作长势强生长量大的良种选育。从综合评价指数来看N14N16N3N22N20N7综合指数较高,是综合性状优良的母本材料,同时可用于大规模蟹爪兰商品生产。

4  25个蟹爪兰品种(系)主要性状的主成分值与综合评价指数

编号

1主成分

2主成分

3主成分

4主成分

5主成分

6主成分

7主成分

综合评价指数

N1

-4.5658

-1.389

-0.6446

0.0715

0.5956

1.7468

-0.6442

-4.8297

N2

-1.7577

-2.4849

-1.8162

-1.9587

0.8818

1.5561

0.4962

-5.0834

N3

1.0019

0.2331

1.8401

-1.6717

2.9804

0.8733

-0.2021

5.055

N4

-0.0459

1.5971

1.4342

-1.619

-0.2684

-0.6631

0.8977

1.3326

N5

-3.7868

1.4672

0.0517

0.279

-0.1333

0.6206

-0.0487

-1.5503

N6

-5.6501

-0.7009

2.0439

0.7096

-0.9484

0.0736

-0.1909

-4.6632

N7

2.387

1.3703

-0.4943

-0.0512

-0.7891

0.2638

0.0329

2.7194

N8

1.5372

-0.3664

0.8964

-1.4681

-0.1493

0.4746

-0.7154

0.209

N9

0.987

-0.8718

-0.4058

-1.1218

0.1338

-1.2543

-1.6279

-4.1608

N10

0.6352

-1.1617

-1.6339

-0.3662

-0.4626

-1.1962

1.0832

-3.1022

N11

-0.9402

2.505

-2.62

-1.7273

-2.1683

-0.6442

-0.0109

-5.6059

N12

-2.9965

4.3022

-0.5573

0.1192

1.2778

-1.3517

0.8692

1.6629

N13

0.0079

-0.3915

1.3561

-0.4924

-0.6186

-1.9202

-1.5843

-3.643

N14

2

2.9329

1.1554

1.8958

-1.6353

2.3704

-1.1514

7.5678

N15

1.4922

-1.3275

0.5484

-0.2291

-1.3707

0.9991

1.2252

1.3376

N16

0.2942

1.1398

1.0277

2.4479

1.7865

-0.5503

0.809

6.9548

N17

-0.0788

-0.0295

-1.9621

0.6239

1.3397

0.5333

-0.6312

-0.2047

N18

1.3583

-1.1273

0.2344

0.3657

1.1315

-0.6979

0.3753

1.64

N19

1.2782

-2.1773

-0.288

1.2998

-0.4022

0.4971

0.3353

0.5429

N20

2.5783

0.3222

-0.4796

0.751

1.6654

-0.7204

-0.6508

3.4661

N21

1.8583

0.7432

-0.8227

-0.6374

-0.5132

0.3171

-0.3412

0.6041

N22

2.7021

0.6186

-0.9169

0.4401

0.0351

1.2402

0.8881

5.0073

N23

0.1107

-1.714

1.5245

-0.4741

-0.4954

-0.6943

0.1827

-1.5599

N24

0.3813

-1.2697

2.4644

0.0474

-1.2875

-0.5374

0.919

0.7175

N25

-0.7879

-2.2201

-1.9357

2.7661

-0.5854

-1.336

-0.3148

-4.4138

2.2  聚类分析

Q型聚类又称样品聚类,是对分类运算单位进行的分析运算,反映不同分类单位之间的相似性和亲缘关系远近[16] 本文对原始数据进行标准化处理后,采用卡方距离法,以离差平方和法对25个品种(系)的16个性状进行聚类(1)。结果如下:25个品种(系)根据16个性状进行品种间聚类,探讨其品种相似性及其亲缘关系的远近,结果显示可分为3类;A类包括N16个品种,B类包括N312个品种,C类包括N107个品种。聚入A类的6个品种又可分为两类,第一类有4个品种分别为N1N5N2N6;第二类有2个分别为N11N12。聚入B类的12个品种为三类,第一类有2个品种分别为N3N4;第二类有6个品种分别为N7N21N22N14N8N9;第三类有4个品种分别为N16N17N18N20。聚入C类的7个品种又分为两类:第一类有4个品种分别为分别为N10N15N19N25,第二类有3个品种分别为N13N23N24

3  讨论

通过对蟹爪兰品种资源进行主成分分析, 将其主要生物学性状指标归结于前7个主成分。这前7个主成分值的贡献率达到88.2% ,其所表达的综合信息可以用来表达全部性状的信息。通过计算各品种的主成分得分和综合得分值,可分析出综合性状优良和主要性状突出的品种,对于商品品种的选择和特异性状的有效利用具有重要的指导意义。通过分析16个性状的相关矩阵R可以得出各性状间的关联性,在杂交亲本的选择中对特异性状进行选择的同时还要考虑其它相关性状对杂交后代带来的影响,进行综合考虑。Q型聚类是在对25个蟹爪兰品种(系)的16性状综合定量分析的基础上揭示其品种间的亲缘关系,根据数量分类的原理[16]得知,亲缘关系越近,就越早地聚合为一类。采用卡方距离离差平方和法对25个蟹爪兰品种(系)的16个性状进行聚类,通过分析,将其划分为3大类,又依据各品种的相似性状,细分为7小类。在蟹爪兰育种和生产需求中,根据各类的特点可以对品种进行相关选择,以减少育种和生产的盲目性和工作量。在遗传距离比较大的组间,结合农艺学性状和亲缘关系,选择两个亲本进行有性杂交配出高优势组合或育成突破性品种的机率较高。蟹爪兰的生物学性状较多,通过性状的相关矩阵(表3)可看出其相互间的关系非常复杂,单纯从生物学性状数据的表象难以得出规律。致使生产中良种选择、杂交配组时母本的选择和子代选优利用都存在工作量较大、带有一定的主观因素和盲目性等问题。采用主成分和聚类分析法进行资源评价, 找准主要因素简化评价指标,从而减少了选择的盲目性,能够较清晰、准确的对现有资源进行有效利用。

参考文献

[1] 齐永涛,崔鸿文.主成分分析在黄瓜早熟育种上的应用[J].西北农业大学学报,1989,17(2):74-78.

[2] 赵天荣,蔡建岗,施永泰,.蟹爪兰的繁殖及栽培养护技术研究[J].北方园艺,2009,10:233-234.

[3] 关友峰,安维太,岳国强.主成分分析在胡麻育种中的应用[J].西北农业学报,1992,1(2):82-85.

[4 ]孙长法,赵晖,陈荣江.棉花新品种产量品质性状的聚类分析与综合评价[J].西北农业学报,2010,19(4):57-61.

[5] 杜晓华,李新睁,刘海妮,.南瓜前期农艺性状的主成分分析[J].西北农业学报,2010,19(2)168-171.

[6] 王晓静,粱燕,徐加新,等.番茄品质性状的多元统计分析[J].西北农业学报,2010,19(9):103-108.

[7] 虞晓芬,傅玳.多指标综合评价方法综述[J].统计与决策,2004,11:119-121.

[8] Martynov S P,DohrotvorskayaT V.Genealogical analysis of diversity of Russian winter wheat euhivam(Triticumaestivum L)[J].Gene ResCrop Evo,2006,53:379-386.

[9] Masumbuko L I,Bryngelsson T.Inter simple sequence repeat(ISSR)analysis of diploid coffee species and cultivated Coffea species and cultivated Coffea Arabica L.from Tanzania[J].Gene ResCrop Evo,2006,53:357-366.

[10] 赵银月,耿智德,保丽萍,.云南省大豆地方品种资源的主成分分析及聚类分析[J].湖南农业大学学报,2007,33:120-122.

[11] 罗珊,康玉凡,濮绍京,.黑河地区55份大豆品种资源农艺性状和营养成分的聚类分析[J].大豆科学,2009,28(3):421-425.

[12] 朱世杨,张小玲,刘庆,.花椰菜自交系主要形态性状的主成分分析和聚类分析[J].植物遗传资源学报,2012,13(1):77-82.

[13] 荣立苹,雷家军.东北地区野生百合数量分类研究[J].植物遗传资源学报,2010,11(1):99-102.

[14] 赵天荣,蔡建刚,施永泰,.大花萱草金娃娃的花器结构和繁育系统观察 [J].草业科学,2013 (1):52-57.

[15] 张尧庭,方开泰.多元统计分析引论[M].北京:科学出版社,1987.

[16] 徐克学.数量分类学[M].北京:科学出版社,1994.

                                                                                                                  


3   16个性状的相关矩阵R

性状

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

x15

x16

x1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

0.5027

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x3

0.3554

0.0465

1

 

 

 

 

 

 

 

 

 

 

 

 

 

x4

0.2917

0.3342

0.5751

1

 

 

 

 

 

 

 

 

 

 

 

 

x5

0.2000

-0.2332

0.2730

0.0965

1

 

 

 

 

 

 

 

 

 

 

 

x6

0.0319

-0.0890

0.3150

0.2628

0.0882

1

 

 

 

 

 

 

 

 

 

 

x7

0.0004

0.2361

-0.7127

-0.6310

-0.4181

-0.1093

1

 

 

 

 

 

 

 

 

 

x8

0.3774

0.0348

0.2169

0.0553

0.3120

-0.1956

-0.0158

1

 

 

 

 

 

 

 

 

x9

0.2989

0.1969

0.3389

0.3076

-0.2555

-0.1513

-0.1397

0.3035

1

 

 

 

 

 

 

 

x10

-0.0670

0.0233

0.075

0.0557

-0.2547

-0.1269

0.1374

0.2233

0.5879

1

 

 

 

 

 

 

x11

0.2322

-0.0640

0.4815

0.4000

0.1658

-0.0586

-0.4895

-0.1854

0.1903

0.1146

1

 

 

 

 

 

x12

0.3505

0.1143

0.4747

0.4571

0.0122

0.1163

-0.3579

0.3664

0.6230

0.0301

0.0929

1

 

 

 

 

x13

0.4272

0.1162

0.3585

0.3862

0.1244

-0.0006

-0.3262

0.5679

0.6073

0.0980

-0.0334

0.7716

1

 

 

 

x14

0.1438

0.0293

0.0437

0.1127

0.5742

-0.0841

-0.3688

0.0088

-0.0909

-0.5516

0.0256

0.2784

0.2323

1

 

 

x15

0.1486

0.1161

0.1405

0.3776

-0.1957

-0.2864

-0.2764

0.0883

0.4208

0.0698

0.2202

0.4330

0.4910

0.1776

1

 

x16

0.0531

0.2784

-0.6304

-0.5234

-0.3709

-0.0330

0.9384

-0.0032

-0.1050

0.2819

-0.4095

-0.4140

-0.3365

-0.3859

-0.1963

1

  

 



 基金项目: 宁波市科技攻关项目(2015C10054);宁波市农科教结合项目(2015NK21);宁波市农科院创新团队项目2016T001

 

   
【字体:】【返回】【顶部】【打印本页】【关闭
相关文章  
甬雪3号不同播种期和栽培密度试验 2017-03-29
几种非寄主植物对甘蓝 主要害虫的田间驱避作用比较 2017-03-29
主成分和聚类分析在 蟹爪兰资源评价和育种中的应用 2017-03-29
宁波地区草莓接耐热甜瓜套种丝瓜栽培模式 2017-03-29
水产品中生物毒素免疫检测技术研究进展 2017-03-29
 
网站地图 使用帮助 隐私安全 联系我们 网站管理 版权声明 登录管理
版权所有 © 2017 宁波市农业科学研究院 未经允许请勿转载或建立镜像
目前已经有25175259人次浏览过该网站
备案号:浙ICP备15021256 技术支持:宏业网络

浙公网安备 33020402000184号