• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    金银花花形基因的发掘及生物信息学分析

    时间:2023-06-30 16:45:02 来源:雅意学习网 本文已影响 雅意学习网手机站

    李凤梅 , 汤雪媛 , 焦高洋 , 齐玉亭 , 杜献婷 , 鲍倩倩 , 张梦 , 徐小博 ,徐鑫 , 张艳芳

    新乡学院生命科学与基础医学学院,河南 新乡 453003

    金银花(Lonicera japonicaThunb.)属于忍冬科忍冬属多年生灌木,是我国重要的中药材。金银花花初开色白,经1~2 d色黄,故称之为金银花。金银花的功能性成分主要包括有机酸类[1]、黄酮类、挥发油类[2]、环烯醚萜苷类[3]、三萜皂苷类[4]等成分,具有消炎[5]、抗菌[6]、抗病毒[7]、抗氧化[8]、防癌[9]等多种功效,具有较高的食用价值与药用价值。例如,以金银花和连翘为材料制作的连花清瘟胶囊,可以抑制严重急性呼吸综合征冠状病毒2(severe acute respiratory syndrome-coronavirus 2,

    SARS-CoV-2,简称新冠病毒)复制,引起病毒颗粒形体改变及抑制宿主细胞炎症因子表达,从而发挥抗新冠病毒活性的作用[10]。2020年4月,国家药监局批准以岭药业生产的连花清瘟胶囊(颗粒)用于治疗轻型新型冠状病毒肺炎(corona virus disease 2019,COVID-19)和普通型肺炎。因此,针对花蕾特性、产量和药用成分含量等育种指标,开展多目标选择育种势在必行。

    金银花主要以未成熟的花蕾入药[11]。截至目前,金银花及其同科植物花形相关基因鲜有报道,分子生物学研究尚浅,而在拟南芥、金鱼草等模式植物中已克隆出多个花器官发育基因[12],这些花器官发育基因为发掘金银花花形同源基因提供了基础。依据功能将这些基因分为3大类[13]:A类基因单独控制萼片的发育,并与B类基因共同调控花瓣的发育;
    B类和C类基因共同调控雄蕊的发育;
    C类基因单独控制雌蕊的发育。A类基因功能失活,会导致心皮取代花萼、雄蕊取代花冠;
    B类基因功能失活,会导致花萼取代花瓣、心皮取代雄蕊;
    C类基因功能失活,会导致雄蕊变成花冠,心皮变成花萼或其他器官结构。随着研究的深入,经典的“ABC”模型发展成为“ABCDE”模型,其中E类基因也能够调控花瓣的发育(图1)。同时,金银花的分子生物学研究进展迅速。2020年,Pu等[14]首次破译金银花染色体水平的基因组(大小为843.2 Mb),并注释了33 939个蛋白质编码基因。2021年,Xiao等[15]整合了77个金银花转录组数据,构建了金银花基因共表达网络,并参考公共数据库信息对金银花基因进行功能注释。这些研究不仅为金银花主要性状的分子机制研究提供了基础,也为分子辅助优良新品种选育提供了理论支撑。

    图1 植物花器官决定的 ABCDE 模型Fig. 1 The ABCDE model of flower organ identity in plant

    近年来,随着中国药典对金银花药用来源的日趋规范,药品、保健品、饮料、日化用品等多行业需求的增加,供需矛盾日益加剧,金银花价格不断高涨[16]。发掘花形(花器官大小)调控基因为金银花高产优质品种的培育提供了理论基础。金银花花形同源基因的发掘,为分子标记辅助选择方式培育道地高产优质金银花品种提供了基因资源,具有不受季节影响、缩短育种时间、节约土地资源等优势[17-18],能够为药用植物育种稳步快速发展提供基础。

    1.1 材料

    本实验所用金银花染色体水平基因组数据从国家基因组数据中心(https://bigd.big.ac.cn/gwh)下载获得,登录号为GWHAAZE00000000,共包括5部分内容:Genome(891 464 kb)、Protein(20 789 kb)、Gff注释(55 933 kb)、CDS(44 399 kb)和RNA(45 500 kb)。

    1.2 方法

    1.2.1NCBI-Blast执行序列比对 因NCBI网站没有金银花基因组和蛋白质组序列信息,本研究采用NCBI的本地Blast工具(下载地址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/)执行核酸和蛋白质序列同源比对。比对结果中,同一性高(第3列)、期望值显著(第11列)、比对得分高(第12列)的序列,即为金银花与拟南芥的同源基因。具体操作代码为:①格式化核酸/蛋白数据库命令:makeblastdb-in待格式化的序列文件-dbtype prot或nucl-parse_seqids-out输出的数据库名;
    ②核酸/蛋白序列比对核酸/蛋白数据库(blastn/blastp)命令:blastn/blastp-query输入基因路径及文件名-out输出基因路径及文件名-db格式化了的数据库路径及数据库名-outfmt 6-evalue 1e-5-max_target_seqs 10-num_threads 8。

    1.2.2同源基因/蛋白的亲缘关系分析 利用MEGA的“Construct/Test Maximum Likelihood Tree”(ML,最大似然法)构建系统发育树,调节参数美化后导出TIFF图片及文件。

    1.2.3同源蛋白的结构域分析 利用SMART网站(http://smart.embl.de/smart/show_motifs.pl)的Normal mode进行结构域预测及功能分析。利用DNAMAN软件进行同源基因序列的多重比较及结构域分析。

    1.2.4表达模式分析 依据金银花L. japonica功能基因组数据库(http://www.gzybioinformatics.cn/LjaFGD/index.php)进行候选基因的表达模式分析。

    1.2.5引物设计 采用Primer Premier 5进行候选基因引物设计。

    1.2.6理化性质分析 采用ProParam (https://web.expasy.org/protparam/)进行蛋白质的理化性质分析。

    1.2.7亚细胞定位预测 利用Cell-PLoc(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc/)的Plant-PLoc部分进行亚细胞定位预测。

    1.2.8信号肽、跨膜结构域、转运肽的预测分析通过在线数据库SignalP4.0 Server(http://www.cbs.dtu.dk/services/SignalP/)进行信号肽预测分析。使用TMHMM Server v. 2.0(http://www.cbs.dtu.dk/services/TMHMM/)在线分析工具分析跨膜结构域。利用Target P1.1Server(http://www.cbs.dtu.dk/services/TargetP/)进行转运肽的预测。

    1.2.9亲水疏水预测 利用ProtScale(https://web.expasy.org/protscale/)进行蛋白亲水疏水性预测。

    1.2.10候选基因的保守基序分析 通过在线软件MEME(https://meme-suite.org/meme/)对候选基因编码蛋白进行Motif分析,分析蛋白质序列中的保守基序,motif个数设置为10。

    1.2.11二级、三级结构预测 利用SOPMA(https://prabi.ibcp.fr/htm/site/web/home)进行蛋白二级结构预测;
    通过SWISS-MODEL(https://swissmodel.expasy.org/)数据库进行蛋白三级结构建模预测分析。

    2.1 金银花花形同源基因的筛选

    根据拟南芥ABC/ABCDE类基因调控花器官形成机理,本实验筛选拟南芥中调控花瓣的A类基因、B类基因和E类基因进行同源序列比对(表1)。

    表1 拟南芥ABCDE模型相关基因Table 1 Genes related to ABCDE model in Arabidopsis

    2.1.1核苷酸序列比对结果和系统发育分析 通过NCBI本地Blast工具执行序列比对可知,金银花与拟南芥的cDNA同源基因有3个,用MEGA软件构建进化树对同源基因的亲缘关系进行分析发现 GWHTAAZE020064与ARF8、GWHTAAZE014043与DA1、GWHTAAZE016396与ANT分别高度同源(图2)。

    图2 同源基因的系统进化分析Fig. 2 Phylogenetic analysis of homologous gene

    2.1.2氨基酸序列比对结果和系统发育分析 通过NCBI本地Blast工具执行序列比对可知,金银花与拟南芥的氨基酸同源蛋白有99个(去除重复),分别为:ANT(4)、CLF(18)、DA1(3)、ARF8(16)、AGL79(2)、AP1(22)、AP3(22)、KLU(8)、LFY(1)、NAP(1)、SEP2(1)、SEP3(25)、SEP4(25)、SWP(1)、UFO(8)、ULT1(3)和ULT2(3)。针对金银花和拟南芥的同源蛋白,我们使用MEGA的最大似然法构建进化树表示各蛋白的亲缘关系(图3)。

    图3 同源蛋白的系统进化树Fig. 3 Phylogenetic analysis of homologous protein

    2.1.3结构域分析 利用SMART网站对拟南芥花形的同源蛋白进行结构域分析和统计(表2),我们发现low complexity、MADS、coiled coil、LIM、FBOX、SANT、CXC、SET、B3、transmembrane region共10个结构域分别出现在9、7、7、1、1、1、1、1、1、1个蛋白中(图4)。其中MADS结构域在高等植物花器官发育中起重要的调控作用,对花器官发育及开花时间早晚进行调控,该研究对筛选金银花花形基因提供指导。

    图4 拟南芥蛋白的结构域统计分析Fig. 4 Statistical analysis of protein domain for Arabidopsis

    综合是否包含MADS结构域,序列同一性是否达到30%,基于99个氨基酸同源基因,我们筛选 出GWHGAAZE001422、GWHGAAZE001424、GWHGAAZE003600、GWHGAAZE003601、GWHGAAZE014905、GWHGAAZE016592、GWHGAAZE031567、GWHGAAZE032544共8个调控花形的金银花候选基因(表2)。经序列比对,我们发现GWHTAAZE001422与 GWHTAAZE001424、GWHTAAZE003600与GWHTAAZE003601相邻且相似,说明它们为同一基因簇内的基因。

    表2 金银花候选基因编码蛋白信息一览表Table 2 Information list of candidate protein in Lonicera japonica Thunb.

    2.1.4表达模式分析 依据Lonicera japonica功能基因组数据库进行候选基因的表达模式分析,本研究发现,在SRP075780样品中,GWHGAAZE016592(GWHPAAZE016602)和GWHGAAZE014905(GWHPAAZE014912)在绿色花芽、白色花芽、白花黄花中的表达量显著高于叶芽、第二叶、成熟叶片、芽、茎秆等部位,据此推测GWHGAAZE014905和GWHGAAZE016592可能正向调控金银花花形(图5)。

    图5 金银花候选基因的表达模式分析Fig. 5 Expression pattern analysis of candidate gene in Lonicera japonica Thunb.

    依据Nr、Swissprot、trEMBL、TAIR10 4个基因功能注释数据库信息,GWHGAAZE014905和GWHGAAZE016592均为K-box region and MADSbox transcription factor family protein,均是Floral homeotic protein。GWHGAAZE014905是一个包含MADS结构域的调控花器官发育的B类基因;
    GWHGAAZE016592是AP3同源基因。

    2.2 理化性质分析

    采用ProParam进行蛋白质的理化性质分析(表3)。GWHGAAZE014905的化学方程式为C1170H1860N346O356S9,氨基酸数量是229,分子量为26 758.28,等电点是8.56,氨基酸组成中Leu(L)、Lys(K)、Arg(R)、Glu(E)含量较高,Trp(W)、Pyl(O)、Sec(U)含量较少,负电子总数为35,正电子总数为38;
    不稳定系数为26.10,小于40,说明该蛋白稳定性好;
    脂肪系数为74.45,综合亲水性平均(GRAVY)为-0.828,小于0,说明该蛋白为亲水性蛋白。

    表3 花形候选基因理化性质分析Table 3 Physical properties and chemical analysis of candidate gene for flower shape

    GWHGAAZE016592的化学方程式为C1498H2415N425O444S12,氨基酸数量是296,分子量为33 867.95,等电点是8.92,氨基酸组成中Leu(L)含量高达12.5%,Trp(W)、Pyl(O)、Sec(U)含量较少,负电子总数为34,正电子总数为40,不稳定系数为38.96,该蛋白为稳定蛋白,脂肪系数为91.18,综合亲水性平均(GRAVY)为-0.440,小于0,说明该蛋白为亲水性蛋白。

    2.3 亚细胞定位预测

    利用Cell-PLoc的Plant-PLoc部分进行亚细胞定位预测。GWHGAAZE014905被定位到细胞核上,GWHGAAZE016592被定位到叶绿体上。

    2.4 信号肽、跨膜结构域、转运肽的预测分析

    通过在线数据库SignalP4.0 Server,进行信号肽预测分析。GWHGAAZE014905的信号肽(Sec/SPI)为0.000 4;
    GWHGAAZE016592的信号肽(Sec/SPI)为0.000 2。两个候选基因的信号肽指数均低于0.5,即均无信号肽,属于非分泌蛋白。

    使用TMHMM Server v. 2.0在线工具分析蛋白的跨膜结构域(图6)。GWHGAAZE014905蛋白不包含跨膜结构域,该蛋白不是膜蛋白。而GWHGAAZE016592包含一个跨膜螺旋区域,位于151~173 bp,因此该蛋白是膜蛋白。

    图6 花形候选基因的跨膜区域分析Fig. 6 The transmembrane domain analysis of candidate gene for flower shape

    利用Target P1. 1 Server进行转运肽的预测。GWHGAAZE014905无转运肽,GWHGAAZE016592的线粒体转移肽(mitochondrial transfer peptide)是0.000 1。

    2.5 蛋白的亲水疏水性预测

    利用ProtScale进行蛋白亲水疏水性预测(图7)。结果表明,GWHGAAZE014905的第13位具有最低分值-2.611,亲水性最强;
    第194位具有最高分1.600,疏水性最强,具有较强的蛋白质折叠动力,有助于蛋白质折叠成稳定的二级结构、形成结构域和三级结构等。GWHGAAZE016592的第228位具有最低分值-3.167,亲水性最强;
    第164位具有最高分2.822,疏水性最强。总体上看,GWHGAAZE014905和GWHGAAZE016592亲水区域明显大于疏水区域,均表现为亲水性。

    图7 候选基因编码蛋白的亲疏水性分析Fig. 7 Analysis of hydrophilicity and hydrophobicity for candidate protein

    2.6 候选基因的结构域和保守基序分析

    利用DNAMAN软件进行同源蛋白的保守结构域分析(图8),发现金银花的GWHGAAZE014905和GWHGAAZE016592蛋白与拟南芥的AGL79、AP1、AP3、SEP3和SEP4蛋白均包含保守的MADS结构域。

    图8 同源蛋白的保守结构域分析Fig. 8 Conserved domain analysis of homologous protein

    通过MEME对候选基因编码蛋白进行Motif保守基序分析,Motif个数设置为10,我们发现GWHGAAZE014905和GWHGAAZE016592蛋白均 包 括Motif1、Motif3、Motif4、Motif2、Motif6和Motif5(图9~10)。

    图9 花形候选蛋白的保守基序分析Fig. 9 Conserved motif analysis of proteins for flower shape

    2.7 二级、三级结构预测

    利用 SOPMA进行蛋白二级结构预测(表4),发现GWHGAAZE014905蛋白包括56.33%的α螺旋,13.10%的延伸链,8.30%的β转角,22.27%的无规则卷曲;
    GWHGAAZE016592蛋白包括44.26%的α螺旋,20.61%的延伸链,6.42%的β转角,28.72%的无规则卷曲。

    表4 同源蛋白的二级结构特性Table 4 Analysis of the secondary structure for candidate proteins

    根据同源建模法,运行Swiss-model软件对蛋白质的三维结构进行模拟(表5)。结果发现,金银花花形候选基因GWHGAAZE014905、GWHGAAZE016592中达到30%及以上的同一性模板与At AGL79、AP3、3-Sep、4-Sep相同,均为6byy.2.A和4ox0.2.C。而AP1的模板3kov.1.A与6byy.2.A相似度极高(图11)。

    图11 模板蛋白的三维结构Fig. 11 3D structure of template protein

    表5 蛋白质的三维结构模拟结果Table 5 Simulated 3D structure of candidate protein

    图10 花形候选蛋白的保守基序Fig. 10 Conserved motif in proteins for flower shape

    金银花属药食同源植物,在医药[19]、食品[6]、保健品[20]和日用化工等领域均有着广阔的发展前景,素有“中药之中的青霉素”美称。金银花主要以花蕾入药,花瓣的大小、形态、结构等与产量息息相关。不同金银花种质花蕾大小不同,例如封丘大毛花、九丰一号、鲁峰王、亚特金银花、大毛花和密县大毛花的花蕾偏大,而亚特红蕾一号和封丘红银花的花蕾偏小[21]。植物在生长过程中,营养器官在外界环境(如温度、日长等)的影响下,茎顶端分生组织开始产生花分生组织,接着形成花器官[22]。对拟南芥[23]和金鱼草[24]的花器官调控基因研究有利于双子叶植物花器官发育的遗传控制机理深入阐释,这些基因调控了植株从营养生长到生殖生长的转换、对光周期的反应、开花时间[25]、花器官的形成、花粉的发育及育性等,并将其分为A、B、C 3大类。随着研究的深入,所分离的MADS-box基因的功能也在不断增加,出现了与其他类型基因共同调控所有花器官的E类基因以及单独控制胚珠发育的D类基因,因此经典的“ABC”模型发展成为目前的 “ABCDE”模型[26]。拟南芥A类基因中AP1编码 MADS-box的转录因子,决定了萼片和花分生组织形成[27],当将ap1、cal及ful3个突变基因聚在一起时,呈现严重的“花椰菜”表型[28]。拟南芥典型的B类基因AP3和PI突变后,花瓣被萼片取代,雄蕊被心皮取代,表现出调控花瓣和雄蕊的特性[29]。拟南芥E类基因SEPALLATA1(SEP1)、SEP2和SEP3共3个MADSbox基因调控花瓣、雄蕊和心皮[30],SEP活性降低会通过STK、AG、SHP1和SHP2多聚体导致正常胚珠发育丧失[31]。

    金银花适应性极强,在我国除新疆、西藏、宁夏、青海、内蒙古、黑龙江和海南等省份外均有种植。金银花一次栽植、多年采花,生育期长达25~30年,丰花期可持续15年左右。近几年,金银花的市场价格不断攀升,资料显示,全国金银花产量仅为5 000 t左右,而市场需求在1.7万t以上,因此供需矛盾日益加剧。金银花生产上,由于长期的扦插繁殖、压条繁殖、成株移栽等无性繁殖致使品种退化、病虫害严重,导致金银花产量和品质下降[32],因此培育金银花高产优质品种势在必行。本研究参照拟南芥的ABC/ABCDE类花形基因,通过一系列生物信息学方法,从金银花基因组和蛋白组数据中筛选出GWHGAAZE014905和GWHGAAZE016592 2个可能调控花形的金银花候选基因,GWHGAAZE014905与拟南芥的AP1、AP3、SEP3和SEP4基因同源,GWHGAAZE016592与拟南芥的AGL79、AP1、AP3和SEP3基因同源。基因注释发现,GWHGAAZE014905拥有K-box区域,属于B类MADS转录因子家族蛋白,突变后可致使花器官缺陷;
    GWHGAAZE016592是AP3的同源基因,是调控花瓣和雄蕊的关键基因[33],突变后可致使花器官缺陷。该研究为金银花的分子标记辅助育种提供基因资源。

    猜你喜欢花形同源金银花两岸年味连根同源华人时刊(2023年1期)2023-03-14金银花“香溢”致富路今日农业(2021年15期)2021-11-26以同源词看《诗经》的训释三则汉字汉语研究(2021年2期)2021-08-30金银花小学生作文(低年级适用)(2019年12期)2020-01-18“铤”有“直”义的词源学解释——兼说/直/义的同源词族汉字汉语研究(2019年2期)2019-08-27感知6以内的数量娃娃乐园·3-7岁综合智能(2016年2期)2016-10-24金银花又开公民与法治(2016年11期)2016-05-17虔诚书画乃同源河北书画研究(2016年3期)2016-04-28夏日良药金银花华人时刊(2016年13期)2016-04-05观花解语中国总会计师(2016年2期)2016-03-28

    推荐访问:花花 金银 发掘

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章