时间:2024-02-28 14:39:58
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇生物信息学的研究进展,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗
传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。 生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.
[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.
[7]guy d,noel e,mike a.using bioinformatics to analyse germplasm collections [j].spri
nger netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.
[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.
[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.
[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.
[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.
关键词: 生物信息学 农业研究领域 应用
“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息
学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。
生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.
[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.
[7]guy d
,noel e,mike a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.
[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.
[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.
[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.
[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.
关键词: 生物信息学 农业研究领域 应用
“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物
中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。
生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.
[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.
[7]guy d,noel
e,mike a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.
[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.
[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.
[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.
[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.
[25]苏晨曦,潘迎捷,赵勇等.疏水网格滤膜技术检测食源性致病菌的研究进展[j].微生物学杂志,2010,30,(6):76-81.
2009年,卫生部立项“十二五”八年制规划教材《生物信息学》的编写工作,并将生物信息学列为八年制医学生的必修课。这是中国现代医学教育的一件大事,一方面体现国家对高等医学人才全面发展、提高理工科理论水平的重视程度;另一方面也表明生物信息学理论已经深入到生物医学科研和实际应用层面,理论生物医学研究已经被国内院校所接受,成为生物医学学科群的重要组成部分[1]。
生物信息学是一门新兴的交叉学科,有非常明显的理工科特性,即在有良好的生物医学背景下,注重数学思维和计算机操作能力,这对于我们目前以医学专业学习为主的高等医学教育产生一定的挑战。如何在有限的学时基础上,完成生物信息学教学任务的同时,让学生初步掌握科研、临床中应用生物信息学的能力,形成理工科处理医学问题的思维,是目前在八年制学生中开展生物信息学教学迫切需要研讨的问题。笔者作为主讲教师于哈尔滨医科大学完成了两轮八年制生物信息学教学任务,通过教学过程、课后调研及考试分析,总结了八年制学生对学习生物信息学的一些认识和学习期间遇到的问题,在这里共同探讨,以便于推进医学院校生物信息学的教学工作,培养更高理论和实践层次的医学人才。
一、授课对象
课程面向临床医学八年制学生93人、基础医学八年制(基地班)学生60人,学生入学录取分数高于生源地重本线50分以上。开课时两个专业的学生均处于大学三年级,已经学完高数、计算机基础等理工基础课,分子生物、细胞生物等生物学基础课,以及组胚、生理等医学基础课,开课学期同时学习遗传、免疫、病理和药理学课程;部分学生参加PBL教学,已经完成呼吸、消化、循环系统的知识学习。
二、教材和课程内容选择
面向两个轨道分别开展《医学信息分析方法》(36学时)和《生物信息学概论》(56学时)两门课程。两个轨道均以人民卫生出版社规划教材《生物信息学》2010年第一版为主讲教材[2],结合临床医学和基础医学的学科特点,采取教师自主选择内容的方式讲授。
在临床专业中以疾病理论和分析方法为中心,专题式讲解疾病分析相关资源、研究策略和常用软件工具。36学时的《医学信息分析方法》讲授疾病数据资源和系统理论、遗传多态与疾病定位、转录调控信息学与复杂疾病分析、miRNA表达与疾病分类、疾病状态表观遗传改变,及测序技术与疾病研究进展等6个专题。每个专题包括4学时理论课程和2学时上机实践。理论课程强调分子生物学基础、实验设计思想和分析理念,实践课程以疾病为中心,由教师指引,学生自主完成一个小规模的实验设计、数据下载到结果分析的全程化信息学实践。
在基础专业中强调生物医学研究数据资源、计算生物医学方法和实验设计手段,系统讲解生物信息学在生物医学研究中的理论和实践技术。讲授内容涉及序列数据资源与分析方法、分子进化、基因表达与调控、蛋白质组学信息学、网络系统生物学、遗传和表观遗传计算分析、疾病的计算系统生物学等较全面的生物信息学方法和理论,要求学生能够在生物医学研究中贯穿理工科分析思维,不仅能熟练运用相应的网络资源和软件工具,还能对生物信息学方法理论有一定了解,熟悉不同方法的扩展性应用。理论和实践课基本按照2比1分配,实践课程根据内容需要选取生物学或医学问题进行全程模拟实验。
三、考试形式和分析
现阶段,两个八年制专业的生物信息学教学以必修考查课形式进行,采取开卷考试、实验报告和标书设计三种考核方式,以便于了解学生对本门课程的学习和对生物信息学研究思想的领悟情况。
开卷考试试题均为主观题,其中理论基础题考查概念、重要的研究思路和经典的研究方法;案例分析题要求学生能够在学过的或书本上的知识基础上,联系生物医学知识进行案例分析,选取相应的方法解决特定的问题;思维拓展题给定学生主题词,由学生进行以生物信息学方法为工具的课题流程设计。考试结果表明学生能够通过学习了解基本的生物信息学方法,并具备初步运用新方法解决实际问题的能力,但考试也反映出,大学三年级学生还具有一定的科研思维局限性,不能够完全把握课题设计过程的创新性和可靠性原则。
实践能力考查主要通过实验报告进行,实验报告要写明研究问题名称、实验数据、处理方法、处理结果和结果分析讨论。通过实验报告的提交,学生基本能够就相应的问题自主选择数据、进行一般性软件分析,并能够对实验结果进行知识面内的讨论和思考,得出符合问题要求的结论。
标书设计作为课后实践,要求学生就自己感兴趣的研究方向进行课题设计。设计内容可以为生物信息学方法研究,也可以以生物信息学为工具进行生物医学问题的探讨和分析。大多数学生能够通过文献查阅、原先具备的生物医学知识总结,发现有意义的生物医学问题,设计内容具有现实意义和一定创新性的,部分课题还有较好的可行性。很多标书设计也暴露出在三年级开展生物信息学时,学生的临床医学知识还比较欠缺,有时候不能很好的发现具有医学意义或应用价值的课题,也比较难于理解生物信息学在实际应用中的价值。
四、学生反馈和教学心得
通过课堂互动、课程临近结束时进行的问卷调查,笔者进一步了解了学生在生物信息学学习过程中的一些困惑,及一些意见和建议。主要问题如下:
1、课程理论性强,计算强度大
学生们普遍反映生物信息学与他们学习的其他课程不一样,生物医学课程偏向于文科性质,主要靠记忆,而生物信息学理科特性很强,需要深入理解分析。另外学生的数理知识有限,感到有些算法比较难,根本听不懂。
2、课程内容多,课时少
许多学生通过学习对生物信息学产生了浓厚的兴趣,真切感受到生物信息学对于他们未来的学习、科研和临床工作将有很大帮助,但是课时太少,不能够在现有课时下理解全部理论。
3、实践课时少,计算机能力薄弱
绝大多数学生都认为生物信息学需要通过理论结合实践的方法来学习才能更好的掌握。现有的实践课程只能完成基本的教学任务,对于众多的研究工具和研究方法只有感性认识。另外大家在实践中也感觉到自身的计算机知识很有限,在高通量数据处理面前力不从心,影响对问题的分析能力。
4、课程开课偏早,背景知识不全
很多学生反映三年级时,八年制学生还没有进行统计学、临床各学科的培养,知识背景不足,很难理解生物信息学中重要的算法公式,也很难对医学问题进行更为深入的思考。
学生们的反馈基本上反映出他们在学习生物信息学时所遇到的困难。笔者所在教研室教师(包括多名规划教材的参编者)共同进行了深入探讨,认为应当根据学生意愿向学校申请①增加理论课课时,分别由24和36增加为28和44学时;②增加实践课课时,分别由12和20增加20和28学时;③适当降低理论难度,减少不必要的数学理论推导,提请学校为八年制学生增设概率统计和计算机编程课程。
生物信息学的理工科特性决定了生物信息学课程在医学教育中开展的难度。虽然医学院校学生课业重、训练强度大,但是现代生物医学发展趋势告诉我们,生物信息学必然在未来的生物医学研究中处于关键地位[3]。不断改进教学手段、加强教学过程的趣味性,更为全面的贯彻以疾病和问题为中心的教学理念,培养理工医结合的现代化医学人才是生物信息教学工作者共同的努力方向,这些理念在不久的将来也会随着教学实践的不断深入而在新版《生物信息学》出版时得到进一步体现。
参考文献
[1] Wei Liping and Yu Jun; Bioinformatics in China: A Personal Perspective [J]; Plos Computational Biology, 2008, 4(4): e1000020.
在1956年美国召开的首次“生物学中的信息理论研讨会”上人们提出了生物信息学的概念[1]。近几年,随着人类基因组计划(HGP)的迅猛发展,各种数学软件以及生物分析软件的出现,将之前积累的大量不同生物基因序列、蛋白质氨基酸残基序列、不同生物种属之间基因序列、蛋白质以及结构序列的保守结构位点进行整合,并据此建立了庞大的数据库系统。而对于这些数据的分析,必须依靠计算机分析技术的不断发展,所以就形成了一门由生物科学、计算机科学、信息科学、应用数学、统计学等多门学科相互交叉的学科——生物信息学技术[2-4]。
生物信息学的基础是各种数据库的建立和分析工具的发展。迄今为止,生物学数据库总数已达500个以上。归纳起来可分为4大类:即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子三维空间结构数据库,以及以上述3类数据库和文献资料为基础构建的二级数据库[7]。常用生物信息学数据库[8-10]:
European Molecular Biology Laboratory(EMBL)——欧洲分子生物学实验室http://ebi.ac.uk/ebi_docs/embl_db/ebi/topembl.html
UK Human Genome Mapping Project-Resource Center(HGMP-RC)——英国医学研究委员会所属人类基因组图谱资源中心 http://hgmp.mrc.ac.uk/default.htm
SeqNet:UK Node of European Molecular Biology Network(EMBNet)——欧洲分子生物学信息网http://seqnet.dl.ac.uk/default.htm
GenBank——美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库http://ncbi.nlm.nih.gov/Web/Search/index.html
National Center for Biotechnology Information(NCBI)——美国国家生物技术信息中心http://ncbi.nlm.nih.gov/
DNA Databank of Japan(DDBJ)——日本核酸数据库http://ddbj.nig.ac.jp/default.htm
Genome Sequence DataBase(GSD)——美国国家基因组资源中心维护的DNA序列关系数据库http://seqsim.ncgr.org/default.htm
Online Mendelian Inheritance in Man(OMIM)——在线人类孟德尔遗传数据库http://www3.ncbi.nlm.nih.gov/Omim/searchomim.html
European Drosophila Genome Project http://edgp.ebi.ac.uk/default.htm
The Institute for Genomic Research(TIGR)——美国基因组研究所http://tigr.org/default.htm
The Sanger Centre http://sanger.ac.uk/default.htm
Swiss Institute of Bioinformatics(Expasy)http://expasy.ch/default.htm
GenomeNet(Japan)http://genome.ad.jp/default.htm
Australian National Genomic Information Service(ANGIS)http://morgan.angis.su.oz.au/default.htm
Bioinformatics and Biology Resources on the Internet http://aeiveos.wa.com/biology/index.html
List of other Genome Sites http://hgmp.mrc.ac.uk/GenomeWeb/default.htm
Brunel University Online Teaching Programme http://brunel.ac.uk/depts/bl/project/front.htm
Whitehead Institute for Biomedical Research(WI)http://wi.mit.edu/
WICGR(WI/MIT Center for Genome Research)http://www-genome.wi.mit.edu/
Cold Spring Harbor Laboratory(CSHL)——冷泉港实验室http://clio.cshl.org/
SMI(Stanford Medical Informatics)http://www-smi.stanford.edu/projects/helix/
BNL(Brookhaven National Laboratory)——美国布鲁克海文国家实验室http://genome1.bio.bnl.gov/
Weizmann Institute of Science——以色列魏兹曼科学研究所 http://bioinformatics.weizmann.ac.il/
中国科学院上海生命科学院生物信息中心(BioSino)http://biosino.org.cn/
北京大学生物信息中心(CBI或PKUCBI)http://cbi.pku.edu.cn/
中国军事医学科学院情报研究所 http://bmi.ac.cn/bio/
1 生物信息学在寄生虫基础研究中的现状
随着HGP的开展[11-12],人体寄生虫基因组研究也受到了广泛的重视。1993年美国人类基因组研究中心对HGP 作了修订,修订后的HGP 将模式生物基因组列入了HGP的内容[13],认为通过对较为简单的模式生物基因组的研究,可为人类基因的功能鉴定提供线索,并可从简单的基因组分析入手建立技术积累经验。人体寄生虫是一类结构较简单的单细胞生物如原虫或多细胞生物如蠕虫[14],是研究模式生物较理想的材料。因此,人体寄生虫基因组计划也已成为人类基因组计划中模式生物基因组研究重要内容之一[15-16]。其中,基因序列测定和新基因的发现是人体寄生虫基因组计划的首要任务。目前应用生物信息学对下列人体寄生虫基因组进行了研究[17-18]:
1.1 恶性疟原虫 基因组计划开展较早,研究表明恶性疟原虫的基因组大小约30Mb,含15000~17000个基因。在GenBank 中已记载的恶性原虫5031个基因顺序资料中,有3755个为抗原/蛋白质的编基因序列。
1.2 利什曼原虫 基因组大小约为35Mb,通过构建利什曼原虫不同时期特异性cDNA文库和长片段基因组文库,已经获得了2000多个EST 序列。
1.3 美洲锥虫 基因组大小为55 Kb,已建立了标化cDNA 文库,BAC 文库和YAC 文库。现已完成了7000个EST序列的测定,3号和4号染色体序列已测定。
1.4 丝虫 基因组大小为100Mb(以马来丝虫代表),至目前为止,在GenBank 中EST 序列已达到16500个,鉴定出新基因6000个,占预测基因总数的1/3。
1.5 硕大利什曼原虫 已有约500个EST 序列进入数据库,均是从含有引导序列的全长cDNA的5端测出的序列,对利什曼原虫的目标是测出至少1500个新序列。
1.6 血吸虫 基因组大小为270 Mb,估计基因数为20000个。血吸虫基因组计划始于1995年,早期研究工作主要是新基因的发现和绘制低分辨率的物理图谱。目前在GenBank中已有的血吸虫基因EST序列超过45900条,3500 个新基因已被鉴定,占基因总数的15%。
2 生物信息学在包虫基础研究中的应用前景
包虫病是一个世界性的流行病,其防治工作倍受各国研究者重视。包虫生活史复杂,同一包虫的不同种株,以及在同一种株的不同发育阶段,不同组织,甚至随着环境的改变,其基因表达变化很大。目前有关包虫的研究还不是很多,研究资源主要集中于研究包虫单个基因的序列及其功能,随着后基因组时代的发展,以及生物信息学的兴起,包虫的研究将从单个基因和功能向全基因组和功能研究转变,从局部向整体转变,从而使有目的地大规模研究疫苗和药物相关基因成为可能。
目前,应用生物信息学在对血吸虫的基础研究中取得了很大的进展。这便给了我们一个提示,可以应用生物信息学对包虫进行基础研究。首先,可以通过生物信息学的相关网站得到目前已知的包虫的基因或蛋白序列。目前报道包虫的核酸序列共11106条[美国国立生物技术信息中心(NCBI)数据库],见下表:
核酸序列线粒体
内核酸线粒体
外核酸总核酸
序列数Nucleotide5625321097相关EST01000210002GSS077 之后可以通过生物信息学相关工具做以下工作[19]:
2.1 基因功能预测 一个新基因得到后,接下来的工作就是寻找该基因的功能。序列同源比较是预测基因功能的第一步。利用同源比较算法,将待检测的新基因序列从DNA和蛋白质序列数据库中进行同源检索后,就可以得到一系列与新基因同源性较高的基因或片段。这些基因和片段的已知功能信息就为进一步分析新基因功能提供了具有相当参考价值的导向。最主要的生物学数据库是核酸、蛋白质序列数据库及其三维结构数据库[20]。
2.2 寻找蛋白质家族保守序列 通过同源检索,寻找新基因中包含的该蛋白质家族的保守序列,为进一步深入研究其功能作好准备。多重序列同源比较,被用来寻找基因家族或蛋白质家族中的保守部分[21-22]。由于保守部分常常与家族成员的功能密切相关,蛋白质家族数据库能够帮助科学家更好地认识基因的功能。最具代表性的蛋白质家族保守序列的数据库有PRINTS、BLOCKS、Sbase 和Prosite等。这些数据库可以帮助我们把新基因所属的蛋白质家族及其保守部分找出来,并提供该家族其他成员的结构和功能信息[23]。
2.3 蛋白质结构的预测 如果一个可能的新基因通过同源检索后没有同源性,就成为孤独基因了。孤独基因可以通过结构同源比较,寻找结构同源的基因或直接预测其高级结构来推测其可能的功能。有很多蛋白质高级结构数据库提供结构同源比较的检索[20]。
目前,在后基因组时代,研究者们面对的不仅是序列和基因,也有越来越多的完整基因组。对不同种株包虫基因组之间的比较性研究很可能会得到大量有用信息,而对同一种包虫生活史不同阶段基因组的比较性研究可能会使人们对于该物种的认识更加深入。因此,随着生物信息学的迅速发展和后基因组计划的深入,包虫的基础研究必将得到极大地发展。人们能够期望从对基因和基因的生物学功能研究着手,发现更有效的抗包虫的药物靶位或疫苗[24-25],并为彻底揭开包虫的奥秘以及有效的治疗与预防包虫病打下基础。
参考文献
[1] 陈颖健.生物信息学[J]. 国外科技动态,2002,10(399):39-41.
[2] Ezio Bartocci,Flavio Corradini,Emanuela Merelli.BioWMS:a web-based Workflow Management System for bioinformatics[J]. BMC Bioinformatics,2007,8(Suppl 1):S2.
[3] Stephen H,Wefer Keith Sheppard.Bioinformatics in High School Biology Curricula:A Study of State Science Standards[J]. CBE-Life Sciences Education,2008,7:155-162.
[4] 冯毅.生物信息学在药物研发中的应用与展望[J].西部医学,2007,19(5):971-973
[5] 孙敏,马月辉.生物信息学研究进展[J].家畜生态学报,2006,27(1):6-10.
[6] 汪凡军.生物信息学在医学上的应用[J].国际检验医学杂志,2006,27(2):161-163.
[7] Yang Yong Mei.Application Development of Bioinformatics in Medicine Study[J]. Medical Recapitulate,2007,13(22):1681-1683.
[8] Michelle D,Brazas BF,Francis Ouellette.2008 update on the Bioinformatics Links Directory[J]. Nucl Acid Res,2008,36:W2-W4.
[9] Benson D,Karsch-Mizrachi I,Lipman D,et al.Gen-Bank:update[J]. Nucleic Acids Res,2004,6:23-26.
[10] Apweiler R,Bairoch A,Wu C,et al.UniProt:the Universal Protein knowledgebase[J]. Nucleic Acids Res,2004,6:115-119.
[11] International Human Genome Sequencing Consortium:Initial sequencing and analysis of the human genome[J]. Nature,2001,409:860-921.
[12] Pennisi E.The sequence of the human genome[J]. Science,2001,291:1173-1180.
[13] Collins F,Galas D.Human genome[J]. Science,1993,262(130):43-46.
[14] Alan F,Cowman Brendan S.Functional genomics:identifying drug targets for parasitic diseases[J]. Crabb Trends Parasitology,2003,19(11):538-543.
[15] Rick L,Tarleton Jessica Kissinger.Parasite genomics:current status and future prospects[J]. Current Opinion in Immunology,2001,13(4):395-402.
[16] David A,Johnston Mark L.Genomics and the biology of parasites[J]. BioEssays,2008,21(2):131-147
[17] Sara E,Melville Christiane,Neil Hall.Methods in Molecular Biology Parasite Genomics Protocols[M]. Humana Press,2004:
[18] Yvan Strahm,David Powell,Christophe Lefebvre.EST-PAC a web package for EST annotation and protein sequence prediction[J]. Source Code for Biology and Medicine,2006,(1):2
[19] Samuel Karlin.Statistical signals in bioinformatics[J]. PNAS,2005,102(38):13355-13362.
[20] Sebastien Ribrioux,Adrian Brüngger.Bioinformatics prediction of overlapping frameshifted translation products in mammalian transcripts[J]. BMC Genomics,2008,9:122.
[21] Catherine H,Schein Ovidiu Ivanciuc,Werner Braun. Bioinformatics Approaches to Classifying Allergens and Predicting Cross-Reactivity[J]. Immunol Allergy Clin North Am,2007,27(1):1-27.
[22] Chua Kek Heng,Rofina Yasmin Othman.Bioinformatics in molecular immunology laboratories demonstrated:Modeling an anti-CMV scFv antibody[J]. Bioinformation,2006,1(4):118-120.
[23] Omar J,Jabado Sean Conlan P. Comprehensive viral oligonucleotide probe design using conserved protein regions[J]. Nucl Acid Res,2008,36(1):10.
生物信息学教学模式探索任务引领生物信息学是用数理和信息科学的观点、理论和方法研究生命现象、组织和分析呈现指数增长的生物医学数据的一门学科,它是生物医学、数学、信息科学以及计算机科学等诸多学科的崭新交叉学科。生物信息学几乎是今后所有生物(医药)研究开发所必需的工具。
21世纪是生物科学的世纪。近年,我国生物技术公司对生物信息学人员的相关需求也迅速增加,浙江理工大学生命科学学院生物技术专业在进行了行业调研并进行专业课程体系构建研究后,于2006年定位和开设了生物信息学课程。该门课程经过8年多的建设后,对教学团队的建设、课程目标的设定、教学内容及教学教法的选择等方面进行了卓有成效的探索,这些探索所形成的结论,可为即将开设或正在进行该课程教学改革的学校提供可借鉴的经验。
一、生物信息学的课程特点
诺贝尔奖获得者W.Gilbert1991年提出了这样一个观点:传统生物学解决问题的方式是实验的,而现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的,是一个科学家先从理论推测出发设定研究目标,然后再回到实验中去追踪或验证这些理论假设。而生物信息学研究正是从英特网上源源不断地采集数据,进行分析、归类与重组,发现新线索、新现象和新规律,用以指导实验工作设计,是一条既快又省的研究路线。它对于找寻一个研究项目的突破口是非常重要的,选定合适的研究出发点,可避免许多不必要的重复,最大程度节约研究资源,使研究成果最大化。鉴于该门技术对生物科学的理论、实践要求以及对信息技术掌握的要求,生物信息学课程与其他课程的教学有很大不同。
1.在课程目标定位中,提高学生对相关网络资源的使用能力是该门课程的重要目标之一。学生必需使用强大的搜索功能实现数据储存、检索和分析,学校在教学资源配置上必需向此倾斜。
2.该门课程学科交叉性强,所涉及的生物及计算机等学科的相关知识更新都很快,导致其理论和实践内容不断推陈出新,这使得在教学内容选择上要紧跟这些更新,不断进行调整。
3.课程教学实践性强,同时涉及生物技术专业实践和计算机应用技术的实践,这需要教师在授课过程中根据学生的学习规律合理安排实践项目,发挥好这两种技术的协同作用。
二、生物信息学课程教学模式探索
1.教学目标与其所培养学生的核心技能
合理的课程目标与定位是决定课程建设成败和教学效果的基础,其主要依据是人才培养需求与授课对象的实际情况。经过对该门课程教学对象的研究发现,在生物专业课程体系下培养的本科生,其前导课程主要集中在生物领域,通常没有系统的学习过计算机、信息技术、编程等知识。对信息检索、模型建立、软件的识别及应用的能力相当薄弱。因此,本门课程将提高学生的信息技术能力也作为一个重要的课程目标。学生在本门课程中将学习与生物技术相关的各种数据库和软件的使用。当然,对学生信息技术能力的要求也定位在能使用、会使用就行,不需要将学生掌握生物数据库构建和软件开发作为课程教学的目标。
在课程目标的设定过程中,应牢记高校对文化的传承的功能,要使学生了解生物信息学发展的历程。在生物信息学学科发展过程中所涌现出来的著名学者,众所周知的震撼人心、启迪心灵的奇闻秩事,能使学生对这门课程产生浓厚的兴趣,甚至更深刻地领会这门课程的含义。
熟练掌握生物数据库的检索和使用是生物信息学课程教学的首要目标。到目前为止,生物学数据库总数已达500个以上,在DNA序列方面有GenBank、EMBL和DDBJ等;在蛋白质一级结构方面有UniProt、SWISS-PROT、PIR和MIPS等;在蛋白质和其他生物大分子的结构方面有PDB等;在蛋白质结构分类方面有SCOP和CATH等。各数据库均通过Internet提供多种形式的数据检索服务。例如,NCBI-GenBank数据库就提供Retrieve(Email),Entrez(Web集成信息检索)及Query(Email集成检索)等多种方式的检索服务。这类检索服务是生物数据库所能提供的多种服务中最基本的信息共享和应用服务,也是生物专业学生和科研工作者经常使用的。在教学过程中需通过设计检索任务来完成对这些数据库使用方法的学习,如通过生物数据库检索家蚕profilin基因的相关信息。
增强学生使用生物信息处理软件的能力,是生物信息学课程教学的重要目标。在世界各地,科学家每天都要通过序列比对软件进行成千上万次的序列比对。学生需要通过课程的学习熟练掌握各种生物信息处理软件,有时还有必要进行一些简单程序的设计,进而掌握发现新线索、查找新规律的工具。例如,目前,借助于生物信息手段的蛋白质预测是提供蛋白质结构及功能信息的重要方法,对这种预测方法的学习将使学生更多更快地了解蛋白质的信息,加深对生物技术科学的理解和运用。除了生物数据库和生物软件使用学习外,还要着重体现生物学文献调研和阅读、论文撰写等基本能力的训练,如EndNote文献管理软件的使用。
2.教学内容选择和教学顺序的组织
生物信息学的课程教学内容的选择,要紧随生物信息学的发展方向,涵盖最前沿知识和最先进技术领域。与此同时,教学内容的选择还应充分考虑学生基础和对该门课程的需求。生物信息学选课学生通常有两类,一类是具有较为扎实的生物学基础的学生,他们学习目的非常明确,其学习重点在于提高对生物信息实验所得结果的分析解释和验证能力。另一类是生物学基础相对较弱的学生,这些学生主要是为了了解生物信息学发展前沿、掌握检索能力以及初步的分析技能,对分析、处理、预测结果的验证涉及不多。无论哪种学生,都比较欠缺信息技术方面的知识,因此,这类知识在前面部分介绍。而后面部分则随学生的类型有所改变,我们根据授课学生的分类选择不同的授课内容和授课重点,尝试据此来划分教学组织的各个阶段,在每个教学节点精心设置任务(如表1所示)。
与其他课程的教学一样,生物信息学课程的教学需遵守学生对知识的掌握规律,其内容的选择与安排应按照循序渐进的原则。从第一阶段到第二阶段,教学内容“由易到难”。随着教学过程的深入,课程内容更侧重于对生物信息学某一专业领域的引导,此时授课教师的指导更加重要,这类领域往往与开课院系专业的优势研究领域和导师研究方向相结合。
3.课程教学方法的改革
生物信息学是一门涉及知识面深刻而广泛,学生独立自学的难度很大的交叉科学。依据建构主义教学理论的特点,这类难度大、技术性和实践性强的课程要特别重视以学生为教学主体的教学方法,应尝试从任务引领入手,将生物信息学的一些重要学习内容逐步展现出来。
在生物信息学教学中,教学内容侧重于任务引领,设定与学生生活相贴近的、接合学科发展前沿的引领任务。例如,可以从高水平杂志(Nature、Science)上根据任务引领的关键词搜索综述,根据综述总结出该任务发展脉络,提炼教学任务,将较为抽象的计算机算法、生物学基础知识融于任务中,使学生有积极参与的意愿。及时将任务相关工具提供给学生,或是提前引导学生自己查询工具,使学生有完成任务的基础。
学生在每个节点都非常清晰地知道下个节点的主题,并在完成教师的任务过程中,构建局部知识框架,形成自己的见解。教师需在课堂上和课堂以外及时掌握学生对各个节点知识的掌握情况,找到学生的最近发展区,针对重点、难点解惑,提高教学效果。这样可以使选择的教学任务吸引学生、引领学科前沿,还能在教学过程与学生的互动中有效地实现教学相长。
4.重视切合课程设计的教材编写
生物信息学不同于其他学科,其很多内容和知识节点更新很快,很多最新成果必须教师根据生物信息学发展前沿及时整理和总结,其教学内容设置着重于保证教学内容的先进性和前沿性。教材的更新和修订周期较短,几乎每学期均需要重新修订。
2001年,教育部在[2001]4号文件中明确要求直属高校的“本科教育要创造条件使用英语等外语进行公共课和专业课教学”,在信息技术、生物科学、管理、金融、法律等专业力争在3年内使外语讲授的课程达到所开课程的5%~10%,尤其强调了生物科学更要先行一步。现实情况也使英文自编教材的编写刻不容缓,现在,绝大部分前沿生物数据信息(最主要的核酸和蛋白质)数据库均为全英文操作界面,操作者只有熟练掌握生物信息学英文术语才能自如地使用该系统,才能更有效的进行生物信息学的学习和研究工作。在英文自编教材编写时,理论部分的参考书我们精心应选定了具有非常严谨理论体系和反应了最前沿生物信息技术的《BIOINFORMATICS:Databases,Tools, and Algorithms》。编写时需要特别注意应依据教学设计来设定来序化任务,突出不同教学阶段的教学重点,使学生学习过程是个循序渐进的过程。我校采用的自编教材根据教学阶段共设置五个引领任务:
(1)Pubmed检索profilin基因研究进展;
(2)家蚕profilin基因结构分析与PCR扩增引物的设计;
(3)家蚕profilin基因同源序列的获取与进化树的构建;
(4)家蚕profilin蛋白二级和三级结构的模拟;
(5)家蚕profilin蛋白理化性质和功能位点的分析.
5.合理配置网络资源和多媒体教学资源
首先,学会利用互联网、计算机、数据库和应用软件进行生物信息分析的基本方法和技能本身就是生物信息学教学重点。以往普通的多媒体教室已难以提供一个交互式的网络化、信息化的教学环境,如果想上好生物信息学这门课程,网络资源和多媒体教学资源的应用,将贯穿于整个生物信息学课程(从任务下发及申领、任务控制及执行、任务完成结果检验与反馈)的整个教与学的过程。而我们通过极域电子教室和学校4A网络教学平台结合,较好的实现了生物信息学交互式的网络化、信息化的教学环境。
课前,教师通过网络平台将任务教学内容、任务序列、工具等传递给学生,学生通过登陆互联网络,利用网络资源和软件尝试完成预习任务。此处可以设置学情反馈点,教师通过网络论坛等形式掌握学生预习情况。授课过程中,教师利用教师机客户端的文件分发系统将任务教学内容、任务序列、工具等发送到学生桌面,再通过广播教学多媒体技术为学生形象的讲解任务内容以及完成方法。每位学生在教师的监督下在互联网上执行任务。教师在监控学生完成任务过程中,不断的得到学生任务进程的反馈,对于任务中学生出现共性问题,利用网络、广播教学或演示等形式及时解决。课下,学生同样可通过学校4A网络教学平台将任务报告、作业、问题和意见等反馈给教师,教师在平台上批改任务报告后将成绩和评语发送给学生,让学生及时了解自己的学习情况,师生还可以通过平台中的网络论坛进行问题讨论等。网络环境下的生物信息学任务引领式教学,不仅能提高学生的学习兴趣,还能创造更为有效的师生互动信息教学环境。
三、结束语
经过多年的生物信息学教学实践发现,如果想建设好生物信息学课程,我们需要设定非常清晰的教学目标,理清课程需要培养学生的核心技能;结合行业发展的技术前沿精心选择教学内容,合理序化教学顺序;要依据建构教学理论,重视以学生为教学主体的教学方法,尝试从任务引领入手引领学生学习,提高学生的学习兴趣;要重视切合课程设计的教材编写,理论部分引自精选英文参考书,设计教材结构应切合任务引领的教学方法;合理配置网络资源和多媒体教学资源,加强学生互动,为成功地实现“反转课堂”提供保障。
参考文献:
[1]张林,柴惠.现代教学手段在生物信息学教学中的应用[J].新课程研究,2011,219(4):156-158.
[2]柴惠,赵虹,张婷.高等院校生物信息学双语教学课程建设之我见[J].中国高等医学教育,2010,(4):83-84.
[3]Gilbert,W.Towards a paradigm shift in biology[J].Nature,1991,(349):99.
[4]刘伟,张纪阳.“生物信息学”课程中研讨式教学实践[J].中国电力教育,2012,(23):60-61.
[5]范丙友,贾小平,胥华伟.生物信息学课程教学改革与探索[J].大学教育,2013,(16):61-62.
关键词 合成生物学;医药;能源;实践
中图分类号 R122 文献标识码 A 文章编号 1673-9671-(2012)121-0161-01
目前科学家已测定了包括人类在内的700多种生物的基因组,这表明生命科学进入遗传密码的全面解析阶段,在分子水平研究基因结构和功能。这些成果为工程师创造新世界提供了有力的生物元器件。工程师可以用这些已知的功能,重新设计和构建具有新功能的生命,甚至可以全合成新生命,这就是进入21世纪新兴的合成生物学。合成生物学是继人类基因组研究之后,生物领域的又一热门学科,是整体系统论生物学思潮在工程学领域的
再现。
1 合成生物学与其他学科的关系
1.1 合成生物学与系统生物学
合成生物学的出现是与系统生物学的发展密不可分的。从哲学思维上,二者都遵从系统论,生物系统的整体功能不可分割。系统生物学将在基因、蛋白质、代谢物等多维分子水平获得大量的细胞行为知识和建立生物网络,为合成生物学提供理论和模型。合成生物学可为系统生物学的定量分析提供模式生物。
1.2 合成生物学与生物信息学、化学
如果把基因组测序看成阅读和解码遗传信息的过程,那么合成生物学就是人工书写和编程过程,是测序的逆过程。这个过程对生物信息学提出了更大的挑战,与所有的工程学一样,合成生物的设计和优化过程中需要用新的算法进行模拟和测试。合成生物的过程是以原料核酸的高速合成为基础的,因此需要高效、低成本的化学合成技术提供支持。目前,常规化学方法合成一个碱基核苷酸商业化价格是2元左右,而新方法有望把成本降到更低。
1.3 合成生物学与基因工程
二者既有联系,也有区别。就操作对象和主要技术手段而言,二者相同,都是以基因为对象,都需要核酸酶和连接酶作为剪切和组装的工具,也都需要载体来承载基因,进行扩大繁殖和保存。然而仅采用基因工程技术,只能在较小的范围内对已经存在生命进行改造,合成生物学研究将降低关键技术成本,解决基因操作的经济性问题,从而在工程领域将得到广泛应用。
2 医药与能源创新发展中的合成生物学技术
创新药物的发现是整个新药研究中最富创造性的环节。20世纪70年代之后,DNA重组技术、基因组学、蛋白质组学、生物信息学及生物芯片技术的研究成果为新药研究提供了指导性的理论知识和多样化的实验手段,极大地促进了新药的研制和产业化。
2.1 DNA重组技术与创新药物研究
DNA重组技术通过人为的基因拼接,构建携带外源目的基因的表达系统,在宿主细胞中表达外源基因编码的蛋白质、多肽类药物。DNA重组技术为创新药物的研究和产业化提供了全新的技术,开创了现代生物技术药物的新阶段。在微生物药物的制备中,具有良好遗传特性的高产菌株是产业化的关键。重组DNA技术已成功地应用于构建具有特定遗传特性的高产菌株。如将放线菌紫红素的合成基因导入紫红链霉菌,产生了新型抗生素二氢榴菌紫红素;将红霉素抗性基因转入红霉素产生菌,可构建出耐自身产物抑制的高产菌株;将透明颤菌的血红蛋白基因导人金霉素产生菌,工程菌可以在低溶氧条件下正常代谢,达到降低供氧能耗的目的。
2.2 蛋白质组学与创新药物研究
蛋白质组学(proteomics)是继人类基因组计划之后又一个引人注目的新兴学科。蛋白质组学是从整体蛋白质水平上,从更贴近生命活动规律的角度去探讨机体生理、病理现象及其本质。人体细胞有3000~10000种以上的蛋白质。蛋白质的种类和数量及其功能状态在同一机体的不同细胞中是不相同的,即使是同一种细胞,在不同时期,其蛋白质的种类和数量也不尽相同。正常和病变状态下细胞内的蛋白质谱存在差异,服药前后的蛋白质谱也存在差异,通过定性和定量地分析蛋白质谱的差异,可以探讨疾病发生的可能机制,发现药物作用的新靶点,从而为研发新药,研究药物作用机制以及指导临床合理用药提供重要的依据。
靶向药物的研制是创新药物研制的主流。据统计,已发展了多种类型的功能或疾病靶标,涉及:肿瘤、血液与造血、免疫调节、心肾系统、胃肠系统、神经系统、内分泌系统及泌尿系统等。据Drew报告(2000年),目前使用的、据认为安全有效的多种疾药的分子靶点483个,按生物化学分类,其中受体45%,酶28%,激素与细胞因子11%,其他为离子通道、核多体等。在分子水平对疾病研究结果显示,潜在的药物靶点数目可能为5000~10000个,均可能作为研制药物的作用靶点。
2.3 生物信息学与创新药物研究
生物信息学是生物学、数学、计算机科学和信息科学等多学科交叉产生的崭新学科。生物信息学借助计算机强大的信息储存和信息分析功能处理生物学领域、尤其是基因组学和蛋白质组学研究领域中爆炸性增长的海量数据。生物信息学的核心内容至少包括基因组信息学、蛋白质组信息学和代谢调控信息学三大部分。基因组信息学指对基因信息的获取、处理、存储和分析,目的是确定全部基因的确切位置,以及各DN段的功能。蛋白质组信息学包括对有关细胞或组织中的全部蛋白质的结构、组成、功能、定位以及各蛋白质问的相互作用的信息进行处理和分析,目的是确定各种蛋白质的组成、结构和功能及相互作用。
2.4 生物芯片技术与创新药物研究
生物芯片(biochip)是近年来生命科学、微电子学和生物信息学结合交叉领域的重大进展。生物芯片分为DNA芯片、RNA芯片、蛋白质芯片、抗体芯片、PCR芯片及药物传输芯片等。生物芯片通过原位化学合成或机械点样构成高密度探针微阵列。比如DNA芯片可在1 cm2的玻璃或硅片衬底上,集中排列数万至数十万个DNA探针。从理论上讲,十至数十个这样的芯片就可以全面检查一个人的基因,从而发现结构异常或功能异常的基因。生物芯片主要用于基因序列测定,分析基因组突变和单核苷酸多态性突变位点,同时也用于测定特定基因的表达水平和比较同源基因的表达差异,以实现对细胞、蛋白质、DNA及其他生物组分的准确、快速和大信息量的检测。生物芯片技术的发展为疾病的临床诊断和个性化治疗开辟了全新的途径,同时为创新药物的高通量筛选(high throughput screening,HTS)提供了强有力的技术支撑平台。
3 结束语
合成生物学为很多领域的研究提供新视角:生物学家用它来重建不同层次的研究对象,由此加深对生命活动和生命过程的理解;化学家用它创造新分子化合物;物理学家用它来发现自然状态下分子的运动行为;工程技术人员则用它进行药物、生物材料和生物能源等工程设计并简单、低廉、高效地制造,满足人类和社会发展的需要。
参考文献
[1]刘夺,杜瑾,赵广荣等.合成生物学在医药及能源领域的应用[J].化工学报,2011,62(9):2391-2397.
[2]梁泉峰,王倩,祁庆生等.合成生物学与微生物遗传物质的重构[J].遗传,2011,33(10):1102-1112.
>> 丹参类贝壳杉烯氧化酶(SmKOL)基因全长克隆及其生物信息学分析 红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析 雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析 丹参SmNAC1基因的克隆和生物信息学分析 黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达 太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 人组蛋白去乙酰化酶11的克隆表达与生物信息学分析 金铁锁糖基转移酶PtT1的克隆与生物信息学分析 平邑甜茶MhWRKY15基因cDNA克隆及其生物信息学分析 茶陵野生稻冷响应基因OrCr3的克隆及其生物信息学分析 唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析 棉铃虫类胰蛋白酶的生物信息学分析 玉米谷胱甘肽过氧化物酶的生物信息学分析 黔北麻羊RERGL基因cDNA克隆与生物信息学分析 小菜蛾p38MAPK基因的克隆与生物信息学分析 高丛越桔UFGT基因电子克隆和生物信息学分析 小菜蛾PxALP1基因的克隆与生物信息学分析 希金斯炭疽菌腺苷酸环化酶生物信息学分析 黄瓜DVR基因的生物信息学分析 FZ6基因及其蛋白的生物信息学分析 常见问题解答 当前所在位置:l)查找开放阅读框(ORF)。生物信息学分析主要采用一些网上软件包进行分析,如采用Interpro (http://ebi.ac.uk/tools/interproscan)进行结构域比对,ExPASy在线服务器的Compute pI/Mw工具(http:///compute_pi/)预测相对分子质量与理论等电点,TargetP1.1 server (http: //cbs.dtu. dk /serv- ices/targetP/)进行信号肽分析,Psort (http://psort.hgc.jp/)及WOLFPSORT (http:///)分析亚细胞定位,TRMHMM server v 2.0 (http:// cbs. dtu.dk/services/TMHMM-2.0/)进行跨膜域分析,Predictprotein (https:///)进行二级结构预测,SWISS-MODEL (http://swissmodel.expasy. org/)进行二级结构分析和结构域的三维同源建模。使用DNAMAN软件对序列进行多重比对,用ClustalW分析软件与其他植物的MCS氨基酸序列进行同源比对,根据分析结果选择17种植物的MCS氨基酸用MEGA 5.1软件构建进化树。
2.4 SmKOL基因的表达分析 取0.1 g毛状根样品采用Trizol试剂盒提取总RNA,用Takara反转录试剂盒反转录成cDNA。其过程为:总RNA模板1 μL(约200 ng),dNTP 1 μL, Radom 6 mers 2 μL,不含RNase的去离子水至10 μL,离心,置于PCR仪上,65 ℃ 5 min,之后冰上急冷。然后加入5×PrimerScript Buffer 4 μL,RNase Inhibitor 0.5 μL,PrimerScript Rtase 1 μL,RNase free H2O 4.5 μL。PCR反应条件为30 ℃ 10 min,42 ℃ 60 min,70 ℃ 15 min,所得cDNA用于Real-time PCR。根据丹参内参β-actin和目标基因SmKOL的核苷酸序列设计引物。其中β-actin上游引物为5′ -AGGAACCACCGATCCAGACA-3′,下游引物为5′ -GGTGCCCTGAGGTCCTGTT-3′;SmKOL上游引物为5′ -GCTTCTGGCAAGGCAATCAAC-3′,下游引物为5′ -CTTTTCCTCGTTGAGTTGGTCG-3′。转录后的cDNA用管家基因引物β-actin进行普通PCR反应,用于反转录质量控制,待目的基因引物及管家基因引物检测合格后,在ABI7300 RT-PCR仪上进行荧光定量检测,反应体系为:5 μL Power SYBR Green PCR Master Mix,0.2 μL引物F,0.2 μL引物R,1.0 μL cDNA,3.6 μL ddH2O。PCR反应条件为95 ℃ 30 s;95 ℃ 5 s;60 ℃ 34 s,40个扩增循环;检测溶解曲线。反应结束后分析荧光值变化曲线和溶解曲线。每个反应重复3次,采用2-ΔΔCT法分析结果。
3 结果
3.1 丹参毛状根SmKOL基因的全长克隆及序列分析 将基因cDNA序列进行Blast比对分析,结果表明测得的片段与其他植物中的KO基因有70%左右的同源性,并有相似的保守区域。将所得的片段进行拼接,获得基因全长序列,共1 884 bp核苷酸,命名为SmKOL,GenBank登录号为KJ606394,DNAMAN软件结合ORF Finder在线软件对SmKOL基因全长cDNA序列进行分析,推测编码519个氨基酸的蛋白质,并含有完整的开放阅读框(open reading frame, ORF),SmKOL基因的开放阅读框位于23~1 582 bp,序列的1~22 bp为5′非翻译区(5′UTR),1 583~1 884 bp为3′非翻译区(3′UTR)。
Blast结果显示SmKOL基因与甜橙Citrus sinensis的KO基因有68%相似, 西洋梨Pyrus communis的KO基因有66%相似、苜蓿Medicago truncatula的KO基因有67%相似、葡萄Vitis vinifera的KO基因有65%相似、拟南芥Arabidopsis thaliana的KO基因有64%相似、粳稻Oryza sativa Japonica Group的KOL基因有57%相似。KOL具有比较保守的结构域,用DNAMAN程序对比葡萄(AFD54196.1)、苜蓿(XP_003637273.1)、西洋梨(AEK01241.1)、粳稻(AAT81230.1)拟南芥(AED93499.1)的氨基酸序列进行多序列比对(图1)。结果表明家族具有较高同源性。使用Interpro结构域比对,结果表明SmKOL具有与IPR001128的Cytochrome P450 domain和IPR017972的Cytochrome P450相同保守位点(图2)。
3.2 KOL氨基酸序列的分子系统进化树分析 将SmKOL与GenBank中的17种植物的17种蛋白进行比对分析,在软件MEGA 5.1上采用相邻链接法构建KOL进化树,进行聚类分析(图3)。SmKOL与阿拉比卡种小果咖啡KOL聚为一类,两者在本文所选蛋白中的亲缘关系最近。
3.3 理化性质和3D结构预测 使用ExPASy在线服务器的Compute pI/Mw工具预测,SmKOL蛋白的相对分子质量为58.88 kDa,等电点pI 7.62。亚细胞定位结果表明可能定位于细胞质或者细胞核。信号肽分析表明为分泌蛋白,前23个氨基酸可能是信号肽,跨膜域分析可能为膜蛋白。SmKOL蛋白的二级结构预测结果显示,α螺旋结构占50.10%、β折叠结构占6.36%、无规则卷曲结构占43.55%。蛋白质的功能很大程度上取决于其空间结构,无规则卷曲结构决定了蛋白质,尤其是酶的功能部位常常位于这种构象区域,而α螺旋主要对蛋白质骨架起稳定作用,通过对蛋白质二级与三级结构预测和分析,有助于理解蛋白质功能与结构的关系[10]。使用Swiss Model进行同源建模,以人Cytochrome P450 2R1蛋白A链(PDB注册号3czh.1.A)作为同源模板,用于建模的氨基酸序列残基为46~511位,序列相似性为23.56%,模型质量得分(GMQE)0.55(图4)。
3.4 SmKOL受茉莉酸甲酯(MeJA)诱导的诱导表达分析 实时荧光定量PCR实验数据结果采用2-ΔΔCT法进行相对定量表达分析,即确定目标基因(SmKOL)和参照基因(β-actin)有相近的扩增效率,就可以确定不同样本中目标基因表达水平的相对差异。不同时段MeJA诱导的丹参毛状根中SmKOL相对表达发现,MeJA能明显诱导丹参毛状根中SmKOL基因mRNA的表达。实验检测了丹参毛状根经MeJA处理12,24,36,120 h后SmKOL基因的诱导表达情况,结果显示经MeJA处理后的SmKOL基因的诱导表达水平在0~36 h逐渐升高,在36 h时达到最大值,随后120 h时SmKOL基因的表达量下降(图5)。
4 讨论
由于丹参毛状根具有遗传稳定性高、产率高等优点,近年来常应用于次生代谢产物的生产。本研究首次从丹参毛状根中克隆得到了赤霉素代谢途径上的KOL基因,获得含有完整ORF的基因全长,并利用生物信息学的方法对其核酸及其推测的蛋白序列组成进行分析。结果表明,该基因与其他物种中的KO基因有较高的同源性,命名为SmKOL,它具有Cytochrome P450 domain,这在所有的家族成员中都是保守的。
同时,SmKOL基因诱导表达结果表明,经诱导子MeJA诱导后,SmKOL的mRNA表达量逐渐上调,在36 h达到最大值,之后表达量下降。随着丹参赤霉素生物合成途径中基因的不断挖掘,为在分子水平上认识赤霉素合成途径中的编码基因、调控方式、酶反应动力学及其代谢调节的分子机制奠定基础[11]。SmKOL基因的克隆为进一步研究该基因的功能和丹参赤霉素生物合成及其次生代谢调控机制提供了靶基因。
[参考文献]
[1] Ogawa M, Kusano T, Koizumi N, et al. Gibberellin-responsive genes: high level of transcript accumulation in leaf sheath meristematic tissue from Zea mays L[J]. Plant Mol Biol, 1999, 40(4): 645.
[2] 虞慧芳, 曹家树, 王永勤. 植物矮化突变体的激素调控[J].生命科学,2002, 14(2):85.
[3] Wang Q, Hillwig M L, Wu Y S, et al. CYP701A8: a rice ent-kaurene oxidase paralog diverted to more specialized diterpenoid metabolism[J]. Plant Physiol, 2012, 158(3): 1418.
[4] 李节法, 田义轲, 王彩虹, 等. 梨贝壳杉烯氧化酶基因PpKO的克隆及生物信息学分析[J]. 园艺学报, 2012, 10: 1575.
[5] Miyazaki S, Katsumata T,Natsume M, et al. The CYP701B1 of Physcomitrella patens is an ent-kaurene oxidase that resists inhibition by uniconazole-P[J]. FEBS Lett, 2011, 585(12): 1879.
[6] Lei L, Fan Z R, Tang L, et al. Molecular cloning and identification of tissue-specific expression of ent-kaurene oxidase gene in Momordica charantia[J]. Afr J Biotechnol, 2011, 10(70): 15724.
[7] Ko K W, Lin F Q, Katsumata T, et al. Functional identification of a rice ent-kaurene oxidase, OsKO2, using the pichia pastoris expression system[J]. Biosci Biotechnol Biochem, 2008, 72(12): 3285.
[8] Song J, Guo B J, Song F W, et al. Genome-wide identification of gibberellins metabolic enzyme genes and expression profiling analysis during seed germination in maize[J]. Gene, 2011, 482(1-2): 34.
[9] Morrone D, Chen X M, Coates R M, et al. Characterization of the kaurene oxidase CYP701A3, a multifunctional cytochrome P450 from gibberellin biosynthesis[J]. Biochem J, 2010, 431: 337.
[10] Zhou X Y, Li J Y, Fan Z Q. Cloning and expression analysis of chalcone isomerase gene cDNA from Camellia nitidissima[J]. Forest Res, 2012, 25: 93.
[11] 谈心, 马欣荣. 赤霉素生物合成途径及其相关研究进展[J]. 应用与环境生物学报,2008, 14(4): 571.
Cloning and bioinformatics analysis of ent-kaurene oxidase
synthase gene in Salvia miltiorrhiza
HU Ya-ting1, GAO Wei2, LIU Yu-jia2, CHENG Qi-qing2, SU Ping2, LIU Yu-zhong1, CHEN Min1*
(1. State Key Laboratory of Dao-di Herbs, National Resource Center for
Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2. School of Traditional Chinese Medicine, Capital Medical University, Beijing 100069, China)
[Abstract] Based on the transcriptome database of Salvia miltiorrhiza, specific primers were designed to clone a full-length cDNA of ent-kaurene oxidase synthase (SmKOL) using the RACE strategy. ORF Finder was used to find the open reading frame of SmKOL cDNA, and ClustalW has been performed to analysis the multiple amino acid sequence alignment. Phylogenetic tree has been constructed using MEGA 5.1. The transcription level of SmKOL from the hairy roots induced by elicitor methyl jasmonate (MeJA) was qualified by real-time quantitative PCR. The full length of SmKOL cDNA was of 1 884 bp nucleotides encoding 519 amino acids. The molecular weight of the SmKOL protein was about 58.88 kDa with isoelectric point (pI) of 7.62. Results of real-time quantitative PCR analyses indicated that the level of SmKOL mRNA expression in hairy roots was increased by elicitor oMeJA,and reached maximum in 36 h. The full-length cDNA of SmKOL was cloned from S. miltiorrhiza hairy root, which provides a target gene for further studies of its function, gibberellin biosynthesis and regulation of secondary metabolites.