时间:2023-06-13 09:27:15
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇神经网络文本分类,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
法,并介绍了在TMS320C540
>> 一种新的基于改进的ADALINE神经网络的DTHF解码器方案 AVS解码器流水线控制机制的一种改进设计 一种SoC架构的AVS硬件解码器设计方案 一种基于BP神经网络整定的PID控制器的算法改进 一种基于改进的BP神经网络的入侵检测方法 基于一种改进BP神经网络算法的教学质量评价研究 一种基于ART2神经网络的算法改进 一种基于改进BP神经网络预测T/R组件温度的方法 一种基于改进神经网络的高效模糊聚类算法 一种基于模糊神经网络的印刷品字符识别器 一种基于遗传神经网络文本分类器的研究 一种新的基于灰色关联分析的BP神经网络剪枝算法 一种新的基于神经网络的IRT项目参数估计模型 一种基于短语统计机器翻译的高效柱搜索解码器 一种基于SOM神经网络的污水处理工艺方案比选方法 一种基于BP神经网络的数控机床伺服系统控制器 一种改进的BP神经网络算法在入侵检测中的应用 一种改进的BP神经网络车牌识别算法的研究 一种改进的BP神经网络算法分析 一种ART2神经网络的改进算法 常见问题解答 当前所在位置:中国 > 科技 > 一种新的基于改进的ADALINE神经网络的DTHF解码器方案 一种新的基于改进的ADALINE神经网络的DTHF解码器方案 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者:未知 如您是作者,请告知我们")
申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 摘 要:本文提出了一种新的基于改进的AD址INE神经网络DTMF信号检测算
法,并介绍了在TMS320C5402和TLV320AICl0上采用此算法的DTMF
关键词:极限学习机;稀疏自动编码器;集成学习;文本分类
1 概述
随着现代社会的发展,互联网成为了人们获取文本信息的重要手段。然而网上的信息杂乱无章,使得人们很难快速而准确的获得所需要的文本信息。因此如何有效的对文本进行分类,帮助用户找到所需的信息成为当代信息技术领域的一个重要课题[1]。
本文提出利用深度学习中的稀疏自动编码器自动选取文本的特征,然后利用极限学习机作为基分类器进行文本的分类,最后结合Adaboost集成学习方法将极限学习机作为基分类器组合成一个效果更好的分类器。实验结果表明,该算法在文本分类方面,可以有效地提高文本分类的准确性。
2 相关理论基础
2.1 稀疏自动编码器
稀疏自动编码器(sparse auto encoder,SAE)是利用人工神经网络的特点构造而成的网络。稀疏自动编码器的训练过程分为两个步:第一步是预训练,即先利用无监督的方法将SAE的输入层和隐含层全部初始化,然后再利用逐层贪心训练算法确定网络的参数。第二步是微调,其思想是整个网络视为一个整体,用有监督学习的方法优化整个网络的参数,由于SAE训练过程的复杂性,具体过程可参考文献[2]。
2.2 极限学习机
针对传统神经网络训练过程时间漫长,优化困难等缺点,新加坡南洋理工大学的黄广斌教授提出了一种全新的单隐层前馈神经网络-极限学习机(Extreme Learning Machine,ELM)[3],该网络能够以极快的学习速度达到较好的泛化性能,从而解决了传统神经网络学习速度缓慢的限制。该网络主要由输入层,隐藏层和输出层组成,其中隐藏层的神经元通过激活函数把输入的数据进行变换,然后把变换后的数据输出到输出层,在网络中输入层和隐藏层的权值是随机设置的,只有隐藏层到输出层的权值需要求解,因此加快了网络的学习速度。
2.3 Adaboost分类器
由于单个分类器通常无法满足分类任务的要求,因此需要通过集成学习来构建并结合多个分类器来完成分类任务,这其中最著名的是在1995年由Freund等提出的Adaboost[4]算法。该算法的核心思想是先从初始训练集训练出一个基学习器,再根据基学习器的变现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续收到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直到基学习器数目达到指定的值,最终将这几个基学习器进行加权结合。Adaboost是一种迭代算法,具体训练过程可参考南京大学周志华教授编写的机器学习课本中关于Adaboost算法的章节。
3 SEA文本分类算法
在本文中,结合稀疏编码器,极限学习机与Adaboost这三种机器学习方法提出SEA文本分类算法,该算法的工作流程如图1所示。
该分类算法的第一步为输入,输入的是经过了向量化表示的文本,但没有经过任何的手工特征提取。第二步是利用SAE算法对数据的重建能力自动选择文本的特征,用SAE算法选择的文本特征可以有效地复原原始文本信息。第三步是利用ELM分类器作为该算法的基分类器,ELM作为第四步中的基分类器参与训练,最后一步是输出该文本属于哪一类。
4 实验结果与分析
4.1 实验数据集与评价指标
本文选用的分类文本数据来源于新闻数据集[5],该数据集复旦大学计算机信息与技术系李荣陆提供,数据集标注比较规范,规模适中,适合于进行文本分类的仿真实验。
在文本分类中常用的评价指标有准确率P(Precision)和召回率R(Recall),公式如下:
P=M/(M+N),R=M/(M+T)
其中,M为正确分类到该类的文本数,N为错分到该类中的文本数,T为属于该类确误分为别类的文本数。
4.2 实验结果
为验证本文提出的SEA文本分类模型,需要将文本数据集进行预处理,对于SEA模型来说,就是进行文本分词。本实验文本分词采用的是NLPIR汉语分词系统,其主要功能包括中文分词,词性标注,命名实体识别,用户字典功能等,是国内比较成熟,用户较多的中文文本分词系统。经过文本预处理后,按照本文提出的SEA文本分模型进行实验,并和几种经典的分类算法做对比。在本实验中Adaboost集成学习算法中基分类器的个数设置为10个,基分类器ELM中隐藏层的个数设置为输入层的0.75倍,稀疏自动编码器中隐藏层数设置为4,实验结果如表1和表2所示。
从表1和表2可以看出随着文本数量的增加,SEA模型的分类准确率和召回率逐渐提高,这是由于在训练数据集较小时,稀疏编码器对自动提取的文本特征变现地不是很理想,容易造成SEA分类模型产生过拟合现象,从而影响分类准确率和召回率。SVM算法在训练数据集比较小时,变现良好,这是由于在训练数据较少时,可以较容易地找到分类超平面,在数据量变大时,由于计算量的增大,使得计算量变大,导致计算得到的超平面效果不好,使得分类准确率和召回率不断下降。BP和ELM算法都随着训练数据的增大,其分类准确率和召回率在不断变大,这是由于随着训练数据的增大,BP和ELM可以更有效的提取输入数据的特征,但ELM算法相比BP算法变现得更好,这是由于BP算法可能无法收敛到最优值,导致分类算法的准确率下降。
综上所述,本文提出的SEA文本分类模型可以有效的提高文本分类的准确率和召回率,尤其是随着训练数据集的不断增大。
5 结束语
文本分类在文本处理中占据着重要的地位,其分类的好坏直接影响着后续的文本处理,如何有效地对文本分类是一个重要的研究课题。本文结合稀疏自动编码器,极限学习机与Adaboost集成学习方法提出SEA文本分类方法,实验结果表明该分类方法可以有效将文本分类过程中的特征提取和分类器结合在一起,从而提高了分类结果的准确性。
参考文献
[1]秦胜君,卢志平.稀疏自动编码器在文本分类中的应用研究[J].科学技术与工程,2013,13(31):9422-9426.
[2]Baldi P, Guyon G, Dror V, et al. Autoencoders, Unsupervised Learning, and Deep Architectures Editor: I[J].Journal of Machine Learning Research,2012.
[3]Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006,70(1-3):489-501.
[4]Freund, Yoav, Schapire, Robert E. A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting[J]. Journal of Computer & System Sciences, 1999,55(1):119-139.
关键词:卷积神经网络;语言模型;分析
1 卷积神经网络语言模型
CNN语言模型基本结构包括输入层、卷积层、池化层及后续的分类层。输入层是表示语言的矩阵,该矩阵可以是通过Google word2vec或GloVe预训练得到的词嵌入表示,也可以是从原始数据重新训练的语言的向量表示。输入层之后是通过线性滤波器对输入矩阵进行卷积操作的卷积层。在NLP问题中,输入矩阵总是带有固定顺序的结构,因为矩阵的每一行都表示离散的符号,例如单词或者词组等。因此,使用等宽的滤波器是非常合理的设置。在这种设置下,仅需要考虑滤波器的高度既可以实现不同尺寸的滤波器做卷积操作。由此可知,在处理NLP问题时,卷积神经网络的滤波器尺寸一般都是指滤波器的高度。
然后,将卷积层输出的特征映射输入池化层,通过池化函数为特征映射进行降维并且减少了待估计参数规模。一般的,CNN池化操作采用1-max池化函数。该函数能够将输入的特征映射统一生成维度相同的新映射。通过池化操作,可以将卷积层生成的特征连接成更抽象的高级特征,所得到的高级特征尺寸与输入的句子不再存在直接关系。
最后,将得到的高级特征输入softmax分类层进行分类操作。在softmax层,可以选择应用dropout策略作为正则化手段,该方法是随机地将向量中的一些值设置为0。另外还可以选择增加l2范数约束,l2范数约束是指当它超过该值时,将向量的l2范数缩放到指定阈值。在训练期间,要最小化的目标是分类的交叉熵损失,要估计的参数包括滤波器的权重向量,激活函数中的偏置项以及softmax函数的权重向量。
2 卷积神经网络语言模型应用分析
CNN语言模型已经广泛应用于诸如文本分类,关系挖掘以及个性化推荐等NLP任务,下面将对这些应用进行具体的介绍与分析。
2.1 CNN在文本分类中的应用分析
kim提出了利用CNN进行句子分类的方法。该方法涉及了较小规模的参数,并采用静态通道的CNN实现了效果很优异的句子分类方法。通过对输入向量的调整,进一步提高了性能实现了包括情感极性分析以及话题分类的任务。在其基础上为输入的词嵌入设计了两种通道,一种是静态通道,另一种是动态通道。在卷积层每一个滤波器都通过静态与动态两种通道进行计算,然后将计算结果进行拼接。在池化层采用dropout正则化策略,并对权值向量进行l2约束。最后将该算法应用于MR、SST-1与SST-2、Subj、TREC、CR以及MPQA等数据集。MR数据集为电影评论数据集,内容为一句话的电影评论,其分类包括积极情感极性与消极情感极性两类。SST-1与SST-2数据集为斯坦福情感树库是MR数据集的扩展,但该数据集已经划分好了训练集、验证集及测试集并给出了细粒度的标记,标记包括非常积极、积极、中性、消极、非常消极等情感极性。Subj数据集为主观性数据集,其分类任务是将句子分为主观句与客观句两类。TREC数据集为问题数据集,其分类任务是将所有问题分为六类,例如关于数字、人物或位置等信息的问题。CR数据集为评论数据集,包括客户对MP3、照相机等数码产品的评论,其分类任务是将其分为积极评价与消极评价两类。MPQA数据集是意见极性检测任务数据集。通过实验证明,该方法在这几个典型数据集上都能取得非常优异的效果。
2.2 CNN在关系挖掘中的应用分析
Shen等人提出了一种新的潜在语义模型,以词序列作为输入,利用卷积-池化结构为搜索查询和Web文档学习低维语义向量表示。为了在网络查询或网络文本中捕捉上下文结构,通过输入单词序列上下文时间窗口中的每个单词来获取词汇级的n-gram语法特征,将这些特征聚合成句子级特征向量。最后,应用非线性变换来提取高级语义信息以生成用于全文字符串的连续向量表示。该模型的不同之处在于,输入层与卷积层之间加入了word-n-gram层与letter-trigram层,它们能够将输入的词序列转变为letter-trigram表示向量。在卷积层通过上下文特征窗口发现相邻单词的位置特征,并变现为n-gram形式。然后通过max池化将word-n-gram特征合并为句子级的高级特征。在池化层之后增加了语义层来提取更高级的语义表示向量。
2.3 CNN在个性化推荐中的应用分析
Weston等人提出了一种能够利用标签(hashtag)有监督的学习网络帖子短文本特征表示的卷e嵌入模型(Convolutional Embedding Model)。该方法利用提出的CNN模型在55亿词的大数据文本上通过预标注的100,000标签进行训练。该方法除了标签预测任务本身能取得好的效果外,学习到的特征对于其它的文本表示任务也能起到非常有效的作用。该模型与其它的词嵌入模型类似,输入层为表示文本的矩阵,但是,在用查找表表示输入文本的同时将标签也使用查找表来表示。对于给定的文档利用10万条最频繁出现的标签通过评分函数对任何给定的主题标签进行排序。
其中,econv(w)表示CNN的输入文档,elt(t)是候选标签t的词嵌入表示。因此,通过对分数f(w,t)进行排序可以获取所有候选主题标签中排序第一的话题进行推荐。实验数据集采用了两个大规模语料集,均来自流行的社交网络文本并带有标签。第一个数据集称作people数据集,包括搜集自社交网络的2亿1000万条文本,共含有55亿单词。第二个数据集被称作pages,包括3530万条社交网络文本,共含有16亿单词,内容包括企业、名人、品牌或产品。
3 结束语
卷积神经网络应用于语言模型已经取得了非常大的发展,对于自然语言处理中的各项任务均取得了优异的结果。本文通过对几项典型工作的分析,探讨了不同卷积神经网络模型结构在不同任务中的表现。通过综合分析可以得出以下结论。首先,CNN的输入采用原始数据训练的向量表示一般效果会优于预训练的词嵌入表示;其次,在卷积层滤波器的尺寸一般采用宽度与输入矩阵宽度相等的设置;最后,为了优化结果可以采用dropout正则化处理。
关键词:模糊神经网络;蔬菜;病害;诊断
中图分类号:TP182;S435 文献标识码:A 文章编号:0439-8114(2013)17-4224-04
Research on vegetables Disease Diagnosis Model Based on Fuzzy Neural Network
WEI Qing-feng,LUO Chang-shou,CAO Cheng-zhong,GUO Qiang
(Institute of Agriculture Science and Technology Information, Beijing Academy of Agriculture and Forestry Sciences, Beijing, 100097)
Abstract: To explore the effective method for the diagnosis of vegetables diseases, through reasonable division of symptoms, using input vector construction method which contained characteristics of symptoms and membership grade, a vegetables disease diagnosis of fuzzy neural network model was constructed. The experimental results showed that the input vector construction method had effectively expressed the disease diagnosis rule, the model had strong fault tolerant ability, and the average diagnostic accuracy was 85.5%.
Key words: fuzzy neural network; vegetable; disease; diagnosis
收稿日期:2013-01-30
基金项目:国家现代农业科技城综合信息“三农”服务平台建设项目(PT01);北京市自然科学基金项目(9093019);北京农业科学院信息所
创新基金项目(SJJ201203)
作者简介:魏清凤(1983-),女,湖北武汉人,助理研究员,硕士,主要从事农业信息技术的研究工作,(电话)13439026360(电子信箱)
;通讯作者,罗长寿,副研究员,(电话)010-51503387(电子信箱)。
病害是影响蔬菜优质生产的重要制约因素之一。我国农村基层还相对缺乏有经验的病害诊断专家,对蔬菜病害不能正确判断,不但延误了防治最佳时机,还严重降低了蔬菜品质。
当前农业病害诊断技术方法主要有图像分析诊断[1-4]、专家系统诊断[5-7]以及人工神经网络诊断[8]等。基于图像分析的病害诊断方法其图像的获取受环境光照的影响较大,且需要专业人员在室内进行数据分析和识别,时效性差,无法实时满足具体生产实践的要求。基于专家系统的诊断方法,采用 IF-THEN产生式推理,存在诊断知识获取有瓶颈、推理规则更新难、容错能力差、串行搜索运行效率低等不足。近年基于人工神经网络的方法无需建立推理规则,具有自学习及并行处理能力,较引人注目,但存在对病害症状的典型性、非典型性模糊特点无法区分度量,样本诊断规律学习不充分等问题。模糊神经网络可以将不确定的症状信息通过模糊隶属集来表示,能解决诊断系统中的不确定性知识表示、并行推理等问题,对具有模糊性复杂性的蔬菜病害诊断非常适用。此文利用模糊系统和神经网络相结合的方法,在对病害特征模糊量化方法研究的基础上,建立能够实际应用的蔬菜病害模糊神经网络诊断模型,为蔬菜病虫害防治提供依据。
1 蔬菜病害诊断知识整理
一般研究中,将植株的发病部位划分为根、茎、叶、花、果5个部分[9]。由于部分蔬菜病害(如猝倒病)在苗期即表现出典型症状,因此,为提高诊断的全面性和准确性,将蔬菜植株发病表现最终划分为根、茎蔓、叶、花、果、苗6个部分。表示如下:
S={Si | i=1,2,3,4,5,6}
式中,Si表示根、茎蔓、叶、花、果、苗6个部分中的1个。
以“北京农业数字资源中心”中蔬菜病害数据库的知识为基础,结合文献资料、植保专家咨询及案例分析,对病害特征知识根据根、茎蔓、叶、花、果、苗6个部分进行分别提取,建立二维知识表。
2 病害症状重要性划分及隶属函数
不同症状对病害诊断的贡献程度不同,一些特征明显的症状表现往往是确定某种病害的重要依据。通常用模糊的自然语言来描述症状对于病害识别的重要程度,这里将其划分为典型症状、主要症状、一般症状3个层次(表1)。
将症状重要性隶属函数定义为模糊语言值,根据专家经验法,确定不同层次的隶属度如下:
L(Si)=1.0 Si∈a0.7 Si∈b0.4 Si∈c i={1,2,3,4,5,6}
L为Si的隶属度,a、b、c为症状类型。
3 基于术语统一描述的病害症状向量构建
一般方法中,直接利用诊断资料的原始文本,以症状表现部位为单元赋权值(或隶属度)作为样本分量构建输入向量[10],不仅存在向量携带信息量少、向量模长短不一、诊断规律体现不明显等问题,还容易产生相同的样本向量对应不同病害种类的错误情况,不能较好地对病害原因进行区分,这也势必影响到诊断的准确性。对此,本方法将原始资料的自然语言样本映射到共同语义空间中,统一利用病状病症的相关术语对症状资料的原始文本进行描述,并根据术语的定义值以及症状重要性隶属度来确定语义样本的样本值,从而构建输入向量,能有效丰富向量信息承载量,充分表达诊断规律,具体如下。
3.1 自然语言症状的术语映射
本环节即是对原始自然语言病害症状资料在共同语义空间中利用相关术语进行统一描述。根据植物学知识,感病植株的外观病态表现可分为病状和病征两大类。共同语义空间的病害症状术语如表2所示。
根据病害症状表,症状的自然语言描述转化为术语描述。如辣椒枯萎病茎蔓部自然语言症状={水浸状腐烂,后全株枯萎,病部白色霉状物},经语义空间映射后,S2={湿腐,枯死,霉状物},其样本定义值D(S2)为{0,0,2,2,0,1}。
3.2 输入向量的构建
综合样本定义值和症状重要性隶属度,形成具有症状特征和症状重要性信息的向量。为了降低输入向量维度,对矩阵中同列均为0值的列进行简约,形成最终输入向量矩阵。输入向量表示为:
Xi={D(S1)×L(S1),D(S2)×L(S2),……,D(Si)×L(Si)}
其中,D(Si)为Si症状的样本定义值,L(Si)为Si症状的重要性隶属度。
4 蔬菜病害诊断模型建立
蔬菜病害诊断神经网络模型采用模糊BP神经网络构建(图1)。模糊系统和神经网络按串联方式连接,用模糊系统对原始知识进行前处理,用神经网络进行病害诊断。
第一层为输入层,其每一个节点代表一个输入变量,它将样本定义值传递到模糊层。
第二层为模糊层,基于症状样本定义值和症状隶属度构建输入向量。
第三层为隐含层,实现输入变量模糊值到输出变量模糊值映射。隐含层节点数确定方法如下:
l=■+a 0
式中,l为隐含层神经元个数,n为输入层神经元个数,m为输出层神经元个数,a为取值0~10之间的常数。
第四层为输出层,输出向量采用“n中取1”的二进制编码法。其中n为编码长度,即病害总数。每组编码中仅有1位为1,其余n-1位为0,表示某一种病害。诊断过程中,最大向元值对应着可疑病害。该最大值若接近0, 则表示发生相对应病害的可能性很小;若接近1,则表明发生相对应病害的可能性极大。
5 诊断测试分析
以番茄白绢病、番茄猝倒病、番茄根霉果腐病、番茄青枯病等19种病害为例,经上文方法构建20维输入向量(部分输入如表3),19维输出向量(部分输出向量如表4)。设隐层单元15个,目标误差0.000 1,循环1 000次,采用Levenberg-Marquardt 算法进行训练,并开发系统界面,对训练好的模型从诊断容错性和诊断准确性两个角度进行分析。
5.1 模型诊断容错性测试
在实际应用过程中,用户提供的病害症状无法与样本完全一致,病害典型症状被选的可能性最大,但部分主要症状和一般症状存在A-误选(提供症状与样本症状不一致)、B-多选(提供症状多于样本症状)、C-少选(提供症状少于样本症状)、A+B-多选及误选、A+C-少选及误选的情况,据此选取用户5组具有代表性测试数据(表5),以番茄溃疡病为例来检验模型的容错性,输出结果如表6。
样本输出向量中第17位为向元最大值,则表明该输出结果为番茄溃疡病。在5组具有代表性的用户测试数据中,输出向量的向元最大值始终在第17位,说明诊断模型具有较强的容错能力。同时,当用户“误选”、“多选”,以及“多选+误选”时,输出向量第17位向元值分别为0.999 9、0.987 6、0.921 6,接近样本模拟值1;当用户“少选”以及“少选+误选”时,输出向量第17位向元值分别为0.778 6、0.594 6,较之其他组测试数据,较远离样本模拟值1,说明用户提供的病害症状信息越多,进行正确诊断的可能性越大。
5.2 模型诊断准确性测试
将本研究与一般方法中直接利用症状权值作为输入向量的一般神经网络诊断模型进行准确性比较。测试数据包括两类,即实验室根据田间数据资料生成的数据,以及涉农用户根据实际生产情况进行症状选择操作生成的数据。经植保专家验证,获得测试结果平均值见表7。
统计结果显示,室内室外测试中,基于模糊神经网络的诊断方法较一般神经网络在正确率方面均有所提高,说明本研究的思路方案是有效的。其中,实验室所利用的田间数据资料测试结果好于农户实际应用。其原因在于,实验室所使用的田间数据资料较接近文献资料中的诊断知识,且基于模糊神经网络的蔬菜病害模型具有较好的容错性,因此诊断正确率较高。外部基层农户则完全按照自己在生产中见到的症状表现进行选择操作而形成测试数据,更为真实地反映了模型的实际应用情况。由于实际生产中存在多个病害夹杂同时表现的复杂情况,这一定程度上影响了诊断正确率,因此也说明在该方面努力能进一步提高模型的实用性。
6 小结
利用基于术语统一描述的病害症状量化方法,能构建既能描述症状特征又能反映症状重要性的输入向量,更能有效地体现病害诊断规律。经过误选、多选、少选、多选+误选、少选+误选的5组测试中,诊断结果仍然能指向正确的病害,模型容错推理能力较强。将模糊数学方法引入神经网络中,结合基于术语统一描述的病害症状量化方法,建立基于模糊神经网络的蔬菜病害诊断模型,较之一般基于神经网络的病害模型,诊断准确性得到了有效提高。
由于农业生产中病害作用的复杂性,今后将在多个病害同时作用的诊断方面进一步努力探索,以提高模型的生产实用性。同时,随着移动网络技术的迅猛发展以及移动设备终端的日益普及,将进行蔬菜病害诊断系统的研究,以期为蔬菜病虫害防治咨询提供更加便捷、灵活、有效的服务。
参考文献:
[1] LAI J C, MING B, LI S K, et al. An image-based diagnostic expert system for corn diseases[J]. Agricultural Sciences in China,2010(8):1221-1229.
[2] 李 旺,唐少先.基于图像处理的农作物病害识别研究现状[J].湖南农机(学术版),2012,39(1):176-178.
[3] 刘连忠,张 武,朱 诚. 基于改进颜色特征的小麦病害图像识别技术研究[J]. 安徽农业科学,2010,40(26):12877-12879.
[4] 邹修国. 基于计算机视觉的农作物病虫害识别研究现状[J]. 计算机系统应用,2011,20(6):238-242.
[5] MANSINGH G, REICHGELT H, BRYSON K O. CPEST: An expert system for the management of pests and diseases in the Jamaican coffee industry[J]. Expert Systems with Applications,2007,32(1):184-192.
[6] 林 潇,李绍稳,张友华,等.基于本体的水稻病害诊断专家系统研究[J].数字技术与应用,2010(11):109-111.
[7] GHOSH I, SAMANTA R K. Teapest:An expert system for insect pest management in tea[J].Applied Engineering in Agriculture,2003,19(5):619-625.
[8] 王军英.基于BP神经网络的葡萄病害诊断方法研究[J].农业网络信息,2010(6):21-23,36.
自动锻压机封闭高度调整改进设计
基于Matlab的三相电压型PWM整流器的仿真研究
基于多传感器数据融合的火灾报警系统设计
模拟氢冷汽轮机转子节能改进
基于VB的大学物理实验数据处理系统的设计与实现
用激光光源测量凸透镜焦距实验探究
项目反应理论在计算机自适应题库建设中的应用
基于遗传算法的排课设计
AutoCAD的三维造型与工程图转换技术研究
论“云计算辅助教学”CCAI及教学资源组织
基于SOA的数字化校园应用模式的研究
模板法制备纳米复合光催化材料HPA/TiO_2
YK73400L数控成形磨齿机工艺设计
环保透水砖的制备与性能研究
混凝土在双向受压下力学性质的试验研究
自动锻压机凸模推出机构改进设计
树麻雀的体温调节
扎龙湿地面积动态变化趋势数学模型及因素分析
基于ARIMA的居民消费价格指数建模与预测
用矩阵实现模糊本体映射
激光跟踪仪在主轴箱体检测上的应用
一种BP神经网络改进算法的研究
传感式智能家用煤气表的研制
基于对象方向方位的连续方向查询算法
一种有效检索和更新移动对象的混合索引结构
较长销孔加工方案分析
移动对象流量查询方法研究
空间数据库R-tree连接方法研究
关联规则挖掘在临床诊断中的应用研究
基于距离和的数据挖掘技术在中考成绩处理中的应用
燃气炉供热改善大气环境的方法
三层C/S通用试题库系统的需求分析和总体设计
外凸轮轮廓曲线加工误差分析
基于单片机的步进电机控制系统的研制
基于组合核支持向量机的图像边缘检测
衣康酰化降解壳聚糖在亚麻织物无甲醛防皱整理中的应用
二氧化硅-氧化锌溶胶凝胶法制备固相微萃取涂层的研究
燃硫炉出口温度与三氧化硫气体浓度的关系
基于网格和XML的异构数据库集成模型
Excel表格计算工程预算的工程量方法
BP神经网络在蜜网系统中的应用
改进BP神经网络在个人信用评估系统的应用
GIS系统在城市燃气管网中的应用
基于USB接口的便携式温湿度记录仪的设计
基于OracleWebServer的管理信息系统开发
Liu-Liu-Liu-Liu系统的混沌同步
企业实施SPC核心工具——控制图方法研究
PL/SQL在求解最短路径问题中的应用
城市燃气用户软管的安装问题研究
基于广播模式的录井仪实时数据传输系统的设计与实现
垂直井筒两相流温度场的模拟计算
基于固定网络的移动对象轨迹查询
压缩天然气管道输送应用研究
CISC与RISC结构CPU间软件移植技术问题分析
液化石油气管道供气方式的应用研究
关键词:主题模型;特征表达;多示例多标记学习;场景分类;文本分类
中图分类号: TP181
文献标志码:A
Multiinstance multilabel learning method based on topic model
YAN Kaobi1, LI Zhixin1,2*, ZHANG Canlong1,2
1.Guangxi Key Laboratory of MultiSource Information Mining and Security, Guangxi Normal University, Guilin Guangxi 541004, China
2.Guangxi Experiment Center of Information Science, Guilin Guangxi 541004, China
Abstract: Concerning that most of the current methods for MultiInstance MultiLabel (MIML) problem do not consider how to represent features of objects in an even better way, a new MIML approach combined with Probabilistic Latent Semantic Analysis (PLSA) model and Neural Network (NN) was proposed based on topic model. The proposed algorithm learned the latent topic allocation of all the training examples by using the PLSA model. The above process was equivalent to the feature learning for getting a better feature expression. Then it utilized the latent topic allocation of each training example to train the neural network. When a test example was given, the proposed algorithm learned its latent topic distribution, then regarded the learned latent topic allocation of the test example as an input of the trained neural network to get the multiple labels of the test example. The experimental results on comparison with two classical algorithms based on decomposition strategy show that the proposed method has superior performance on two realworld MIML tasks.
英文关键词Key words:
topic model; feature expression; multiinstance multilabel learning; scene classification; text categorization
0引言
传统的监督学习问题通常定义为单示例单标记学习问题,一个对象用一个示例来表示,同时关联一个标记。定义X为示例空间,Y为标记集合。单示例单标记学习的目的是从一个给定的数据集{(xi,yi)|1≤i≤N}中学习一个函数f:xy,其中:xi∈X是一个示例,yi∈Y是示例xi的一个标记。在机器学习技术[1]日益成熟的条件下,传统的单示例单标记学习方法已经取得了很大的成功。
然而,在现实世界中,一个对象通常是多义性的复杂对象,如果仍用传统的单示例单标记学习方法,不但不能很好地表达出对象丰富的内容信息,而且不能得到对象准确的语义标记集合,因此对于这种多义性对象,可以采用多标记学习方法来处理。在多标记学习[2]方法下,一个对象用一个示例来表示,但是关联多个标记。多标记学习的目的是从一个给定的数据集{(xi,yi)|1≤i≤N}中学习一个函数f:x2y,其中:xi∈X是一个示例,yiY是示例xi的一个标记集合{(yi1,yi2,…,yili)},li是标记集合yi中标记的个数。虽然多标记学习已经取得了很大的成就,但是只用一个示例来表示多义性对象不能有效地表达出多义性对象的复杂内容。
事实上,在多标记学习中,一个标记对应着对象不同的区域,如果能够对一个确定的区域(不是一个整体的对象)和一个特定的标记直接建立对应的模型,将会有效地减少噪声对分类准确性的影响,因此可以采用多示例学习的方法来表示多义性对象的复杂内容。多示例学习[3]的任务是从一个给定的数据集{(xi,yi)|1≤i≤N}中学习一个函数f:2xy,其中:xiX是一个包的示例集合{(xi1,xi2,…,xini)},ni是包xi中示例的个数,yi∈Y是包xi上的一个标记。然而,多示例学习主要用于单标记问题,对于多标记问题需要分解为多个单标记问题进行处理。
为了克服多标记学习和多示例学习方法的缺点,将二者结合起来形成一种多示例多标记学习方法[4],来处理带有复杂内容的多义性对象将会更加合理和有效。多示例多标记学习的目的是从一个给定的数据集{(xi,yi)|1≤i≤N}中学习一个函数f:2x2y,其中,xiX是一个包的示例集合{(xi1,xi2,…,xini)},ni是示例集合xi中示例的个数,yiY是包xi的一个标记集合{(yi1,yi2,…,yili)},li是标记集合Yi中标记的个数。
近年来,多示例多标记学习已经取得了很大的进展,同时也面临着三个主要的难题。首先,由于图像分割技术[5]的限制,很难划分出具有完整语义标记的示例;其次,在划分示例后,传统的做法是提取示例的底层特征,然后建立特征向量和语义标记之间的映射模型,由于特征提取[5]和机器学习技术[1]的限制,如何自动提取示例的高层特征及建立映射模型也是一个难点;最后,由于标记之间复杂的相关性[6],如何建立能够捕获标记之间相关性的模型[7]也是一个难点,同时文献[8]指出了大数据问题也是多示例多标记学习面临的一个新问题。如果能够克服这些主要难题,可以建立一个完美的多示例多标记模型,该模型可以直接学习示例和标记之间的映射关系,同时可以捕获到标记之间的相关性。
1相关研究
1.1多示例学习
多示例学习中,一个样本被看成是一个包含多个示例的包,当需要对一个包进行标记的时候,如果包中至少有一个示例具有对应的标记含义,则将这个包标记为正包,否则标记为负包。虽然多示例学习框架被限制在单标记问题上,但是多示例学习方法已经取得了很多研究成果,针对不同的问题提出了不同的多示例学习方法,此外多示例学习还可以用于图像检索。
1.2多标记学习
对于多义性对象,可以采用多标记学习的方法来处理。文献[6]对多标记学习作了一个全面的综述报告;文献[9]提出了一种基于神经网络的多标记学习方法。从现有的多标记算法可以看出,可以采用两个策略来处理多标记学习问题:一是将多标记问题分解为多个单标记问题。但是在很多情况下标记之间是有相关性的,例如天空和海洋可能会同时出现在同一个场景中,如果仍然用这个策略来处理多标记学习问题,将会丢失这种对提升多分类性能很有帮助的信息。二是直接对示例和标记集合之间建立模型。在一些复杂的模型中,不但可以直接建立示例和标记集合的对应关系,同时也可以得到标记之间的一些相关性。
1.3多示例多标记学习
对于多示例多标记学习,文献[4]中对多示例多标记学习作了一个全面的介绍,并且提出了MIMLBOOST和MIMLSVM算法。MIMLBOOST算法首先将多示例多标记问题转化为多示例问题,然后再采用MIBOOST[10]来处理多示例问题;MIMLSVM算法首先将多示例多标记学习问题转化为多标记问题,然后采用MLSVM[11]算法来处理多标记问题。传统的监督学习方法、多示例学习方法和多标记学习方法都可以通过分解策略从多示例多标记学习中得到,但是采用这种分解策略会丢失很多蕴藏在训练样本中的信息,同时也不能考虑到标记之间存在关联性的问题。后来,文献[12]提出了一种直接学习示例和标记之间映射关系的MIMLRBF算法;文献[7]提出了一种联合多示例和多标记的新颖算法,该算法不但可以直接对示例集合和标记集合之间进行建模,同时还可以捕获到标记之间的关联性;文献[8]则提出了一种针对大数据问题的快速多示例多标记算法。然而,上述文献中提到的方法都没有考虑如何来更好地表示对象的特征这一因素。针对这一问题,本文考虑将特征学习模型融入多示例多标记学习中,以学习到一个更好的特征表达方式,从根源上提升分类算法的准确性。概率潜在语义分析模型可以学习到样本中潜在的主题这一高层特征,本文结合这一特性提出一种新的多示例多标记学习方法PLSANNMIML,以解决多示多标记学习中如何更好地表示对象特征这一问题。
2PLSANNMIML方法
2.1概率潜在语义分析
Hofmann[13]首次提出用概率潜在语义模型对文本进行建模的方法。当用概率潜在语义分析模型处理图像数据时,可以把图像看成是文档,用概率潜在语义分析模型对图像进行建模来发现图像潜在的主题分布。
假设D={d1,d2,…,di}代表一个图像数据集,W={w1,w2,…,wj}代表一个视觉词汇表,这种用概率潜在语义分析模型对图像进行建模的模型是一个发现共现矩阵隐变量的模型,而该共现矩阵的值由nij=(wj,di)组成,其中nij=(wj,di)是一个视觉词wj出现在图像di中的数量。设Z={z1,z2,…,zk}代表没有观测到的潜在主题变量, P(di)代表观测到一张具体图像的概率, P(zk|di)代表一张特定图像在潜在主题空间下的概率分布, P(wj|zk)代表一个视觉词出现在一个确定主题变量下的条件概率。这种生成模型可以用如下步骤表示:
1)以一定的概率P(di)选择一张图像di;
2)以一定的概率P(zk|di)选择一个主题zk;
3)以一定的概率P(wj|zk)生成一个词wj。
经过上面的过程,当得到一个观测点(wj,di)时,潜在的主题变量zk被忽略,产生下面的联合概率模型:
L=logP(wj,di)=∑d∈D∑w∈Wn(wj,di)logP(wj,di)
(1)
在遵循似然原则的条件下,采用期望最大化算法[12]最大化似然函数的对数,从而得到P(wj|zk)和P(zk|di),似然函数的对数表现形式如式(2)所示:
L=logP(wj,di)=∑d∈D∑w∈Wn(wj,di)logP(wj,di)
(2)
2.2神经网络
神经网络[14]由于其在信息处理中具有非线性的自适应能力,已经在人工智能领域中取得了广泛的应用。算法通过具有三层结构的前向神经网络模型[15]来得到样本的标记集合,每层由不同的神经元组成,第一层叫输入层,中间层叫隐藏层,最后一层叫输出层。在每一层中的每个神经元都连接着下一层的所有神经元,但在同一层中的神经之间是没有连接的,当信息从一层传到下一层时,前层中的每个神经元都会有一个激活函数对信息进行变换,该函数选择的是S型的激活函数,其定义是:f(x)=1-ex1+ex。在训练神经网络时,采用的是反向传播学习算法[15]来学习神经网络中神经元的权值。
2.3PLSANNMIML方法
算法主要包括训练和测试两个阶段,流程如图1所示。
2.3.1训练阶段
训练过程包括两个步骤:首先通过概率潜在语义分析模型从所有的训练样本中学习到每个样本的特定主题分布P(zk|di)和每个主题的特定词分布P(wj|zk),每个样本就可以用P(zk|di)来表示;其次再用每个样本的特定主题分布来训练神经网络,具体细节如下所示:
式(3)描述的是神经网络在样本xi上的误差函数。训练过程中算法采用概率潜在语义分析模型将xi转化为主题向量zk。假定标记空间Y有Q个标记,神经网络具有与主题向量zk维数相同的输入和Q个输出,其中Q个输出对应着Q个标记,向量w是在神经网络中需要学习的权值向量。
Ei(w)=∑Qq(ciq-diq)2
(3)
其中:ciq是训练时样本xi在第q个类上的实际输出;而diq是样本xi在第q个类上的目标输出,如果q∈yi则diq的值为1,否则其值为-1。通过结合误差反向传播策略[14],采用随机梯度下降法来最小化式(3)中的误差函数,其过程如下:
假定xji是单元j的第i个输入, wji是关联输入xji的权值大小,netj=∑iwjixji是单元j的网络输出,oj=f(netj)是单元j的实际输出,tj是单元j的目标输出,根据随机梯度下降算法可以得到每个权值的更新公式如下:
wji=wji-ηEiwji
(4)
其中η是学习速率的大小。计算式Eiwji的值时,分两种情况讨论:
当j是输出层的单元时,推导出式(5):
Eiwji=-(tj-oj)oj(1-oj)
(5)
当j是隐藏层的单元时,推导出式(6):
Eiwji=-oj(1-oj)xji∑k∈S[(tj-oj)oj(1-oj)]wkj
(6)
其中S是单元j的输出所能连接到的单元的集合。
2.3.2测试阶段
给定一个测试样本pX,算法首先利用在训练阶段得到的每个主题的特定词分布P(wj|zk)来学习到测试样本的特定主题分布P(zk|dt),然后将学习到的主题分布输入到已经训练好的神经网络,神经网络将会有Q个输出,采用文献[9]介绍的方法选择阈值,通过选择合适的阈值,得到标记的相关集合。
3实验结果与分析
3.1实验步骤
根据选择的模型,算法涉及到三个需要确定的参数变量,分别是词的数量、主题的数量和神经网络中隐层神经元的数量,分别用Words、Topics、Neurons来表示。由于这三个参数对算法的性能有很重要的作用,因此首先需要确定这三个参数的最优值。在确定参数的最优值时,采用汉明损失(Hamming loss)和1错误率(oneerror)这两个评价指标来评估参数对算法性能的影响。确定算法的最优参数后,算法对现实世界中的两种多示例多标记学习任务进行实验,并与现有的多示例多标记算法MIMLBOOST和MIMLSVM进行比较。
实验涉及到两个数据集,每个数据集都有2000个样本。实验时先把每个数据集划分为三部分:1000个样本的训练集合、500个样本的验证集和500个样本的测试集。
其中500个样本的验证集用于确定算法的最优参数。当确定算法的最优参数后,再将1000个样本的训练集和500个样本的验证集合并形成一个1500个样本的训练集,最终每个数据集对应着一个1500个样本的训练集和一个500个样本的测试集。表1是对实验中所用数据集的具体描述。
【答:文本数据集每个包划分出的示例都不相同,一个平均值表示的是一次实验时每个包的示例的平均数,表格中平均数有个范围是对数据集进行不同的划分,进行多次实验时的一个平均值范围,所以是3.56±2.71,也与后面表中的实验数据一致。上面场景数据集,每幅图片都划分成9个示例,所以平均数不变,也可以写成9.00±0.00;
3.1.1场景数据集
实验使用的场景数据集包含2000幅自然场景图像,整个数据集包含的类标记有沙漠、山、海洋、日落、树。数据集中每幅图像的标记都是人工标记的,数据集中超过22%的图像具有多个标记,平均每幅图像的标记数量是1.24±0.44。对图像划分示例后,通过提取每个示例的颜色和纹理特征将其中的每个示例表示为一个18维的向量,并用这个特征向量代表这个示例。
3.1.2文本数据集
实验使用的文本数据集又名为Reuters21578数据集。实验时先对这个数据集进行预处理,形成一个具有2000个文档的数据集。整个文档数据集包含7个类标记,大约15%的文档具有多个标记,平均每个文档的标记数量是1.15±044。当进行示例划分时,采用滑动窗口的技术[16]来形成文档的示例,每个示例对应着一个被大小为50的滑动窗口所覆盖的文本段,最后采用基于词频[17]的词袋模型表示方法来表示生成的示例。
3.2实验结果
图2是采用部分场景数据集作为实验数据,观测不同参数值配置对算法性能的影响。图2(a)~(f)中参数变量的取值范围为[3,21],并且参数变量取整数值;
算法中,学习速率η的值设置为0.1。通过改变参数的配置,采用汉明损失和1错误率来评估参数对算法性能影响,进行了多组实验来确定算法的最优参数值。
实验开始时,如图2(a)和(b)中显示,先确定Neurons和Topics这两个参数的值,其值设置为Neurons=3,Topics=3,Words的变化范围为[3,21]。从图2(a)和(b)中可以看到,当Words取值为7时,汉明损失和1错误率指标取得最小值,算法的分类性能最好。
在图2(c)和(d)中,参数Neurons的值与图2(a)和(b)中的值相同,但是Words的值设置为7,Topics的变化范围为[3,21]。从图2(c)和(d)中可以看出,当Topics取值为9时,汉明损失和1错误率指标取得最小值,算法的分类性能最好。
在图2(e)和(f)中,根据前面的实验结果,参数Words的值设置为7,Topics的值设置为9,Neurons变化范围为[3,21]。从图2(e)和(f)中可以看出,当Neurons取值为9时,汉明损失和1错误率指标取得最小值,算法的分类性能最好。确定算法的最优参数值后,算法对现实世界中的两种多示例多标记学习任务进行实验,并和MIMLBOOST和MIMLSVM进行比较,采用文献[12]中提到的五种多标记学习评价指标来评估算法的性能。表2和表3分别是各个算法在场景数据集和文本数据集上进行实验的结果,同时表4还给出了各个算法在这两个数据集进行实验时所需要的时间。在表2和表3中,表示数值越小算法性能越好,而表示数值越大算法性能越好。
从表2、3中的数据可以看出,对于表中的所有评价指标,PLSANNMIML算法在场景数据集和文本数据集上具有更好的性能。
从表4中可以看出,PLSANNMIML方法在时间上也具有更好的性能,在训练和测试阶段,算法需要的时间都比MIMLSVM算法稍微少些,而且远远要少于MIMLBOOST算法所需要的时间。从所有的实验结果可以看出,PLSANNMIML方法在现实世界中的两种多示例多标记学习任务中具有更优越的性能。
4结语
现有的大部分多示例多标记学习算法都没有考虑怎么样更好地表示对象的特征这一因素,因此提出了一种结合概率潜在语义分析和神经网络的多示例多标记学习方法。概率潜在语义分析模型可以学习到样本中的潜在语义这一高层特征,而神经网络在多标记问题中具有良好的分类性能。对现实世界中的两种多示例多标记学习任务进行实验表明,PLSANNMIML算法对其他的多示例多标记学习算法而言具有很强的竞争力,解决了在多示例多标记学习算法中怎么更好地表示对象的特征这一问题;同时也存在着不足之处,算法依然采用的是分解策略来处理多示例多标记学习问题,同时还忽略了标记之间的相关性。下一步将在融入特性学习模型的基础上寻找其他策略来处理多示例多标记问题,同时也要考虑标记之间的相关性。
参考文献:
[1]
BISHOP C M. Pattern recognition and machine learning: information science and statistics [M]. New York: Springer, 2006: 67-459.
[2]
ZHOU Z, ZHANG M,ZHANG S, et al. Multiinstance multilabel learning [J]. Artificial Intelligence, 2012, 176(1): 2291-2320.
[3]
ZHOU Z. Multiinstance learning: a survey [R/OL]. Nanjing: Nanjing University, National Laboratory for Novel Software Technology, 2004 [20150206]. http:///zhouzh/zhouzh.files/publication/techrep04.pdf.Nanjing, China, Mar. 2004.
[4]
ZHOU Z, ZHANG M, HUANG S, et al. Multiinstance multilabel learning [J]. Artificial Intelligence, 2012, 176(1): 2291-2320.
[5]
PRATT W K. Digital image processing [M]. DENG L, ZHANG Y, translated. Beijing: China Machine Press, 2005:345-398. (PRATT W K. 数字图像处理[M].邓鲁华,张延恒,译. 北京:机械工业出版社,2005:345-398.)
[6]
LI Z, ZHUO Y, ZHANG C, et al. Survey on multilabel learning [J]. Application Research of Computers, 2014, 31(6): 1601-1605. (李志欣,卓亚琦,张灿龙,等.多标记学习研究综述[J].计算机应用研究,2014,31(6):1601-1605.)
[7]
ZHA Z, HUA X, MEI T, et al. Joint multilabel multiinstance learning for image classification [C]// CVPR 2008: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2008: 1-8.
[8]
HUANG S, ZHOU Z. Fast multiinstance multilabel learning [C]// AAAI 2014: Proceedings of the 28th AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press, 2014: 1868-1874.
[9]
ZHANG M, ZHOU Z. Multilabel neural networks with applications to functional genomics and text categorization [J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(10): 1338-1351.
[10]
XU X, FRANK E. Logistic regression and boosting for labeled bags of instances [C]// PAKDD 2004: Proceedings of the 8th PacificAsia Conference on Knowledge Discovery and Data Mining, LNCS 3056. Berlin: Springer, 2004: 272-281.
[11]
BOUTELL M R, LUO J, SHEN X, et al. Learning multilabel scene classification [J]. Pattern Recognition, 2004, 37(9): 1757-1771.
[12]
ZHANG M, WANG Z. MIMLRBF: RBF neural networks for multiinstance multilabel learning [J]. Neurocomputing, 2009, 72(16/17/18):3951-3956.
[13]
HOFMANN T. Unsupervised learning by probabilistic latent semanticanalysis [J]. Machine Learning, 2001, 42(1/2): 177-196.
[14]
SCHMIDHUBER J. Deep learning in neural networks: an overview [J]. Neural Networks, 2015, 61: 85-117.
[15]
HAYKIN S. Neural networks [M]. YE S, SHI Z, translated. 2nd ed. Beijing: China Machine Press, 2004: 109-176. (HAYKIN S. 神经网络原理[M].叶世伟,史忠植,译.2版.北京:机械工业出版社,2004:109-176.)
[16]
SEBASTIANI F. Machine learning in automated text categorization [J]. ACM Computing Surveys, 2001, 34(1): 1-47.
1、首先打开趣头条APP,切换到“任务”页面。
2、然后向下滑动屏幕,即可看到“走路赚金币”选项。用户点击该选项后,页面就会显示当天的行走步数。一般情况下,50步数等于1金币,连续兑换7天就会有500金币。
“趣头条”是一款上海基分文化传播有限公司开发的APP。团队致力通过大数据算法和云计算等技术,为用户提供内容及服务。趣头条致力于打造一款新形式的资讯阅读软件,以平台、媒体和共赢的方式。以移动应用为载体进行内容创造、资讯阅读,提供更多有用、有趣、有益的内容给大家。
狮子关库区植物群落乔木层优势种及群落分类
狮子关库区森林群落演替过程和结构动态
日本落叶松人工林单木模型的研究
论生态林业的理论与实践途径
鄂西南地区松褐天牛生物学特性及发生规律研究
应用M99-1引诱剂监测马尾松病虫害的研究
松材线虫在受害马尾松树体内的分布及取样部位研究
湖北恩施松材线虫病的防治现状及对策
胡萝卜板栗糕的试制
丁草胺对水稻根系活力和C/N的影响
TGF-β_1对不同肺癌细胞生物学行为的影响
动物中天然抗癌产物研究
聚合物固体酸催化合成丙烯酸双酯——固体酸的合成
三溴偶氮氯磷-溴代十六烷基吡啶-钐-乙醇显色体系的分析研究
化学修饰电极及其测定痕量Pb2+、Cd2+、Hg2+的应用
光度法测定鱼腥草中有效成分的质量分数
以β-环糊精衍生物为柱层析固定相拆分氨基酸对映体
化学工业的可持续发展之路——绿色化学
模糊度量空间中的不动点及应用
祝贺生物资源保护与利用湖北省重点实验室顺利通过验收评估以评促建以评促改以评促发展
奇素数方幂中的孤立数
一类具混合功能反应函数的三种群捕食链模型分析
脉冲时滞Cohen-grossberg神经网络的指数稳定性
一类成批服务排队模型的时间依赖解的存在唯一性
基于模糊综合评判的学生综合素质评价体系
内积H-Z-空间及其性质
关于integralfromx=ato+∞(f(x)dx)的收敛性与limfrom(x+∞)(f(x))=0的关系
复平面上多项式的零点问题
平面复合材料热传导问题的一个新的多尺度渐近展开式
对牛顿迭代法条件的一个改进
基于MATLAB的血管三维重建
基于信息熵的TFIDF文本分类特征选择算法研究
一种基于势场的威胁模型及其应用
基于协同模式的一站式服务系统的设计与实现
基于ArcGISServer的企业级WEBGIS的设计与开发
整周模糊度的一种半参数解算方法
GPS高程测量精度分析
优质油菜栽培与养分管理智能决策系统的设计与实现
恩施州烟叶生产区域划分及配套栽培技术措施研究
祝贺生物资源保护与利用湖北省重点实验室顺利通过验收评估以评促建以评促改以评促发展
奇素数方幂中的孤立数
一类具混合功能反应函数的三种群捕食链模型分析
脉冲时滞Cohen-grossberg神经网络的指数稳定性
一类成批服务排队模型的时间依赖解的存在唯一性
基于模糊综合评判的学生综合素质评价体系
内积H-Z-空间及其性质
关于integralfromx=ato+∞(f(x)dx)的收敛性与limfrom(x+∞)(f(x))=0的关系
复平面上多项式的零点问题
平面复合材料热传导问题的一个新的多尺度渐近展开式
对牛顿迭代法条件的一个改进
基于MATLAB的血管三维重建
基于信息熵的TFIDF文本分类特征选择算法研究
一种基于势场的威胁模型及其应用
基于协同模式的一站式服务系统的设计与实现
基于ArcGISServer的企业级WEBGIS的设计与开发
整周模糊度的一种半参数解算方法
GPS高程测量精度分析