时间:2023-08-24 09:27:41
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇神经网络研究现状,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
>> 大规模自组织人工神经网络技术在智能建筑中的应用方法研究 基于自组织增量神经网络的码书产生方法在图像分类中的应用 基于Matlab的自组织神经网络在油气层识别中的应用研究 基于自组织竞争神经网络的地震预测 自组织竞争网络在测井资料岩性识别中的应用 自组织特征映射网络在探地雷达数据处理中的应用 气体识别自组织神经网络 一种基于自组织过程神经网络的动态样本半监督学习算法 自组织灰色神经网络中的基于电力系统短期负荷预测方法应用研究 基于自组织映射神经网络的边坡样本分析方法 基于SOM神经网络技术的区域卷烟消费状态自组织分类 人工神经网络模型在水动力模型数据缺失中的应用 基于人工神经网络的数据挖掘技术在临床中应用进展 自组织特征映射网络在压缩编码设计中的应用 液压控制系统中自组织双模糊神经网络控制模型关键点研究 浅谈人工神经网络在林业中的应用 人工神经网络在空调系统中的应用 一种改进的动态二叉树的自组织神经网络算法 基于SOM神经网络技术的卷烟零售客户自组织分类 基于自组织神经网络SOM的汽车安全气囊装配故障诊断 常见问题解答 当前所在位置:百度百科 移动学习2012-12-7
[2] 叶成林 徐福荫 许骏 移动学习研究综述 电化教育研究 2004 No.3
[3] 陈伟超 国内移动学习研究现状及发展建议[J].中国电力教育,2009 No.9
[4] 词汇语义知识库浅述 刘兴林 福建电脑 2009 No.9
人工神经网络属于一种对人脑结构及功能进行反映的数学抽象模型,对人的思维以及存储知识等功能进行模拟,从而完成某项工作。对于岩土工程来说,主要包括岩体和土体两项内容,且这两项内容均具备很高的复杂性。在岩土工程研究过程中,有必要借助人工神经网络,从而使岩土工程的研究得到有效进步发展。本文在分析人工神经网络的基础上,进一步对人工神经网络在岩土工程中的应用进行分析,以期为岩土工程研究的进展提供一些具有价值的参考建议。
关键词:
人工神经网络;岩土工程;应用
岩土工程的研究对象分为两大类:其一为岩体;其二为土体。岩土工程涉及的介质存在两大特性,即模糊性和随机性,这两大特性又统称为不确定性。近年来,不少学者在岩土工程研究过程中,提出了人工神经网络这一概念,即利用人工神经网络,将其应用到岩土工程研究领域当中,从而为深入了解岩土工程的某些介质特征奠定有效基础[1]。从岩土工程研究的优化及完善角度考虑,本文对“人工神经网络在岩土工程中的应用”进行分析意义重大。
1人工神经网络分析
1.1人工神经网络概念
对于人工神经网络来说,是一种对人脑结构与功能进行反映的数学抽象模型;主要通过数理策略,经信息处理,进一步对人脑神经网络构建某种简化模型,进一步采取大量神经元节点互连,从而形成复杂网络,最终完成人类思维及储存知识的能力的模拟。神经网络无需构建反映系统物理规律的数学模型,与别的方法比较,在噪声容忍度方面更强[2]。与此同时,还拥有很强的非线性映射功能,对于大量非结构性以及非精准性规律存在自适应能力,具备超强的计算能力,可完成信息的记忆以及相关知识的推理,且其自身还具备自主学习能力;与常规算法相比,优势、特点突出。
1.2BP网络简述
从研究现状来看,基于实际应用过程中,人工神经网络模型大多数采取BP网络。BP网络即指的是多层前馈网络,因多层前馈网络的训练通常使用误差反向传播算法,所以将BP网络称之为属于一类误差反向传播的多层前馈网络。对于其网络而言,具备输入节点和输出节点,同时还具备一层隐层节点与多层隐层节点,基于同层节点当中不存在耦合状态。其中的输入信号从输出层节点依次传过各个隐层节点,进一步传输至输出节点,每一层节点的输出只对下一层的节点输出产生影响。
2人工神经网络在岩土工程中的应用分析
在上述分析过程中,对人工神经网络的概念有一定的了解,由于其模型算法的优越性,可将其应用到岩土工程研究领域当中,从而为解决岩土工程问题提供有效凭据。从现状来看,人工神经网络在岩土工程中的应用主要体现在以下几大方面。
2.1在岩石力学工程中的应用
岩石力学工程是岩土工程中尤为重要的一部分,将神经网络应用到岩石力学工程当中,主要对岩石非线性系统加以识别,同时还能够为工程岩体分类提供有效帮助,此外在爆破效应预测方面也具备一定的应用价值。对于人工神经网络来说,存在从有限数据中获取系统近似关系的优良特性,而岩石当中的各项参数之间又存在很复杂的关系,并且难以获取完整的参数集。在这样的情况下,使用人工神经网络技术,便能够使岩石非线性系统识别问题得到有效解决[3]。此外,有研究者将岩石抗压强度、抗拉强度以及弹性能量指数等作为岩爆预测的评判指标,进一步对岩爆预测的神经网络模型进行构建,然后预测了岩爆的发生与烈度。通过计算得出结论:采取人工神经网络方法进行岩爆预测行之有效,值得采纳借鉴。
2.2在边坡工程中的应用
对于岩土工程中的边坡工程来说,边坡失稳状况突出,且是由多因素造成的,比如边坡失稳的地质形成条件、诱发因素的复杂性以及随机性等。与此同时,由于边坡动态监测技术从目前来看尚且不够成熟,因此边坡失稳在岩土工程研究领域一直视为是一项难以解决的工程项目。而对于神经网络方法来说,因其具备非常好的预测功能,因此相关岩土工程研究工作者通常会采取人工神经网络对岩土工程中的边坡工程问题进行求解。并且,从现有研究成果来看,将人工神经网络应用于岩土工程的成果突出。有学者对影响岩质边坡的稳定性的相关因素进行了分析,包括地形因素、岩体因素以及外部环境因素等,并构建了边坡稳定性分析的BP网络模型[4]。此外,还有学者将大量水电边坡工程的稳定状况作为学习训练样本及预测样本,对以人工神经网络技术的边坡岩体的稳定性进行了研究,结果显示,采取人工神经网络对边坡岩体的稳定状况进行预测可行性高。
2.3在基坑工程中的应用
采取人工神经网络对基坑变形进行预测主要分为两种情况:其一,对会影响基坑变形的各大因素及位移的神经网络模型加以构建;其二,把变形监测数据作为一个时间序列,以历史数据为依据,将系统演变规律查找出来,进一步完成系统未来发展趋势的分析及预测。有学者针对基坑变形利用了人工神经网络方法进行预测,结果表明:对前期实测结果加以应用,使用此方法能够对后续阶段的基坑变形实时预测出来,并且预测结果和实测结果保持一致性。此外,还有学者根据具体工程项目,采取人工神经网络,对深基坑施工中地下连续墙的位移进行了深入分析及预测,结果显示:使用人工神经网络方法进行分析及预测,在精准度上非常高,值得在深基坑工程相关预测项目中使用[5]。
2.4在地铁隧道工程中的应用
在地铁隧道施工过程中,存在地表变形和隧道围岩变形等状况,为了深入了解这些状况,可将人工神经网络应用其中。有学者在对地层的影响因素进行分析过程中,列出了可能的影响因素:盾构施工参数、盾构物理参数以及地质环境条件,进一步利用人工神经网络,构建了人工神经网络模型,进一步针对盾构施工期间的地层移动进行实时动态预测,最终得到了不错的预测成果。此外,还有学者对BP网络算法进行改进,然后对某地铁工程中隧道上方的地表变形进行了未来趋势预测,结果表明:和其他地表变形预测方法相比,人工神经网络预测方法的应用价值更为显著。
3结语
通过本文的探究,认识到基于人工神经网络模型的算法具备很高的优越性,由于岩土工程地质条件复杂,为了深入研究岩土工程,可将人工神经网络应用其中。结合现状研究成果可知,人工神经网络在岩石力学工程、边坡工程、基坑工程以及地铁隧道工程中均具备显著应用价值。例如:将人工神经网络应用于岩石力学工程当中,能够预测岩爆的发生与烈度;应用于边坡工程当中,能够边坡工程的稳定性进行精准预测;应用于基坑工程当中,实现对基坑工程变形的实时动态监测;应用于地铁隧道工程当中,能够进一步了解地铁工程中隧道上方的地表变形情况。
总而言之,人工神经网络在岩土工程中的应用价值高,值得相关工作者采纳应用。
作者:张洪飞 单位:山东正元建设工程有限责任公司
参考文献
[1]郑惠娜.章超桦.秦小明.肖秀春,等.人工神经网络在食品生物工程中的应用[J].食品工程,2012(01):16-19.
[2]邹义怀.江成玉.李春辉,等.人工神经网络在边坡稳定性预测中的应用[J].矿冶,2011(04):38-41.
[3]曹建智.张健.人工神经网络在白洋淀水质评价中的应用[J].电子技术与软件工程,2016(08):261-262.
【关键词】压电方程;BP神经网络;预测
0 研究背景
材料从使用性能上可以分为结构材料和功能材料两大类[1],其中结构材料以其强度、韧性、硬度、弹性等力学特性为 应用依据,功能材料以其电、磁、光、声、热等物理性能为基础,用以制作有特殊功能的器件。压电材料是实现机械能与电能相互转换的功能材料[2],是一类对机、电、声、光、热敏感的电子材料,外力和电场之间的耦合为压电材料提供了一种机制,用于感测力学载荷所诱发电位变化,并通过外部电场改变结构应。压电材料的结构可靠性已引起越来越多的关注,因为它们大多是被应用在微机电系统中,而微机电系统的大量应用也决定了研究压电材料的重要意义。
1 压电材料的本构方程
2 神经网络
人工神经网络(简称神经网络)是由人工神经元互连组成 的网络,是一种非线性动力学系统,它采用类似于“黑箱”的方法,通过学习和记忆而不是假设,找出输入、输出变量之间的非线性关系(映射),在执行问题和求解的时候,将所获取的数据输入给训练好的网络,依据网络学习的知识进行网络推理,得出合理的答案与结果。其中BP神经网络是目前发展比较成熟的一种人工神经网络,约有80%的神经网络系统采用BP网络。它是一种反馈式全连接多层神经网络,具有结构简单,工作状态稳定等优点,并且具有较强的联想、记忆和推广能力,可以以任意精度逼近任何非线性连接函数[4]。
3 压电陶瓷平面方程验证
本文将针对PZT-4压电陶瓷的本构方程进行研究。对于此种压电材料,本构方程里面的常系数c与ζ均为已知常数。此压电材料属于线性压电材料的范畴,为减少数据量的运算,方便神经网络的预测,本文将着重针对该材料的二维平面方程进行验证。对于平面问题,不妨设坐标x2方向上的应力大小为0,则根据弹性力学中平面应力基本模型,此时可知坐标系x2方向上的电位移D2=0,且凡是下标带有x2的应力与应变大小均为0。故可以得出以下关系式(3)。
4 结论
平面压电本构方程中的线性常数已经给出,通过输入多组输入数据根据本构方程得到准确的输出数据作为神经网络的样本训练数据,借由神经网络极强的模拟映射关系,训练好的网络可以预测出任意数据关系模型,包括此处的线性关系模型。本文通过神经网络验证压电方程中数据之间的线性关系,是一种很好的验证方法,具有一定的使用意义。
【参考文献】
[1]盖学周.压电材料的研究发展方向和现状[J].中国陶瓷,2008,5(44):9-13.
[2]裴先茹,高海荣.压电材料的研究和应用现状[D].郑州:郑州师范学院.
关键词人工神经网络;发展;应用
中图分类号:TP183 文献标识码:A 文章编号:1671-7597(2014)12-0003-01
随着科学技术的发展,各个行业和领域都在进行人工智能化的研究工作,已经成为专家学者研究的热点。人工神经网络就是在人工智能基础上发展而来的重要分支,对人工智能的发展具有重要的促进作用。人工神经网络从形成之初发展至今,经历了不同的发展阶段,并且在经济、生物、医学等领域得到了广泛的应用,解决了许多技术上的难题。
1人工神经网络概述
关于人工神经网络,到目前为止还没有一个得到广泛认可的统一定义,综合各专家学者的观点可以将人工神经网络简单的概括为是模仿人脑的结构和功能的计算机信息处理系统[1]。人工神经网络具有自身的发展特性,其具有很强的并行结构以及并行处理的能力,在实时和动态控制时能够起到很好的作用;人工神经网络具有非线性映射的特性,对处理非线性控制的问题时能给予一定的帮助;人工神经网络可以通过训练掌握数据归纳和处理的能力,因此在数学模型等难以处理时对问题进行解决;人工神经网络的适应性和集成性很强,能够适应不同规模的信息处理和大规模集成数据的处理与控制;人工神经网络不但在软件技术上比较成熟,而且近年来在硬件方面也得到了较大发展,提高了人工神经网络系统的信息处理能力。
2人工神经网络的发展历程
2.1 萌芽时期
在20世纪40年代,生物学家McCulloch与数学家Pitts共同发表文章,第一次提出了关于神经元的模型M-P模型,这一理论的提出为神经网络模型的研究和开发奠定了基础,在此基础上人工神经网络研究逐渐展开。1951年,心理学家Hebb提出了关于连接权数值强化的法则,为神经网络的学习功能开发进行了铺垫。之后生物学家Eccles通过实验证实了突触的真实分流,为神经网络研究突触的模拟功能提供了真实的模型基础以及生物学的依据[2]。随后,出现了能够模拟行为以及条件反射的处理机和自适应线性网络模型,提高了人工神经网络的速度和精准度。这一系列研究成果的出现为人工神经网络的形成和发展提供了可能。
2.2 低谷时期
在人工神经网络形成的初期,人们只是热衷于对它的研究,却对其自身的局限进行了忽视。Minskyh和Papert通过多年对神经网络的研究,在1969年对之前所取得的研究成果提出了质疑,认为当前研究出的神经网络只合适处理比较简单的线性问题,对于非线性问题以及多层网络问题却无法解决。由于他们的质疑,使神经网络的发展进入了低谷时期,但是在这一时期,专家和学者也并没有停止对神经网络的研究,针对他们的质疑也得出一些相应的研究成果。
2.3 复兴时期
美国的物理学家Hopfield在1982年提出了新的神经网络模型,并通过实验证明在满足一定的条件时,神经网络是能够达到稳定的状态的。通过他的研究和带动,众多专家学者又重新开始了对人工神经网络方面的研究,推动了神经网络的再一次发展[3]。经过专家学者的不断努力,提出了各种不同的人工神经网络的模型,神经网络理论研究不断深化,新的理论和方法层出不穷,使神经网络的研究和应用进入了一个崭新的时期。
2.4 稳步发展时期
随着人工神经网络研究在世界范围内的再次兴起,我国也迎来了相关理论研究的热潮,在人工神经网络和计算机技术方面取得了突破性的进展。到20世纪90年代时,国内对于神经网络领域的研究得到了进一步的完善和发展,而且能够利用神经网络对非线性的系统控制问题进行解决,研究成果显著。随着各类人工神经网络的相关刊物的创建和相关学术会议的召开,我国人工神经网络的研究和应用条件逐步改善,得到了国际的关注。
随着人工神经网络的稳步发展,逐渐建立了光学神经网络系统,利用光学的强大功能,提高了人工神经网络的学习能力和自适应能力。对非线性动态系统的控制问题,采取有效措施,提高超平面的光滑性,对其精度进行改进。之后有专家提出了关于人工神经网络的抽取算法,虽然保证了精度,但也加大了消耗,在一定程度上降低了神经网络的效率,因此在此基础上又提出了改进算法FERNN。混沌神经网络的发展也得到了相应的进步,提高了神经网络的泛化能力。
3人工神经网络的应用
3.1 在信息领域中的应用
人工神经网络在信息领域中的应用主要体现在信息处理和模式识别两个方面。由于科技的发展,当代信息处理工作越来越复杂,利用人工神经网络系统可以对人的思维进行模仿甚至是替代,面对问题自动诊断和解决,能够轻松解决许多传统方法无法解决的问题,在军事信息处理中的应用极为广泛[4]。模式识别是对事物表象的各种信息进行整理和分析,对事物进行辨别和解释的一个过程,这样对信息进行处理的过程与人类大脑的思维方式很相像。模式识别的方法可以分为两种,一种是统计模式识别,还有一种是结构模式识别,在语音识别和指纹识别等方面得到了广泛的应用。
3.2 在医学领域的应用
人工神经网络对于非线性问题处理十分有效,而人体的构成和疾病形成的原因十分复杂,具有不可预测性,在生物信号的表现形式和变化规律上也很难掌握,信息检测和分析等诸多方面都存在着复杂的非线性联系,所以应用人工神经网络决解这些非线性问题具有特殊意义[5]。目前,在医学领域中的应用涉及到理论和临床的各个方面,最主要的是生物信号的检测和自动分析以及专家系统等方面的应用。
3.3 在经济领域中的应用
经济领域中的商品价格、供需关系、风险系数等方面的信息构成也十分复杂且变幻莫测,人工神经网络可以对不完整的信息以及模糊不确定的信息进行简单明了的处理,与传统的经济统计方法相比具有其无法比拟的优势,数据分析的稳定性和可靠性更强。
3.4 在其他领域的应用
人工神经网络在控制领域、交通领域、心理学领域等方面都有很广泛的应用,能够对高难度的非线性问题进行处理,对交通运输方面进行集成式的管理,以其高适应性和优秀的模拟性能解决了许多传统方法无法解决的问题,促进了各个领域的快速发展。
4总结
随着科技的发展,人工智能系统将进入更加高级的发展阶段,人工神经网络也将得到更快的发展和更加广泛的应用。人工神经网络也许无法完全对人脑进行取代,但是其特有的非线性信息处理能力解决了许多人工无法解决的问题,在智能系统的各个领域中得到成功应用,今后的发展趋势将向着更加智能和集成的方向发展。
参考文献
[1]徐用懋,冯恩波.人工神经网络的发展及其在控制中的应用[J].化工进展,1993(5):8-12,20.
[2]汤素丽,罗宇锋.人工神经网络技术的发展与应用[J].电脑开发与应用,2009(10):59-61.
[3]李会玲,柴秋燕.人工神经网络与神经网络控制的发展及展望[J].邢台职业技术学院学报,2009(5):44-46.
本文建立相应的BP神经网络模型,根据民生银行信贷信用评级指标体系,选取BP神经网络模型的训练样本和检验样本。将训练样本输入BP神经网络进行训练,BP神经网络模型完成训练后,用检验样本对本文建立的BP神经网络模型进行检验。完成训练的BP神经网络模型将根据企业的信用评级信息计算出企业信用得分的预测值,从而使商业银行规避信贷过程中的信用风险,起到风险预警功能。
关键词:
BP神经网络;信贷信用;风险预警
我国一直没有建立起符合市场规范的信用体系,信用风险是商业银行面临的最传统最基本的风险形式,也是最难于控制和管理的风险形式。本文建立相应的BP神经网络模型,根据民生银行信贷信用评级指标体系,选取20个企业的信用评级信息作为BP神经网络模型的训练样本,选取10个企业的信用评级信息作为BP神经网络模型的检验样本。将训练样本输入BP神经网络,让BP神经网络根据信贷企业信用得分的输出值与真实值之间的误差不断调节各个神经元之间的权值与阀值,当误差满足要求时,BP神经网络模型完成训练。BP神经网络模型完成训练后,对本文建立的BP神经网络模型进行检验[1]。完成训练的BP神经网络模型将根据企业的信用评级信息计算出企业信用得分的预测值,为商业银行信贷过程中的信用风险进行预测评价,从而使商业银行规避信贷过程中的信用风险,起到风险预警功能。
一、BP神经网络理论
BP神经网络理论是学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传人,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程是周而复始地进行的[2]。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。
(一)BP网络模型
采用BP算法的多层感知器是至今为止应用最广泛的神经网络,在多层感知器的应用中,单隐层网络的应用最为普遍。一般习惯将单隐层感知器称为三层感知器,所谓三层包括了输入层、隐层和输出层。三层感知器中,输入向量为()T12,,...,,...,inX=xxxx;隐层输出向量为()T12,,...,,...,jmY=yyyy;输出层输出向量为()T12,,...,,...,klO=oooo;期望输出向量为()T12,,...,,...,kld=dddd。输入层到隐层之间的权值矩阵用V表示,()T12,,...,,...,jmV=VVVV,其中列向量jV为隐层第j个神经元对应的权向量;隐层到输出层之间的权值矩阵用W表示,()T12,,...,,...,kiW=WWWW,其中列向量kW为输出层第k个神经元对应的权向量[3]。下面分析各层信号之间的数学关系。对于输出层,有:(net)kko=fk=1,2,...,l(1)0netmkjkjjwy==∑k=1,2,...,l(2)对于隐层,有:(net)jjy=fj=1,2,...,m(3)0netnjijiivx==∑j=1,2,...,m(4)以上两式中,转移函数f(x)均为单极性Sigmoid函数:1()1xfxe−=+(5)f(x)具有连续、可导的特点,且有:f′(x)=f(x)[1−f(x)](6)根据应用需要,也可以采用双极性Sigmoid函数(或称双曲线正切函数):1()1xxefxe−−−=+(7)式(1)~式(7)共同构成了三层感知器的数学模型。
(二)网络训练与检验
网络设计完成后,要应用训练样本进行训练。训练时对所有样本正向运行一轮并反向修改权值一次称为一次训练。在训练过程中要反复使用样本集数据,但每一轮最好不要按固定的顺序取数据,通常训练一个网络需要很多次。网络的性能好坏主要看其是否具有很好的泛化能力,而对泛化能力的测试不能用训练集的数据进行,要用训练集以外的测试数据来进行检验[4]。一般的做法是,将收集到的可用样本随机地分为两部分,一部分作为训练样本,另一部分作为检验样本。
二、基于BP神经网络的民生银行信用风险评价研究
(一)建立保险公司投资风险评价指标体系
贷款信用评级财务指标包括贷款企业经营管理能力、贷款企业债务偿还能力和贷款企业持续发展能力。贷款企业经营管理能力包括五个指标,分别是资产报酬率、流动资产周转率、应收账款周转率、主营收入现金含量、成本费用利润率;贷款企业债务偿还能力包括五个指标,分别是流动比率、利息保障倍数、资产负债率、现金流与流动负债比、净资产与贷款余额比;贷款企业持续发展能力包括三个指标,分别是净资产增长率、主营利润增长率、工资福利增长率。贷款信用评级非财务指标包括五个指标,分别财务报表质量评价、企业员工能力、企业经营者履历、企业经营者信誉、行业现状及前景。
(二)BP神经网络模型训练
选取20个企业的信用评级信息作为BP神经网络模型的训练样本。根据民生银行信贷信用评级指标体系,训练样本的输入向量X由18个指标组成,分别是资产报酬率1x、流动资产周转率2x、应收账款周转率3x、主营收入现金含量4x、成本费用利润率5x、流动比率6x、利息保障倍数7x、资产负债率8x、现金流与流动负债比9x、净资产与贷款余额比10x、净资产增长率11x、主营利润增长率12x、工资福利增长率13x、财务报表质量评价14x、企业员工能力15x、企业经营者履历16x、企业经营者信誉17x、行业现状及前景18x。训练样本的输入向量T121718X=(x,x,,x,x)。训练样本的输出向量为Y,代表企业的信用得分。输入BP神经网络模型的训练样本如表1所示。建立的BP神经网络模型为三层网络,拓扑结构为18-5-1。将20个训练样本输入BP神经网络进行训练,让BP神经网络根据信贷企业信用得分的输出值与真实值之间的误差不断调节各个神经元之间的权值与阀值[5]。采用MATLAB7.0神经网络工具箱进行运算,当误差平方和小于10-5时,训练终止。训练样本中各个信贷企业的真实信用得分和BP神经网络模型输出值。
(三)BP神经网络模型检验
由表1可以看出BP神经网络模型输出值与信贷企业真实信用得分的误差很小,下面对本文设计的BP神经网络模型进行检验。BP神经网络模型采用10个企业的信用评级信息作为检验样本。对本文建立的BP神经网络模型进行检验,将10个企业的信用评级信息作为检验样本输入完成训练的BP神经网络模型,完成训练的BP神经网络模型将根据10个企业的信用评级信息计算出企业信用得分的预测值。检验样本中各个信贷企业的真实信用得分和BP神经网络模型预测值如表2所示。根据表2的数据,得到信贷企业的真实信用得分和BP神经网络模型预测值之间误差曲线。检验样本中信贷企业的真实信用得分和BP神经网络模型预测值的拟合度较高,部分样本真实值与预测值基本重合。检验样本中信贷企业的真实信用得分和BP神经网络模型预测值误差值整体较小,最大误差11.7%,最小误差0.27%。假设以绝对误差小于5%为容忍度,那么本文建立的BP神经网络模型的准确率为70%。假设以绝对误差小于10%为容忍度,那么本文建立的BP神经网络模型的准确率为90%。
三、结论
1、检验样本中信贷企业的真实信用得分和BP神经网络模型预测值的拟合度较高,样本21、26、28的真实值与预测值基本重合,样本24、25的真实值与预测值偏差较大。
2、检验样本中信贷企业的真实信用得分和BP神经网络模型预测值误差值整体较小,最大误差11.7%,最小误差0.27%。
3、假设以绝对误差小于5%为容忍度,那么本文建立的BP神经网络模型的准确率为70%。假设以绝对误差小于10%为容忍度,那么本文建立的BP神经网络模型的准确率为90%。计算结果表明本文建立的BP神经网络模型准确率较高,可以为商业银行信贷过程中的信用风险进行预测评价,从而使商业银行规避信贷过程中的信用风险,起到风险预警功能。
参考文献:
[1]许美玲,齐晓娜,李倩等.基于BP神经网络的村镇银行信用风险预警模型的构建[J].河南科技,2014(22).
[2]黄梦宇.基于BP神经网络的手机银行风险预警模型研究[J].时代金融(下旬),2014(4).
[3]迟国泰,陈国斌,迟枫等.基于神经网络的中国商业银行效率综合评价[J].哈尔滨工业大学学报,2006,38(4).
[4]于彤,李海东.基于BP神经网络的客户信用风险评价[J].现代电子技术,2014(10).
关键词:深度学习;机器学习;卷积神经网络
1概述
深度学习(Deep Learning)是人工智能、图像建模、模式识别、神经网络、最优化理论和信号处理等领域的交叉学科,主要构建和模拟人脑进行分析学习,它属于机器学习的新兴领域。
2大数据与深度学习
目前,光学检测、互联网、用户数据、互联网、金融公司等许多领域都出现了海量数据,采用BP算法对于训练神经网络出现了梯度越来越稀疏、收敛到局部最小值只能用有标签的数据来训练等缺点。Hinton于2006年提出了深度学习的概念,Lecun等人提出了卷积神经网络,卷积神经网络利用空间关系减少参数数目以提高训练性能。
CPU和GPU计算能力大幅提升,为深度学习提供了硬件平台和技术手段,在海量大数据处理技术上解决了早期神经网络训练不足出现的过拟合、泛化能力差等问题。
大数据和深度学习必将互相支撑,推动科技发展。
3深度学习模型
深度学习模型实际上是一个包含多个隐藏层的神经网络,目前主要有卷积神经网络,深深度置信神经网络,循环神经网络。
1)卷积神经网络
在机器学习领域,卷积神经网络属于前馈神经网络的一种,神经元不再是全连接的模式,而是应用了局部感受区域的策略。然而传统的神经网络使用神经元间全连接的网络结构来处理图像任务,因此,出现了很多缺陷,导致模型⑹急剧增加,及其容易过拟合。
在卷积神经网络中,网络中的神经元只与前一层的部分神经元连接,利用图像数据的空间结构,邻近像素间具有更强的相关性,单个神经元仅对局部信息进行响应,相邻神经元感受区域存在重叠,因此,综合所有神经元可以得到全局信息的感知。
另外,一个卷积层中的所有神经元均由同一个卷积核对不同区域数据响应而得到,即共享同一个卷积核,使得卷积层训练参数的数量急剧减少,提高了网络的泛化能力。
一般在卷积层后面会进行降采样操作,对卷积层提取的特征进行聚合统计。降采样区域一般不存在重叠现象。降采样简化了卷积层的输出信息,进一步减少了训练参数的数量,增强了网络的泛化能力。
卷积神经网络实现了局部特征的自动提取,使得特征提取与模式分类同步进行,适用于处理高分辨率的图像数据。目前,卷积神经网络在图像分类、自然语言处理等领域得到广泛应用。
2)深度置信网络
深度置信网络是一种生成模型,网络中有若干隐藏层,同一隐藏层内的神经元没有连接,隐藏层间的神经元全连接。神经网络经过“反向运行”得到输入数据。
深度置信网络可以用做生成模型,通过前期的逐层无监督学习,神经网络可以较好的对输入数据进行描述,然后把训练好的神经网络看作深度神经网络,最后得到分类任务的深度神经网络。
深度置信网络可以用于图像识别、图像生成等领域,深度置信网络可以进行无监督或半监督的学习,利用无标记数据进行预训练,提高神经网络性能。但近几年由于卷积神经网络的飞速发展,深度置信网络已经很少被提及。
3)循环神经网络
循环神经网络是一种专门用于处理时序数据的神经网络,它与典型的前馈型神经网络最大区别在于网络中存在环形结构,隐藏层内部的神经元是互相连接的,可以存储网络的内部状态,其中包含序列输入的历史信息,实现了对时序动态行为的描述。这里的时序并非仅仅指代时间概念上的顺序,也可以理解为序列化数据间的相对位置。如语音中的发音顺序,某个英语单词的拼写顺序等。序列化输入的任务都可以用循环神经网络来处理。如语音、视频、文本等。对于序列化数据,每次处理时输入为序列中的一个元素,比如单个字符、单词、音节,期望输出为该输入在序列数据中的后续元素。循环神经网络可以处理任意长度的序列化数据。
循环神经网络可以用于机器翻译、连写字识别、语音识别等。循环神经网络和卷积网络结合,将卷积神经网络用于检测并识别图像中的物体,循环神经网络用于识别出物体的名称为输入,生成合理的语句,从而实现对图像内容的描述。
4深度学习应用
1)语音识别
语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。其应用领域主要有语音输入系统、语音控制系统和智能对话查询系统,语音识别极大地推动了人工智能的快速发展。1952年Davis等人研究了世界上第一个能识别10个英文数字发音的实验系统。大规模的语音识别研究是在20世纪70年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。2012年,微软研究院使用深度神经网络应用在语音识别上将识别错误率降低了20%,取得了突破性的进展。2015年11月17日,浪潮集团联合全球可编程芯片巨头Altera,以及中国最大的智能语音技术提供商科大讯飞,共同了一套DNN语音识别方案。
2)图像分析
图像是深度学习最早尝试的应用领域。1989年,LeCun和他的同事们就发表了卷积神经网络的工作。2012年10月,Hinton和他的两个学生用更深的CNN在ImageNet挑战上获得了第一名,使图像识别向前跃进了一大步。
自2012年以来,深度学习应用于图像识别使得准确率大大上升,避免了消耗人工特征抽取的时间,极大地提升了效率,目前逐渐成为主流的图像识别与检测方法。
关键词:人工神经网络模型;卫生人力;人力资源测算
卫生人力是指经过专业培训、在卫生系统工作、提供卫生服务的人员,包括直接从事医疗、卫生、保健服务的卫生技术人员以及管理、工勤等其他人员。由于卫生系统本身具有复杂性和时变性的双重特性,因此卫生人力受许多因素影响,如人口、经济、社会与文化、资源利用效率、健康状况等等,而且多个因素间相互作用、相互影响。
我国的卫生事业虽然取得了很大的发展,但却存在明显的卫生人力资源失衡现象,突出表现在:卫生人员总量过剩、人员地区分布不均衡尤其是城乡差距较大、卫生人员总体素质不高。因而迫切需要加强卫生人力预测研究,使其更合理地从数量上、质量上和分布上调整现有存量、优化增量,以推动整个卫生事业的发展进程[1,2]。
人工神经网络作为一种综合信息处理和模拟技术,其特有的非线性适应性信息处理能力,克服了传统方法的局限性,而且还具有学习预测精度高、容错能力强和预测速度快的特点[3]。本研究基于人工神经网络方法,构建出一套合理、有效的测算卫生人力需求量的指标体系。
1人工神经网络简介
人工神经网络基本组成单位是神经元(节点),神经元之间按一定的方式相互连接,构成神经网络系统,可以通过预先提供的一批相互对应的输入--输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果[4,5]。
迄今为止,已有多种人工神经网络模型被开发和应用。本文应用较为成熟的误差反向传播学习算法人工神经网络(BP-ANN)。BP神经网络从模拟生物的神经网络出发[6],其最基本的结构是3层前馈网络,即输入层、隐含层、输出层(见图1),层与层之间多采用全互连方式,同一层单元间不存在相互连接。
图1 人工神经网络结构
BP网络模型的应用过程包括训练和预测两个过程。训练时,输入信息从输入层经隐含层逐层处理,并传向输出层。如果输出层得不到期望的输出,则将误差信号沿原来的连接通道返回,通过修改各层神经元的连接权值,使得误差最小。网络重复以上过程进行迭代计算,直至收敛,由此构成了非线性映射模型,掌握了隐含在样本内部各元素间的特殊关系[7]。经训练后的人工神经网络不仅对拟合过的样本有效,而且对未经拟合的样本也可以较准确地预测。人工神经网络以其独特的信息储存方式、良好的容错性、大规模的非线性并行处理方式[8]以及强大的自组织自拟合和自适应能力,已应用于信号处理、模式识别、综合评价、预测分析等领域。
2指标筛选
本文的研究对象是卫生人力的数量。人工神经网络要求选择那些影响输出的主要因素作为输入层,选定的输入变量数必须足够且具有代表性[9,10],基于这一点,经过文献评阅分析及专家小组讨论,本研究对于输入变量,即测算指标的选择主要从以下几方面进行:
2.1人口数量变化 人口数量的变化是影响卫生人力需求量的最重要的因素。人口的增减会引起卫生服务需求量的增减,从而引起卫生人力需求量的波动。对应的变量选择了总人口数、就诊人次数、住院人次数。
2.2经济发展水平 随着社会经济迅猛发展,居民的生活水平不断提高,人们对生活质量要求也逐步提高,而健康是衡量生活质量的重要指标之一,所以随着居民对健康意识的增强,卫生服务需求量将会加大,卫生人力的需求量也随之增加[11,12]。对应的变量选择了卫生总费用、人均卫生费用、人均国民生产总值。
2.3医院发展规模 医院规模直接影响整个卫生人力需求量和卫生人力内部构成。医院规模的大小通常是以病床数来衡量的,而病床数又是人员编配的重要标准[13]。对应的变量选择了医院机构数、总床位数。
2.4卫生人力供给 每年都有大量的医学生走向工作岗位,为医疗系统注入新的血液。对应的变量选择了高等医学院校毕业生数、中等医学院校毕业生数[14]。
3结果与讨论
得到卫生人力的测算指标包括总人口数(万人)、就诊人次数(亿次)、住院人次数(万人)、卫生总费用(亿元)、人均卫生费用(元)、人均国民生产总值(元)、医院机构数、总床位数(万张)、高等医学院校毕业生数、中等医学院校毕业生数10项指标。鉴于年鉴收录自国家及各省市地方统计局的历年统计资料,具有资料翔实,信息密集的特点,所有数据均从统计年鉴中获取,按照年份顺序进行整理,过滤缺失的数据,建立起从1990~2008年的有关卫生人力资源的数据库。
参考文献:
[1]薛娅,高歌,沈月平.常州市卫生人力需要量统计预测研究[J].中国卫生统计,2007,24(3):287.
[2]Francis Omaswa. Human resources for global health: time for action is now[J].The Lancet.2008,371:625.
[3]蒋宗礼.人工神经网络导论[M].北京:高等教育出版社,2002.
[4]任宏,姜庆五.人工神经网络及其在预防医学领域的应用[J].上海预防医学,2003,15(1):22.
[5]黎衍云,李锐,张胜年.人工神经网络及其在疾病筛查中的应用前景[J].环境与职业医学,2006,23(1):71.
[6]钱玲,施侣元,程茂金.应用人工神经网络预测糖尿病/糖耐量异常[J].中国公共卫生,2003,19(10):1272.
[7]Qian AI,Shrestha GB.An ANN based load model for fast transient stability calculations[J].Elec Power Syst Res,2006,76:217.
[8]RiccardoB,DarioG,LauroC,works and robust Bayesian classfiers for risk stratification following uncomplicated myocardial infarction[J].Int J Cardiol,2005,101:481.
[9]薛娅,高歌. 卫生人力需求量预测研究综述[J].上海预防医学杂志,2005,17(12):589.
[10]钟珞,饶文碧,邹承明.人工神经网络及其融合应用技术[M].北京:科学出版社,2007:12.
[11]陈力凌.江苏省卫生人力资源现状及需要量预测研究[D].硕士学位论文,2006:23.
[12]左延莉.广西卫生人力资源配置现状与预测研究[D].硕士学位论文,2002:12.
关键词:
中图分类号: TP391.4文献标识码:A文章编号:2095-2163(2011)03-0043-04
Analysis of Training Results based on the Selection of
Parameters Influencing BP Neural Network
HAN Xue
Abstract: Pattern recognition includes two aspects : sample training and sample recognition. And sample training is the premise of sample recognition.Of course, there are lots of training samples and the samples are representative, whichis good, but not the more the better. In the process of training the neural network, it is very important how to determine various parameters that is beneficial to the training efficiency such as the weights and threshold values. This paper is aimed at the use of a simple sample for neural network training, changes parameter values for observing the training effect, thus obtains the different output results and the diagrams. Further study and comparison are carried outto find out the optimal parameter settings. And the experiment method and the conclusion are helpful for application in other identification system development.
Key words:
0引言
在对BP神经网络进行训练的过程中,很多时候,一些基本参数和训练函数参数是随机生成的,但是训练效率并不高。对于BP神经网络所应用的不同领域,这些参数的设置也有所区别。怎样才能使得训练网络的效率更高,就需要了解参数的变化对于训练结果的影响。本文要解决的问题就是变化其中的各项参数值,对得到的不同训练结果进行对比分析,并找出相关规律。
1研究现状
“神经网络”的研究内容主要包括人工神经网络、生物神经网络、认知科学和混沌。
在研究方法上,对于神经网络的研究已经收获了很多不同的研究方法,比较重要且已有一定成果的研究有多层网络 BP算法、Hopfield网络模型、自适应共振理论和自组织特征映射理论等。
在研究领域上也可以分为理论研究和应用研究两大方面。理论研究包括两个方面:其一是理论上的深入研究,通过对已有算法的性能分析来探索功能更完善、效率更高的神经网络模型,包括对稳定性、收敛性、容错性、鲁棒性等各个性能的最优化研究;其二是朝着智能的方向发展,利用神经生理与认知科学对人类思维和智能机理进行研究。应用研究也包含了两个方面,分别是神经网络的软硬件研究和神经网络在各个领域中应用的研究,其中包括:模式识别、信号处理、知识工程、专家系统、优化组合、机器人控制等[1]。
BP神经网络是当前最流行、应用最广泛的神经网络模型之一。但是仍存在一些缺陷,如训练速度较慢,所以很多学者正在寻找快速有效的BP学习算法,而且也取得了一些成效,最重要的几种快速变体有QuickProp[Fah88]、 SuperSAB [Tol90]和共轭梯度法[Bat92][1]。
除了收敛速度较慢之外,BP神经网络还存在一些缺点:容易在优化的过程中产生局部最优解而不是全局最优解;在对新样本训练的同时容易遗忘旧的样本。基于对以上缺陷的改进,目前已有了一些行之有效的解决方法。
为了提高网络训练速度,在调整权值时增加了动量项,从而对某时刻前后的梯度方向都进行了必要的考虑;为了加快算法收敛速度,采用了自适应学习率调节的方法,如VLBP神经网络,后面的实验中还会进一步比较介绍。
目前,BP神经网络作为很重要的神经网络模型之一,在很多应用领域中发挥着重要的作用,包括图像压缩编码、人脸识别、分类、故障诊断、最优预测等。
2算法原理
BP神经网络的基本思想是通过不断地训练权值,并设有一个标准的输出,每次训练以后得到的实际输出与标准的输出比较,设置一个最小误差,达到这个误差就表示网络训练好了,否则继续训练;经过一定的训练次数后,若还没有达到这个误差标准,就表示网络的设置有问题。本实验通过对参数的改变,寻找出最优参数设置的规律。
3算法实现
使用matlab开发平台,程序编写分为定义输入向量和目标向量、创建 BP网络设置训练函数、初始化权值阈值、设置训练函数参数、训练神经网络五个部分。进行对比实验时,只需将相关参数进行修改即可。对基本的BP神经网络进行训练时,设置基本参数:权值、阈值;训练函数参数:学习率、最后达到的均方误差、最大步长。分别对学习率、均方误差、初始权值、初始阈值进行修改,对比实验结果;基本的BP神经网络中无法对学习率实现事先最优,所以用VLBP神经网络进行改进。
程序如下:
netbp.trainParam.goal=0.0001//设置最后达到的均方误差为 0.0001
netbp.trainParam.epochs=5000 //设置最大训练步长
[netbp,tr]=train(netbp,p,t)
4实验结果
初始训练样本的输入设为[1;3],期望输出设为[0.95;0.05],第一层的权值设为[1 2;-2 0],第二层的权值设为[1 1;0 -2],第一层的阈值设为[-3;1],第二层的阈值设为[2;3],学习率设为1,均方差设为0.0001。其实验仿真图如图1所示。
4.1改变学习率
只改变学习率的训练函数参数时,运行程序后的对比结果如表1所示。
从表1中的实验结果可见:在其他条件不变、学习率增大的情况下,所需的训练步长变短,即误差收敛速度快。但是学习率不可以无限制地增大,增大到一定程度后,误差收敛速度将减慢,甚至有可能达不到误差范围内,进入局部稳定状态。
表1中的各组实验仿真图如图2-图7所示。
4.2改变均方差
将均方差由原来的0.0001变为0.001后与原初始样本参数对比结果如表2所示。
均方差变为0.001后的仿真图如图8所示。
可见,在其他条件一样的前提下,将最后要达到的均方误差值设置较大时,网络训练步长变短,误差收敛速度慢些,最后的输出结果较为精确些。
4.3改变初始权值
将初始权值改变后的对比结果如表3所示。
改变初始权值后的仿真图如图9所示。
可见,后者的初始权值比较合适些,因此训练的时间变短,误差收敛速度明显快些。
4.4改变初始阈值
将初始阈值改变后的对比结果如表4所示。
改变初始阈值后的仿真图如图10所示。
可见,后者的初始阈值比较合适些,因此训练的时间变短,误差收敛速度明显快些。
4.5学习率可变的VLBP神经网络
用最基本的 BP 算法来训练 BP神经网络时,学习率、均方误差、权值、阈值的设置都对网络的训练均有影响。选取合理的参数值会有利于网络的训练。在最基本的 BP算法中,学习率在整个训练过程是保持不变的。学习率过大,算法可能振荡而不稳定;学习率过小,则收敛速度慢,训练时间长。而在对网络进行训练之前是无法选择最佳学习率的。
虽说学习率在训练前无法选最优,但是在训练的过程中能否可变呢?因此BP神经网络的一种改进算法VLBP可派上用场。也就是说,另外设置学习增量因子和学习减量因子,当误差以减少的方式趋于目标时,说明修正方向正确,可以使步长增加,因此学习率乘以增量因子k,使学习率增加;而修正过头时,应减少步长,可以乘以减量因子k,使学习率减小。
程序设计中加入下列语句:
netbp=newff([-1 1;-1 1],[2 2],‘logsig’ ‘logsig’,‘traingdx’)
netbp.trainParam.lr_inc=1.1//增量因子设为1.1
netbp.trainParam.lr_dec=0.65 //减量因子设为0.65
经过训练后最后的输出结果为[0.963 8;0.050 0],训练步长为50,训练后第一层的权值为[1.004 5 2.013 5;-1.408 4 1.774 8],训练后第二层的权值为[0.766 9 0.768 3;-1.544 7 -2.865 0]。
VLBP神经网络训练仿真图如图11所示。
观察网络的收敛速度,采用学习率可变的VLBP算法要比学习率不变BP算法收敛速度提高很多。以上两种算法都是沿着梯度最陡的下降方向修正权值,误差减小的速度最快。
5结束语
通过上述验证性实验,可以看出参数的选取对网络的训练结果有着很大的影响,当然BP算法还很多,但没有一个算法适合所有 BP 网络。在实际运用时,需根据网络自身的特点、误差要求、收敛速度要求、存储空间等来做具体选择。
参考文献:
[ 1 ] http://blog.csdn.net/zrjdds/archive/2008/01/02/2010730.aspx.
[ 2 ] 陈兆乾,周志华,陈世福. 神经计算研究现状及发展趋势. 南京
大学计算机软件新技术国家重点实验室,2008:3-7.
[ 3 ] 赵艳. 神经计算与量子神经计算的研究综述[J]. 计算机与信息