首页 优秀范文 神经网络基本原理

神经网络基本原理赏析八篇

发布时间:2023-08-15 17:13:29

序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的神经网络基本原理样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。

神经网络基本原理

第1篇

关键词:人工神经网络 反向传播算法 故障诊断

1 引言

随着经济的发展,空调系统得到了越来越广泛的应用,空调设备已成为重要的生活必备品之一。这就要求空调系统可靠性高且功能齐全,而且在故障诊断维修服务方面达到一定的水平。国内目前的大部分空调系统中无故障诊断系统,当空调系统出现故障后,维保人员往往不能及时、准确地了解系统出现故障的原因及相关信息,空调系统无法得到及时修复,这种情况急需得到改善。

2 关于故障诊断技术

故障诊断FD(fault diagnosis)是一种了解和掌握设备在使用过程中的技术,确定其整体或局部是否正常,早期发现故障及其原因并能预报故障发展趋势的技术。在诊断过程中,必须利用被诊断对象表现出来的各种有用信息,经过适当地处理和分析,做出正确的诊断结论。在制冷暖通空调领域,1987年在彦启森教授的建议下,才开始了故障诊断专家系统在制冷暖通空调领域的研究应用[1]。

3 人工神经网络用于空调系统故障诊断的基本原理

人工神经网络(Artificial Neural Network.简称ANN)正是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。它实际上是由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统。

典型的神经网络结构如图1所示。

在众多的人工神经网络模型中,最常用的是BP(Back Propagation)模型,即利用误差反向传播算法求解的多层前向神经网络模型[2]。BP网络在故障诊断、模式识别、图像识别、管理系统等方面都得到了广泛的应用。本文讨论利用神经网络中的BP模型进行空调系统的故障诊断。

首先需要进行知识的获取。由专家提供关于各种空调系统故障现象(征兆集)及相应的故障原因(故障集)实例作为学习样本。将数据分为两部分,一部分用于训练网络,另一部分用于测试。将训练网络的数据按一定顺序编码,分别赋给网络输入、输出节点,通过神经网络学习算法对样本进行学习,经过网络内部自适应算法不断修正权值,直到达到所要求的学习精度为止。此时在大量神经元之间联结权值上就分布着专家知识和经验。训练完毕后,再将测试网络的数据从初始状态出发,向前推理,将显示出的故障结果与实际的测试数据结果相比较,如果误差很小,说明网络的权值建立正确;如果误差较大,说明网络的权值建立有误,需要重新进行网络的训练。

将训练样本训练完毕后,即可进行空调系统的故障诊断。只要实际输入模式接近于某一个训练时的学习样本的输入模式,则可产生出接近学习样本的输出结果,也就是所谓的自联想功能。同时,由于网络计算上的大量并行性,当机器运行状况改变,出现网络学习未考虑的情况时,系统亦能给出正确分类结果。同时将新数据并入网络,实现系统的自适应。一般来说,学习的故障实例样本越多,诊断结果的准确率越高。

4 BP学习算法

BP算法因其简单、易行、计算量小、并行性强等优点,是目前神经网络训练采用最多也是最成熟的训练算法之一。BP算法的实质是求解误差函数的最小值问题,由于它采用非线性规划中的梯度下降法(Gradient Descent),按误差函数的负梯度方向修正权值 [3]。其主要思路是如果求出训练网络的指标函数误差:

一般的BP算法称为标准误差逆传播算法,也就是对应每一次输入都校正一次权值。这种算法不是全局误差意义上的梯度下降计算。对各个神经元的输出求偏导数,那么就可以算出误差对所有连接权值的偏导数,从而可以利用梯度下降法来修改各个连接权值。真正的全局误差意义上的梯度下降算法是在全部训练模式都学习完后才校正连接权和阈值。其计算流程如图2所示:

5 故障诊断实例 5.1 空调系统故障诊断的BP网络建立

空调系统故障模式及故障机制分析[4]如表1所示

表1 空调系统故障模式及故障机制分析 表示

符号

表示

符号

房间温度均偏高

1.冷冻机产冷量不足

2.喷水堵塞

3.通过空气处理设备的风量过大,热交换不良

4.回风量大于送风量

5.送风量不足(可能空气过滤气堵塞)

6.表冷器结霜,造成堵塞

相对湿度均偏低

7.室外空气未经加湿处理

系统实测风量大于设计风量

8.系统的实际阻力小于设计阻力

9.设计时选用风机容量偏大

房间气流速度超过允许流速

10.送风口速度过大

第2篇

关键词:功率放大器; 预失真技术; 神经网络; 单入双出; 互调失真

中图分类号:TP18 文献标识码:A

文章编号:1004-373X(2010)09-0107-05

Research of Self-adaptive Digital Predistortion Technology Based on SIDO-neural Network

QIU Wei, LIU Yu-peng, ZHANG Lei-lei

(The base of China Ocean Measure, Jiangyin 214431, China)

Abstract: Because of inherent nonlinearity of high-power amplifier, which may cause bad influence on communication systems, it is necessary to make a linearization processing to overcome or weaken it. The math analysis of nonlinear distortion for the high-power amplifier(HPA) is performed. The basic principle of digital predistortion and the foundamental knowledge of neural network are described. A self-adaptive digital predistortion technology based on SIDO-neural network is proposed according to the amplifying amplitude and the distortion characteristic of phase, which can be improved by the technology. Taking a double-sound signal and 16QAM signal as an example, the Matlab simulation is carried out, The result proves that this technology is superior.

Keywords: power amplifier; predistortion technology; neural network; SIDO; intermodulation distortion

0 引 言

无线通信技术迅猛发展,人们对通信系统的容量要求也越来越大。为了追求更高的数据速率和频谱效率,现代通信系统都普遍采用线性调制方式,如16QAM和QPSK方式,以及多载波配置[1]。

但这些技术产生的信号峰均比都较大,均要求功率放大器具有良好的线性特性,否则就会出现较大的互调失真,同时会导致频谱扩展,造成临道干扰,使误码率恶化,从而降低系统性能。

预失真技术是一项简单易行的功放线性化技术,具有电路形式简单,调整方便,效率高,造价低等优点[2]。其中,基带预失真还能采用现代的数字信号处理技术,是最为看好的一项功放线性化技术。这里利用一种简单的单入双出三层前向神经网络来进行自适应预失真处理,同时补偿由高功率放大器非线性特性引起的幅度失真和相位失真,从而实现其线性化。

文中分析了基于这种结构的自适应算法,并做了相应的仿真。仿真结果表明,该方法能有效克服功放的非线性失真,且收敛速度比一般多项式预失真更快,具有一定的优势。

1 高功率放大器非线性分析

高功率放大器一般都是非线性器件,特别是当输入信号幅度变化较大时,放大器的工作区将在饱和区、截止区、放大区之间来回转换,非线性失真严重,会产生高次谐波和互调失真分量。由于理论上任何函数都可以分解为多项式的形式,故放大器的输入和输出关系表示为:

Vo=a1Vi+a2V2i+a3V3i+…+anVni(1)

假设输入的双音信号为:

Vi=V1cos(ω1t)+V2cos(ω2t)(2)

把式(2)代入式(1),得到输出电压为:

Vo=a22(V21+V22)+a1V1+a334V31+32V1V22+…cos(ω1t)+a2V2+a334V32+32V2V21+…cos(ω2t)+12a2V21+…cos(2ω1t)+12a2V22+…cos(2ω2t)+14a3V31+…cos(3ω1t)+14a3V32+…cos(3ω2t)+a2V1V2[cos(ω1+ω2)t+cos(ω1-ω2)t]+34a3V21V2[cos(2ω1+ω2)t+cos(2ω1-ω2)t]+

34a3V22V1[cos(2ω2+ω1)t+cos(2ω2-ω1)t]+58a5V31V22cos(3ω2-2ω1)t+58a5V21V32cos(3ω1-2ω2)t+…

从上式可以看出,输出信号中不仅包含了2个基频ω1,ω2,还产生了零频,2次及高次谐波以及互调分量。通常2ω1-ω2,2ω2-ω1,3ω1-2ω2和2ω1-3ω2会落在通频带内,一般无法滤除,是对通信影响最大的非线性失真分量,即所谓的三阶互调和五阶互调。放大器线性化的目标就是在保证一定效率的前提下最大地减小┤阶和┪褰谆サ鞣至俊

2 预失真基本原理及其自适应

预失真就是在信号通过放大器之前通过预失真器对信号做一个与放大器失真特性相反的失真,然后与放大器级联,从而保证输出信号相对输入信号是线性变化。预失真器产生一个非线性的转移特性,这个转移特性在相位上与放大器转移特性相反,实质上就是一个非线性发生器。其原理图如图1所示。

图1 预失真基本原理

预失真器的实现通常有查询表法和非线性函数两种方式[2]。由于查表法结构简单,易于实现,早期的预失真多采用此方法,但它对性能的改善程度取决于表项的大小,性能改善越大,需要的表项越大,所需要的存储空间也越大,每次查找遍历表项的每个数据和更新表项所需要的时间和计算时间也越长,因此在高速信息传输的今天已经不可取。非线性函数法是用一个非线性工作函数来拟合放大器输出信号采样值及其输入信号的工作曲线,然后根据预失真器特性与放大器特性相反,求出预失真器的非线性特性函数,从而对发送信号进行预失真处理。这种方法只需要更新非线性函数的几个系数,而不需要大的存储空间,因此是近年来研究的热点。

假设预失真器传输函数为F(x),放大器传输函数为G(x),F和G均为复函数。若输入信号为x(t),则经过预失真器之后的信号为u(t)=F[x(t)],放大器输出函数为y(t)=G[u(t)]=G{F[x(t)]},预失真的目的就是使x(t)通过预失真器和放大器级联后输出y(t)=ax(t),a为放大器增益。通过一定的方法可以找到合适的F,使实际输出和期望输出的误差最小。

由于温度、电器特性、使用环境等因素的不断变化,放大器的传输特性也会发生变化,从而预失真器传输函数F(x)的各参数也会随之而变化,因此现代数字预失真技术一般都要采用自适应技术以跟踪调整参数的变化。目前常用的两种自适应预失真结构如图2、图3所示。

图2 自适应预失真系统结构图

图3 复制粘帖式自适应预失真系统结构图

图2是一般的通用自适应结构,结构简单,思路明确,但一些经典的自适应算法由于多了放大器求导项而不能直接应用,且需要辨识放大器的传输特性,而图3的复制粘帖式结构(非直接学习)则不存在这些问题,关于这种结构的优缺点比较和具体性能分析见文献[3]。本文将采用后一种自适应结构。

3 基于一种单入双出式神经网络的自适应预失真技术

3.1 神经网络

神经网络是基于生物学神经元网络的基本原理而建立的。它是由许多称为神经元的简单处理单元组成的一类自适应系统,所有神经元通过前向或回馈的方式相互关联、相互作用。由Minsky和Papert提出的多层前向神经元网络是目前最为常用的网络结构,已广泛应用到模式分类和函数逼近中,且已证明含有任意多个隐层神经元的多层前向神经元网络可以逼近任意的连续函数[4]。本文利用神经网络的这种功能来拟合预失真器的特性曲线,并且用改进的反向传播算法来自适应更新系数。

多层前向神经元网络由输入层、一个或多个隐层和输出层并以前向方式连接而成,其每一层又由许多人工神经元组成,前一层的输出作为下一层神经元的输入数据。三层前向神经元网络示意图如图4所示,其中输入层有M个人工神经元,隐层有K个神经元,输出层有N个神经元。关于人工神经元的具体介绍参考文献[5-6]。

图4 三层前向神经元网络

3.2 基于单入双出式神经网络的自适应预失真系统模型

对于图5所示的单入双出式三层前向神经网络,假设隐层包含K个神经元。输入数据经过一系列权系数{w11,w12,…w1K}加权后到达隐层的各个神经元。隐层中的神经元将输入进来的数据通过一个激励函数(核函数),将其各神经元的输出经过一系列权系数{w21,w22,…,w2K}和{w31,w32,…,w3K}加权并求和后分别作为输入层第一个神经元和第二个神经元的输入,然后各神经元的输入通过激励函数得到两个输出。

将图5代替图3中的函数发生器,即得到本文中所提到的基于单入双出式前向神经网络的预失真器结构图,如图6所示。

神经网络的三组系数向量开始都随机初始化。设输入序列为xi(i=1,2,…),通过幅度提取和相位提取后得到信号的幅度序列和相位序列。若神经网络的输入为原始输入序列的幅度序列ri(i=1,2,…),则隐层各单元输入I1k=w1kri-θ1k。经过核函数后,隐层各单元的输出为J1k=f(I1k),其中f(x)=11+e-x为核函数,输出层的静输入为z1=∑Kk=1w2k*J1k-θ1,z2=∑Kk=1w3k*J1k-θ2,输出层神经元1的输出,即预失真器幅度预失真分量为U1=f(z1)。

图5 单入双出三层前向神经元网络

图6 单入双出式前向神经网络预失真器结构图

由于相位失真分量的输出范围没有限制在0和1之间,因此不能用核函数加以限制,这里设定输出层神经元2的输出等于其输入,即预失真器相位预失真分量为U2=z2,最后预失真后的幅度和相位和的指数相乘得到送入功放的复信号。功率放大器的输出信号设为yi(i=1,2,…),其幅度和相偏分别为yai(i=1,2,…)和ypi(i=1,2,…)。最后整个系统的幅度绝对误差为ea(i)=Gri-ya(i),相位绝对误差为ep(i)=U2(i)+yp(i),整个系统的绝对误差和为e(i)=ea(i)+ep(i),然而直接把此误差运用到反向传播算法(BP算法)中会导致算法出现局部收敛且收敛速度极慢。因此本文对误差信号做了改进,即把误差信号改为:

e(i)=12[λ(ea(i)]2+(1-λ)φ[ea(i)]+

λ[ep(i)]2+(1-λ)φ[ep(i)]

其中:φ(x)=In[cos(βx)]/β,加入的调整因子λ和辅助项φ,能把算法从局部收敛点拉出来,且收敛速度得到一定的提高。最后根据反向传播算法,得到训练神经网络的权系数更新式如下(下标2为隐层到输出层权系数,下标1为输入层到隐层权系数):

δ2a(i)=ca(i)*[1+U1(i)]*[1-U1(i)](3)

δ2p(i)=cp(i)(4)

w2(i)=α*δ2a(i)*J1+η*w2(i-1)(5)

θ2(i)=α*δ2a(i)+η*θ2(i-1)(6)

w3(i)=-α*δ2p(i)*J1+η*w3(i-1)(7)

θ3(i)=-α*δ2p(i)+η*θ2(i-1)(8)

δ1(i)=(δ2a(i)*w2-δ2p(i)*w3)*

J1(i)*[1-J1(i)](9)

w1(i)=β*δ1(i)*ri+η*w1(i-1)(10)

θ1(i)=β*δ1(i)+η*θ1(i)(11)

式中:ca(i)=λea(i)-1-λ2tan[β*ea(i)];cp(i)=λ*ep(i)-1-λ2tan[β*ep(i)]。

预失真权系数可分为训练和跟踪两个阶段。根据上面的迭代公式,得到一组训练神经网络的权系数,用当前的权系数替代预失真器神经网络中原来的权系数,得到一组新的预失真系数,之后重新计算误差,继续上面的过程循环迭代运算,直到误差小于规定的范围,即整个系统收敛,则预失真器训练完成,此时为训练阶段。之后随着温度、输入的调制信号不同,以及环境等变化可能引起功放特性的变化,可以设置一个误差门限值,一旦发现误差超过此门限,立即重新启动上面的循环迭代,重新训练,直到满足条件,此时为跟踪阶段。这种改进型BP算法的收敛速度快,能满足实时运算的要求。同时在硬件实现上,只要做一个核函数发生器,其他都是乘累加运算,硬件实现要简单得多,因此具有一定的实用性。

4 性能仿真

文中使用双音信号进行了仿真分析,双音信号为:

xs=0.5[sin(2π×10×t)+sin(2π×8×t)]

放大器模型采用经典salef[9]模型,神经网络的隐层数设为15。图7为双音信号原始频谱。

图8是为双音信号直接通过放大器和通过文中所提的预失真网络后再通过放大器的频谱图对比。由此可见,双音信号直接通过放大器后产生了较大的失真,其中的三阶互调达到了-16 dB,五阶互调也有-29 dB。通过对文中所提神经网络预失真系统进行处理后,即信号通过预失真器再通过放大器后,三阶互调被抑制到-42 dB,五阶互调也被抑制到-48 dB以下,此时三阶互调改善26 dB,五阶互调改善19 dB,使放大器的非线性失真得到较大的抑制。

图7 原始信号归一化频谱图

图8 预失真前后信号归一化频谱图

下面以16QAM信号为例,说明这种预失真技术对功放非线性特性的改善,如图9所示。

图9(a)为16QAM信号规则星座图,调制信号均匀地分布在正方形的16个点上;图9(b)为16QAM信号经过功率放大器后解调的星座图。由图可见,信号经过放大器后,幅度受到压缩,相位发生偏移,并且输入信号幅度越大,输出信号幅度压缩越大,相位偏移越严重,最后出现严重的“云团效应”,使得接收端不能正确解调信号。图9(c)是经过本节所提出的单入双出式神经网络预失真器处理后解调信号的星座图。由图可见,经过预失真处理后,由于放大器非线性引起的幅度压缩和相位旋转都得到较好的纠正,“云团效应”明显减弱,最后各个点基本都在理想点上,与┩9(a)对比,基本消除了失真。

5 结 语

针对放大器固有的非线性特性问题,从数学上分析了放大器的非线性失真,介绍了基于预失真基本原理和神经网络基本概念,提出了一种单入双出式神经网络自适应预失真技术。仿真结果表明,该技术能对三阶互调能抑制29 dB左右,对五阶互调能抑制19 dB左右,对QAM调制信号由于放大器非线性引起的幅度压缩和相位旋转都得到较好的纠正,在很大程度上克服了放大器非线性特性,改善了通信系统的性能。

图9 16QAM信号星座图失真及改善对比

参考文献

[1]赵慧,漆兰芬.射频放大器的工作函数预失真线性化[J].无线电工程,2001,31(12):58-61.

[2]贾建华,刘战胜.关于自适应预失真射频功率放大器线性化研究[J].微波学报,2005,21(3):48-50.

[3]钱业青.一种高效的用于RF功率放大器线性化的自适应预失真结构[J].通信学报,2006,27(5):35-40,46.

[4]CYBENKO G. Approximations by superpositions of a sigmoidal function[J]. Mathematics of Control, Signals and Systems, 1989(2): 183-192.

[5]刘宝碇,赵瑞清,王纲.不确定规划及应用[M].北京:清华大学出版社,2003.

[6]朱剑英.只能系统非经典数学方法[M].武汉:华中科技大学出版社,2001.

[7]WU Shan-yin, SIMON H S F, WONG Y M. The use of nonlinear curvefitting in digital predistortion for linearizing RF power amplifiers[J]. IEEE ICICS, 2005, 3: 960-963.

[8]GLENTIS G O, BERBERDIS K, THEODORIDID S. Efficient least sqares adaptive algorithms for FIR transversal filtering[J].IEEE Signal Processing Magazine,1999,16(4):13-41.

第3篇

【关键词】BP神经网络;遗传算法;变压器;故障诊断

1 引言

变压器作为电力系统重要的变电设备,其运行状态直接影响到供电的可靠性和整个系统的正常运行。一旦发生事故,将对电力系统和终端用户造成严重的影响。因此研究变压器故障诊断技术,对电力系统安全运行有着重要的现实意义。

对变压器油中溶解气体进行色谱分析(DGA)是变压器内部故障诊断的一种重要的手段。基于此技术,采用具有高度的非线性映射以及自组织、自学习能力的人工神经网络,现阶段在进行故障诊断时多采用BP神经网络。BP算法是基于梯度的方法,容易陷入局部极小值,且收敛速度慢。GA遗传算法的发展为我们提供了一个全局的、稳健的搜索优化方法,本文充分利用GA具有不受函数可微与连续的制约,并且能达到全局最优的特点,由GA寻找最优的BP网络权值与相应节点的阈值,并加入动量因子,此方法弥补了传统优化方法的不足,极大地改善了BP网络的性能。

2 BP神经网络及遗传算法原理

2.1 BP神经网络的基本原理

BP神经网络是一种利用反向传播训练算法的前馈型神经网络,BP学习算法基本原理是梯度最速下降法,中心思想是调整权值使网络总误差最小,即采用梯度搜索技术,以使其网络的实际输出值与期望输出值的误差均方值为最小。

BP学习算法包括前向传播和误差反向传播两个学习阶段。当给定网络的一个输入模式时,输入信号经隐层逐层处理后传到输出层,并由输出层处理后产生一个输出模式,称为前向传播;当输出响应与期望的输出模式有误差时,则转入误差反向传播。即将误差值沿原来的连接通路逐层反向传播直至输入层,并修正各层连接权值。对于给定的一组训练模式,不断地重复前向传播和误差反向传播的过程,通过沿途修改各层神经元间的连接权和神经元阈值使得误差达到最小。当各个训练模式都满足要求时,就说BP网络已学习好。BP神经网络模型的基本结构如图1。

2.2 附加动量的BP神经网络

传统的BP神经网络训练在修正权值时,是按着k时刻的负梯度方式进行修正,而忽略了之前积累的经验,导致权值的学习过程发生振荡,收敛缓慢。因此提出加入动量因子a,此时k+1时刻的权值为:

附加动量法总是力图使同一梯度方向上的修正量增加。这种方法加速了收敛速度,并在一定程度上减小了陷入局部极小的概率。

2.3 GA遗传算法的基本原理

GA是模拟自然界优胜劣汰的进化现象,把搜索空间映射为遗传空间,把可能的解编码成一个向量(染色体),向量的每个元素称为基因。通过不断计算各染色体的适应值,选择最好的染色体,获得最优解。

首先把问题解用遗传表示出来,在对种群中的个体进行逐个解码并根据目标函数计算其适应值。根据适应值的大小而决定某些个体是否得以存活的操作,把适应值高的个体取出复制再生,再将两个个体的某些部分互换并重新组合而成新的个体,经过交叉后随机地改变个体的某些基因位从而产生新的染色体。这样的过程反复循环,经过若干代后,算法就收敛到一个最优的个体,问题最终获得全局最优解。GA流程图如图2所示:

3 GA优化BP神经网络的变压器故障诊断模型设计

GA-BP算法主要思想是:先利用神经网络试探出最好的网络的隐层节点数,再利用遗传算法在整体寻优的特点将网络的权值优化到一个较小的范围,进而用BP算法继续优化。

3.1 BP网络的建立

(1)输入模式的确定

本文为了充分利用在线监测中的特征气体而又不使输入量过大,特取C2H2/C2H4、C2H4/C2H6、CH4/H2的比值归一后作为输入矢量。

(2)输出模式的确定

本文对输出层采用正常、低温过热、中温过热、高温过热、局部放电、低能放电、高能放电共7个神经元。输出值最大为l,数值越大则表明该类型的故障的可能性和严重程度也越大,如表2.1:

(3)隐含层神经元数确定

本文参考关于隐含层神经元数的理论研究和经验公式,获得理论值为5~15。再利用matlab 软件,通过试凑法对网络进行训练,将隐层节点设置为6、8、10、12、14,将其输入计算机,在相同训练条件下进行训练,得知隐层节点数为12时网络收敛性能好,收敛时间较短。故选节点数为12。

综上所述,本文构建一个输入层为3,隐含层为12,输出层为7的BP神经网络。

3.2 GA对BP网络进行优化

(1)初始化种群P、以及权值、阈值初始化;在编码中,采用实数进行编码,本文初始种群取30;

(2)计算每一个个体评价函数,并将其排序;可按下式概率值选择网络个体:

其中 i为染色体个数,k为输出层节点数,YK为训练值,P为学习样本数,T为期望目标值;

(3)进行选择复制、交叉、变异遗传操作;

(4)将新个体插入到种群P中,并计算新个体的评价函数;

(5)计算BP的误差平方和,若达到预定值则进行BP神经网络的训练,否则重复进行遗传操作;

(6)结束GA操作,以GA遗传出的优化初值作为初始权值,运用BP神经网络进行训练,计算其误差,并不断修改其权值和阈值,直至满足精度要求,此时说明BP网络已经训练好,保存网络权值和阈值。

4 故障诊断系统的仿真

本文选取了具有代表性的30组作为训练样本, 在建立的GA-BP变压器故障诊断网络中输入样本进行训练,其遗传算法适应度曲线、误差平方和曲线和GA-BP的训练目标曲线图分别见图3、图4和图5。

从图中可以看出,适应度较高的个体被遗传了下来,适应度较低的则被淘汰;GA进行了150代的遗传操作达到了目标值;GA-BP算法进行了106步左右就收敛到指定精度0.0005。由此看出,此GA优化BP建立的变压器故障诊断模型的收敛精度和收敛速度都比较高。

采用实际检测到的10组电力变压器故障实例(表2)来验证网络性能,神经网络诊断结果和实际故障结果的比较,如表3所示:

由表3可见,基于遗传算法优化BP神经网络的变压器故障诊断系统在故障诊断中达到了很高的准确率,能较好地满足变压器故障诊断的要求,极大的提高了诊断的可靠性和准确性。

5 结束语

文中将遗传算法与BP网络相结合,在DGA的基础上设计了适用于变压器故障诊断的3-12-7结构的BP神经网络。先对网络的权值阈值进行GA算法处理,并在传统的BP算法中加入动量因子,通过MATLAB编程实现了GA优化BP网络。通过仿真分析可知GA优化BP网络收敛性能的提高改善了BP网络的学习效率,并在下一步的诊断工作中体现其高准确率,推广了此优化网络在变压器故障诊断的实用性。

参考文献:

[1]张绪锦,谭剑波,韩江洪.基于BP神经网络的故障诊断方法[J].系统工程理论与实践,2002(6).

[2]王少芳,蔡金锭.GA―BP混合算法在变压器色谱诊断法中的应用[J].高电压技术,2003(7).

[3]郑高,戴玉松.人工智能方法在变压器故障诊断中的应用[J].四川工业学院报,2004 (5).

[4]李国勇.智能控制机器MATLAB实现[M].电子工业出版社,2005.

[5]徐志钮,律方成.多神经网络方法在变压器油色谱故障诊断中的应用[J].高压电器,2005(3).

第4篇

关键词:滑坡 F-A-M 桥梁易损度

中图分类号:U4 文献标识码:A 文章编号:1007-0745(2013)05-0252-02

1.引言

高速公路不断向西部山区发展,山区特殊的地质水温状况,使得滑坡等地质灾害频发,桥梁作为带状结构物不免要受到滑坡的破坏,对滑坡区的桥梁进行滑坡易损性风险评估,为施工单位提供参考。所谓F-A-M法就是神经网络-有限元-蒙特卡罗模拟计算方法。以往利用有限元计算概率的方法的计算量过于庞大,利用F-A-M法则可避免这一弊端。

2.F-A-M法的原理

2.1. F-A-M法的基本原理及思路

基于F-A-M的风险概率计算方法,是以有限元软件计算、神经网络仿真分析、蒙特卡罗方法模拟为基础,通过有限元软件数值计算来建立一个可靠的神经网络模型,然后根据蒙特卡罗模拟的有关理论,最终得到概率值。F-A-M法的基本思路为:首先建立描述问题相近的概率模型,并利用相似性把这个概率模型的某些特征(变量的均值方差等)与数学计算问题的解答联系起来,然后对模型进行随机模拟和统计抽样,最终利用所得结果求出这些特征的统计估值作为原来数学计算问题的近似解[1]。

2.2. F-A-M法的基本步骤

3.F-A-M法的实桥应用

3.1 工程概况

该桥位于湖北省境内,上部结构为7*30m预应力混凝土T型连续梁桥,双柱式桥墩,U型扩大基础。桥位跨越处为三峡水库蓄水淹没区,两侧均为斜坡且都种植桔树,其中一侧坡度较大约50°。不良地质为顺层土坡,坡体表面堆积碎石土,结构松散,下伏侏罗系的粉砂土,坡面与岩层产状近一致,构成顺坡结构,便道开挖不当会导致坡体失稳或坍滑。另外三峡库区蓄水以后,导致坡脚长期浸泡的水中,极易引起土体失稳而塌岸。

3.2 概率计算

通过有限元软件MIDAS CIVIL建立模型如图2。将利用岩土软件计算得出12组滑坡冲击力,将其加载到3号桥墩上,计算两桥梁结构的内力。经计算最危险单元均位于墩底,结果见表1。图3是第一组力计算的结果。

利用MATLAB建立神经网络,利用上面的数据进行网络的训练与检验。结果见表2所示。

由表2可知神经网络与有限元计算结果的误差较小,最大的为3.66%,这对于山区桥梁滑坡易损性风险分析是足够准确的。

参考文献:[2]中的计算公式计算桥墩的屈服弯矩M=6352.4KNm。根据蒙特卡罗原理,利用MATLAB编写程序随机产生多组随机数,然后将各组随机数分别带入已经训练好的网络中,最后统计出超过屈服弯矩的值得个数,得到山区桥梁滑坡风险概率,详见表3。

由表3可知随着模拟次数的增加,概率趋于稳定,并近似等于0.076。

4.结论

基于神经网络-有限元-蒙特卡罗(F-A-M)模拟计算方法很好的解决了传统概率计算中遇到的桥梁结构极限状态函数呈隐式、高次非线性的问题。而且避免了单纯使用有限元软件计算风险概率的庞大计算量的难题,利用神经网络以及蒙特卡罗的原理大大减少了结构有限元的计算次数,提高了计算效率。

参考文献:

第5篇

1基于贝叶斯算法的BP神经网络

1.1贝叶斯算法基于贝叶斯算法的BP神经网络是基于贝叶斯定理而发展出来的用于解决统计问题的方法,即任意一个待求量都可以看作是一个随机变量,因此可以通过概率分布来对待求量进行描述,这个概率是在抽样前就有的关于待求量的先验概率分布。贝叶斯理论正是在没有样本信息时,只根据先验概率分布来求解待求量。而在有样本后,则可根据总体、样本和先验信息的联合分布来对未知量进行判断。后验分布π(θ|x)是反映人们在抽样后对随机变量θ的认识,其与先验分布即样本x的差异是由于样本出现后人们对θ的调整,即后验分布π(θ|x)为抽样信息对先验分布π(θ)调整的结果[6]。

1.2贝叶斯算法BP神经网络基于贝叶斯算法的BP神经网络是一种以神经网络基本原理为构架,通过引入贝叶斯推理有效地控制网络模型的复杂度,进而更好地解决非线性问题及其不确定性[7]。在BP神经网络中,训练样本集为D(xm,Om),xm为输入信号,Om为输出节点,在一定的网络结构A与网络参数W下,可以得到网络的输出由网络的输入D唯一的确定。网络训练的目标函数为误差函数ED(D|W,A),则有。采用贝叶斯算法BP神经网络步骤如下:(1)确定网络结构A,初始化超参数α,β,对网络参数W进行赋值。(2)以最终目标函数为M(W)最小为原则,对BP神经网络进行训练,寻找最优可能网络参数W。(3)寻找最优可能参数α,β。(4)采用不同初始网络参数寻找最优网络参数。(5)对不同网络结构A,寻找最优网络参数。

2贝叶斯算法的BP神经网络量化结果分析

2.1训练样本与测试样本在对管道进行磁化的过程中,最常用的方法是沿管道轴向进行磁化,提取缺陷处沿轴向变化的漏磁场与沿周向变化的漏磁场,缺陷的长度信息主要由沿轴向变化漏磁场反应,缺陷的宽度信息主要由沿周向变化的漏磁场反应,而缺陷的深度信息则是由这两个量共同反应[9]。本文采用实验的方法获取网络所需样本,这里以对陡壁缺陷的分析为例,研究贝叶斯算法的BP神经网络对陡壁缺陷量化的有效性。分别制作缺陷长度为3,3.5,4,4.5,5,5.5倍管道壁厚,宽度为0.5,1,1.5,2倍管道壁厚,深度为0.1,0.15,0.2,0.25倍管道壁厚,共得到96组测量结果,取其中80个缺陷特征作为网络的训练样本,剩余的16个缺陷特征作为测试样本。

2.2长度的量化采用统计分析的方法选取与缺陷长度关系密切的特征量作为神经网络的输入信号,将缺陷长度作为网络的输出信号来对网络进行训练。所选取主要特征有漏磁场轴向分量的静态阈值截取长度、一阶微分信号极小值的位置与周向变化漏磁场动态阈值截取长度。分别对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,当均方误差小于10-3时停止训练,得到两种网络的训练与学习过程如图1所示。比较两种算法训练过程可以看出贝叶斯算法的BP神经网络总共进行了331次训练,而基本的BP神经网络总共进行了1789次训练,可见贝叶斯算法的BP神经网络的收敛速率更快。用16组测试数据对两种网络长度的量化误差进行比较,得到量化后缺陷最大相对误差与最小相对误差如表1所示,对应贝叶斯算法BP神经网络量化的缺陷如表2所示。从表2中可以看出,采用贝叶斯算法的BP神经网络量化得到的缺陷长度与设计值的误差明显小于基本的BP神经网络,最大相对误差仅为0.05%。

2.3宽度的量化与缺陷长度的量化相似,采用统计分析的方法选取与缺陷宽度关系密切的特征量作为神经网络的输入信号,将缺陷宽度作为网络的输出信号来对网络进行训练。所选取主要特征有轴向变化漏磁场峰谷值、周向变化漏磁场波形面积、波形能量、静态阈值截取长度。分别对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,当均方误差小于10-3时停止训练,得到两种网络的训练与学习过程如图2所示。比较两种算法训练过程可以看出贝叶斯算法的BP神经网络总共进行了269次训练,而基本的BP神经网络总共进行了2248次训练,可见引入贝叶斯算法后的BP神经网络的收敛速率大幅提升。与之前相同,用16组测试数据对两种网络宽度的量化误差进行比较,得到量化后缺陷误差如表3所示,贝叶斯算法BP神经网络量化达到误差的缺陷见表4。在对缺陷宽度进行量化的过程中,尽管量化得到的最大相对误差仍较大,采用贝叶斯算法的BP神经网络量化得到的缺陷宽度与设计值的误差明显小于基本的BP神经网络。

2.4深度的量化在对缺陷的深度进行量化时,采用统计分析的方法选取了缺陷的长度、宽度以及轴向变化漏磁场的两个峰谷值、波形面积、周向变化漏磁场峰值、峰谷值作为神经网络的输入信号,将缺陷深度作为网络的输出信号来对网络进行训练。对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,得到两种网络的训练与学习过程如图3所示。贝叶斯算法BP神经网络总共进行了4152次训练,基本的BP神经网络总共进行了8763次训练,尽管引入贝叶斯算法BP神经网络的训练过程仍旧较长,但比基本BP神经网络的收敛速率有所提升。用16组测试数据对两种网络深度的量化误差进行比较,得到量化后缺陷误差如表5所示,贝叶斯算法BP神经网络量化达到误差的缺陷见表6。从对缺陷深度量化结果可以看出,采用贝叶斯算法的BP神经网络对缺陷深度进行量化,得到的缺陷深度与设计值的误差小于基本的BP神经网络。

3结束语

第6篇

关键词:BP人工神经网络模型;多元线性回归;逐步回归;拟合精度

中图分类号:TP183;Q945.17 文献标识码:A 文章编号:0439-8114(2014)02-0434-03

Application of Artificial Neural Network in Predicting Trunk Sap Flow

XIE Heng-xing1,ZHANG Zhen-hua2

(1.College of Chemistry and Life Science, Weinan Normal University, Weinan 714099, Shaanxi, China;

2. College of Geography and Planning, Ludong University, Yantai 264025, Shandong, China)

Abstract: The BP artificial neural network model, multi-linear regression model and stepwise regression model were used to fit trunk sap flow velocity and the fitted precision was compared. Results showed that the fitting effect was the best in BP artificial neural network model with a deciding coefficient of 0.944 3, the smauest relative error within the range of -31.120 0%~36.755 5%. In the fitting effect of sap flow, BP artificial neural network was the best one.

Key words: BP artificial neural network model; multi-linear regression; stepwise regression; fitting precision

液流是指蒸腾在植株体内引起的上升流,植株根部吸收的水分99.8%以上消耗在蒸腾上[1],而树干是树木液流通道的咽喉部位,因此通过精确测量树干部位的液流速率、液流量可以基本反映植株的蒸腾状况。热技术是目前测量植株液流应用最广泛的方法[2],热技术根据不同的原理可分为热脉冲法、热平衡法和热扩散法[3]。国内外学者应用热技术对植株液流进行了研究,如刘奉觉等[4]、司建华等[5]应用热脉冲技术分别研究了杨树和胡杨的液流;严昌荣等[6]、曹文强等[7]应用热平衡技术分别研究了胡桃楸和辽东栎等树木的液流;马长明等[8]、孟平等[9]应用热扩散技术对山杨和苹果等树木的液流进行了研究。但研究多停留在对植株液流现象的描述上,对植株液流与环境因子的定量分析也仅仅是简单的回归分析或逐步回归分析[4-9],缺乏系统的量化研究。Ford等[10]利用热扩散技术观测了火炬松的液流变化,并应用ARIMA(差分自回归移动平均)模型拟合了土壤水分亏缺条件下火炬松树冠蒸腾。人工神经网络是一个具有高度非线性的超大规模连续时间动力系统,因其具有自学习功能、联想存贮功能、高速寻找优化解功能等优点而在经济、化工、水文、农业等领域得到了广泛应用[11-14]。树干液流与环境因子之间很难建立一个准确的数学方程[15],本试验尝试利用BP人工神经网络模型来拟合液流速率,以求为液流速率和环境因子之间建立准确的数量关系。

1 材料与方法

1.1 研究区概况

1.2 仪器安装

2 结果与分析

2.1 BP人工神经网络基本原理

2.2 液流速率BP人工神经网络分析

3 结论

液流速率是植物蒸腾强弱的表现,蒸腾受温度、湿度、风速和太阳辐射诸多因子的影响,而环境因子之间又存在复杂的关系,这给液流速率的预测带来了很大的难度。BP人工神经网络在超大规模非线性模拟中显示了一定的优越性,利用人工神经网络研究液流与环境因子的定量关系具有广阔的适用性。本试验的拟合结果表明,BP人工神经网络模型明显优于多元线性回归和逐步回归模型,其液流速率的拟合值与观察值相对误差最小。

参考文献:

[1] 王沙生,高荣孚,吴贯明.植物生理学[M]. 第二版.北京:中国林业出版社,1991.192.

[2] 孙慧珍,周晓峰,康绍忠.应用热技术研究树干液流进展[J].应用生态学报,2004,15(6):1074-1078.

[3] SWANSON R H. Significant historical developments in thermal methods for measuring sap flow in trees[J]. Agric For Meteorol,1994,72(1-2):113-132.

[4] 刘奉觉,EDWARDS W R N,郑世锴,等.杨树树干液流时空动态研究[J].林业科学研究,1993,6(4):368-372.

[5] 司建华,冯 起,张小由.热脉冲技术在确定胡杨幼树干液流中的应用[J].冰川冻土,2004,26(4):503-508.

[6] 严昌荣,ALEC D,韩兴国,等.北京山区落叶阔叶林中核桃楸在生长中期的树干液流研究[J].生态学报,1999,19(6):793-797.

[7] 曹文强,韩海荣,马钦彦,等.山西太岳山辽东栎夏季树干液流通量研究[J].林业科学,2004,40(2):174-177.

[8] 马长明,管 伟,叶 兵,等.利用热扩散式边材液流探针(TDP)对山杨树干液流的研究[J].河北农业大学学报,2005,28(1):39-43.

[9] 孟 平,张劲松,王鹤松,等.苹果树蒸腾规律及其与冠层微气象要素的关系[J].生态学报,2005,25(5):1075-1081.

[10] FORD C R,GORANSON C E, MITCHELL R J, et al. Modeling canopy transpiration using time series analysis: A case study illustrating the effect of soil moisture deficit on Pinus taeda[J]. Agric Forest Meteorol, 2005,130(3-4):163-175.

[11] 刘 艳,杨 鹏.基于ANN的预警指标预测系统在企业经济运行预警中的应用[J].统计与决策,2006(4):161-163.

[12] 胡燕瑜,桂卫华,李勇刚,等.基于BP神经网络的熔融锌液流量检测[J].有色金属,2003,55(3):143-146.

[13] 过仲阳,陈中原,李绿芊,等.人工神经网络技术在水质动态预测中的应用[J].华东师范大学学报(自然科学版),2001(1):84-89.

第7篇

关键词:智能车;电磁循迹;路径识别;神经网络;偏差量

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2012) 17-0000-02

1 引言

人工神经网络是模拟生物神经系统建立起来的非线性动力学系统具有自我学习、联想存储以及高速寻求最优解的强大功能,它的分类能力和非线性映射能力使得它在系统辨识、模式识别、图像处理、智能控制等领域有着广泛而吸引人的前景,并且越来越多地被人们所运用。

“飞思卡尔”杯全国大学生智能车竞赛中的电磁组是依据电磁感应原理,实现智能车的自动循迹。以飞思卡尔公司生产的MC9S12XS128芯片作为微控制器,以通有固定频率和电流值的导线作为目标路径,用电磁传感器检测智能车偏离导线的偏差量,配合舵机和电机的动作在50cm宽的赛道上实现自动循迹。其中偏差量的检测与计算是智能车能否准确快速跟踪引导线的关键。当前偏差量的计算算法主要有两种,一种是取感应电动势最大的传感器位置作为线径所在位置,这种方法本质上以点来检测,测量精度低,需要的传感器数量大。另外一种是根据感应电动势的特点,将两个传感器的感应电动势作差值计算,得到电动势与偏差量之间的一个二次函数,这种方式计算是关于二次函数来进行的,计算量大,对检测的实时性会有所影响。本文提出的方案,是以电感线圈作为传感器来检测路径,基于人工神经网络算法来计算车身相对引导线的偏移量,把样本数据放在matlab环境下训练,得到满足误差要求的参数,然后将参

2 BP神经网络模型基本原理

BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,中间层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反向传播。BP神经网络的拓扑结构如所示:

BP神经网络主要由输入层、隐含层和输出层构成。输入信号先向前传播到隐含层节点,经作用函数后,把隐节点的输出信号传播到输出节点,最后得出输出结果。本文中隐层节点的激励函数选取双曲正切S型函数,

(1)

在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。

前向传播过程:

(1)隐层神经元的输入为输入神经元的加权和加上输入层到隐层的阈值。

(2)

(2)隐层神经元的输出为:

(3)

(3)输出层神经元输出为隐层神经元的输出加权和加上隐层到输出层阈值。

(4)

网络输出y1与理想输出y01的误差e1为:

e1=y10-y1 (5)

反向传播采用L-M优化算法,调整各层间的权值。L-M算法是一种利用标准的数值优化技术的快速算法,它是梯度下降法与高斯-牛顿法的结合。设W(k)表示第 k 次迭代的权值和阈值所组成的向量新的权值和阈值组成的向量W(k+1)可根据下面的规则求得:

(6)

对于L-M算法则有:

(7)

其中,J为雅克比矩阵。比例系数μ>0为常数,I为单位矩阵。当 μ=0即为高斯-牛顿法;当μ取值很大则接近梯度下降法。实践证明,采用L-M算法可以较原来的梯度下降法提高速度几十甚至上百倍。本文采用L-M算法进行训练。

3 Matlab中神经网络算法的实现

3.1 获取样本数据

根据麦克斯韦电磁场理论,通有交变电流的导线会在其周围产生交变的电磁场,如果在里面放置一个电感线圈,电磁感应作用会使线圈中产生交变的感应电压。智能车使用电感线圈作为传感器检测导线周围磁场信息,由电磁学可知,水平放置的电感线圈在导线磁场内的感应电动势E=h/(h2+x2),h表示传感器离导线的垂直距离,x代表传感器距离导线的水平距离。假设h=5cm,x在±15cm内电动势和水平距离的关系曲线如2所示:

经过实际测试,使用四路传感器比较合适。传感器分布以车轴为中心,间隔为12cm 呈“一”字均匀排列构成前瞻,传感器距离水平面15cm,距离车身50cm。布局示意图如图3所示:

图2电动势和水平距离的曲线图 3前瞻分布示意图

将传感器的感应电动势进行检波放大 ,把处理后的信号经AD转换得到传感器信号值。转换过程如图4所示。

本系统的BP神经网络的输入为四路传感器的感应电压信号,输出为小车车身偏移引导线的水平偏移量,综合考虑训练误差和速度,设置隐含层得神经元个数为10。训练目标误差平方和取为0.000005 ,训练次数为5000次。

3.2 智能车算法实现:

最终算法的实现需要将神经网络的训练好的权重和阈值移植到智能车的微控制器中去。通过BP神经网络对智能车采集到的输入信号进行处理运算,计算得到的输出层的神经元输出值就是当前车轴中心线偏离引导线的偏差量,根据此值进行相应的打舵与调速操作,以实现智能车的快速稳定循迹。

4 实验结果与分析

记录并分析实验数据,matlab训练得到的实际输出与理想输出之间的关系如图5所示:

由上图可知,基于BP神经网络算法计算出的偏差量与理想偏差量之间的误差在±1cm以内。在“飞思卡尔”杯智能汽车竞赛中,由于神经网络的非线性映射能力和高速寻求最优解能力,把它应用到智能车的循迹上来效果是很明显的,它不需要计算感应电动势和偏差量之间的非线性关系,把计算量很大的训练过程放在matlab环境下进行,微控制器直接使用matlab下训练得到的参数就可以了。

5 结论

本文在当前主流循迹算法的基础上,提出了基于BP神经网络的路径识别算法,并详细叙述了基本原理和具体的实现方法。实验结果证明:使用BP神经网络计算得到的结果误差在±1cm以内,它可以大幅度地提高智能小车对环境的适应性,从而降低系统对智能小车硬件的要求。但其激励函数和学习算法仍需要深入研究,并且在实际运用中还有待提高,以达到更好的应用效果。

参考文献:

[1]卓晴,黄开胜,邵贝贝.学做智能车[M].北京:北京航天航空出版社,2007.

[2]马锐.人工神经网络原理[M].机械工业出版社,2010.

[3]张雨浓,杨逸文,李巍.神经网络权值直接确定法[M].中山大学出版社,2010.

[4]陈杰,黄鸿.传感器与检测技术[M].北京:高等教育出版社,2002.

[5]飞思卡尔竞赛管理秘书处,电磁组竞赛车模路径检测设计参考方案,2010.

[6]童诗白,华成英.模拟电子技术基础[M].高等教育出版社,2000.

[7]傅荟璇,赵红等.MATLAB神经网络应用设计[M].机械工业出版社,2010.

[8]CS12微控器原理及应用[M].北京航天航空大学出版社,2007.

第8篇

【关键词】信用风险评估 判别分析 Logit模型 BP人工神经网络模型

一、引言

银行在现代经济体系中发挥着非常重要的作用,尤其是在创造货币存款、实现金融政策效率、社会投资实现等方面都起到了举足轻重的核心作用。信用风险评估是银行信用风险管理的关键环节,关系到银行自身的生存和经济社会的稳定和繁荣,世界上所有国家都非常重视对银行信用风险的监管和评估,特别是发达国家更是对此关注度极高。我国商业银行和金融市场仍处在转轨和新兴发展阶段,信用风险管理方法和技术比较落后,因此加快我国信用风险评估方法研究显得尤为必要和迫切。

信用风险评估方法的研究可以追溯到上世纪30年代,大致经历了比例分析、统计分析和人工智能三个阶段。本文试图通过阐述统计模型和人工智能模型中的典型代表来分别阐述其实现条件和过程,分析各种方法的不足,并对我国银行信用风险评价方法给出评价和建议。

二、两类银行信用风险评估方法介绍

(一)传统统计方法概述

传统的统计分析方法主要是基于多元统计分析方法,其基本思路是根据已经掌握的历史上每个类别的若干样本,从中分析出分类的规律,建立判别公式,用于新样本的分类,典型的代表有多元判别分析(MDA)和Logit模型分析。

1.多元判别分析(MDA)。数理统计理论中判别分析模型主要有三类,分别是距离判别法、Bayes判别分析法、Fisher判别分析法;在三种判别分析方法中,距离判别法是根据个体到总体间的距离进行判别;Bayes判别是在已知总体分布的条件下求得平均误判概率最小的分类判别函数;Fisher判别是在未知总体分布函数的条件下,根据Fisher准则得到的最优线性判别函数,Fisher准则的基本思想就是利用一元方差分析思想,导出线性判别函数。

2.Logistic模型的提出。由于多元判别分析模型(MDA)在应用的过程中要求有正态分布的假定,而在现实经济生活中常无法满足,所以当涉及到一些样本数据不同分布于正态分布时,应用MDA模型所得到的研究结果缺乏可信度,从而探索非同分布的方法就十分必要,其中最常见的一种方法就是应用Logistic模型,Logit分析与MDA分析最本质的差异就在于Logit分析不需要样本满足正态分布或同方差,其判别正确率高于判别分析结果。Logit模型采用logistic函数,函数形式如下:

Y=,η=с0+cixi;

其中xi(1≤i≤p)表示第i个指标,ci是第i个指标的系数,Y是因变量,因为Y∈(0,1),所以Y也可以理解为属于某一类的概率。

由于logit分析无需假定任何的概率分布,所以就不需要类似于判别分析那样先进行检验而是可以直接应用样本数据计算,以得到logit模型。

(二)人工智能模型(AI)概述

1.人工神经网络及BP神经网络概述。人工神经网络是一种具有模式识别能力的计算机制,它具有自组织、自适应和自学习三大特点,它的编码可以用于整个的权值网络,不仅可以呈现分布式存储,而且具有相当大的容错能力。在人工神经网络中,下面提到的BP神经网络技术是算法最成熟且应用最广泛的一种。

2.BP神经网络的基本原理和算法。第一,BP神经网络的基本原理。

BP神经网络属于前向三层即前馈式神经网络的一种典型分支代表,主要是由以下三个部分组成即输入层、隐含层和输出层组成。

第二,BP神经网络的基本算法。

BP学习算法的基本思想是通过由输入层输入的信息,传导至隐层分析后再由输出层输出,如果输出层的结果未达到期望值要求则计算每个神经元的误差值并且将这些误差值重新反向传递到隐层的神经元,根据误差值调整各个神经元的连接权值,直到误差值达到了期望值的要求。

BP神经网络技术一般运用传递函数来反映下层的输入对上层节点的刺激脉冲强度,因此传递函数又称为刺激函数,通常情况下取(0,1)内连续取值Sigmoid函数。

Sigmoid函数函数可以表示为:

该函数可以用于计算和反映出实际的计算输出与期望输出间的误差大小。

三、两类方法存在问题的分析

(一)统计分析方法存在的问题

传统统计分析模型是以历史数据作为分析和建立模型的基础,这些数据仅以会计账面价值为原始来源,没有将银行贷款者的非财务因素纳入模型当中,并且这些会计账面数据属于离散和非连续性的数据类型,因此很难捕捉到这些银行贷款者信用状况细微和快速的变化,无法对贷款者的信用状况做出比较全面的评价。另外,该类模型处理速度慢且数据的准确性较差,属于静态模型没有自主的调整能力。

(二)人工智能模型存在的问题

人工智能模型最大的缺陷在于指标和加权值的确定带有很大的主观性和不确定性,造成在网络结构确定方面存在较大困难,另外该模型的训练效率比较低,解释能力也比较差,在建模过程中经常出现组合爆炸和过度拟合等问题。其典型代表神经网络系统的缺陷主要有以下几个方面,第一,所谓“黑箱子”问题,即神经网络没有办法确定输入变量之间的具体的函数关系,也无法产生有效的统计规则来解释模型的具体运行过程,这使得模型在应用时缺乏透明度和可信度;第二,在指标选取方面,神经网络模型对于非线性的方法没有统一具体的成熟方法进行分析指标选取;第三,模型结构的问题,神经网络模型在应用过程中效果表现的好坏和预测结果的精确程度主要决定于系统结构的设计是否合理和科学,但是如果想要得到一个比较好的神经网络结构通常会消耗大量的人力和时间,这些在实际的建模过程中经常无法同时满足。

四、对我国银行信用风险评估的启示

(一)我国银行信用风险评估存在的问题

我国商业银行信用风险评估方法的主要缺陷可以概括为以下几个方面,首先,在商业银行信用风险评估中,大部分采用的仍然是专家系统机制,即通过个别专家系统的经验和个别风险分析人员提供的信息来对信贷的风险进行评估和决策,这就导致信用风险评估效果较低且银行无法及时地应对金融市场的即时变化;其次,国内对银行信用风险评价方法的研究中大都缺乏定性分析和定量分析相结合的探索,片面的停留在定性分析和定量分析的两个极端,第三,在现今的银行信用风险评估指标体系方面,没有形成客观、科学、有效的指标体系,大多数信用风险模型选取的都是财务性指标而缺乏那些影响信用风险的非财务指标;最后,由于我国金融市场的发展起步较晚,银行业各种运作机制存在很多的问题尚待完善和发展,其中很重要的一点就是我国商业银行在客户资料收集、整理和存储方面存在很大的不足,未能建立有效的风险评估数据库系统,不能为风险评估模型的运用提供很好的样本基础,成为制约我国风险评估方法发展的一大瓶颈。

(二)对我国银行信用风险评估的启示

虽然我国商业银行信用风险评估的方法和理论得到了不断地发展,但其中仍存在需要改进的地方。在我国,大多数先进的银行信用风险评估方法是建立在西方发达国家商业银行对历史数据的统计分析和经验总结的基础上,还不能够直接应用到我国商业银行信用风险评估当中,因此我国商业银行在研究和探索信用风险评估方法时必须考虑到我国自己的基本国情、金融市场发展的现状以及银行业自身发展的客观现实等。

针对以上分析的国内信用风险评估方法发展的现状,我们可以通过从以下几个方面来改善和提高。一方面,商业银行应该建立切实有效的企业信贷风险管理数据库系统,加强对企业各类违约风险评估数据的收集、整理和管理,及时更新和加强数据库的建设。另一方面,商业银行需要建立自身内部的信用评价体系,为现代信用风险评估的运用创造适宜的条件和基础,将定性方法和定量方法相结合,进一步推动我国银行信用风险评估方法的发展。最后,任何完善的信用风险评估方法都离不开高素质的专业风险管理人才,因此加强信用风险评评价的人才队伍建设也是一个刻不容缓的课题,商业银行应该加快培养高素质信用风险评估人才的步伐,同时要在全球范围内大量吸纳那些已经具备信用风险评估专业知识和技术的优秀人才,为推动我国信用风险评估方法的进步不断寻求突破。

参考文献

[1]柯孔林,周春喜.商业银行信用风险评估方法研究述评[J].商业经济与管理,2005(6)

[2]王建新,于立勇.基于信用风险度的商业银行风险评估模型研究[J].管理工程学报,2007(4)

[3]徐晓霞,李金林.基于决策树法的我国商业银行信用风险评估模型研究[J],北京理工大学学报,2006, 8(3)

[4]王莉,郑兆瑞,郝记秀.BP神经网络在信用风险评估中的应用[J].太原理工大学学报,2005,36(2)

[5]韩岗.国外信用风险度量方法及其使用性研究[J],国际金融研究,2008

[6]闫晓丽,徐建中.商业银行信用风险评估模型比较研究[J],哈尔滨工业大学学报(社会科学版),2007,9(2)

[7]郑毅,蔺帅.遗传神经网络在商业银行信用风险评估中的应用[J].社会科学家,2008,(1)