非数值算法

科技工作者之家  |   2020-11-17 17:33

非数值算法,是根据对象的不同,分为数值并行算法和非数值并行算法两种中的一种。

算法介绍并行算法根据对象的不同分为数值并行算法和非数值并行算法两种。

多项式与线性代数方程组,矩阵与非线性方程,插值、逼近及其应用,数字信号处理,小波

变换,快速傅利耶变换等内容属于数值算法。非数值算法一般包括线性表、栈、队列和串,

树,图,排序、查找与文件操作,并行算法等,主要是为符号运算而设计的并行算法。

常用的非数值并行算法有模拟退火算法、遗传算法、神经网络算法等1。

模拟退火算法模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体

内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平

衡态,最后在常温时达到基态,内能减为最小。根据Metropolis 准则,粒子在温度T 时趋于

平衡的概率为e-ΔE/(kT),其中E 为温度T 时的内能,ΔE 为其改变量,k 为Boltzmann 常

数。用固体退火模拟组合优化问题,将内能E 模拟为目标函数值f,温度T 演化成控制参数

t,即得到解组合优化问题的模拟退火算法:由初始解i 和控制参数初值t 开始,对当前解重

复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t 值,算法终止时的当

前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火

过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t 及其衰减因子Δt、每个t

值时的迭代次数L 和停止条件S。

1、模拟退火算法可以分解为解空间、目标函数和初始解三部分 。

解空间它为问题的所有可能(可行的或包括不可行的)解的集合,它限定了初始解选取和新解产

生时的范围。对无约束的优化问题,任一可能解(possible solution)即为一可行解(feasible

solution),因此解空间就是所有可行解的集合;而在许多组合优化问题中,一个解除满足目

标函数最优的要求外,还必须满足一组约束(constraint),因此在解集中可能包含一些不可行

解(infeasible so1ution)。为此,可以限定解空间仅为所有可行解的集合,即在构造解时就考

虑到对解的约束;也可允许解空间包含不可行解,而在目标函数中加上所谓罚函数(penalty

function)以“惩罚”不可行解的出现。

目标函数它是对问题的优化目标的数学描述,通常表述为若干优化目标的一个和式。目标函数的

选取必须正确体现对问题的整体优化要求。例如,如上所述,当解空间包含不可行解时,目

标函数中应包含对不可行解的罚函数项,借此将一个有约束的优化问题转化为无约束的优化

问题。一般地,目标函数值不一定就是问题的优化目标值,但其对应关系应是显明的。此外,

目标函数式应当是易于计算的,这将有利于在优化过程中简化目标函数差的计算以提高算法

的效率2。

初始解基本思想:

(1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点), 每个T 值的迭

代次数L

(2) 对k=1,,L 做第(3)至第6 步:

(3) 产生新解S′

(4) 计算增量Δt′=C(S′)-C(S),其中C(S)为评价函数

(5) 若Δt′0,然后转第2 步。

二、遗传算法

遗传算法的基本思想是基于Darwin 进化论和Mendel 的遗传学说的。

Darwin 进化论最重要的是适者生存原理。它认为每一物种在发展中越来越适应环境。物种

每个个体的基本特征由后代所继承,但后代又会产生一些异于父代的新变化。在环境变化时,

只有那些能适应环境的个体特征方能保留下来。

Mendel 遗传学说最重要的是基因遗传原理。它认为遗传以密码方式存在细胞中,并以基因

形式包含在染色体内。每个基因有特殊的位置并控制某种特殊性质;所以,每个基因产生的

个体对环境具有某种适应性。基因突变和基因杂交可产生更适应于环境的后代。经过存优去

劣的自然淘汰,适应性高的基因结构得以保存下来。

遗传算法简称GA(Genetic Algorithm),在本质上是一种不依赖具体问题的直接搜索方法。

1、遗传算法的原理

遗传算法GA 把问题的解表示成“染色体”,在算法中也即是以二进制编码的串。并且,在

执行遗传算法之前,给出一群“染色体”,也即是假设解。然后,把这些假设解置于问题的

“环境”中,并按适者生存的原则,从中选择出较适应环境的“染色体”进行复制,再通过

交叉,变异过程产生更适应环境的新一代“染色体”群。这样,一代一代地进化,最后就会

收敛到最适应环境的一个“染色体”上,它就是问题的最优解。

长度为L 的n 个二进制串bi(i=1,2,,n)组成了遗传算法的初解群,也称为初始群体。

在每个串中,每个二进制位就是个体染色体的基因。根据进化术语,对群体执行的操作有三

种:

(1).选择(Selection)

这是从群体中选择出较适应环境的个体。这些选中的个体用于繁殖下一代。故有时也称这一

操作为再生(Reproduction)。由于在选择用于繁殖下一代的个体时,是根据个体对环境的适

应度而决定其繁殖量的,故而有时也称为非均匀再生(differential reproduction)。

(2).交叉(Crossover)

这是在选中用于繁殖下一代的个体中,对两个不同的个体的相同位置的基因进行交换,从而

产生新的个体。

(3).变异(Mutation)

这是在选中的个体中,对个体中的某些基因执行异向转化。在串bi 中,如果某位基因为1,

产生变异时就是把它变成0;反亦反之。

2、遗传算法的特点

(1).遗传算法从问题解的中集开始嫂索,而不是从单个解开始。

这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值迭代求最优解的;

容易误入局部最优解。遗传算法从串集开始搜索,覆盖面大,利于全局择优。

(2).遗传算法求解时使用特定问题的信息极少,容易形成通用算法程序。

由于遗传算法使用适应值这一信息进行搜索,并不需要问题导数等与问题直接相关的信息。

遗传算法只需适应值和串编码等通用信息,故几乎可处理任何问题。

(3).遗传算法有极强的容错能力

遗传算法的初始串集本身就带有大量与最优解甚远的信息;通过选择、交叉、变异操作能迅

速排除与最优解相差极大的串;这是一个强烈的滤波过程;并且是一个并行滤波机制。故而,

遗传算法有很高的容错能力。

(4).遗传算法中的选择、交叉和变异都是随机操作,而不是确定的精确规则。

这说明遗传算法是采用随机方法进行最优解搜索,选择体现了向最优解迫近,交叉体现了最

优解的产生,变异体现了全局最优解的覆盖。

三、神经网络算法

“人工神经网络”(ARTIFICIAL NEURAL NETWORK,简称A.N.N.)是在对人脑组织结构和

运行机智的认识理解基础之上模拟其结构和智能行为的一种工程系统。早在本世纪40 年代

初期,心理学家McCulloch、数学家Pitts 就提出了人工神经网络的第一个数学模型,从此开

创了神经科学理论的研究时代。其后,F.Rosenblatt、Widrow 和Hopf、J.J.Hopfield 等学者又

先后提出了感知模型,使得人工神经网络技术得以蓬勃发展。

神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本

单元。据神经生物学家研究的结果表明,人的一个大脑一般有10 10 ~10 11

个神经元。每个神经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它

较短分支——树突组成。轴突的功能是将本神经元的输出信号(兴奋)传递给别的神经元。其

末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接受来自其它神经

元的兴奋。神经元细胞体将接受到的所有信号进行简单地处理(如:加权求和,即对所有的

输入信号都加以考虑且对每个信号的重视程度——体现在权值上——有所不同)后由轴突输

出。神经元的树突与另外的神经元的神经末梢相连的部分称为突触。

1、神经网络的工作原理

人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写

“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而

当输入为“B”时,输出为“0”。所以网络学习的准则应该是:如果网络作出错误的的判决,

则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值

赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权

求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”

和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使

连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。如果输出

为“0”(即结果错误),则把网络连接权值朝着减小综合输入加权值的方向调整,其目的在

于使网络下次再遇到“A”模式输入时,减小犯同样错误的可能性。如此操作调整,当给网

络轮番输入若干个手写字母“A”、“B”后,经过网络按以上学习方法进行若干次学习后,

网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功,它已将这

两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时,能够

作出迅速、准确的判断和识别。一般说来,网络中所含的神经元个数越多,则它能记忆、识

别的模式也就越多。

2、人工神经网络的特点

人工神经网络是由大量的神经元广泛互连而成的系统,它的这一结构特点决定着人工神经网

络具有高速信息处理的能力。人脑的每个神经元大约有10 3~10 4 个树突及相应的突

触,一个人的大脑总计约形成10 14 ~10 15 个突触。用神经网络的术语来说,

即是人脑具有10 14 ~10 15 个互相连接的存储潜力。虽然每个神经元的运算

功能十分简单,且信号传输速率也较低(大约100 次/秒),但由于各神经元之间的极度并行互

连功能,最终使得一个普通人的大脑在约1 秒内就能完成现行计算机至少需要数10 亿次处

理步骤才能完成的任务。

人工神经网络的知识存储容量很大。在神经网络中,知识与信息的存储表现为神经元之间分

布式的物理联系。它分散地表示和存储于整个网络内的各神经元及其连线上。每个神经元及

其连线只表示一部分信息,而不是一个完整具体概念。只有通过各神经元的分布式综合效果

才能表达出特定的概念和知识。

由于人工神经网络中神经元个数众多以及整个网络存储信息容量的巨大,使得它具有很强的

不确定性信息处理能力。即使输入信息不完全、不准确或模糊不清,神经网络仍然能够联想

思维存在于记忆中的事物的完整图象。只要输入的模式接近于训练样本,系统就能给出正确

的推理结论。

正是因为人工神经网络的结构特点和其信息存储的分布式特点,使得它相对于其它的判断识

别系统,如:专家系统等,具有另一个显著的优点:健壮性。生物神经网络不会因为个别神

经元的损失而失去对原有模式的记忆。最有力的证明是,当一个人的大脑因意外事故受轻微

损伤之后,并不会失去原有事物的全部记忆。人工神经网络也有类似的情况。因某些原因,

无论是网络的硬件实现还是软件实现中的某个或某些神经元失效,整个网络仍然能继续工

作。

人工神经网络是一种非线性的处理单元。只有当神经元对所有的输入信号的综合处理结果超

过某一门限值后才输出一个信号。因此神经网络是一种具有高度非线性的超大规模连续时间

动力学系统。它突破了传统的以线性处理为基础的数字电子计算机的局限,标志着人们智能

信息处理能力和模拟人脑智能行为能力的一大飞跃。

本词条内容贡献者为:

孔祥杰 - 副教授 - 大连理工大学软件学院