发布时间:2023-03-28 15:00:33
序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的数字图像处理论文样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。
论文摘要:针对硕士研究生在学习“数字图像处理与模式识别”课程中面临的理论与实际脱节、书本知识陈旧和教学手段单一等问题,本文从教材选择、讲授内容和手段、讲授形式和考核方法等方面进行了教学改革的探讨,通过在教学活动中不断实践探索,使学生在学习中不仅学到了丰富的理论知识,而且通过开放的实验环节找到理论应用到实际之中的关键所在,同时带领学生放眼于本领域的热点技术,激发了大家的研究兴趣。本课题已获得“211工程”三期的资助。
1 绪论
学生刚从本科阶段走入研究生阶段,都怀着极大的热情要投身于科学研究中,他们需要通过更多更专业的课程来夯实自身的理论基础,以便使他们能够在科学研究工作中充分发挥自身才华,所以研究生阶段的文化课程具有更强的针对性和实用性。可反观研究生课程现状,选用的教材往往是五年甚至十年之前出版的,其内容已非常陈旧,与信息时代的要求相差甚远;学生反映学到的知识不知如何在实际科研中应用,不了解本领域最新发展方向,学习过程单调枯燥,没有达到研究生课程应有的效果。针对这些问题,作者在多年的教学过程中不断总结原因,不断进行教学改革探索,并在国家“211工程”资助下,开展了研究生“数字图像处理与模式识别”课程的教学改革课题研究。
2 教学改革内容
“数字图像处理与模式识别”课程面对的授课对象包括电子、自动化、计算机、光电、机械、车辆等各个专业的硕士研究生,他们在各自的研究领域都将面临图像处理及识别的实际问题,为了培养学生掌握该领域的基础知识,并能迅速地在研究工作中发挥作用,必须学习本课程,并能灵活应用到各自的研究工作中。本课程从数字图像处理技术的整体知识框架出发,对图像进行一系列处理技术的讨论,经过参数分析与模式识别,使数字图像处理与模式识别技术融为一体,为各个应用领域的理论研究和实际应用奠定基础。
2.1为学生量身打造教材
目前图像处理领域发展非常迅速:3D图像处理技术、3G可视化图像通信技术、高速公路不停车收费技术等都在日常生活中得到广泛的应用,可研究生教材中涉及的教学内容还停留在上世纪90年代的水平,远远不能满足当今社会的需求。为此,作者所在的课题组三位老师撰写的国家“十一五”规划教材《数字图像处理及模式识别(第二版)》,教材更新了一些经典算法,同时根据我们课题组近年在图像处理领域的最新科研成果,将新算法新技术融合到教材当中,使学生能够接触到本领域的前沿技术。另外作为教材的最后一章,作者将一个实际科研项目作为典型实例编入教材中,向学生展示了如何把教材中涉及的理论方法应用到实际工程之中。通过学习本教材,既可掌握经典的图像处理算法,又接触到目前比较先进的图像处理算法,同时又可根据教材提供的很多应用实例和算法源代码,促进学生掌握理论知识与实际问题的结合方法,尽快地运用学到的理论知识进行创新性科学研究。该教材也于2008年获得北京市高等学校精品教材称号。
另外教材附带了一套自主开发的实验软件系统,为学生提供实验平台,包含六个实验:图像的二维傅里叶变换及性质、图像的编码、图像的参数分析、图像的平滑与锐化、图像的运动模糊及去模糊、图像的匹配识别。该软件界面友好,通用性强,结构开放,可二次开发,可以激发学生在完成实验的基础上积极动脑去完善现有实验,开发新的实验。
2.2改进授课内容
根据研究生的特点,课堂上除了讲授基础的理论知识以外,主要针对当前比较热门和先进的数字图像处理方法,以及学生们比较感兴趣的知识点,以专题研讨的形式进行研究和讨论。例如针对预防犯罪分子进行犯罪活动方面,可以通过人脸识别的方法在可视频监控的区域进行自动人脸特征提取,并用犯罪分子图库进行比对。大家对这个技术很感兴趣,对技术细节进行了热烈的讨论,各抒己见,通过这种专题讨论,活跃了课堂气氛,增加了学生主动参与的机会,激发了学生的学习热情和创造灵感。
同时教学中注重设计了一些新颖的课题,留给学生课后思考、调研,课上教师与学生进行研究和讨论,增强教与学的双向互动和交流,避免被动式灌输知识,激发学生的学习积极性、主动性和创造性。
结合实际科研成果,将一些数字图像处理系统的实例引入教学。例如将嵌入式多通道数字图像采集处理系统作为例子,讲解系统实现的原理、图像处理算法的应用及编程实现过程等等,这样既避免了抽象知识的讲授,又满足了学生对数字图像处理系统的软、硬件平台设计方法的掌握,真正达到学以致用。 2.3讲授手段综合应用
除了常规的教学手段以外,更多地应用现代多媒体技术来授课,包括展示图片、播放视频。恰巧多媒体教学技术本身就是多种数字图像处理技术的一个综合应用,所以利用多媒体教学技术来讲课就是本门课程涉及的各种技术在实际生产生活中的一个很好的应用实例。目前教学主要采用课堂讲授,电子课件与板书相结合,课内实验与课外实验相辅助,摒弃灌输式教学方法,倡导启发式教育,讲授课本知识的同时注意拓宽学生知识面,加强学生创新能力的培养,使学生的理论基础和实践应用能力同步得到提高,取得了较好的教学效果,几位教师的学生评价结果皆为优秀。
通过搭建一些算法平台,给学生提供可选择、有侧重、可设计的实验环境,弥补本课程没有专门实验的缺点,通过这些平台可以开启学生的创新研究和实践欲望。实践环节提供自主开发的图像采集与跟踪系统软硬件实验,学生可自己对实验进行设计并实时验证,另外提供一些比较新颖的实验题目供学生选做,在学习同时通过实验加深对知识的理解和掌握。同时将相关课件、资料等放置到网络,供学生访问下载,并提供Email信箱与学生答疑和沟通。
2.4讲授人员因需而变
除了授课教师外,根据当前研究热点和学生感兴趣的方向,邀请具有专门科研经验和知识的博士生,以研讨的形式进行某个知识点的讨论,以拓展学生的知识面,实现宽泛的知识教育,同时使学生了解最前沿的学科方向。
2008年邀请了张健博士做了“H.264转换编码研究与改进”的专题讲座;2009年邀请了姜薇博士做了“人脸识别算法研究”专题讲座。通过博士生的讲座,大家了解了研究生阶段的科研工作,极大带动了学生的求知欲,课堂讨论热烈,很多同学与两位博士课下进行了多次交流,为他们在学术上起到启迪作用。同时,大胆地邀请了一名同年级的硕士生站到讲台上,就“基于四元数FFT的水印嵌入算法”进行了专题讨论,面对这个全新的领域,很多同学被深深震撼了,同时感到了压力和差距,触动学生从主观意识上对本门课产生兴趣,掀起理论课程联系实际项目的学习热潮。
2.5教学思想的讨论与转变
研究生教学的目的不是要学生只掌握书本的知识,也不是必须进行卷面考核。特别是本门课程的实践性很强,所以本课程通过提供几个具有综合性、设计性的命题,结合我们提供的一些平台,让学生自己完成方案设计、命题的实现,更鼓励同学自己提出命题来进行研究实现,以期使学生真正融会贯通本门课程的思想精髓,更好地解决理论知识和科研能力的衔接,也真正实现本门课程的以素质为基础、知识为手段、实践为中介、能力为目标的教学宗旨。
3 教学改革总结
由于本课题组教师在“数字图像处理与模式识别”这门课中一直贯穿着先进的教育理念,得到了全校学生的认可,教学效果良好,2010年听课人数达到了169人,并有不同专业的多名博士生进行了旁听。
经过了几位教师的努力,本门课的教学改革已见成效,使“教”与“学”达到了有机的平衡和统一,教师知道学生想学什么,学生知道理论知识如何应用,真正达到学以致用,并会在实际科研工作中总结问题,运用理论知识来解决实际问题,也达到了研究生教学改革的目的。
参考文献:
[1]冈萨雷斯.数字图像处理[M].第2版.北京:电子工业出版社,1998.
关键字:数字图像处理;K-means算法;聚类
一、数字图像处理发展概况及边缘的概念
数字图像处理(Digital Image Processing)即计算机图像处理,就是利用计算机对图像进行去除噪声、增强、复原、分割、特征提取、识别等处理的理论、方法和技术[1]。最早出现于20世纪50年代,它作为一门学科大约形成于20世纪60年代初期。它以改善图像的质量为对象,以改善人的视觉效果为目的。在处理过程中,输入低质量图像,输出质量高图像,图像增强、复原、编码、压缩等都是图像处理常用的方法[1]。数字图像处理在航天、航空、星球探测、通信技术、军事公安、生物工程和医学等领域都有广泛的应用,并取得了巨大的成就。
边缘就是图像中灰度有阶跃变化或屋顶变化的像素的集合,边缘是图像最重要的特征之一,它包含了图像的大部分信息。实质上边缘检测就是采用算法提取图像中对象与背景间的交界线。在目标与背景、目标与目标、区域与区域、基元与基元之间都存在边缘,这是图像分割所依赖的最重要的特征之一。根据灰度变化的剧烈程度,边缘可以分为两种:一种是屋顶边缘,一种为阶跃性边缘。对于屋顶状边缘,二阶导数在边缘初取极值,而对阶跃性边缘,二阶导数在边缘处零交叉;。
二、彩色图像的K-means聚类算法
(一)K-means聚类
聚类就是把数据分成几组,按照定义的测量标准,同组内数据与其他组数据相比具有较强的相似性。K-means聚类就是首先从n个数据对象任选k个对象作为初始聚类中心;剩下的其它对象,则根据它们与这些聚类中心的距离(相似度),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);一直重复此过程直至标准测度函数收敛为止。通常都采用均方差作标准测度函数。k个聚类有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
聚类的用途是很广泛的。在商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来,并且概括出每一类消费者的消费模式或者说习惯。它作为数据挖掘中的一个模块,可以作为一个单独的工具以发现数据库中分布的一些深层的信息,并且概括出每一类的特点,或者把注意力放在某一个特定的类上以作进一步的分析;并且,聚类分析也可以作为数据挖掘算法中其他分析算法的一个预处理步骤。
(二)算法思想分析
输入:聚类个数k,以及包含 n个数据对象的彩色图片。
输出:满足方差最小标准的k个聚类。
处理流程:
(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;
(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(3)重新计算每个(有变化)聚类的均值(中心对象);
(4)循环(2)到(3)直到每个聚类不再发生变化为止。
首先设置K值,也就是确定若干个聚类中心。使用rand函数随机获得K个颜色值,存放在矩阵miu中,第一次对每个像素点中的K种颜色进行迭代运算,得到最小的颜色矩阵的2范数,同时标记该颜色,依次相加的到各点的颜色矩阵总值。再次迭代得到K中颜色的各个矩阵均值。最后提取出标记的各个颜色,依次对各个点进行颜色赋值,使每个像素点的颜色归类。得到聚类后的图像。
(三)算法的数学描述
■
(四)算法过程分析
设置K值为8,读入一幅图片后计算图像上所有的像素点个数为N,即令N=size(X,1)*size(X,2),令颜色矩阵R为矩阵[N,K]并清零。随机获得颜色聚类中心为Miu=fix(255*rand(K,3))。
在10次迭代中,对每一个像素点进行k=8次迭代,计算该点颜色值与各个聚类中心的欧氏距离dis。若dis最小,则标记此时颜色矩阵为R(n,k)=1。依次对8个聚类中心迭代,计算标记的每一个坐标点的颜色总值sum1和总数量sum2,计算新的聚类中心Miu(k,:)=sum1/sum2。再次对所有点进行迭代,根据第一次迭代时标记的R(n,k)值,若R(n,k)为真时,对该点颜色赋值为聚类中心k的颜色值。依次分析聚类出最终效果图。
■
图 K-means聚类算法流程图
(五)K-means算法结果分析
K-means算法取K值为8,就是通过对每个像素点进行8次迭代找到欧式距离最小的聚类中心,依次迭代,得出平均聚类中心,以最后得到的8个平均聚类中心为图像的最优聚类中心,依次为各个像素点进行聚类操作,最后得到聚类后的图像边缘。
本算法由于要对图像的各个像素均进行多次迭代,因此执行算法将会耗费很长时间,对一幅800x600的图片进行一次聚类需要耗时200s左右,其运行效率较低。但是由于本算法采用的是动态获取聚类中心,且直接对彩色图像的RGB颜色进行分析聚类,故得到的图像边缘检测效果比较好。K-means算法的特点:聚类中心用各类别中所有数据的平均值表示。
三、结语
K-means算法的一个特点就是在每次迭代中都要考察每个样本的分类是否正确。如果不正确必须调整,在调整完全部样本后,修改聚类中心,然后再进入下一次的迭代。K-means算法工作原理[3]:首先算法随机从数据集中选K个点作为初始聚类中心,再计算每个样本到聚类中距离,把样本归到离它最近的聚类中心所在的类。通过计算新形成的每一个聚类的数据对象的平均值得出新聚类中心,若相邻两次的聚类中心没有变化,则证明样本调整结束,聚类准则函数已经收敛。若再一次迭代算法中,所有的样本被正确分类,就不会有调整,聚类中心也不变化,这就标志着已经收敛,算法结束。
参考文献:
[1] 何东健.数字图像处理.西安:西安电子科技大学出版社,2008;
论文摘要:为考察“数字图像处理”双语教学的实际教学效果,对授课对象进行问卷调查。调查内容包括:对双语教学主要目标的认知、对教材的看法、对课堂教学的适应情况与评价、双语教学的收获、影响学习效果的因素。对得到的有效数据进行分析讨论,并就今后保证双语教学效果提出了建议。
“数字图像处理”是为了适应现代装甲车辆战场信息获取与信息处理的要求而开设的一门专业基础性课程。数字图像处理技术大量的研究、教学文献、资料均是以英文形式出现的,直接以原文为信息源来理解相应理论和方法,可以减少因翻译者的认知偏差而产生的误解,从而更为准确地把握相关的前沿问题。从对外交流和知识更新的角度看,这门课非常适合双语教学模式。
学员成绩是衡量双语教学效果的重要方面之一,然而试卷的难易程度、考试方法、教员评卷的宽严程度均会影响学员的成绩。教学活动是教学双方参与的活动,学员是教学活动的最直接的感受者,因而最有资格评价教员的课堂教学效果与质量。笔者从2004年起一直承担着“数字图像处理”双语教学课程建设和授课任务,授课对象是光学专业大三本科学员。在教学中,笔者感到授课对象的英语水平参差不齐,课堂参与程度并不理想。鉴于此,笔者以所授班级全体学员为调查对象,在学期末课程结束后做问卷调查,旨在通过学员对双语教学的评价,考察双语教学的实际教学效果,并探求保证教学效果的最佳途径。
一、对象与方法
此次调查的对象是“数字图像处理”双语授课的全体学员,调查采用的问卷是选择式问卷,主要包含以下6个方面内容:学员通过英语四、六级情况、对双语教学主要目标的认知、对教材的看法、对课堂教学的适应情况和期望、双语教学的收获、影响学员学习效果的因素。为了准确反映学员的真实想法,调查采取不记名问卷方式,统一发放并回收。共发放问卷31份,收回31份,有效问卷31份。
二、结果与分析
1.学员通过英语四、六级情况
通过四级27人,占87%;通过六级4人,占13%。从外语水平看,学员的外语基础较好
2.对双语教学主要目标的认知
学员对双语教学主要目标的认知情况(多选项问题)调查结果显示,认为“提升外语知识和能力”的占71%,排在首位;其次为“开拓国际视野和意识”的占61%;再次为“提升专业知识和能力”的占58%;最后是“学习外国先进教育理念”的占48%。但是,不同外语水平的学员对双语教学主要目标的认知情况有所差别,通过四级的学员选“提升外语知识和能力”的人数最多,占74%;而通过六级的学员选“提升专业知识和能力”的人数最多,占75%。可见英语水平越高,对“提升专业知识和能力”的认同度越高。
3.对教材的看法
本课程选用的教材是冈萨雷斯的digital imageprocessing,但由于受到课时限制只选取了其中的部分章节作为教学内容。为了便于学员自学,还自编了一本与教学内容同步的词汇手册。从调查结果看,认为教材“很难”或“较难”的占58%;认为教材“一般”或“较容易”的占32%。而对于词汇手册,74%的学员持肯定态度,认为对学习有一定的帮助。调查中还发现,约10%的学员对教材的难易程度以及词汇手册的辅助作用认识比较模糊,选择了“不好说”一项,这说明他们对本课程所选用的教材和词汇手册并不熟悉。造成这种情况的原因可能是:他们对课程本身并不感兴趣,或是尚不知如何学习本课程。
4.对课堂教学的适应情况和期望
统计结果表明,84%的学员在一开始并不能适应双语教学模式,然而经过一段时间后均能适应双语模式。这说明双语模式对学员来说并不是无法跨越的鸿沟,只要给予一定的锻炼过程,绝大部分学员都能习惯这种教学模式。但是调查中也有约10%的学员选择“一直不适应”,这主要集中在仅通过四级的学员中,在已通过六级的学员中并没有人选此项,可见外语水平越高,双语模式的适应情况越好。
在“数字图像处理”双语课堂上,课件是必不可少的,它承载了很大信息量,比如重点词汇、一些不易直观接受的内容,用课件展示出来,非常有助于学员的理解和记忆。调查发现,94%的学员希望授课的课件为中英文混合形式,然而他们所期望课件的中英文比例差别较大,其中选“中英文各半”的占21%,选“英文为主中文为辅”的占41%,选“中文为主英文为辅”的占38%。这与学员所希望的课堂上的中英文授课语言的比例相类似。这说明在双语教学中,一味追求全英文授课,很有可能导致学员对双语教学的不认同,最终影响双语教学效果。但是,需要注意的是,中英文混合授课时无论以哪种语言为主,都要避免“双语混合疲劳”现象产生。所谓的“双语混合疲劳”指的是,为了满足学员对课堂语言的要求,在课堂上总是混合使用两种语言,打破了学员的正常思路,导致学员对课程内容无法理解。这样的授课方式笔者曾经尝试过,比如在讲授某一知识点时,先用英语讲一遍之后再用汉语讲一遍,发现学员根本无法跟上教学节奏,这主要是由于他们的注意力完全被中英文之间的对应关系牵扯住,从而忽视了对教学内容的理解。同样,在课件的制作中也要避免“双语混合疲劳”现象。
5.双语教学的收获
双语教学的收获的调查分两个方面,专业知识和外语水平。71%的学员认为双语教学对专业知识有一定的促进作用,而81%的学员认为双语教学对外语水平有一定的提高作用。可见学员对外语方面收获的认同程度大于专业知识方面。这恰与学员对双语教学主要目标的认知相吻合。但是,笔者认为双语教学的主要目标绝不是语言教学,也不是为了扩展学员在专业领域的外语词汇量,而应该是以讲授专业知识为主线,以系统地掌握一门专业知识为主要目的。为了避免本末倒置,在教学过程中,要重视对学员教学目的的教育;同时,教员在备课授课中,要注重课程前延和后续相关学科知识的衔接,不要让双语课程孤立,让学员能够将这门课程的专业知识纳入自己的专业知识体系。
6.影响学员学习效果的因素
调查发现,74%的学员表示“不认识专业英文词汇”是他们学习本门课程的主要困难。约65%的学员认为“教材参考词汇表”是学习本门课程有效的辅助措施。这说明在授课中,同步词汇手册对学习本门课程非常重要。87%的学员认为“中英文参考资料”对学习本门课程很有效。关于这一点笔者认为,如何给学员提供适当的中英文参考资料需要慎重考虑,资料不宜太多,否则会与教学内容偏离,适得其反。
三、对保证双语教学效果的建议
对双语教学效果的评价有多种,如领导评价、专家评价、同行评价、学员评价等。此次调查从学员角度出发,符合以学员为中心的教学模式。针对调查中发现的问题,为保证教学效果,在今后的教学中需要把握以下两点:
(1)加强学员双语教学目的的认知教育,避免学员学习中过分强调语言而忽略专业知识。
(2)教学内容要深入浅出。教员在授课中,除了对讲授内容要了如指掌,做到放得开、收得拢以外,还应洞察学生心理,了解学员对知识的掌握情况。不要只站在教的角度考虑问题,还应从学的立场出发,将要讲的内容转化成学员渴求的知识传授给学员。
双语教学是一项实施成本较高的课程教学,如果没有好的教学效果,不仅造成人力、物力、财力等资源的浪费,还会对下一步的推进造成不利影响,因此每门双语教学课程都要重视教学质量。
参考文献:
关键词:手写数字识别;Fisher判别;置信度分析
中图分类号:TP751文献标识码:A文章编号:1009-3044(2011)21-5202-03
Algorithm Based on Confidence Analysis for Off-Line Handwritten Digits Recognition
GAO Jian-qing, CHEN Xing-e
(Department of Electronic Information Science, Fujian Jiangxia College, Fuzhou 350007, China)
Abstract: This article has mainly studied the characteristic choice, the characteristic extraction and the classifier design questions in the off-line hand-written digits recognition, has selected the grid characteristic and the intersection characteristic, has used the minimum distance classifier and based on the Fisher distinction linear classifier, and uses based on the confidence analysis method carries on the mix integration, enhanced the recognition accuracy.
Key words: handwritten digits recognition; fisher distinction; confidence analysis
脱机手写数字识别是整个OCR领域中最为困难的部分,是一个经典的研究问题,在银行票据的认证、税表的自动处理、邮政编码识别等方面有很多重要的应用。数字的类别虽然只有十种,笔划简单,但是一些测试结果表明,数字的正确识别率比印刷体汉字和联机手写体汉字低。手写数字识别的主要难度在于其变体多,而且对数字识别单字识别正确率的要求高。目前对各类字体的数字识别已经有很多算法,但识别效果仍然不够理想,特别是在脱机手写数字识别方面还处在发展阶段。
脱机手写数字识别算法中,特征的选择与提取和分类器的设计是最关键的部分,本文采用了网格特征、交叉点特征的特征提取方法,给出了最小距离分类器和基于Fisher判别的线性分类器的分类方法,并使用基于置信度分析的方法进行混合集成,提高了识别正确率。
1 特征提取
脱机手写数字图像经过灰度化、二值化、锐化、去除噪声点、倾斜调整、数字分割、归一化和细化等预处理后,需要根据识别方法的进行图像特征抽取,选择的特征要求能够足够代表这个图像模式,而且特征的数量尽可能少,这样能有效地进行分类和降低计算量。本文选取了网格特征和交叉点特征,选取这两种特征符合了保持足够的信息量和相关性小的原则,同时特征维数为16个,也不大。
1.1 网格特征
经过归一化后,图像的大小都是16×16,把图像分成4×2=8个格子,在每个格子里面统计黑色像素的个数,这样就形成一个8维的特征。网格的分法划分的方法跟归一化后的大小和字符的形状特征有关系,可以划分为2×2,3×3,4×4等。数字字符一般在纵向的特征信
息比较丰富一些,所以采用4×2比较合适,在纵向分成4块,横向分成2块。按照从上到下,从左到右的顺序,对每个格子中的黑色像素进行统计,存入向量X中,则X=(x1,x2,x3,x4,x5,x6,x7,x8)。在图1中是经过预处理后的手写数字图像“5” 的网格特征划分示意图,对该图进行网格特征统计后,特征向量X=(4,6,4,0,2,7,7,5)。
1.2 交叉点特征
交叉点特征与网格特征对整个图像的划分完的每个区域的黑色像素进行统计不同,是对局部位置的黑色像素的个数进行统计。为了提高特征的分类能力,必须选具有代表性的取局部特征。在纵向的特征信息比较丰富,因此在纵向应该选取更多的局部特征,而边缘部分不适合选取,因为通过细化后的图像边缘部分有很多白色,区分度不高。交叉点特征的选取方法是,在横向接近四等分以及纵向接近二等分的地方,用三条水平线和一条垂直线穿过图像,统计其与图像相交地方的黑色像素的个数,这样可以得到4维特征。按照先水平方向再垂直方向穿透的顺序,统计每条穿透线上的黑色像素的个数,存入向量Y中,则Y=(y1,y2,y3,y4)。在图2中是经过预处理后的手写数字图像“5” 的交叉点特征穿透示意图,对该图进行交叉点特征统计后,特征向量Y=(1,1,1,3)。
2 最小距离分类器
首先将所有待识别手写数字图像进行预处理,使之分割成为16×16大小的二值化图像,然后提取网格特征,根据式(1)计算出最小距离的模板作为第一种分类方法;接着提取交叉点特征,根据式(2)计算出最小距离的模板作为第二种分类方法。
(1)
(2)
(3)
其中kil表示第l类模板的第i维特征值,由式(3)计算出来,总共有10类模板对应10个阿拉伯数字。tlij表示第l类模板的第j个样本的第i维特征的值,Nl表示第l类模板的样本总数,M表示特征维数。
若Dr=min(Dl)则识别结果为r。
3 Fisher线性判别
关于线性判决函数的分析工作,在历史上,是从R.A.Fisher的经典论文(1936年)开始的[1]。Fisher的方法实际上涉及维数压缩问题,因为低维空间比高维空间在解析和计算工作方面有非常明显的优势,所以降低维数就成为处理实际问题的关键。
下面,定义几个必要的基本参量。
1)在d维X空间
各类样本均值向量mi。
,Ni为i类样本总数, (4)
样本类内离散度矩阵Si和总类间离散度矩阵Sw。
(5)
Sw=S1+S2 (6)
样本类间离散度矩阵Sb。
Sb=(m1-m2)(m1-m2)T(7)
2)在一维Y空间
各类样本均值mi。
,Ni为i类样本总数,(8)
样本类内离散度si2和总类内离散度sw。
(9)
(10)
投影后,在一维Y空间里各类样本尽可能的分开,各类样本内部尽量密集,类内离散度越小越好,两类样本均值之差(m1-m2)越大越好,因此可以定义Fisher准则函数为:
(11)
下面要求使得JF(w)取得最大值的w*,经过推导可得:
(12)
以上所做的工作是将d维空间的样本集Ψ映射成一维样本集ζ,d维空间的分类问题已经转化为一维空间的分类问题,所以只要再确定一个阈值y0就可以做出决策了。
选取: (13)
这样对于给定的x,计算出它在w*上的投影点y:y=w*Tx
决策规则:
(14)
数字识别过程也是分类的过程,识别目标总共有10个数字,首先要对样本中的两种不同的数字对应的二维图像矩阵进行运算,这样就有C210=45种组合。对于每一种组合的两个数字,取出对应的所有样本,根据式(4)算出样本均值向量m1和m2,按照选取特征点的个数找出这两个向量中差值较大的点对应的坐标,本文选取了60个特征点,也就是要映射的一维空间Y。再根据式(8)算出m1和m2,然后根据式(9)、式(10)和式(12)就可以算出w*,根据式(14)算出阈值y0。
4 基于置信度分析的混合集成方法
多方案集成是目前模式识别领域内研究的一个热点,从仅利用分类器首选类别判定的多数表决方法发展到利用识别结果进行信息度量。置信度分析是分类器集成的一个重要工具,有采用基于不同特征的分类器,也有采用基于相同特征的不同种分类器。因此为了提高分类的效果,可以采用基于不同特征和不同分类器的混合模型的集成方法。
Consensus理论研究如何将一组专家的各自结论协调一致,它在统计和管理科学中被广泛应用。在Consensus理论中,有两个主要方法:“对数意见池”(Logarithmic Opinion Pool-Log-OP)和“线性意见池”(Linear Opinion Pool-Linear-OP)。
Log-OP的决策函数为:
(15)
Linear-OP的决策函数是:
(16)
在以上两个式子中,pi(wj|X)是第i个专家对X所属类别的概率估计,γ1,…, γM是分配给每个专家的权重,集成系统的最后结果是:
(17)
设计手写数字识别集成分类器时,先从测试样本中统计出每种分类器识别出的结果对应于每一个数字的概率,如式(18)所示:
(18)
Pij表示i被识别为j的概率,Rij表示i被识别为j的次数,Nj表示识别为j的总次数。本文中使用了三个分类器:两个最小距离分类器,包括网格特征、交叉点特征;一个线性分类器,是基于Fisher线性判别。设这三个分类器对应的概率分别为PX,PY,PZ。专家的权重根据对测试样本识别的正确率来设定,分别为γ1,γ2,γ3,。再用Mi表示集成分类器识别为数字i的概率,则:
(19)
j1,j2,j3表示三个分类器识别的结果,他们的值有可能不一样。若Mr=max(Mi),那么识别的结果为r。
5 实验结果分析
通过应用上述的识别算法,使用美国邮政服务数据库USPS提供的2007个测试样本进行了不同特征不同分类器的测试,测试结果如表1所示。从单一的分类器来看,Fisher线性判别的总体的识别正确率比较高,但是Fisher判别对数字“0”和“6”的识别正确率比网格特征低,对数字“1”的识别正确率又比交叉点特征低。通过分类器的集成,最终使各个数字的识别正确率都得到了提高,总体的识别正确率达到了90%。
6 结束语
本文主要讨论了脱机手写数字识别问题中的特征的选择与提取和分类器设计,设计了基于置信度分析的集成分类器,使识别正确率在单一分类器的基础上得到了提高。在其他文献中,识别正确率较高的是采用改进AdaBoost集成方案[2],达到95.8%。因此本文的识别正确率还有待提高,但在实验中理想的结果可以达到95%,还有改进的空间,可以从以下两个方面进一步研究:把最小距离分类器改为BP神经网络分类器,提高单个分类器的性能;在特征选择方面再引入如投影特征、边缘特征以及宽高比等。
参考文献:
[1] 张宏林. Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2008.
[2] 白利达.神经网络集成识别手写体数字研究[D].北京邮电大学硕士学位论文,2007,3.
[3] 张宏林. Visual C++数字图像处理典型算法及实现[M].北京:人民邮电出版社,2008.
[4] 阮秋琦.数字图像处理学[M].北京:电子工业出版社,2007.
[5] 瞿金海.手写体数字识别方法的研究与实现[D].南京理工大学硕士学位论文,2005,9.
[6] 柳回春,马树元,吴平东等.手写体数字识别技术的研究[J].计算机工程,2003,29(4):24-25.
关键词 遥感制图;制图方式
中图分类号TP7 文献标识码A 文章编号 1674-6708(2012)71-0204-02
1遥感制图概论
遥感制图是指通过对遥感图像目视判读或利用图像处理系统对各种遥感信息进行增强与几何纠正并加以识别、分类和制图的过程。遥感图象有航空遥感图象和卫星遥感图象,制图方式有计算机制图与常规制图。目前应用最多及着重研究的是利用Landsat的MSS图象制图。由于多波段的卫星图象具有信息量丰富、现势性强,利用它编图周期短等优点,在制图方面得到了广泛的应用。简单地说是通过对遥感图像目视判读或利用图像处理系统对各种遥感信息进行增强与几何纠正并加以识别、分类和制图的过程,可作为新编地形图的重要信息来源。
传统地图的制图方法是测绘,编绘。随着计算机及相关输入、输入设备的使用,出现了计算机地图制图,实现了工艺上和技术上的变革,产生了数字地图。遥感技术的兴起使传统的地图编制理论与方法发生了深刻的变革。因为遥感技术可以通过多平台、多波段、多时相的信息源,快速、真实地提供了丰富的制图信息。遥感技术在地图学领域的应用,也大大缩短了地图的成图周期。
2遥感制图方法分类
遥感技术的出现,使得制图方法拓宽,从而丰富了地图类型以及地图内容。从广义的概念上讲,遥感影像制图是由遥感影像加以特定地图要素的符号,比如境界线、风向、等压线,再辅以注记、说明、图廓、图框、图名、图例等成图。
2.1常规方法
常规方法制作遥感影像地图过程与步骤上与普通地图编制、生产流程基本相同,但是又有所区别,遥感影像地图主要用影像表现信息,需要进行影像处理,如滤波和变换;而且制图综合简单许多。
生产流程上包括:设计、选图像、选底图、影像纠正、制版、套印。
展开来讲,设计阶段:根据任务要求进行影像地图设计,确定资料,专题要素表示方法的选择,图面配置要求,生产流程,生产技术措施,质量管理方法等等;
选图像:要根据制图专题内容,选择恰当时相和波段的图像,对选好的图像进行预处理,对专题内容进行目视解译;
选底图:所选择的基础底图要反映出区域地理背景,对影像进行位置纠正,选择的底图范围要与制图范围相适应,比例尺与制图比例尺一致,要素相对要全面;
影像纠正:即要求影像与底图具有一致的坐标系统;
制版:使遥感影像解译形成的线划注记版,影像套合地图的基本要素有经纬网、高程点、等高线、交通网、境界线、居民点。
套印:分色、分色片、套印。
2.2计算机辅助制图方法
在计算机系统支持下,根据地图制图原理,应用数字图像处理技术和数字地图编辑加工技术,实现遥感影像地图制作和成果表现的技术方法。
需要计算机的软硬件设备进行处理,硬件设备包括输入设备、处理设备、输出设备。软件包括图像处理软件,地图编辑处理软件,专用制图软件。
生产流程包括:选图像、数字化,选底图,数字化,影像纠正与图像处理,影像镶嵌、地图拼接,影像与地图复合,制作符号注记层,图面配置,图件输出。
展开来讲,选图像、数字化:根据制图内容和要求选图像,包括时相、波段、多景图像来源尽可能统一图像质量,对于摄影胶片,需“数字化”黑白扫描,彩色扫描;
选底图:所选择的基础底图要反映出区域地理背景,对影像进行位置纠正,选择的底图范围要与制图范围相适应,比例尺与制图比例尺一致,要素相对要全面;
数字化:底图数字化的方法包括手扶跟踪数字化、屏幕数字化、扫描矢量化,步骤包括分幅、分层数字化,又要编辑、检查;
影像纠正与图像处理:几何纠正使得影像具有底图一致的坐标系统,方法上使用控制点纠正;图像处理上要做到消除噪音、去云、信息增强;方法上采用对比度变换、图像平滑、锐化、彩色合成、主成分变换等方法。
影像镶嵌、地图拼接:几何校正以及边缘灰度处理;
影像与地图复合:将统一区域的图像与图形准确套合;
制作符号注记层:即地图符号与注记的选择;
图面配置:图名、图例、图框、比例尺、指北针等等;
图件输出:利用设备输出
总结来讲:遥感制图包括遥感图像输入、数据预处理、图像识别分类、几何投影变换、影像图形输出等步骤。
2.3遥感制图中重要步骤
图像镶嵌:为了便于镶嵌,镶嵌要有足够宽的重叠区,最好不少于图像的1/5,如果过于狭窄,会影像镶嵌精度,特别是图像边缘会出现扭曲。镶嵌时最好先进行图像校正,这样精度会高些。
图像变换和增强:要注意综合使用各类方法,来突出相关的专题信息,提高图像视觉效果。综合使用光谱增强、彩色增强和空间增强。
3 发展前景
遥感制图按照表现内容可以分为普通影像地图和专题影像地图。按照获取遥感信息传感器可以分为航空摄影影像地图,扫描影像地图,雷达影像地图。
遥感影像地图在现代化的应用中具有明显的优势。其信息量丰富,与传统地图相比,遥感影像地图上没有信息空白区域。传统地图往往经过制图综合,地物分布信息被高度概括。形象直观,影像是经过“自然概括”的,而不是“人为综合、抽象”的。能直观形象地反映地势起伏等形态,增加了地图的可读性。具有一定的数学基础,与一般的遥感影像相比,遥感影像地图具有较为严密的数学基础,可以方便确定地理位置、进行地图量测与定量分析。现势性强,遥感技术可以快速、准确、动态地获取信息,遥感制图成图周期短。目前应用最多及着重研究的是利用Landsat的MSS图像制图。由于多波段的卫星图像具有信息量丰富、现势性强,利用它编图周期短等优点,在制图方面得到了广泛的应用。
4结论
随着数字环境和软硬件设备的飞速发展,遥感制图具有广阔的发展前景,多层次、多元化、系统化的遥感制图体系必将形成。
参考文献
[1]赵锐.遥感制图原理与方法.测绘出版社,1990-7-1.
关键词:藏文传输;信息隐藏;秘密信息共享;信息安全
中图分类号:TN401 文献标识码:A 文章编号:2095-1302(2014)12-00-05
0 引 言
安全、有效的信息传输对国家安全、社会稳定和人民安居乐业至关重要。网络和多媒体技术的发展,使得信息传输的速度和数量正以惊人的增量发展。然而,信息传输的便利在方便人们的同时也给信息安全带来了隐患,同时也为基于数字载体的秘密信息传输提供了广阔的研究空间。目前,基于载体的秘密信息传输是信息安全领域的一个方兴未艾的研究热点。而基于载体预处理的藏文信息隐藏技术将为信息安全领域提供一些新的数字信息共享和传输理念,特别是藏文的预处理规律、在数字信息中的隐藏规律等,将有助于涉藏秘密通信技术的发展,并可以对民用和商用领域中涉及到藏文内容的传输、共享、存储和提取的通信过程起到安全保护、版权保护及完整性认证的作用,并对国家涉藏领域的网络舆情监控、国内外涉藏敏感信息标注和情感色彩认知起着至关重要的作用。
在藏文信息隐藏技术方面,目前主要涉及的技术有关键字识别、字符识别和提取、韵律认知、语义角色标注、文本资源挖掘和语料抽取等,并以此为基础进行置乱优化。
1 国内外信息隐藏技术研究现状
信息隐藏一直是信息安全领域中保障隐秘信息安全传输和数字信息版权的重要手段,也是近年来国内外学者研究的热点之一。最新的一届ACM信息隐藏和多媒体安全会议(ACM IH&MMSec’13 Workshop)的主要研究内容有信息隐藏算法、多媒体水印和认证、载体运算域的数字信号处理等。其中,信息隐藏算法的设计首先依赖于载体的选择和预处理;关于多媒体水印和认证的研究则将信息隐藏和数字水印的载体范围从数字图像等常见载体拓展到了包括三维模型在内的新型载体上;载体运算域的数字信号处理涉及到了载体预处理时所用的具体方法,如空间域或变换域等。2013年IEEE 图像处理国际会议(IEEE ICIP 2013)的主要研究内容包括图像、音视频和3-D等多媒体的信息隐藏算法和多媒体特征提取和分析等,这两类研究内容均与载体的选取和预处理有关。最新一届信息隐藏国际会议(IH2012)的主要研究内容包括多媒体安全和其他载体的信息隐藏。我国的第十一届全国信息隐藏暨多媒体安全学术大会(CIHW2013)中关于信息隐藏算法的研究内容也主要集中在非常规载体的分析和预处理上。
藏文作为信息隐藏领域一种新的信息格式,对其研究主要局限于藏文操作系统、藏文信息技术标准、藏文信息处理等几个方面[1],具体内容集中在藏文编码字符集、术语集、拼音辅助集等的建立。
基于载体的秘密通信技术是20世纪90年代中期发展起来的跨领域的学科,而载体的预处理技术一直是其研究的主要方向。对隐藏载体进行预处理,生成信息隐藏嵌入区域是信息隐藏算法中最重要的研究内容之一。从上述国内外各学术会议中关于信息隐藏的参会论文和研讨情况看,各类载体固有特性的研究对预处理技术有着重要的意义,且数字图像依然是主要的一类载体,而三维模型将是未来主要研究的一类非常规载体。下面就对数字图像和三维模型两类载体的预处理技术的研究现状进行阐述。
1.1 数字图像预处理技术研究综述
基于数字图像的信息隐藏技术是信息隐藏学科中重要的技术分支,是目前应用最广、覆盖范围最大的信息隐藏技术手段。在基于数字图像的信息隐藏技术研究中,信息隐藏区域的生成是关系算法性能的重要因素。信息隐藏区域的生成方法主要包括空间域生成法、变换域生成法以及空间域和变换域联合的生成方法。
空间域算法:作为空间域算法中出现最早、操作最简单且应用最广泛的算法,基于位平面分解理论的LSB算法可以直接替换的方式隐藏较大的数据量,刘红翼等提出的一种LSB算法具有容量大、运算量小的特点[2];刘文彬等提出的LSB隐写替换的消息定位方法则可以对此类算法进行检测[3];而IH2012的论文中,有学者运用假设检验理论和含秘载体的奇偶感知特性可有效地检测LSB算法所隐藏的隐秘信息[4,5],这些研究为藏文信息隐藏中涉及到关于此类算法的抗检测性研究提供了新的待改进方向。张焱等提出的像素值排序和赵彦涛等提出的直方图修改等空间域算法在沿用LSB直接替换的隐藏理念的同时,还提升了鲁棒性,因此也被广泛用于数字图像载体预处理[6,7];随后,杨春芳等提出了针对此类算法的检测方法[8],这也为针对此类算法抗检测性改进的研究提供了重要依据。此外,上述同类算法中的载体子区域划分思想、内容自适应思想等也对本项目基于载体结构特性建立空间匹配模型的机制提供了方法学上的有力支持[9-13]。
变换域算法:不同于空间域算法直接对载体的空间特性进行修改,变换域预处理方法以修改载体的频率参数来隐藏信息[14],因此算法的鲁棒性比空间域算法好。在此基础上,唐燕等又对隐秘信息的检测和恢复进行了研究和改进,实现了几乎无需原始参量的半盲提取[15]。尽管变换域算法不具备空间域算法容量大、运算量小和易操作等优势,但是变换域中的多小波理论因其同时具有对称性、短支撑性、二阶消失矩和正交性等特性成为了信号处理中有明显优势且较常用的方法,在前期研究中利用多小波方法将数字图像载体分块后作为嵌入区域,提高了算法的鲁棒性和不可见性[16,17],这种方法为在藏文信息隐藏研究中建立基于区域能量的阶梯性分布机制提供了一种研究手段。
混合域算法:较单独运用一种空间域或变换域生成隐藏区域并设计信息隐藏算法来看,基于空间域与变换域联合的信息隐藏算法可以兼有多种算法的性能优势。在基于空间域和变换域联合的信息隐藏算法中,空间域的作用体现在数据嵌入的具体操作方面,因为隐藏的实质就是在当前环境下的空间分量上进行数据修改,利用边缘像素值差分(Edged Pixel Value Differencing,EPVD)将载体换算为若干个像素块,以最大斜角的数据修改作为信息隐藏的具体方法[18];利用湿纸码和基于LSBM的双层隐写来对载体进行加1嵌入或减1嵌入[19];另外,国内外许多学者利用调色板理论进行数据嵌入[20,21]。而变换域在载体预处理中的主要作用是生成满足特定需要的信息隐藏环境(区域),主要包括变换后的系数分布以及n阶分量子图等。如对RSV颜色空间的V分量做DCT变换,分块后作为嵌入区域[22];利用视觉显著点技术确定跟踪窗(Regions of Interest,ROI),在ROI的DCT系数上嵌入隐藏信息,并指定某个ROI边缘地图脆弱性标识,嵌入到DWT变换后的含密图像中[23];前期研究中,研究人员利用自适应颜色迁移理论中lαβ域对颜色的控制力,消除了RGB颜色分量的强相关性,并结合GHM能量分区隐藏信息,在不可见性、嵌入信息量和鲁棒性方面均具有较好的表现[24]。
1.2 三维模型预处理技术研究综述
潘志庚等将基于三维模型的信息隐藏预处理方法主要分为空间域算法和变换域算法[25]。这也这为藏文信息隐藏研究提供了新的思路和方法。
空间域算法:空间域算法通常具有易嵌入和盲提取的特点,如直接置换载体的几何信息来隐藏数据是三维模型载体信息隐藏最原始、最直接的方法[26]。为改进此类算法的鲁棒性,引入仿射不变量是有效的措施,如利用具有连续解析性的仿射不变量优化需要置换的顶点[27]、 将稳态锚点通过三角垂心编码解析为聚类元素从而嵌入隐秘信息[28]。此外,基于主元分析的算法也有助于改善空间域算法的鲁棒性,例如可根据主元分析(Primary Component Analysis,PCA)来确定模型的关键位置作为鲁棒区域,并用网格分割法改进鲁棒性和不可见性[29-32]。这类算法也为藏文信息隐藏从载体结构特性进行解析和预处理提供了理论依据。改进型的空间域算法多针对鲁棒性或容量性有所提升,如基于连续解析性的体积矩的盲算法,改善了之前算法对连通性攻击的鲁棒性[33];通过重排顶点和面片在网格文件中的表示信息,利用表示域内的信息进行嵌入使算法具有良好的不可见性和大容量性[34],但对相似变换以外的攻击不具有鲁棒性。
变换域算法:三维模型预处理的变换域方法大多利用频谱分析将模型信息参数化[35],对参数进行少量修改后以隐藏信息,其中,基于小波变换的算法可以对规则和非规则网格模型进行小波域参量修改以嵌入较多信息[36]。理论上,变换域算法比空间域算法鲁棒性强,但由于三维模型顶点的天然无序性和不规则性,对其进行频谱分析难度大,导致变换域算法实用性目前较低,因此空间域算法依然是比变换域算法更有实用价值的研究方向[37]。
2 藏文信息隐藏技术研究现状
目前反映藏文信息处理技术最新进展的文献较少,综合以已有的研究成果及相关研究文献,藏文信息处理可划分为藏语信息处理和藏字信息处理两个层次[38,39]。藏语信息处理包括机器翻译、信息检索、信息提取、文本校对、文本生成、文本分类、自动摘要以及藏文字识别和语音识别的后处理等等;而藏字信息处理包括操作系统以及编码字符集、输入技术、字形描述与生成、存储、编辑、排版、字频统计和藏字属性库等。这些研究基础对藏文信息隐藏技术的发展至关重要,是基于载体预处理的藏文信息隐藏的主要技术来源。鉴于藏文的独特构造,以及藏文的特点,目前对藏文秘密信息的预处理技术一般指置乱和加密算法的选择[40],而置乱使信息变得杂乱无章难以辨认,可以起到加密与改变信息嵌入特性的作用。可用于藏文信息隐藏的置乱算法主要有Arnold变换、幻方矩阵、Gray码变换、混沌序列等方法[41]。其中,Arnold变换算法简单且置乱效果显著,使有意义的数字图像变成像白噪声一样的无意义图像,实现了信息的初步加密和信息结构的调整,在嵌入信息为数字图像时可以很好的应用[42]。幻方置乱的思想基于查表思想,基于数字图像的幻方置乱可降低幻方置乱阶数或以图像块进行置乱,实现置乱效果与系统开销的平衡[43]。Gray是一种具有反射特性和循环特性的单步自补码,它的循环、单步特性消除了随机取数时出现重大误差的可能,它的反射、自补特性使得求反非常方便[44]。混沌的优势在于对初始条件的极端敏感和轨迹在整个空间上的遍历性。根据经典的Shannon置乱与扩散的要求,这些独特的特征使得混沌映射成为信息隐藏嵌入算法的优秀候选[45]。上述传统的置乱算法一般用于正方形图像处理,而经过改进的Arnold算法可直接用于宽高不等的矩形图像而不必进行正方形扩展[46],这也将是藏文信息隐藏技术所采用的主要置乱方法之一。
3 藏文信息隐藏技术的研究目标、研究内容和要解决的问题
3.1 研究目标
面向藏文安全通信的高性能信息隐藏算法是目前藏文信息隐藏技术的主要目标,包括提出性能出色的、适合藏文通信要求的信息隐藏算法;提出一种具有普适性的高性能信息隐藏嵌入区域生成原则和嵌入规则:
(1) 基于数字图像的藏文信息隐藏算法:提出至少两种基于数字图像的藏文信息隐藏算法,算法将同时满足面向藏文安全的信息隐藏应用所要求的高不可见性(PSNR≥34.90dB)、强鲁棒性(抗击大约69%以下的JPEG2000压缩、35%以下的剪切及常见滤波与加噪)、大容量性(基于彩色图像的信息隐藏信息嵌入率≥18%)以及高感知篡改性(检测隐藏数据是否被篡改能力≥95%)。
(2) 基于三维模型的藏文信息隐藏算法:提出至少一种基于三维模型的藏文信息隐藏算法。算法将同时满足面向藏文安全的信息隐藏应用所要求的高不可见性(RSNR≥69.94dB、En≥70%)、应对一般攻击的强鲁棒性(抗击大约0.10%随机加噪、50-times Laplacian平滑、50%均匀重网格化以及均匀简化等)、大容量性(相对理想的RSNR,嵌入率≥29%)以及低复杂度(根据载体模型几何信息量而变化)。
(3) 普适性信息隐藏嵌入区域生成原则和嵌入规则:利用载体图像能量和复杂度特性,提出基于能量性和复杂度的藏文信息隐藏区域生成原则和嵌入规则,将适应于所有对数字图像处理后有能量区别的图像处理方法,指导设计者利用能量与鲁棒性、复杂度与不可见性的对应关系,研究出同时满足不可见性和鲁棒性的信息隐藏算法。
3.2 研究内容
(1) 藏文信息隐藏区域生成原则与规则研究:数字图像信息隐藏技术的研究核心集中在隐藏区域和嵌入规则的设计上,藏文信息隐藏算法的设计方法和思路就是在选定藏文信息隐藏区域以及制定好信息隐藏规则后,按照一定的顺序将两者进行合理的组织,所以研究藏文信息隐藏区域生成原则以及信息隐藏规则是重点。
(2) 基于数字图像的藏文信息隐藏算法研究:隐藏算法是基于数字图像的信息隐藏技术的研究核心,需按照嵌入域进行划分,对基于空间域和基于变换域的信息隐藏算法分别进行研究,提出单独基于空间域、单独基于变换域以及两者联合应用的数字图像信息隐藏算法。
(3) 基于三维模型的藏文信息隐藏算法研究:首先对三维模型的结构特性和能量特性进行研究,再根据载体模型的特性找出对应的预处理方法。在研究基于空间域和基于变换域的信息隐藏算法的基础上,提出改进型的三维模型信息隐藏算法。主要用于提升载体有效嵌入容量和降低载体视觉失真度。
(4) 载体与藏文秘密信息的一致化方法研究:基于上述研究基础,生成结构和能量差异化子区域,再将藏文秘密信息按照拼音属性进行解析生成信息序列。再利用优化算法使得预处理后的载体信息和藏文秘密信息的解析编码获得最大一致化,从而提高算法性能。
3.3 需解决的关键问题
综合已有的研究,在藏文信息隐藏技术方面,目前需要解决的问题有以下几个方面:
(1) 信息隐藏区域与嵌入规则设计:在具有什么性质的区域内应用什么样的规则进行藏文信息隐藏才可以解决“不可见性与鲁棒性的对立、容量性与抗分析性的对立”问题,是藏文信息隐藏研究领域的关键技术之一。需找出隐藏区域的性质与信息隐藏性能的关系,提出面向藏文信息传输的信息隐藏区域选择的原则与方法;给出在具有具体性质的嵌入区域中的藏文信息隐藏嵌入规则的制定原理和方法;提出大量的藏文信息数据转换思想与方法,以提供形式多样的信息隐藏嵌入规则。
(2) 数字图像载体预处理方法:①多小波理论在载体预处理中的应用。对于数字图像经过多小波变换后所具有的特殊性质,找出多小波变换后数字图像所具有的能量特性与基于数字图像信息隐藏算法性能之间所遵循的规律已有学者进行研究。②颜色空间的性能分析与应用选取。RGB、CMYK、lαβ、YUV以及HSx颜色空间,应用方法以及应用各有优劣势。该技术的应用难点在于为颜色空间在藏文信息隐藏的应用提出完备的应用方案,因为这些颜色空间在藏文信息隐藏技术中的应用目前非常少,应用优劣还处于实验验证阶段,没有理论验证的支持。
(3) 三维网格模型载体预处理方法:骨架抽取和内切球解析技术在藏文信息隐藏算法中的应用。这种方法不涉及顶点数量及坐标的改变和拓扑关系的修改。难点在于寻找一个理想的仿射不变量作为辅助参数以弥补算法对缩放攻击的脆弱性。
(4) 藏文的置乱与遗传优化算法:有的藏文字处理系统把藏文看成是由30个辅音、4个元音、3个上加字、5个下加字共42个藏文字符组成的,而有的则认为由其他数量的字符组成。基于对藏文中加字对发音的影响规律的研究,利用字符与二进制码的解析规则和置乱与优化技术对信息置乱,达到隐藏信息与载体信息的最大匹配度也是一个技术难点。
4 藏文信息隐藏技术研究的新方法
(1)利用载体图像能量和复杂度特性,提出基于能量性和复杂度的藏文信息隐藏区域生成原则和嵌入规则。高能量与强鲁棒、高复杂度与高不可见性的对应关系,从根本上解决藏文信息隐藏算法中不可见性和鲁棒性的对立问题,为面向藏文通信安全的信息隐藏算法的设计给出一种普适性方法。
(2)根据数字图像信息隐藏嵌入区域的生成原则和嵌入规则,提出新的、高性能的数字图像的藏文信息隐藏算法。算法利用lαβ等颜色空间转换以及多小波对载体图像进行的处理,生成具有不同能量特性的嵌入区域,从频率域上满足藏文信息隐藏的应用要求;通过对载体图像进行颜色迁移、矢量解析以及环形处理,从数字图像的空间结构上满足藏文信息隐藏的应用要求。
(3)提出满足三维模型结构特性和能量特性的藏文信息隐藏算法。算法利用局部高度理论和均值偏移理论对载体模型进行预处理,生成具有不同能量特性的嵌入区域,从频域上满足信息隐藏的应用要求;通过对载体图像进行骨架抽取、内切球解析,从空间结构上满足藏文信息隐藏的应用要求。
参考文献
[1]陈玉忠,俞士汶. 藏文信息处理技术的研究现状与展望[J]. 中国藏学. 2003(4):97-107.
[2]刘红翼,王继军,韦月琼,等.一种基于LSB的数字图像信息隐藏算法[J].计算机科学,2008, 35(1):100-102.
[3]刘文彬,刘九芬.一种针对LSB替换隐写的消息定位方法[J].信息工程大学学报,2013,14(6):641-646.
[4] R. Cogranne, C. Zitzmann, F. Retraint,et al. Statistical Detection of LSB Matching Using Hypothesis Testing Theory[C].In: Proceedings of the 14th International Conference on Information Hiding,2013.
[5] J. Fridrich, J. Kodovsky. Steganalysis of LSB Replacement Using Parity-Aware Features[C]. In: Proceedings of the 14th International Conference on Information Hiding, 2013.
[6] 张焱,张敏情,瓮佳佳.基于直方图对的大容量信息隐藏算法[J].计算机应用研究,2013,30(7):2108-2111.
[7] 赵彦涛,李志全,董宇青.基于排序和直方图修改的可逆信息隐藏方法[J].光电子.激光,2010,2(1):102-106.
[8] 杨春芳,刘粉林,罗向阳.基于相对熵的直方图差异与JPEG隐写的定量分析[J].计算机研究与发展, 2011,48(8):1563-1569.
[9] 熊志勇,王江晴.基于差分直方图平移的彩色图像可逆信息隐藏[J].四川大学学报,2011,43(3): 81-89.
[10] Z.H. Wang, C.F. Lee, C.Y. Chang. Histogram-shifting-imitated reversible data hiding[J]. The Journal of Systems and Software, 2013,86(2): 315-323.
[11] X.L. Li, J. Li, B. Li, et al. High-fidelity reversible data hiding scheme based on pixel-value-ordering and prediction-error expansion[J].Signal Processing,2013, 93(1): 198C205.
[12] X.T. Wang, C.C. Chang, T.S. Nguyen, et al. Reversible data hiding for high quality images exploiting interpolation and direction order mechanism[J]. Digital Signal Processing, 2013,23(2): 569C577.
[13] Nabin Ghoshal, Anirban Goswami, H. S. Lallie. Adaptive Steganography for Image Authentication Based on Chromatic Property[C]. In: Proceedings of the International Conference on Frontiers of Intelligent Computing: Theory and Applications (FICTA),2013.
[14]和红杰,张家树.对水印信息篡改鲁棒的自嵌入水印算法[J].软件学报,2009,20(2):437-450.
[15] 唐燕,闾国年,殷奎喜.规范类正交矩阵的信息隐藏算法[J].东南大学学报,2013,43(1):45-49.
[16] T. Zhang, D.J. Mu, S. Ren, et al. Study of reversible information hiding scheme based on CARDBAL2 and DCT[C].Proceedings-2010 3rd IEEE International Conference on Broadband Network and Multimedia Technology (IC-BNMT2010),2010.
[17] T. Zhang, D.J. Mu, S. Ren. A Confidential Communication-Oriented Information Hiding Algorithm based on GHM multi-wavelet and DCT[J].Applied Mathematics & Information Sciences,2013, 7(5): 1803-1807.
[18] H.B. Kekre, P. Halarnkar, K. Dhamejani. Capacity increase for information hiding using maximum edged pixel value differencing[J].Communications in Computer and Information Science,2011, 145(1): 190-194.
[19] 奚玲,平西建,张韬.整数小波域湿纸码自适应信息隐藏算法[J].计算机辅助设计与图形学学报,2011,2(7):1217-1223.
[20] H. Zhao, H.X. Wang, M.K. Khan. Steganalysis for palette-based images using generalized difference image and color correlogram[J].Signal Processing, 2011,91(11): 2595-2605.
[21] A. Lamgunde, A. Kale. Palette based technique for image steganography[J].Communications in Computer and Information Science, 2011,125(2): 364-371.
[22] Y.J. Qiu, H. T. Lu, N. Deng, et al. A robust blind image watermarking scheme based on template in Lab color space[C].2011 International Conference on Computing, Information and Control(ICCIC 2011),2011.
[23] L.H. Tian, N.N. Zheng, J.R. Xue, et al. An intergrated visual saliency-based watermarking approach for synchronous image authentication and copyright protection[J].Signal Processing:Image Communication,2011,31(2): 9-64.
[24] 任帅,张|,慕德俊,等.基于GHM多小波与自适应颜色迁移的信息隐藏算法研究[J].西北工业大学学报,2010,28(2):64-269.
[25] 潘志庚, 孙树森, 李黎.三维模型数字水印综述[J].计算机辅助设计与图形学学报,2006,18(8):1103-1110.
[26] S.H. Lee, K.R. Kwon. VRML animated model watermarking scheme using geometry and interpolator nodes[J].Computer-Aided Design,2011,43(8): 1056-1073.
[27] M. Luo, A.G. Bors. Surface-preserving robust watermarking of 3-D shapes[J].IEEE Transactions on Image Processing, 2011,20(10): 2813-2826.
[28] L. Du, X.C. Cao, M.H. Zhang, et al. Blind Robust Watermarking Mechanism Based on Maxima Curvature of 3D Motion Data[C]. In: Proceedings of the 14th International Conference on Information Hiding,2013.
[29] Z.Q. Yao, R.J. Pan, F.H. Li, et al. A mesh partitioning approach for 3D mesh oblivious watermarking[J].Chinese Journal of Electronics, 2010,19(4): 651-655.
[30] S. Cai, X.K. Shen. Octree-based robust watermarking for 3D model[J].Journal of Multimedia, 2011,6(1): 83-90.
[31] S. Cai, X.K. Shen. OTP-W:Octree partition-based 3D mesh watermarking[C].Second International Workshop on Education Technology and Computer Science,2010.
[32] 廖学良,王屏.一种新的三维模型水印嵌入空域算法[J]. 计算机学报,2008, 31(10): 1848-1856.
[33] K. Wang, G. Lavouéa, F. Denisb, A. Baskurt. Robust and blind mesh watermarking based on volume moments[J].Computers & Graphics,2011, 35(1): 1-19.
[34] I.L. Chung, C.M. Chou, D.C. Tseng. Hiding data in triangle meshes by rearranging representation order[J].International Journal of Innovative Computing, Information and Control,2011, 7(6): 3419-3435.
[35] 胡敏,刘辉.基于特征点的自适应三维网格数字水印算法[J].合肥工业大学学报(自然科学版),2010,33(1):55-59.
[36] M. Hachani, A.Z. Ouled, S. Bahroun. Wavelet based watermarking on 3D irregular meshes[C]. 19th IEEE International Conference on Image Processing(ICIP),2012.
[37] Y.P. Wang, S.M. Hu. Optimization approach for 3D model watermarking by linear binary programming[J].Computer Aided Geometric Design, 2010,27(5): 395-404.
[38]陈力为. 中文信息处理丛书序言[M].北京:清华大学出版社,2000.
[39]俞士汶,朱学锋,贾玉祥. 汉语隐喻自动处理研究之概况[C].第四届文学与信息技术国际研讨会,2008.
[40] 谭良,吴波,刘震,等.一种基于混沌和小波变换的大容量音频信息隐藏算法[J].电子学报,2010,38(8):1812-1819.
[41] 丁玮,闫伟齐,齐东旭.基于置乱与融合的数字图象隐藏技术及其应用[J].中国图象图形学报,2000,5(8):644-649.
[42] 田云凯,贾传荧,王庆武.基于Arnold变换的图像置乱及其恢复[J].大连海事大学学报:自然科学版,2006,32(4):107-109.
[43] 彭万权,张承畅,冯文江,等.多阶幻方卷积码的构造及译码[J].电子学报,2013,41(1):123-130.
[44] W. Din, W.Q. Yan, D.X. Qi. Digital image scrambling technology based on Gray code[C]. In Proceedings of International Conference on CAD/CG,1999.
关键词:电子信息;创新能力;实验实践;教学改革
21世纪是以信息科学为关键技术的知识经济时代,信息产业是我国重点发展的产业,而电子信息工程专业是培养电子信息技术高级技术人才的主要专业之一[1][2]。地方性院校在电子信息专业人才培养方式上,既不同于清华大学等一流大学,也不同于深圳职业技术学院等国内一些优秀的职业技术学院,如何在缺乏政策、资金、地域优势,教学手段相对落后的情况下,构建面向区域经济、行业经济的应用型、工程型人才培养体系是急需研究的问题。本文针对地方院校电子信息工程的一般性特点,探讨了实验、实践教学环节改革在电子信息专业教学中的重要作用,培养学生成为具有扎实的专业理论基础、并有较强的工程实践能力及创新精神的、在某一专业方向具有技能专长的应用型和工程型技术人才。
一、课程设置保基础、重实践、强能力
如何培养当今社会所需要的工程应用型人才、工程教育如何适应市场经济发展及地方与行业的需要,如何建立适应区域经济需求的专业方向,课程的设置是解决这些问题的落脚点。地方院校电子信息专业在课程设置上应遵循:保基础、重实践、强能力,面向工程应用的原则。
课程设置主要有:基础课程群、专业基础课程群、专业必修课程群以及专业选修课程群。专业基础课程力求保证学生具有较扎实的电子学科系统的基础理论和知识;专业必修课程使学生在电路系统、软件技术、信息处理、网络与通信等几个方面受到基本的、规范的专业教育;专业选修课课群则根据技术经济发展不断优化、更新,使学生能够了解和跟踪先进的电子信息技术。实践教学环节改革旨在培养学生工程观、系统观、强化综合实践能力,使能从事电子与信息系统的设计、开发、应用。
二、建立适应时展和适应区域经济需求的实践教学体系
工科类专业的核心是要培养学生的实践能力、创新能力和工程素养[3][4][5]。要达到这个目标就必须大力加强实践教学,建立多层次、多类型的实践教学体系。建设开放性实践教学环节,主要通过增加开放性、综合性、设计性、创新性实验,进行多学科综合课程设计,面向工程实际的毕业设计(论文),开展丰富的大学生课外科技活动等培养学生分析问题、解决问题的实际能力,逐步培养创新精神和工程设计能力。
1.学科实验课
实验教学在高等工科教育中占有非常重要的地位,它不仅是对理论教学的论证、补充,更是培养学生理论联系实际,增强动手能力和创新能力的重要手段。现在的综合实验台,虽提高了实验效率,但学生的失去了动手参与的机会,这样的实验激发不了学生的兴趣,更谈不上有什么创新性。实践教学改革目标要求在实验课中减少验证性实验项目,增加综合性和设计性实验项目。实际教学中在单片机应用、电子线路、C++编程等课程要求设计性、开发性试验或编程题目达到80%以上,并要求每学生每门课程至少提出一个创新性题目,并进行方案设计,实验室提供相应制作条件并计入学科成绩,这对促进学生的积极性,加强工程实践能力培养起到积极作用。
2.综合课程设计
课程设计是实践教学环节中非常重要的一个部分,学习某一专业学科基本分析、计算、设计方法的过程。但是纵观现阶段电子技术发展,电子系统越来越复杂,硬软件结合紧密,学科知识综合交叉,仅用一门学科知识很难完成实用性的设计;因此有必要对专业基础课、必修课进行分门别类,组合成群,进行综合性课程设计,才能加强课程设计的全面性、有效性。实际教学中我们把电子信息专业基础平台组成四个课群,开展四项综合课设,促使学生综合运用所学知识,了解各个学科相互联系,理解电子系统的组,建立了系统工程观念。
(1) 电子技术综合课程设计。电子技术基础包括模拟电子和数字电子技术和通信电子技术,是电子信息技术类专业的重要专业基础课,通过模拟、数字、数模混合电路的综合设计,通过使用开发板、计算机仿真、实际制作相结合的手段,进一步使学生掌握、融合电子线路基本理论、方法。综合性的电子技术课程设计题目主要有:数显温度计、电压表、电流表的设计、超声波测距系统的设计、简易数字存储示波器设计、数调信号发生器、数字频率计、数码功率放大器等等。
(2)单片机及应用课程设计。单片机在电子系统中的应用极为广泛,其难度适中、应用开发成本低,设计过程具有创造性,与其他学科结合紧密,特别适于地方院校电子信息专业学生学习和应用。在完成电子技术基础、通信线路、单片机、传感检测等课程后,学生已具备了较多的电子方面的知识,选择一个与单片机应用相关的项目,设计出进而完成一个实际产品的设计,可培养学生的电子系统观、工程意识,使课程设计更接近实际产品设计。采用的单片机以51为主,兼顾其他如6805系列,PIC单片机、AVR单片机、MSP430单片机等。电子信息专业中,信号处理课程是主要的专业课程(包括数字信号处理、数字图像处理、语音信号处理等),但是由于课程的概念比较抽象,许多理论是基于较为繁琐的数学理论和数学推导,容易使学生感到乏味很难与实际结合起来,达不到预期的效果。考虑实际硬件制作的难度和成本,根据我校学生的实际情况,主要采用软件Matlab等进行仿真的方法进行课程设计。本课程的教学重点并不在于提高学生的软件编程能力,而是要求学生掌握信号处理课程的基本概念、基本方法和基本技能及基本应用。因此,我们采用仿真软件来满足“信号处理”课的教学的需要。如: FIR数字滤波器的设计、数字图像处理算法、语音信号的编码、合成、识别等都可通过Matlab仿真实现。
(3)应用软件编程的课程设计。电子信息专业软件类课程有基础层次的《面向对象程序设计》、《软件技术基础》、《数据库原理》和专业选修课《C++与可视化程序设计》、《JAVA语言》等课程。众所周知,计算机语言系列的课程是实践性非常强,为此在综合设计中突出实用性,需用所学的一门以上的语言对一些小型项目进行模拟开发,目的在于训练学生综合应用所学程序设计知识,独立完成项目设计问题、加深软件系统理解,提高编程水平,实际教学中题目主要包括:信息管理系统设计、可视化工控程序设计、开发网络小游戏、网页制作等。
3. 毕业设计
毕业设计是培养学生理论联系实际、综合分析解决实际问题能力的重要实践教学环节,是对学生在校四年学业中的基础理论知识、运用工具知识、实际动手能力、知识创新等综合知识能力的综合训练,对培养工程实践能力具有重要意义。对此,毕业设计的选题要尽量来源于生产实践实际和科研课题,做到“真题真做”。实际课题有助于学生主动学习,激励学生的独创精神,培养学生的创新能力。此外为调动了学生学习的积极性和创造性,鼓励学生根据自己的就业意向、兴趣、社会需求自拟毕业设计课题。面向工程实践毕业设计题目类型主要有:①硬件设计部分,以各类单片机为主的系统设计;以DSP为主的信号处理硬件设计;仪器仪表信号采集处理的电路设计,通信系统设计等,智能建筑弱电系统设计;面向工控的PLC应用系统设计等。②软件部分:管理数据库设计;网络通信编程;基于Vis)ual C++的工控软件、组太设计;语音、数字图像处理与仿真;此外毕业设计严格做到一人一体,要求使用当前先进理论和技术,选择流行的硬件芯片、软件和开发工具,是毕业设计过程与企业人才需求接轨。
三、丰富大学生课外活动、组织学生参加各级各类电子竞赛
建立学生创新中心,参加电子设计竞赛。为了丰富大学生生活,增强学生实践能力,我们由专业教师组建了大学生创新中心,还邀请企业的工程师作为兼职辅导老师,我院地处河北,紧邻京津,创新中心根据这一区域经济发展和技术要求,设立了不同的产品设计和研究课题学生还可以根据自己的兴趣、爱好进行一些小制作、小发明。我们还积极开展第二课堂活动,激发学生兴趣,积极参加全国、全省的电子设计竞赛,学校和院系也可以经常组织一些中小型的竞赛活动,如、无线电通讯比赛、网络设计比赛、网页制作等。
定期进行专题讲座。定期开展学术讲座,内容涉及到《智能信息处理》、《高速DSP技术及其应用》、《ARM嵌入式系统设计》、《无线通信系统开发》、《虚拟仪器及其应用》、《电子设计自动化》等技术,使学生普遍获得了较大的信息量,更加深人地了解了电子信息技术。
建立健全校外实践基地,加强产学研合作。高素质人才的培养离不开优越的条件和优良的环境,在完善基础实验设施的基础上,建立健全校外实践基地,建立与企业和科研单位的广泛的联系,共同承担人才培养、有计划地组织参学生参观、实习和生产劳动,扩大学生的视野,增加他们与社会接触的机会,了解科学技术的最新发展动态。
作者单位:河北建筑工程学院
参考文献:
[1]陈小虎,刘化君,朱晓春等.电气信息与电子信息类应用型人才培养体系的创新与实践[J] .中国大学教育,2006,(4):55-56.
(1)召开学生座谈会,征集毕业年级学生及毕业后走上工作岗位学生对“方案”的修订意见,了解学生自身需求。坚持以学生的学为中心,处理好教与学的关系。(2)邀请用人单位参与“方案”的修订。了解行业最新发展动态,邀请用人单位参与修订论证,充分考虑行业对专业人才的要求,尤其是行业协会制定的人才质量标准。(3)参照执行教育部的专业规范标准,确保专业完整性。
2德、智、体、美全面发展,处理好
通识教育与专业教育的关系本着“通识教育为体,专业教育为用”的思想,通识素质类教育贯穿始终,德育工作与通识类课程考核结合,学术讲座日常化,引进并开设高质量的艺术类通识教育课程。针对全国各地生源基础教育水平差异,对外语、数学、计算机课程进行分级教学。专业教育逐步向产学研合作的模式靠近,专业课程开设以业界需求为主导,鼓励与业界建立长期、稳定、互动的合作关系,鼓励“方案”的部分课程以合作教育的形式开展,包括合作办学、合作育人、合作就业、合作发展等。
3大力开展第二课堂教育,“方案”
反映培养学生创新意识的要求设置6学分区间,给予参加学科竞赛、参与教师教、科研课题研究,参加人文、社会科学、自然科技、军事、历史、艺术类通识课程修读,开展创业,参加职业资格认证考试、英语四、六级考试,参加计算机等级考试等学生的学分奖励,该模块是学生毕业必要条件之一。
4改革实践教学模式,加强实践教学环节,处理好理论教学与实践教学的关系
按照《普通高等学校本科教学工作合格评估方案》,工科实践教学比例占总学分不低于25%。根据校企合作的实际情况,改革实践教学模式,灵活多样,毕业实习以集中统一安排为主。重点让学生体验基层行业工人的工作过程,磨练意志,为走上工作岗位打下良好的基础。提倡学生的毕业论文(设计)以参与教师的教、科研课题的形式完成。重视课程设计。
5合理安排第四学年教学工作
根据学生职业发展需求“,方案”要考虑考取研究生深造和就业两种需求,1-10周集中安排课程,剩余时间安排毕业实习、毕业论文(设计)、准备研究生考试,确保教学秩序。
6教学计划统一性与灵活性相结合
随时关注行业发展需求,建立专业与行业信息交流机制,将行业发展最新的信息整合为课程资源,通过短课时的课程、讲座等形式开设,同时必须坚持“方案”的执行稳定性。
7分方向培养
在电子技术和信息系统的理论基础上,从第三学年开始分方向培养:嵌入式集成电路、信号与信息处理两个方向。嵌入式集成电路方向主要课程:嵌入式系统原理与应用、嵌入式操作系统、嵌入式微控制器应用、嵌入式Linux设备驱动开发;信号与信息处理方向主要课程:信息论基础、数字图像处理、DSP技术与应用、信息与网络安全。同时设置多门其他方向的选修课:通信工程、物联网工程、计算机网络、软件工程等。
8小结