发布时间:2023-03-06 15:59:30
序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的压缩技术论文样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。
关键词:XML;后缀树;后缀数组;自索引;BWT
中图分类号:TP311.13 文献标识码:A 文章编号:1674-7712 (2012) 06-0099-01
一、数据压缩知识
数据压缩技术的发展。
随着计算机技术的飞速发展,数据压缩作为解决海量信息存储和传输的支撑技术受到了人们的极大重视,对数据压缩算法的研究也不仅局限于信息论中有关信源编码的范畴,数字图像信号、语音信号的分析和处理等技术被大量引入到有关的研究领域。
1977年,两位以色列科学家Jacob Ziv和Abraham Lempel发表了名为“A Universal Algorithm for Sequential Data Compression”(顺序数据压缩的通用算法)的论文,提出了一种不同与以往的基于字典的压缩方法——LZ77,他们在1978年又提出了LZ77的改进算法——LZ78,这两个算法吧数据压缩的研究推向了一个全新的阶段。1984年,Terry Weleh发表的论文“A Technique for High Performance Data Compression”(高性能数据压缩技术)描述了对LZ78算法的改进和具体实现技术,成为LZW算法。目前,无损数据压缩领域中流行的数据压缩方法多是基于字典的压缩技术。UNIX系统上的一个实用压缩软件COMPRESS和Windows系统下的压缩软件Winzip和Winrar中所使用的压缩算法都是基于字典压缩技术的。
当数据压缩被用于减少存储空间时,可以减少程序的总执行时间。这是因为存储量的减少将导致磁盘存取次数的减少,虽然数据的压缩/解压缩过程会增加额外的程序指令,但由于程序的执行时间通常少于数据的存储时间,因此中的执行时间将减少。也正因如此,数据压缩技术在计算机技术飞速发展的今天仍然有着很重要的作用。
二、XML压缩索引
(一)XML压缩背景
上文中已经述说了XML的优点,但和其它形式的数据表示相比,XML文档往往很大。因此有些时候,传输速度和存储空间会非常重要。具体来说:
1.XML是一种清晰而易用的文本标记格式,但它的弱点就是当有大量数据需要交换,而程序内部处理部分又非常少时,会导致XML文档非常大,这样过大的空间占用意味着更大的处理代价;
2.由于本文压缩算法多年来一直是大量研究项目的课题,目前已经非常成熟。这种类型的算法都能方便的将XML进行压缩,但将XML文本作为一般文本文件进行压缩,这类算法都不大可能改善处理的速度,而且还会增加了解压后再解析的步骤;
3.我们把XML文档用于索引结构,这样就不能只保持了XML文档的结构而无法对XML进行索引搜索。也就排除了一些简单的XML压缩算法。
(二)XML压缩方法
当压缩文档时,通常首先考虑常用的压缩算法,如:Lempel-Ziv和Huffman,以及在它们上面实现变化的一些常用实用程序。在类Unix平台上通常是gzip;在其它平台上,zip更为常用,比如:PKZIP、Info-ZIP和WinZip。但这些实用程序实际上意在充分地减少XML文件的大小。但是,都没有保持了XML文档的结构,或是无法对XML文档进行索引。这样本文选择使用BWT压缩算法而不是顺序Lempel-Ziv算法。
(三)BWT数据压缩
利用BWT压缩算法,我们先把字符文本进行转换,然后进行压缩,这样就解决了XML文档过大的弊端。而且BWT压缩算法要比顺序LZ算法,解压时速度有所提高。BWT算法的具体介绍我们在第5章进行讲解。
三、系统设计
(一)XML文件整体输出
首先,我们先不考虑XML文件的结构,这样把XML数据文件提交给程序,会按照普通文本文件的方式进行处理。程序先读取整个文件的内容,之后将它们作为一个字符串,进行后缀数组排序,然后BWT转换。但是这样的结果并不如意,有以下两个缺点:
1.程序执行的效率不高,文件内容如过大,导致整体的速度下降;
2.不便于查找,整体进行排序换转后打乱了文件结构,不能成为索引;
(二)以XML文件结构进行输出
由于不能破坏XML文件的结构,只能按照XML现有的标签内容进行。这样我们就引入了XML解析器,它可以分析出XML文件的结果和具体内容。先用解析器解析XML文件,我们就方便的判断出,什么是标签,什么是数据。把每个标签或者数据,单独进行排序转换。
具体过程:
1.XML解析器读取分析XML文件;
2.建立一个空的XML文件,进行添加排序转换后的数据;
3.如分析出标签开始,则提取此标签,对其进行排序转换,把结果插入新的XML文件;并记住此标签的级别,用于插入下级标签时使用;
4.如分析出数据,则对数据进行排序转换,并直接把新数据插入包含它的标签中;
5.如分析出标签结束,则关闭此级标签,结束数据转换;并记录新的标签级别,用于插入平级标签时使用。
参考文献:
[1]Donald Knuth.Art of Computer Programming[M].2002,Volume,3
论文摘 要 智能交通系统 (ITS) 是集成于信息技术、传输技术、电子技术、及计算机处理技术等多种类电子工程技术,而建立起的实时、高效、准确的综合运输和管理体系。其中,数据压缩和数据融合技术使得ITS技术更具有现实意义。本文基于智能交通系统中信息的特征,探讨了数据压缩和数据融合技术涉及的关键技术及要求,分析了技术应用及现实突破。
1 ITS信息及特征分析
1.1 智能交通信息(ITS)
交通系统由包括4个基本要素:人(交通出行者、驾驶员和管理者)、物(货物)、各类交通工具和相应的交通设施构成。交通信息是指所有与交通系统的四大要素相关联的信息,是ATMS的关键基础。面向ATMS的基础交通信息主要是指与交通运行状态和交通管理有关的交通信息,是交通信息中最直接、最基础的信息。基础交通信息包括基础交通地理信息、交通实时状态信息、交通控制和管理信息、交通政策法规信息、公共交通信息。
1.2 基础交通信息的属性特征
基础交通信息是一种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统,其应具有以下一些基本属性特征:1)准确性;2)及时性;3)共享性;4)信息的采集具有实时性和动态性;5)具有海量信息特征;6)增值性。
2 数据压缩处理技术
交通信息一方面时采集到的信息烦杂多样,要想利用这些不同类别的信息,需采用不同的处理方法;另一方面,交通信息的一个显著特征是它的空间性和随机性,因此对它的研究分析需要建立在广泛统计的基础上,应用各类信息处理技术和统计分析方法来探索它的规律性。
所谓多媒体技术就是能对多种载体(媒体)上的信息和多种存储(媒质)上的信息进行处理的技术,特点主要表现在它的综合性和交互性。交通信息是属于多媒体信息范畴。若要实时的综合处理声音、图像、视频、文字等多媒体信息,其数据量是非常大的。要传输或存储这样大的数据量是非常困难的,必须对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。
数据压缩主要依靠信源编码技术。一般的,图像压缩技术可分为两大类:无损压缩和有损压缩技术。在多媒体应用中常用的压缩方法有PCM(脉冲编码调制)、预测编码、变换编码、插值和外推法、统计编码、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也已经接近实用化水平。
3 信息融合技术
信息融合技术在单纯数据采集融合(即一次融合)阶段称为数据融合,是研究多种信息的获取、传输与处理的基本方法、技术、手段以及信息的表示、内在联系和运动规律的一门技术。融合是指采集并集成各种信息源、多媒体和多格式信息,从而生成完整、准确、及时和有效的综合信息,它比直接从各信息源得到的信息更简洁、更少冗余、更有用途。
先进的交通管理系统(ATMS)是一个典型的多传感器系统,信息融合技术给交通信息加工和处理提供了一种很好的方法,信息融合技术的最大优势在于它能合理协调多源数据,充分综合有用信息,提高在多变环境中正确决策的能力。
在信息融合领域使用的主要数学工具或方法有概率论、推理网络、模糊理论和神经网络等,其中使用较多的是概率论、模糊理论、推理网络。当然,除了这几种常用的方法之外,还有其他很多解决途径。
3.1 概率论
在融合技术中最早应用的就是概率论。在一个公共空间根据概率或似然函数对输入数据建模,在一定的先验概率情况下,根据贝叶斯规则合并这些概率以获得每个输出假设的概率,这样可以处理不确定性问题。贝叶斯方法的主要难点在于对概率分布的描述,特别是当数据是由低档传感器给出时,就显得更为困难。另外,在进行计算的时候,常常简单地假定信息源是独立的,这个假设在大多数情况下非常受限制。卡尔曼滤波方法则根据早先估计和最新观测,递推地提供对观测特性的估计。另外,概率论和模糊集理论的综合应用给解决多源数据的融合问题提供了工具。
3.2 模糊理论
模糊集理论是基于分类的局部理论,因此,从产生起就有许多模糊分类技术得以发展。隶属函数可以表达词语的意思,这在数字表达和符号表达之间建立了一个便利的交互接口。在信息融合的应用中主要是通过与特征相连的规则对专家知识进行建模。另外,可以采用模糊理论来对数字化信息进行严格地、折衷或是宽松地建模。模糊理论的另一个方面是可以处理非精确描述问题,还能够自适应地归并信息。对估计过程的模糊拓展可以解决信息或决策冲突问题,应用于传感器融合、专家意见综合以及数据库融合,特别是在信息很少,又只是定性信息的情况下效果较好。
3.3 推理网络
推理网络的构建和应用有着很长的历史,可以追溯到1913年由一位名叫John H W ig-more的美国学者所做的研究工作。近来,许多对于分析复杂推理网络的理论往往基于贝叶斯规则的推论,并且都被归类于贝叶斯网络。目前,大多数贝叶斯网络的研究都包括了对于概率有效传播的算法拓展,同时它在整个网络中也充当了新证据的角色。同时贝叶斯网络在许多A1任务里都己作为对于不确定推理的标准化有效方法。贝叶斯网络的优点是简洁、易于处理相关事件。缺点是不能区分不知道和不确定事件,并且要求处理的对象具有相关性。在实际运用中一般不知道先验概率,当假定的先验概率与实际相矛盾时,推理结果很差,特别是在处理多假设和多条件问题时显得相当复杂。
参考文献
[1]杨兆升.基础交通信息融合技术及其应用[M].北京:中国铁道出版社,2005.
[2]史其信,陆化普.中国 ITS 发展战略构想[J].公路交通科技,1998,3.
关键词:多媒体通信;IP;视频会议
Abstract: According to the main features of the IP network, focusing on network bandwidth, compression technology, multicast technology, transport protocol, QOS, and other aspects of the five IP-based video conferencing system, building a network of technical requirements.
Key words: multi-media communication; IP; video conferencing
1 前言
随着多媒体计算机技术和通信技术的发展,产生了一种新的技术——多媒体通信技术,它是多媒体、通信、计算机和网络等相互渗透和发展的产物,兼收了计算机的交互性、多媒体的复合性、通信的分布性以及电视的真实性等特点,具有明显的优越性。目前,如何在IP网络中更好、更快地实现视频、音频的传送已成为当今的研究热点之一。
2 基于IP网络构建视频会议系统的技术要求
随着IP网络的速率越来越高,从窄带走向宽带,承载业务从非实时走向实时,IP技术已成为实现视频、音频、数据等综合业务的最佳选择。在IP网络上建立视频会议系统需要多种技术支持,是比较复杂、完整的多媒体应用系统。
2.1 要有足够高的带宽
要传送视频,必须要有足够的网络带宽,就像大车要有足够宽的马路才能通行一样,否则,视频数据无法通过网络。以一帧1024×768像素的图像为例,如果用12bit表示每个像素,则共需要9.4Mb,如果按照25帧/秒的传输速率,则1秒内需要传输的数据量就是235Mb。在现有的网络条件下,传输这么大的数据是无法接受的。
2.2 要有好的压缩技术
只有采用高压缩比的压缩算法,有效地降低数据量,才能使视频、音频数据在IP网上传输成为可能。例如:在H.323会议系统中,图像编码主要采用H.261和H.263标准,支持CIF、QCIF的分辨率,而正在完善之中的H.264是比H.263和MPEG-IV压缩比更高的标准,节约了50%的编码率,而且对网络传输具有更好的支持,可获得HDTV、DVD的图像质量。
2.3 要有基于IP网络的多播技术
多播是一种多地址广播,发送与接收是一对多的关系。在传输过程中,发送端只需发送一次数据包,位于多播组内的各个用户就可以共享这一数据包。在视频会议系统应用中,将一个节点信号传送到各个节点时,无论是重复采用点对点通信,还是采用广播的方式,都会严重浪费网络带宽,而多播技术将数据传送分布到网络节点中,减少了网络中的数据总量。
转贴于 2.4 要有相适应的传输协议
TCP、UDP协议均不能很好地支持视频会议系统,这就需要与之相适应的协议,如RTP、RTCP、RSVP等。RTP运行在UDP之上,音频、视频等数据被封装在RTP数据包中,每个RTP数据包被封装在UDP包中,然后再封装到IP包中进行传输。在底层网络支持多播的情况下,RTP还可以使用多播向多个目的端点发送数据。RTCP是RTP的控制协议,负责反馈控制、检测QoS和传递相关信息,对RTP的数据收发做相应调整,使之最大限度地利用网络资源。
2.5 要提供服务质量保证
网络服务质量是网络与用户之间以及网络上互相通信的用户之间关于信息传输与共享的质量约定。第一,在任何网络中,时延总是存在的。视频会议系统具有较高的实时性和可靠性要求,为了获得各会场的真实的现场感,音频、视频的时延都要小于0.25s,最大时延抖动应小于10ms。其次,在视频会议系统中,还要求唇音同步,只有达到时间上的同步,才能自然有效地表达关于会场的完整信息。第三,允许一定的丢包率。因为人的感知能力有限,在一个视频会议系统中,个别分组丢失,人眼是感觉不到的,因此可以允许一定的传输误码,丢包率应控制在人能接受的范围内。
3 基于IP网络构建视频会议系统的协议
基于IP网络构建视频会议系统的标准主要有:H.323和SIP。
H.323沿用了传统的电话信令模式,比较成熟,已经出现了很多产品,形成了比较成熟的应用体系和市场体系。SIP协议将音、视频传输作为Internet上的一个应用,增加了信令和QoS要求,借鉴了其它Internet标准和协议的设计思想,遵循简练、开放、兼容和可扩展等原则,比较简单,但其推出时间不长,协议并不是很成熟,应用也不是很多。
4 结束语
随着网络、多媒体、通信技术的飞速发展和性能的提升,基于IP网络构建视频会议系统技术会不断被发展和完善,必将以其独特的优势广泛应用到Internet、Extranet、Intranet上,为政府机关、商业集团、科研院所、医疗机构及普通个人等进行异地交流提供方便条件,成为工作、学习、生活中不可或缺的工具。
参考文献
[1] 张智江,张云勇,刘韵洁.SIP协议及其应用[M].北京:电子工业出版社,2006.
[2] 沈鑫剡,等.多媒体传输网络与VoIP系统设计[M].北京:人民邮电出版社,2005.
[3] Douglas E.Comer. Internetworking With TCP/IP Vol I:Principles,Protocols,and Architectures Fourth Edition[M].北京:电子工业出版社,2004.02.
【关键词】数字音视频 MXF DV MP4
数字音频码流的分割及合并技术能够快速对音视频数据进行删除、替换以及增加等修改操作。在对数字高清视频素材进行编辑时,能够使各类高清素材完成精确帧定位并进行剪、接等操作;能够确保素材在分割后,拥有独立的组织结构,以正确的格式进行播放并且支持再次编辑;能够使多个素材片段实现无缝拼接。这就使得对数据码流的分割以及合并技术的研究显得尤为重要,因为数据码流的分割与合并技术直接关系到编辑的效果。
1 数字音频编码标准
目前在国际上,数字音视频编码压缩标准主要以MPEG和H.26X标准为主。其中,MPEG主要是针对MPEG系统、视频、音频制定的标准格式,又可分为:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21;而H.26X主要是针对多媒体通信视频和音频编码制定的标准格式。
随着数字音视频编码技术的不断完善,由 SMPTE制定的DV和MXF格式,已成为当今高清电影电视、电子新闻节目制作的主流。其中,DV是一种专业的数字音视频采集设备、数码影像规格,它广泛应用在电视电影节目制作、电子新闻采集等专业领域。MXF是一种通用的媒体容器格式,它可以在不同的协议和操作系统下工作,它能够将各类压缩方式的素材进行灵活封装。目前,音视频素材的封装主要以P2系列音视频标准格式为主。它能够直接采用MXF文件格式将音视频素材记录到P2卡上,提高了音视频编辑的速度和效率,P2已经成为高清数字音视频编缉的主要格式。本文就是在P2格式环境下,对高、低码率两类素材的分割合并技术进行研究。
2 分割及合并技术分析
要想准确顺利完成对数字音频视频文件进行分割及合并,必须在了解MXF文件结构、音视频数据组织、封装形式、素材数据等信息前提下,对文件头部重要元素进行分析。P2系列音视频素材MXF文件结构主要由头部Partition Pack标识的 Header Partition和Body Partition,以及Footer Partition所组成。由于Header Partition中涉及头部元素数据与索引表,Header Partition紧跟Partition Pack标识,Footer Partition又对索引表进行了拷贝;Body Partition中涉及音视频素材实质数据,因此,P2系列音视频素材MXF文件中的数据都将以KLV编码组织。如下图1所示:
为了将音视频数据放入通用媒体容器中,则利用Body Partition Pack后的Essence Container作为能够承受装载的容器,并采用Clip Wrapping封装映射方式对音视频数据帧进行定位分割及合并操作。因此,先对文件进行读取,查看是否属于MXF文件;其次,当文件为多个Body Partition时,则从尾读取至Partition Pack起点位置,当文件为单个时,则依次序读取,并对Header Partition进行依次序分析,并确定Essence Container的位置;再次,根据Header Metadata给出的信息,对格式、生成方式、素材输入时间等信息进行音视频确认;最后,对音视频数据帧进行定位分割及合并操作。由于数字音频数据编码方式为KLV组织,使素材检索定位效率获得了提高。在进行Clip Wrapping封装时,视频所有帧数依次一帧紧接一帧靠在一起作为Picture Item放置到通用媒体容器中。对帧的定位顺序为:Body Partition、Picture Item的位置,以及视频帧在Picture Item的位置,并取出。而音频数据与视频数据读取的方式相类似,由于数据重要放置在Sound Item中,因此,读取的时候,只需要一次读取1s或Ns的采样数据,封装时,因Sound Item中的数据量不够,则需要从多个Sound Item中读取音频数据进行分割合并,组成一个较大的数据缓冲,从而实现数字音频码流的无缝拼接。
视频压缩编码技术有帧内压缩( Intra--frame ) 和帧间压缩(Inter-frame)两种, 音视频素材在编辑过程中采用哪种压缩方式决定了对素材进行分割与合并的难度。帧内压缩一般是有损压缩,针对每一帧图像进行压缩,帧与帧之间没有相互关联,在压缩以后仍然可以以帧为单位进行编辑,因此,在DV格式等非线性编辑领域常常会使这种压缩方式。但是这种压缩比率一般不高,为了要达到更高的压缩比例就得使用帧间压缩方式。帧间压缩一般是无损压缩,它通过比较相邻两帧之间的差异,在记录时仅仅记录本帧与相邻帧的差值,这种压缩方式减少了数据量,大大提高了压缩的比率。在实际应用中,两种压缩方式往往同时使用,MPEG-2编码就同时具有帧内压缩与帧间压缩两种方式。
3 数字音视频压缩技术的实现
3.1 帧内压缩方式下的分割及合并
利用帧内压缩方式下的分割及合并技术,只需要对分割文件偏移位置进行确认后,进行重新编写新的文件,所修改分割合并后的新音视频素材文件就能够正常进行播放。下面主要针对DV、AVCI两类采用帧内压缩方式的素材进行分析。其具体分割流程如图2所示:
合并的实现过程与分割过程基本相同,素材的合并主要是针对格式以及参数相同的两个素材而言。
3.2 帧间压缩方式下的分割及合并
帧间压缩方式具有压缩效率高、速度快等优点,但对素材的分割与合并不能简单的找到相应帧的位置进行操作。我们将采用帧类型变换的方法对帧间压缩的素材进行分割。以MPEG-4格式为例,首先把MP4文件分解成视频数据MPEG-4 video ES和 音频数据MPEG-4 audioAAC。由于MPEG-4 文件中没有各帧对应的时码信息,没有分割MXF文件时直接供参考帧的绝对时码,因此需先依据原素材文件的开始时码即入点和出点来计算出对应的帧序号,然后根据帧头分别找到入点和出点对应的帧偏移。合并技术的重点在于实现各个素材片段的重排序以及无缝合并,实现音视频重同步效果。
综上所述,数字音视频压缩技术主要是为了能够在原音视频素材上,有效缩短任务时间快速对帧进行定位访问,并根据帧的位置,实现数字音视频素材编辑的无缝拼接。以确保数字音视频素材在经过压缩以后,依然具有完整性、可再编辑性。目前针对多种应用环境下的音视频码流素材的分割、合并技术的研究也正在进行,对数字音视频的高效长远的发展有着很大的意义。
参考文献
[1] 龚声蓉,王朝晖.结合视频分割的形状编码算法[A].苏州市自然科学优秀学术论文汇编,2010.
[2] 张晓萌,刘云,陈潜.嵌入式音视频码流合并系统的设计与实现[J].计算机应用,2011.
[3]张文丰.MPEG-2音视频码流合成与转换技术的研究和实现[D].电子科技大学,2006.
由於在现今资讯流通普遍的社会中,影像的需求量越来越大,影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大,在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式,在压缩率及还原度皆有不错的表现,为其尚未有一标准的格式,故在应用上尚未普及。但在不久的未来,其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波(WAVELET)转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
JPEG2000是新一代的静态图像编码国际标准,与已有的JPEG标准相比,它可以提供更好的图像质量和更高的压缩率,但其计算的复杂度也远高于JPEG算法。一般在处理JPEG 2000图像时,若欲将其图像尺寸缩小,首先需由JPEG 2000解码器处理,将JPEG 2000图像解码到空间域图像后,在空间域里将图像缩小至所需尺寸后,再经JPEG 2000编码器将图像作编码,最后得到尺寸缩小后的压缩图像。但是由于在空间域里使用图像大小转换方法来缩小JPEG 2000图像,需要大量的计算量、繁杂的处理过程、以及占用大量的存储空间。为了加快图像尺寸转换处理速度、降低计算复杂度、以及有效降低存储空间占用,本论文提出一个快速的JPEG 2000图像尺寸缩小转换算法。流程如图1。
在我们的快速JPEG 2000图像尺寸缩小转换方法中,首先将原始JPEG 2000图像经EBCOT解码以及反量化步骤解出图像的频率域编码信息后,再透过频率域图像尺寸缩小转换方法,直接在频率域里缩小图像尺寸,最后再通过量化与EBCOT编码等步骤,将图像尺寸缩小后的图像频率域编码信息编成JPEG 2000图像。
本文所提的JPEG 2000图像尺寸缩小转换方法与空间域图像大小转换方法相比,所提的方法省掉反向小波转换、反向色彩转换、后置处理、前置处理、正向色彩转换、以及正向小波转换等六个步骤。由于所提的方法不需将频率域编码信息转成空间域图像,因此本论文所提的方法除了可更快速的转换图像大小外,也可省下存放空间域图像内容所需的存储空间以及减少所需的计算量。
1 简化JPEG 2000压缩与解压缩流程
在快速JPEG 2000图像尺寸缩小转换方法中,保留了EBCOT解码、反量化、量化与EBCOT编码等四个部分,主要原因说明如下:
1.1 EBCOT编/解码 JPEG 2000编码后的图像会储存成封包的格式,但封包并非以子频带为单位储存,所以要取得各子频带的内容,必须先经过EBCOT解码才行。再者本文的方法有可能需要对子频带再进行小波转换,因此EBCOT编/解码过程不可省略。
1.2 量化与反量化 保留量化与反量化步骤的主要原因在于图像经由正向小波转换后,会产生不同大小的子频带频率信息,不同子频带频率信息使用不同的量化步长值进行量化。
子频带与量化步长值这两者有相对应关系,换句话说以具有7个子频带的JPEG 2000图像而言,必须要有7个相对应的量化步长值。而子频带与量化步长值所产生的数目与小波转换的层数有关,对于一个经过m层小波转换的影像,所具有的子频带数目Nsubbands计算公式为:Nsubbands=3×m+1,图2所示为图像经由二次小波转换后所产生的七个不同的子频带。
每个子频带的量化步长值都是由一组独立的控制参数(ε,μ)决定,该组控制参数必须记录于JPEG 2000码流头部,供译码端还原量化步长值使用。图3所示为一张图像经过三次小波转换后所产生的频率域情况。
本文所提的频率域图像尺寸缩小方法会改变原本图像的小波转换层数,进而影响到量化步长值与子频带的对应关系。当使用不同小波转换层数时,每个子频带的量化步长值会不同。所以,当图像在进行尺寸缩小前,先使用原本JPEG 2000图像的量化步长值对图像进行反量化,还原频率域信息,当图像尺寸已调整缩小后,再用新的量化步长值来量化频率域信息,即可解决量化步长值与子频带不一致的问题。
在我们所提的方法中,分别会遇到小波层数足够与小波层数不足的情况。假设一张JPEG 2000图像小波层数为m层,欲要将图像尺寸缩小为原来的(1/2n×1/2n)大小时,假如n
若n=m发生,也就是小波层数不足。首先经EBCOT解码后,产生不同的子频带信息。针对不同的子频带信息使用反量化,接着进行图像缩小的工作,将不需要的外频信息去除,保留的频率信息因小波层数不足(小波层数需为1层以上),要对保留的频率信息再进行小波转换。产生出来的小波频率域尺寸大小超过欲转换尺寸,可将外频的小波频率信息去除,保留LL子频带。此时图像大小虽已符合转换所需大小,但JPEG 2000规定图像至少要有一层小波转换,所以必须再做一次小波转换,得到一张小波转换层数为1的JPEG 2000图像,最后再经量化与EBCOT编码,得到尺寸缩小后的JPEG 2000图像。
2 频率域图像尺寸缩小转换方法
图1中间的频率域图像尺寸缩小转换方法主要工作包括缩小频率域图像尺寸与修改JPEG 2000图像码流主标头相关参数等步骤,详细步骤如下:
2.1 括缩小频率域图像尺寸
①小波转换层数足够的作法。假设当图像的小波层数为m层,欲将图像尺寸缩小为(1/2n×1/2n)大小时,若n 首先使用EBCOT解出频率域信息,再对需保留的频率域信息作反量化动作,接着将整张图像的尺寸缩小,并且丢弃不需要的外频频率信息,最后将所保留的频率域信息再重新经过量化与EBCOT编码,即可得到图像尺寸缩小后的JPEG 2000图像。
②小波转换层数不足的作法。假设当图像的小波层数为m层时,欲将图像尺寸缩小为(1/2n×1/2n)大小时,若n=m,就是小波层数不足,则除了丢弃m个外层的中高频信息外,还需要将原来最内层的低频信息,进行(n-m)+1次小波转换,再将所产生的(n-m)层的中高频信息丢弃。由于以上的(n-m)次小波转换后的中高频信息最终将被丢弃,因此在进行以上小波转换时可直接省略许多计算工作,不必进行完整的小波转换。此法为本文提出的快速小波转换方法。
2.2 修改JPEG 2000图像码流主标头相关参数 JPEG 2000图像码流主标头记录原始图像大小、块状(tile)大小、小波层数、各子频带的量化步阶值参数(ε和μ)等数据信息。在我们所提方法中,并没有将图像解回空间域,而是在频率域信息缩小图像尺寸后,直接进行量化和EBCOT编码,产生新的JPEG 2000图像。新的JPEG 2000图像码流主标头数据无法像空间域转换方法由JPEG 2000压缩方式设定,而必须自行修改JPEG 2000图像码流主标头内的相关参数。
3 小结
JPEG 2000具有的多种特性使其有着广泛的应用前景。目前许多图形图像公司如Pegasus,Aware等在开发的图像软件中集成了JPEG 2000图像压缩技术;有的公司如ImagePower等已开发出JPEG 2000的DSP芯片。JPEG 2000将取代JPEG在图像压缩领域发挥重要作用。本论文提出一个新的快速图像压缩方法,可大幅降低使用空间域转换时的处理时间,以及所需存储空间,但是本文所提方法只针对静态图像实现固定大小的缩小转换,无法对图像作任意大小转换,对图像作任意大小转换是一个很好的发展方向,需作进一步研究。
参考文献:
[1]杜伟娜,孙军,倪强.基于JPEG2000的高效率控制算法[J].上海交通大学学报,2006,40(1):16-19.
查看更多《信息技术》杂志社信息请点击: 《信息技术》编辑部
基金项目
(1)基于c++ builder的共焦显微镜三维重建方法 杨召雷 张运波 董洪波
(4)m—link在通信系统仿真中的设计与实现 姚云龙 周俊 刘强
(8)基于嵌入式的无线煤炭自燃预警系统 刘德文 杜宇人
(11)tts语音单元的无损压缩与按需解压缩技术 卡斯木江·卡迪尔 古丽娜尔·艾力 艾斯卡尔·艾木都拉
无
(14)2012年中国国际信息通信展览会开幕 无
基金项目
(15)低载荷工业机器人运动学分析与仿真 陈蓓玉 胡凯 杨乐
(19)基于zigbee无线传感网络监测系统的实现 杨俊 阮超 陈睿瑶 付红桥
(23)endnote x5软件在论文撰写过程中的应用 程宏辉 程筱农 奚和平 黄新
(26)一种近距离无线传感器系统的设计 叶天凤 胡长晖 叶梦君 万里光
(29)sakai网络教学平台统一身份认证中心的实现 柯水洲 马雪梅 王新舸 邹刚
(33)增益连续可调宽带前置放大电路设计与实现 汪俊杰 盖建新 刘旭 程爽
(37)actionscript3.0垃圾回收机制及优化策略 李智勇
(40)基于彩信的远程控制宠物笼系统的研制 杨乐 高超
(42)spring mvc技术分析及在实践教学系统中的应用 符红霞
(47)支持向量机在广义预测控制中的应用 张伟 贾蓉
(50)测控信息技术领域提高学生实践创新能力的方法 王可宁 刘缠牢 王伟 张雄星
(53)一种复杂背景下车牌定位算法 赵大伟 陈刚
研究与探讨
(58)基于spce061a的语音手动双控制开关的设计 李建新 张肖飞 徐丽妍
(62)基于bp神经网络的钻井复杂情况和事故诊断 崔猛 汪海阁 李洪 纪国栋 于洋
无
(65)第九届通信企业管理现代化创新成果审定会开幕 无
研究与探讨
(66)一种基于单摄像头的虚拟键盘 杨骋
(68)基于椭圆曲线的充值卡加密 孙传亮 周海港
(72)基于ccd和光电编码器的差速整定方法研究 李增彦 张迪洲 张男
(77)嵌入式软件仿真测试平台开发 林丹丹
(80)基于anybus-s pn io模块的profinet远程i/o设计 杨明 王永刚 张陆毅
(85)采用mel倒谱参数的咳嗽声识别方法 尹永 莫鸿强
(92)模板匹配算法的两种实现方法比较 谢方方 杨文飞 陈静 李芳 于越
(96)基于msp430的低频信号分析仪设计 张君 李金龙 郭建强 杨林晓
(101)基于labview的双向智能钥匙充放电测试系统 尹武 张文娟 周继宇
br> (104)多用途市电负载功率调功电路的设计 姚正武 部绍海 林涛 李树伟
(107)gps周跳探测与修复方法的比较分析 徐欢 唐亮 都业涛
(112)并行计算技术综述 王磊
(116)卫星远程监视及实时故障诊断研究与应用 陈怀木 贾银山 穆友胜
(121)基于soa的一体化缴费接入管理平台设计 王树全 邹宁峰 金鑫
(125)基于增量式pid控制算法的智能车设计 肖文健 李永科
应用技术
(128)油层保护模糊专家系统的分析与设计 张丹 曹谢东 魏存挡 庞扬
(131)基于multisim10低频信号源的设计与仿真 兰羽 周茜
(134)光电池基本特性的测定 赵楠 孙雪萍 李平舟
(137)基于单片机的无视频报警监测仪设计 李钊
(140)基于hfss的有孔屏蔽体的屏蔽效能分析 陈新平 杨显清
(144)战术无线电台半实物仿真系统设计与实现 张爱民 辛广辉 郑振华
(147)基于混合高斯模型与核密度估计的目标检测 吕游 任政 李向阳 方向忠
(151)基于业务流程的信息化建设与应用 刘光伟
(153)基于国产cpu的嵌入式医疗电子无线网络设计 裴家俊 张辉 刘芸 戎蒙恬
(157)利用vba及office自动化技术辅助人事办公 王晶
(159)数字钟电路的设计 曹啸敏
(163)基于电磁传感器的智能车自主寻迹系统设计 师克 王洪军 李永科
无
(166)上海市中国软件名城创建暨软件产业工作会召开 无
应用技术
(167)异步时钟亚稳态仿真方法 高文辉 胥志毅 邬天恺 刘文江 仲景尼
(170)lwip的移植及其在并行系统中的应用 赵虎 黎英 游谦
(173)盲人行走辅助装置中道路检测算法的研究 徐姗姗 应捷 宋彦斌
无
(176)尚冰出席第八届中国信息无障碍论坛开幕式并致辞 无
应用技术
(177)多载波传输系统的频偏及采样钟联合补偿算法 李炎 周志平 李鑫
(181)智能小车模糊-pid控制调速系统设计 张家骅 徐连强 吴迎春
无
(183)第九届海峡两岸信息产业和技术标准论坛举行 无
综述与评论
(184)epc信息管理系统在装备器材保障中的研究 康帅 高庆 程远增
(187)基于供应链信息共享的备件资源整合研究 黄健 程中华 王亚彬
(190)航空航天侦察情报保障能力综合评价模型研究 童涛 杨桄 谭海峰 王寿彪 叶怡
(194)装备保障信息评价研究 赵国存 刘占岭
无
(f0003)
关键词:KVM-OVER-IP;H.26X;MPEG;RLE(游程编码)
中图分类号:TP368 文献标识码:A文章编号:1009-3044(2011)31-0000-00
Video Compression in the Network about Management of Server
FENG Zhan, WU Xin-jun
(Jiangnan Institute of Computing Technology, Wuxi 214128, China)
Abstract: the video compression technology in the server management plays a decisive role, this paper first introduced the current main video compression technology development, the application fields and standards, then for low cost, low power consumption demand, and proposes an improved RLE algorithm.
Key words: KVM-OVER-IP; H.26 X; MPEG; RLE(the run-length coding)
随着服务器管理技术的发展,大部分的厂商都实现了服务器的远程网络管理。使用者不必亲临现场便能处理发生的各种问题,极大的提高了服务器管理的效率。在服务器管理的硬件管理方案中KVM-OVER-IP的应用最为广泛。KVM实现远程桌面,虚拟设备、远程安装OS镜像等。一般的KVM卡内嵌了浏览器,在客户端通过web网页直接访问控制界面。
1 KVM-OVER-IP
在KVM over IP系统中,最大的挑战来自于视频信号的压缩与传输。以分辨率1024x768,刷新率75Hz,32位真彩显示输出为例,其信号传输带宽高达1.75Gb/sec,远远高于局域网及广域网所能提供的传输带宽。实用的KVM over IP系统需要在局域网中,提供高于1500:1的视频压缩比率;在广域网中,提供高于6000:1的压缩比率;同时,KVM over IP系统必须在实现高比率视频压缩的同时,在客户端提供足够清晰的视频还原。其中,帧间比对与数据压缩算法通常是各公司的专有技术,也是直 接决定客户端还原视频质量的重要因素。
2 目前主流的视频压缩算法
在视频编解码技术定义方面有两大标准机构。包括国际电信联盟 (ITU) 和国际标准化组织 (ISO)。前者已经开发了用于低比特率视频电话的 H.26x 标准,其中包括 H.261、H.262、H.263 与 H.264;主要针对电信领域的应用,后者主要针对消费类应用,已经针对运动图像压缩定义了 MPEG 标准。MPEG 标准包括 MPEG1、MPEG2 与 MPEG4。
图1说明了视频编解码标准的发展历程。
2.1 H.261
H.261[1]标准是1990年ITU制定的的第一个主流有损视频压缩标准,设计的目的是能够在带宽为64kbps的倍数的综合业务数字网(ISDN for Integrated Services Digital Network)上传输质量可接受的视频信号。编码程序设计的码率是能够在40kbps到2Mbps之间工作,能够对CIF和QCIF分辨率的视频进行压缩编码。
H.261原理是第一步是对采集的显卡信号使用帧间预测来消除空域冗余,同时使用了运动矢量来进行运动补偿。随后进行变换编码即采用使离散余弦变换(DCT)来进一步的消除空域的冗余,然后对变换后的系数进行量化,并量化后的变换系数进行Zig-zag扫描来消除时域的冗余,最后使用熵编码(可以使长度编码或者是霍夫曼编码)来消除统计冗余。但是H.261仅仅对视频的解码进行了规定,而并没有定义解码器的实现,因此在具体实现时,研究者可以针对不同的应用对数据进行不同的预处理从而达到更好的效果,
2.2 MPEG-1
MPEG-1 [2] 是ISO 于1990年开发的第一个视频和音频有损压缩标准。主要应用是数字媒体上动态图像与音频的存储与检索,如速率为 1.15Mbps、采用 SIF 分辨率(352′240-29.97fps 或者 352′288-25 fps)的VCD。MPEG-1在关键技术上做了一些改进,块方式的运动补偿,离散余弦变换,等技术,随后被Video CD采用为核心技术。 但是其缺点也比较明显,虽然在速率上可以满足很多应用,但是压缩比不够大,作为实时视频压缩,需要的磁盘空间特别大,正是这一点也限制了它的应用。
2.3 MPEG-2
MPEG-2 [3] 是ISO 于1994年制定的,主要针对于高级工业标准的图像质量以及更高的传输率。并且MPEG-2相比MPEG-1提供较广范围的压缩比,已适用于对画面质量,存储容量,以及带宽要求不同的场合。MPEG-2主要用于DVD的标准,还可用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。
2.4 H.263
H.263的开发主要是为了实现低码流的通信。是在H.261的基础上制定出来的,但实际上这个标准在很多方面做了改进,可用在很宽的码流范围。它在许多应用中都可以取代H.261。H.263的编码算法与H.261基本原理一样,但做了一些改善和改变,以提高性能和纠错能力。H.263标准在低码率下能够提供比H.261更好的图像效果,其特点包括以下几点:
1)H.263中的数据流层次结构的某些部分是可选择的,使得编解码可以根据针对实际的应用选择数据率和纠错能力;
2)H.263的运动补偿使用半像素精度,这与H.261相比提高了压缩率;
3)H.263采用了基于空域的的帧内预测方法;
4)H.263支持5种分辨率,即包括QCIF,CIF,SQCIF、4CIF,16CIF,其中SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍;
5)H.263采用了无限制的运动向量,允许运动矢量指向图像以外的区域;
6)H.263采用了基于句法的算术编码模式使用算术编码代替霍夫曼编码,可在信噪比和重建图像质量相同的情况下降低码;。
7)H.263提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力。
2.5 MPEG-4
MPEG-4[4] 是1998年11月公布的,MPEG-4标准主要应用于视像电话(Video Phone),视像电子邮件(Video Email)和电子新闻(Electronic News)等,其传输速率要求较低,在4800-64000bits/sec之间,分辨率为176X144。MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图像质量,但是其在服务器的领域没有得到广泛的应用。
视频编码技术最重要的突破是由 ITU 和 ISO/IEC 的联合视频小组 (JVT) 开发的H.264/MPEG-4 AVC[5]标准。H.264/AVC[5] 在压缩效率方面取得了巨大突破,H.264和H.261、H.263一样,也是采用DCT变换编码加DPCM的差分编码,即混合编码结构。同时,他采用了一些新的更有效率的技术如帧内预测编码,可变矢量块大小。多参考帧预测,自适应环路去块滤波器等。并且其在应用方面有了更大的进步:
1)H.264没有繁琐的选项,而是力求简洁的“回归基本”,它具有比之前的压缩标准更好的压缩性能,又具有适应多种信道的能力。
2)H.264的应用目标广泛,可满足各种不同速率、不同场合的视频应用,具有较好的抗误码和抗丢包的处理能力。
3)H.264的基本系统无需使用版权,具有开放的性质,能很好地适应IP和无线网络的使用,这对目前因特网传输多媒体信息、移动网中传输宽带信息等都具有重要意义。
正是由于H.264的种种特点,使得该算法标准一制定出来,便受到了广泛的应用,其优秀的编解码能力在视频通信领域应用的的也越来越多,尽管其复杂性也是之前视频压缩算法的数倍,但是集成电路的发展以及SOC技术的革新,这些已经可以得到很好的解决。
随着视频压缩算法的不断更新,各大服务器厂商的的实现产品也不断的革新,主要是针对不同的应用场合采用不同的压缩算法,然后结合所做的硬件部分进行一些改进和优化。
3 改进的RLE(游程)压缩算法
本论文提出的视频压缩算法是一个低代价,低功耗的可行算法,针对某种特定场合所使用的,虽然压缩视频的效果有待提高,但是能满足基本的要求。本文的视频压缩是基于一个256M大小的FPGA上实现的,而且在该FPGA上还实现了一个嵌入式软核,软核的作用是实现BMC的调试,因此硬件资源有限,该视频压缩只能算该FPGA的一个模块。因此涉及到太多乘法的算法难以实现,考虑选择RLE游程算法来实现,该算法简单容易实现,其基本的思想是,利用数据之间的关联性,而屏幕显示的数据,以整个像素为单位,关联性是很强的,对一般常见的屏幕图像使用RLE(游程编码)算法进行单幅图像的压缩,平均可以获得30%到50%的压缩效果,因此使用RLE算法是可行的。以现有的试验平台的硬件条件来看,以太网是100Mbps。传输的数据占用1/5带宽,因此传输的数据量有限,只能减少传输的数据量,降低传送视频的图像数和视频的压缩质量从而完成视频的压缩,根据人的视觉系统所能接受的范围,本文以每秒10幅图像来完成视频的传输,这样每幅图像的压缩数据应该为256KB,而一幅未经任何处理的1280X1024的图像大小约为4MB,这样压缩效果必须达到原来图像的1/8左右,因此必须对RLE算法进行优化,使得修改后的压缩算法能够保证数据的实时性传输,
由于视频压缩模块接受的是显卡输出的像素数据,是以RGB形式接收的,本文实现的方法是对每个像素的后三位数据进行四舍五入而后丢弃,这样做得好处有两方面:
1)可以增强相邻像素的相关性从而加强压缩的效率;
2)可以减少传输的数据总量;
然后再对得到的数据使用RLE压缩方法,具体是实现时是以每行的大小来压缩成一个数据包,然后通过以太网进行传输,客户端进行解压缩得到源图像数据。虽然图像有一定的失真,但是在可以接受的范围内,通过在FPGA上测试,基本能达到1/10的压缩率。
这种低功耗,低成本的视频压缩系统,适用于小架构的电子产品。例如低精度的小型摄像仪器,监控系统等。
4 结束语
本文首先介绍了目前主流的视频压缩算法,以及适用的各种领域,而后提出一种改进的RLE压缩算法,主要应用在小功耗的压缩系统的中,虽然压缩效果不是很好,但是容易实现,而且其优点也是很明显的。
参考文献:
[1] ITU-T建议 H.261:,《用于 px64Kbps 音频/视频业务的视频编解码技术》.
[2] ISO/IEC 11172-2:,《1.5Mbps 数字存储媒体的动态图像及相关音频的编码》.1993
[3] ISO/IEC 13818-2:,《动态图像及相关音频信息的通用编码:音频》.1995
[4] SO/IEC 14496-2:,《信息技术――音频/视频对象的通用编码》.2001
[5] Sullivan G,Wiegand T.“视频压缩――从概念到 H.264/AVC 标准”[J].IEEE学报,2005(1).