《多媒体数据处理技术.ppt》由会员分享,可在线阅读,更多相关《多媒体数据处理技术.ppt(34页珍藏版)》请在课桌文档上搜索。
1、第 5 章,多媒体数据压缩技术,5.1 数据压缩基本原理 5.1.1 信息、数据与编码 5.1.2 数据压缩的条件 5.1.3 数据冗余5.2 数据压缩算法 5.2.1 数据压缩算法分类 5.2.2 预测编码原理 5.2.3 变换编码原理 5.2.4 统计编码原理 5.2.5 霍夫曼编码原理 5.2.6 行程编码原理,5.2.7 算术编码原理 5.2.8 LZW压缩编码5.3 静态图像JPEG压缩编码技术 5.3.1 JPEG标准的由来 5.3.2 JPEG压缩算法 5.3.3 无失真预测编码 5.3.4 有失真DCT压缩编码5.4 动态图像MPEG压缩编码技术 5.4.1 基本原理 5.4.
2、2 MPEG技术标准,数据压缩基本原理,5.1,5.1.1 信息、数据与编码,1信息和熵,信息量的大小和消息有一定的关系。在数学上,消息是其出现概率 的单调下降函数。信息量越大,消息的可能性越小,反之亦然。信息量:为了从N个相等的可能事件中挑选出一个事件所需的信息 度量和含量,所提问“是或否”的次数。也就是说,在N个事件中辨 识特定的一个事件要询问“是或否”次数。,例,随着每次询问,有半数的可能事件被取消,这个过程由公式表示:,可看出:对于256个数的询问只要进行8次,即可确定一个具体的数。设:从N个数中选定任意一个数x的概率为p(x),假定选定任意一个数的概率都相等,即p(x)=1/N,则信
3、息量为:,如果将信息源所有可能事件的信息量进行平均,即可得到信息的“熵”(熵是平均信息量),信息源X的符号集为xi(i=1,2,N)。设:xi出现的概率为p(xi),则信息源X的熵为:,信息与数据,2.,信息可以用函数表示,该函数由信息论创始人C.E.Shannon提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:,公式中,Pi(i=1,2,r)是随机消息组合Xa1,a2,ar中的消息ai(i=1,2,r)的先验概率。Pi 可以度量ai(i=1,2,r)所含的信息量。而I(ai)(i=1,2,r)在X的先验概率空间Pp1,p2,pr中的统计平均值为信息源X的熵:,信息源X的熵用来
4、度量X中每种消息所包含的平均信息量。信息熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。,多媒体信息的数据量,3.,数据压缩的条件,5.1.2,数据冗余度(重复数据、可忽略数据),信息传输与存储的限制(压缩 传输或存储 解压缩),44.1kHz/Stereo 1.3MB,22.0kHz/Mono 0.3MB,Stop,数据冗余,5.1.3,冗余基本概念,冗余 信息所具有的各种性质中多余的无用空间,冗余度 多余的无用空间的程度,音频数据8kHz采样8bit60秒=3840KBit(合480KB/分钟),冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,
5、3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关
6、性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的
7、相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面
8、间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,声音频率文字组句色彩渐变主观意识:,数据压缩算法,5.2,5.2.
9、1 数据压缩算法分类,预测编码原理,5.2.2,预测编码 有损压缩编码,主要对统计冗余进行压缩。,1预测编码的基本原理 用原样本值对新样本进行预测,得到新样本的预测值。接着,取新 样本的实际值和预测值进行比较,二者相减得到差值,然后对差值 进行编码。,DPCM预测压缩算法,3.,DPCM(Differential Pulse Code Modulation)差分脉冲编码调制算法,主要用于对图像的像素进行预测、压缩处理。,工作原理 首先比较相邻的两个像素,如果存在差异,则传送差异之处的差值;若 无差异,则不传送差值。由于图像相邻像素通常是类似的,差异很小,因此,传送的差值总是少于图像的像素值,达
10、到了减少数据量的目的。,变换编码原理,5.2.3,变换编码(Transform coding)有损压缩编码,用于对统计冗余(图像数据)的压缩。,工作原理 首先对时域上的信号进行函数运算,并变换到频域上,然后在频域上对变换后的信号进行编码。在频域上,信息是按照频谱的能量和频率分布进行排列的。,霍夫曼编码原理,5.2.5,霍夫曼编码 无损编码。,行程编码原理,5.2.6,行程编码(Run Length Coding)无损压缩编码。,算术编码原理,5.2.7,算术编码 无损压缩编码,属于统计编码。,20世纪60年代由Elias提出,某些方面优于霍夫曼编码。因此,在JPEG标准的扩展系统中,算术编码已
11、经取代了霍夫曼编码。,LZW压缩编码,5.2.8,LZW(Lempel Ziv Welch)无损压缩编码,用于图像数据的压缩。,静态图像JPEG压缩编码技术,5.3,5.3.1 JPEG标准的由来,1991年,联合专家组提出了ISO CD建议草案,后经过国际电子技术委员会ISO/IEC的批准,正式成为第10918号标准,并正式命名为“JPEG高质量静止图像压缩编码标准”,简称“JPEG标准”。,JPEG压缩算法,5.3.2,适用于连续色调、多级灰度、彩色或黑白图像的数据压缩。,无损压缩比:大约为4:1。有损压缩比:在10:1100:1之间。不大于40:1时,还原的图像在色彩、清晰度、颜色分布等
12、方面与原始图像相比,误差不大,基本上保持了原始图像的风貌。,无失真预测编码,5.3.3,无失真预测编码 无损压缩,压缩比一般为2:1。,有失真DCT压缩编码,5.3.4,采用DCT(Discrete Cosine Transform)离散余弦变换的压缩算法。,1DCT离散余弦变换,有失真DCT压缩编码,5.3.4,3图像的质量与压缩比,采用DCT算法存在失真,但是,只要量化表中的元素更科学、更 符合人类视觉敏感度,则压缩后的图像不会产生过大的视觉变化。,动态图像MPEG压缩编码技术,5.4,5.4.1 基本原理,1动态图像压缩主要解决的问题,1)正确区分静止图像和动态图像。2)提取动态图像中的
13、活动成分。3)进行帧之间的预测,提供压缩的依据。,图像的分类,3.,MPEG标准根据处理图像的性质,把图像分成以下三类:,1)帧内图像(Intra pictures)又称“I图像”,JPEG标准按照静止图像的模式进行压缩处理。主要利用静止图像自身的相关性进行编码,实现数据压缩的目的。帧内图像的压缩比属于中度压缩,典型的压缩像素编码为2 bit。,MPEG技术标准,5.4.2,MPEG-标准,诞生于1991年,主要特点:,1)以1.5Mb/s的速率传输视频信号,即压缩信号带宽为1.5Mb/s。2)以单通道64kb/s、128kb/s和192kb/s的传输速率传输音频信号。3)可通过差值运算,在3
14、52240画面分辨率上显示活动图像。4)分三个组成部分:视频、音频和系统。5)对于帧内图像,采用二维余弦变换、自适应算术编码、行程编码、变字长编码,以及差分脉冲编码(DPCM)进行压缩。6)帧间压缩采用运动补偿预测编码和运动补偿内插编码。,MPEG技术标准,5.4.2,MPEG-标准,主要特点,1)压缩信号带宽为415Mb/s,即信号传输速率为415Mb/s。2)支持NTSC制720480画面分辨率,PAL制720576画面分辨率,画面质量达到广播级,适用于HDTV高质量电视信号的传送与播放。3)解码器同时支持MPEG-和MPEG-两种标准。4)视频信号的传输速率为30帧/s,音频信号的质量达
15、到CD级。5)为了在画面质量、数据量和带宽之间寻求最佳值,允许在一定范围 内调整压缩比。6)最高压缩比为200:1,但由于画面中活动内容的多少和人为调整压缩 比等因素的影响,大多数情况下达不到最高压缩比。7)MPEG-用于DVD视频信号的压缩,DVD音频信号的压缩随制式的 不同而不同:PAL制采用MPEG-;NTSC制采用AC3压缩标准。,第5章 多媒体数据压缩技术,小结,5.1 数据压缩基本原理 5.1.1 信息、数据与编码 5.1.2 数据压缩的条件 5.1.3 数据冗余5.2 数据压缩算法 5.2.1 数据压缩算法分类 5.2.2 预测编码原理 5.2.3 变换编码原理 5.2.4 统计
16、编码原理 5.2.5 霍夫曼编码原理 5.2.6 行程编码原理,5.2.7 算术编码原理 5.2.8 LZW压缩编码5.3 静态图像JPEG压缩编码技术 5.3.1 JPEG标准的由来 5.3.2 JPEG压缩算法 5.3.3 无失真预测编码 5.3.4 有失真DCT压缩编码5.4 动态图像MPEG压缩编码技术 5.4.1 基本原理 5.4.2 MPEG技术标准,习题五,5.1 数据压缩的理由有哪些?5.2 什么是数据冗余?5.3 冗余有多少种?分别是什么?5.4 无损压缩编码指的是什么?5.5 数据压缩具备哪两个过程?5.6 霍夫曼编码的特点是什么?5.7 采用JPEG压缩格式的静态图像具有哪些主要特点?5.8 动态图像压缩主要解决哪些问题?5.9 MPEG-标准具有哪些主要特点?,