多媒体数据压缩.ppt

上传人:夺命阿水 文档编号:248116 上传时间:2023-03-23 格式:PPT 页数:105 大小:653.50KB
返回 下载 相关 举报
多媒体数据压缩.ppt_第1页
第1页 / 共105页
多媒体数据压缩.ppt_第2页
第2页 / 共105页
多媒体数据压缩.ppt_第3页
第3页 / 共105页
多媒体数据压缩.ppt_第4页
第4页 / 共105页
多媒体数据压缩.ppt_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《多媒体数据压缩.ppt》由会员分享,可在线阅读,更多相关《多媒体数据压缩.ppt(105页珍藏版)》请在课桌文档上搜索。

1、第三章 多媒体数据压缩,本章提纲,多媒体数据压缩的概念和分类常用的压缩编码方法音频压缩标准图像和视频压缩标准,3.1 多媒体数据压缩的概念和分类,多媒体数据压缩的重要性数据冗余的类型数据压缩技术的性能指标数据压缩方法的分类,3.1.1 多媒体数据压缩的重要性,多媒体数据压缩编码是信息产业的关键技术多媒体技术最大的难题是海量数据存储以及电视信息数字化之后的数据传输,数据量是否等于信息量,电视信号512*512*8*3=6291456=6.3Mb/s6.3*30fps=188Mb/s188/8=23.5MB/s650MB光盘/23.5=27.5s,语音信号正常人说话频率20Hz-4KHz采样定律采

2、样精度8位4KHz*2*8=64Kb/s=8KB/s与电视信号相比23.5MB/8KB=3000倍,陆地卫星陆地卫星(Land Sat-3)其水平和垂直分辨率分别为2340和3240,四波段,采样精度7位2340*3240*4*7=212Mb按每天30幅计,每天数据量为212*30=6.36Gb每年的数据量高达2300Gb,如此巨大的数据量给存储器的传输容量、通信干线的信道传输率以及计算机的运算速度都增加了极大的压力单纯用扩大存储容量、增加通信干线的信道传输率是不现实的数据压缩是行之有效的方法,信息量和数据量的关系,I=D-duI:信息量D:数据量du:冗余量,3.1.2 数据冗余的类型,冗余

3、:信息存在的各种性质的多余度。冗余例子中文广播员一分钟180个汉字,一个汉字2个字节,共360字节采样一分钟:8k*60*8/8=480kB/分钟480kB/360B=1000倍冗余,冗余例子中文百科全书扫描进计算机200万字*2=4MBB5扫描(182*257mm 300dpi 12pixel/mm)185*257*12*12*8/8=6.84MB200万字以1000页计算,数据量6.84GB图像、视频数据冗余量更大,数据冗余的类型,空间冗余时间冗余信息熵冗余视觉冗余听觉冗余结构冗余知识冗余,1、空间冗余,在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,在数字化图像中表现为冗余示

4、例,空间冗余,统计上认为其像素的信息存在冗余,这是冗余的一种。图像的冗余信息会产生生理视觉上的多余度,去掉这部分图像数据并不影响视觉上的图像质量,甚至对图像的细节也无多大影响,这说明数据具有可压缩性。可以在允许保真度的范围内压缩待存储的图像数据,以大大节省存储空间,同时在图像传输时也会大大减少信道的负荷。,2、时间冗余,它反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。示例,空间冗余和时间冗余是把图像信号看作概率信号时所反映出的统计特性,因此,这两种冗余也被称为统计冗余。,3、信息熵冗余,信息量:从N个相等的可能事件中选出一个事

5、件所需的信息度量和含量信息熵:指一堆数据所带的信息量,平均信息量就是信息熵(entropy),例如:从64个数中选出某个数。可先问是否大于32?从而消除半数的可能这样只需6次即可选出某个数每提问一次得到1 bit信息量,在64个数中选中某数所需的信息量是log2 64=6 bit,信息量:从N个相等的可能事件中选出一个事件所需的信息度量和含量,信息量和事件出现的概率有关,概率越大,信息量越小;概率越小,信息量越大I(x)=IP(x)=loga(1/P(x)=-logaP(x)若a=2 则信息量度量单位为bit 若a=e 则信息量度量单位为nit 若a=10,则信息量度量单位为哈特莱,如果将信源

6、所有可能事件的信息量进行平均,就得到了平均信息量。信息熵=平均信息量,信息熵:指一堆数据所带的信息量,平均信息量就是信息熵(entropy),信息熵冗余,无失真编码定理:无失真编码极限=信源所含平均信息量(熵)信源编码时,当分配给第i个码元类的比特数 b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。,4、视觉冗余,人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存

7、在着视觉冗余。,5、听觉冗余,人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余,6、结构冗余,数字化图像中的物体表面纹理等结构往往存在着冗余,这种冗余称为结构冗余。当一幅图有很强的结构特性,纹理和影像色调等与物体表面结构有一定的规则时,其结构冗余很大。例如,草席的纹理很规范清晰,它的图像就存在结构冗余。,7、知识冗余,由图像的记录方式与人对图像的知识差异所产生的冗余称为知识冗余。人对许多图像的理解与某些基础知识有很大的相关性。例如人脸的图像建筑物中的门、窗的形状、位置等等这类规律性的结构可由先验知识和背景知识得到。人具有这样的知识,但计算

8、机存储图像时还得把一个个像素信息存入,这就是知识冗余。,3.1.3 数据压缩技术的性能指标,评价压缩技术的三个指标压缩比恢复效果压缩算法复杂度、速度另外也必须考虑每个压缩算法所需的硬件和软件。,无损压缩(图象质量不变)有损压缩,3.1.4 数据压缩方法分类,根据解码后数据与原始数据是否完全一致可以分为两大类:无损压缩法:采用可逆编码方法实现的压缩称为无损压缩。这种方法的解码图像与原始图像严格相同,即压缩是完全可恢复的或没有偏差的。压缩比在2:15:1,又称冗余压缩法,熵编码法有损压缩法;采用不可逆编码方法实现的压缩称为有损压缩。这种方法的还原图像较之原始图像存在一定的误差,但选择的压缩率应使视

9、觉效果可被接受。压缩比几十到几百。又称熵压缩法,数据压缩方法分类,数据压缩方法,预测编码变换编码统计编码(熵编码)哈夫曼编码行程编码算术编码其它:子带编码、运动估计,1、预测编码(Prediction Coding),预测编码的基本原理是统计冗余数据压缩理论的三个重要分支之一,用预测编码减少数据时间和空间的相关性,如果有一个数,通过数学模型能够精确地产生数据源,则不需要传输这个数,通过以往的样本值,预测,将预测值与实际值相减,对差进行编码,预测编码的基本思想建立一个数学模型,利用以往的样本数据,对新样本值进行预测,将预测值与实际值进行相减,对其差进行编码差值很小,可以减少编码码位,典型的预测编

10、码方法DPCM(Differential Pulse Code Modulation):差分脉冲编码调制ADPCM(Adaptive DPCM):自适应的差分脉冲编码调制,1、预测编码,在多媒体通信的图像传输上使用预测编码是常用的方法,图像压缩中的“未来”是指下一个像素、下一条线或下一帧,一般景物在这三方面都有一定程度的冗余。同一帧图像内,相邻像素之间的相关性比较强,任何一像素均可以由与它相邻的且已被编码的点来进行预测估计。连续的若干帧中,“未来”的帧中也会有许多地方保留了“过去”的部分,如背景或静止的地方等。,1、预测编码,关键:建立一个理想的预测器(数学模型)如果能找到一个数学模型完全代表

11、数据源,那么在接收端就能依据这一数学模型精确地产生出数据。但是,现实中的系统是无法找到一个完整的、贴切的数学模型的。实际上能找到的最好的预测器只能以某种最小化的误差对下一个采样作预测。,1、预测编码,优点可以去除数据的时间和空间冗余,直观、简捷和易于实现,特别是用于硬件实现。在传输速度要求很高的应用中,大多选用此方法。缺点预测方法的不足使压缩能力有限,DPCM一般只能压缩到2-4bit/像素。,2、变换编码(Transformation Coding),其实质是一种函数变换,从一个信号域变换到另一个信号域,使其更适于压缩该过程是可逆的如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号

12、,在频域中信号的能量较集中,再进行采样、编码就可以压缩数据。,2、变换编码,变换本身是可逆的,因而其也是一种无损技术。然而,为了取得更满意的结果,某些重要系数的编码位数比其他的要多,某些系数干脆就被忽略了。这样,该过程就成为有损的了。数学家们已经构造了多种数学变换。除了傅里叶变换外,还有余弦、Hadamard、Haar、Karhunen-Loeve(K-L)变换。最实用最常用的数学变换是离散余弦变换(DCT)。,3、统计编码(熵编码),原理:变字长编码定理若各码字长度严格按照所对应符号出现概率的大小逆序排列,则其平均码长最小根据变字长编码定理,概率大的用短码字表达,反之用长码字表达。统计编码的

13、目的是减少符号序列的冗余度,提高符号的平均信息量。,3、统计编码,它根据符号序列的统计特性,寻找某种方法把符号序列变换为最短的码字序列,使各码元承载的平均信息量最大,同时保证无失真地恢复原来的符号序列。如数字序列:742300000000000000000055 编码为:7423Z1855,3、统计编码,典型的熵编码方法哈夫曼编码方法(利用信源概率分布特性)行程编码方法(利用相关特性)算术编码(利用概率分布特性),哈夫曼编码,Huffman在1952年提出了对统计独立信源达到最小平均码长的编码方法,又称最佳码。从理论上可以证明,这种编码具有即时性和唯一可译性。Huffman编码的基本原理是按信

14、源符号出现的概率大小进行排序,出现概率大的分配短码,反之则分配长码。,哈夫曼编码,求信息熵信源有4个符号,信息熵:H(x)=-1/2log2(1/2)-1/4log2(1/4)-1/8log2(1/8)*2=1/2+1/2+3/4=1.75 bit/字符,哈夫曼编码,编码步骤信源符号按概率大小排列出现概率最小的两个符号概率相加,合成一个概率将合成概率看作一个新组合的符号概率,重复上述做法,直到最后只剩下两个符号概率为止反过来逐步向前编码,每一步两个分支,各赋予一个 二进制代码,对信源进行Huffman编码,信源a1a2a3a4,概率1/21/41/81/8,1/4,0,1,0,1,1/2,0,

15、1,1,码字010110111,平均码长L=1/2*1+1/4*2+1/8*3+1/8*3=1.75 bit/字符=H(x)编码效率100%,码长1233,哈夫曼编码,编码码字长度不均匀在信源符号概率不均匀时效率高;若信源符号概率均匀,则不用huffman编码,行程编码(run-length coding),又称运行长度编码或游程编码,该压缩算法是将一个相同值的连续串用一个代表值和串长来代替。以图像编码为例,可以定义在特定方向上具有相同灰度值的相邻像素为一轮,其延续长度称为连续的行程,简称为行程。行程终点位置由到前一行终点的相对距离确定,这样就可以由灰度行程来表示图像数据。例如,若沿水平方向有

16、一串(M个)像素具有相同的灰度 N,则行程编码后,只传递两个值(N,M)就可以代替M个像素的M个灰度值N。,行程编码,分为定长行程编码和变长行程编码两种对传输差错很敏感一位符号出错就会改变行程编码的长度,从而使整个图像出现偏移,因此一般要用行同步和列同步的方法把差错控制在一行一列之内。一组连续同值的若干像素可用两个值表示:像素的值和同值像素的个数。对于有许多相同颜色的图像区域,这种算法的压缩效果是很明显的。,行程编码,例如有一串数码为000011111000,按上述的表示方法,则它的行程码为0453。第一位表示该数码串的首码0;第二位表示有4个连续的0;第三位表示有5个连续的1;第四位表示l以

17、后是3个0。由于二进制数的码非0即 l,因此无须在04后再写 l。,算术编码(arithmetic coding),算术编码方法不是将单个信源符号映射成一个码字,而是把信源符号表示为实数0到1之间的一个区间,其长度等于该消息的概率。消息序列中的每个元素都要用来缩短这个区间。消息序列中元素越多,所得到的区间就越小,就需要更多的数位来表示这个区间。再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。原理,算术编码,算术编码的特点不需要码表当信源符号概率比较接近时,算术编码效率高于哈夫曼方法实现方法复杂,尤其是硬件实现 JPEG成员对多幅图像的测试结果表明,算术编码比哈夫曼编码能提高5

18、左右的效率。在JEPG的扩展系统中,用算术编码方法取代了哈夫曼方法。,3.3 音频压缩标准,音频压缩编码的基本方法电话质量的语音压缩标准调幅广播质量的压缩标准高保真立体声压缩标准,3.3.1 音频压缩编码的基本方法,3.3.2 电话质量的语音压缩标准,ITU建议的用于电话质量的语音压缩标准,3.3.3 调幅广播质量的压缩标准,调幅广播质量音频信号的频率范围是50Hz7KHz,又称“7KHz音频信号”,当使用16KHz的采样频率和14bit的量化位数时,信号速率为224Kbps。1988年ITU制定了G.722标准,它可把信号速率压缩成64Kbps。,3.3.4 高保真立体声音频压缩标准,高保真

19、立体声音频信号的频率范围50Hz20KHz,在44.1KHz采样频率下用16bit量化,信号速率为每声道705Kbps。目前国际上比较成熟的高保真立体声音频压缩标准为“MPEG音频”。MPEG是动态图像编码的国际标准,“MPEG音频”是该标准中的一部分。,3.4 图像和视频压缩标准,静止图像压缩标准JPEG运动图像压缩标准MPEG系列MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21视频通信编码标准H.261、H.263运动静止图像专家组的M-JPEG其它:Real-Networks的RealVideo、微软公司的WMT以及Apple公司的QuickTime等,3.4.1

20、静止图像压缩标准JPEG,1986年ISO和CCITT成立联合图片专家组(Joint Photographic Experts Group)1992.1 提出“多灰度静止图像的数字压缩编码”(简称JPEG标准)草案主要制订静态图像帧内压缩编码ISO/IEC 109181994.2 正式第一次编辑出版,JPEG标准采用了混合编码方法,定义了两种基本压缩算法:基于DCT变换并应用行程编码和熵编码的有损压缩算法,压缩率1011001基于空间线性预测技术(即DPCM)的无损压缩算法,压缩率大约为41,JPEG编码框图,原图像数据,8*8块,DCT变换,量化器,熵编码器,压缩图像数据,表说明,表说明,J

21、PEG标准,适用于彩色和单色多灰度或连续色调静止数字图像的压缩,可支持很高的图像分辨和量化精度有损压缩,压缩比大,通常压缩2040倍时,人眼基本看不出失真,JPEG标准,JPEG算法主要存储颜色变化,尤其是亮度变化,因为人眼对亮度变化要比对颜色变化更为敏感。只要压缩后重建的图像与原来图像在亮度变化、颜色变化上相似,在人眼看来就是同样的图像。其原理是不重建原始画面,而生成与原始画面类似的图像,丢掉那些未被注意到的颜色。,JPEG2000,高压缩率无损压缩渐进传输感兴趣区域压缩色彩模式丰富图像处理更简单,3.4.2 运动图像压缩标准MPEG,1988年成立了MPEG-Motion Picture

22、Expert Group它吸收了JPEG和H.261标准1992年正式通过ISO/IEC 11172运动图像压缩编码标准MPEG-1,1993年8月第一次正式出版1995年5月正式编辑出版ISO/IEC 13818 MPEG-2,3.4.2 运动图像压缩标准MPEG,MPEG的缔造者们原先打算开发四个版本:MPEG1到MPEG4,以适用于不同带宽和数字影像质量的要求,后来MPEG3被放弃。MPEG优于其他影像压缩方案的地方是具有很好的兼容性压缩比最高可达200:1数据的损失小,(1)MPEG-1标准,MPEG-1标准(ISO/IEC11172).1992年发布。该标准分为视频、音频和系统三部分

23、。它是一个通用标准,既考虑了应用要求,又独立于具体应用之上。可适用于不同带宽的设备,如CDROM、VideoCD、CDi。它的目的是把221Mbps的NTSC图像压缩到1.2Mbps,压缩率为2001。这是图像压缩的工业认可标准。,可针对SIF标准分辨率(对于NTSC制为352240;对于PAL制为352288)的图像进行压缩,传输速率为1.5Mbps,每秒播放30帧,用256kbps速率可进行立体声编码,具有CD音质,质量级别基本与VHS(广播级录像带)相当。MPEG-1的编码速率最高可达45Mbps,但随着速率的提高,其解码后的图像质量有所降低。,MPEG数据流的结构,数据流视频流(运动序

24、列)包括序列头一组或多组图像序列序列尾,图像序列层,图像组层,图像层,宏块片层,宏块层,Y,Cb,Cr,块层,MPEG-1标准的图像帧类型,帧内帧(Intra Picture),预测帧(Predicted Picture),插补帧(Bidirectional Picture),MPEG1标准编码原理,采用了两种基本压缩技术为减少时间冗余,采用1616个象素组成的像素块的运动补偿技术为减少空间冗余,采用88图像块的DCT变换技术,时间冗余的减少运动补偿技术在MPEG1标准中,一帧图像分成许多宏块,作为估算运动的基本单元,称为运动补偿单元。一个宏块由一个1616的亮度信息和两个88的色度信息组成,

25、运动补偿以宏块为单位进行预测。预测时在已经知道的图像帧中查找与当前块相近的图像块,用二维的运动矢量来描述宏块的运动补偿预测值,然后将当前宏块的实际数据减去预测值以得到预测误差。,空间冗余的减少DCT变换在运动补偿预测和运动补偿插值之后,将差值图像或插值图像分割成88的图像块,然后对每一块做DCT变换和量化,再用二维的行程长度编码(RLE)及可变长度编码(VLC)技术对这些系数进行编码。采用MPEG1算法,可以把数字电视图像信号压缩到每个编码像素为0.51bit。对于35224030帧/秒的数字电视图象,数据率从71Mb/s压缩到1.2Mb/s。经解压缩还原得到的彩色电视图像的质量与VHS的质量

26、相当。,MPEG-1标准的特点,有损的,非平衡编码有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x CD-ROM的速率压缩也能达到VHS的图像质量和高保真立体声的效果非平衡编码意味着压缩一幅图像比解压缩慢的多,MPEG1标准的应用,应用领域VCDMP3音乐数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。,(2)MPEG-2标准,MPEG2标准(ISO/IEC13818).1994年发布。设计目标:提供高级工业标准的图像质量以及更高的传输率。MPEG-2标准的视频数据速率为4.15Mbs,典

27、型传输速率为10Mbps,与MPEG-1兼容,适用于1.5Mbps100Mbps速率的编码范围。能提供720480(NTSC)或720576(PAL)分辨率的广播级质量的视像,适用于包括宽屏幕和高清晰度电视(HDTV)在内的高质量电视广播。,(2)MPEG-2标准,能够提供CD级的音质。MPEG2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道和多达七个伴音声道。可提供一个较广范围的可变压缩比,以适应不同的画面质量、存储容量以及带宽的要求。能够对分辨率可变的视频信号进行压缩编码,可在301或更低的压缩比时提供广播级的质量。,MPEG-2标准,解码器通常支持MPEG-1和MPEG-2两

28、种标准压缩比可高达2001,能够以每秒30帧的速度播放全屏幕的影像。实际的压缩比依赖于节目的内容和所需的重放质量。运动和背影的变化越多,所得到的压缩比就越低。,MPEG-2应用领域,视音频资料的保存 电视节目的非线性编辑卫星传输电视节目的播出,MPEG-1与MPEG-2的对比,MPEG-1是以CD-ROM等存储媒体为主要对象的,上限比特速率限制为1.5Mbps;而MPEG-2是通用编码,有多领域的应用对象,上限比特速率根据等级分别界定共同点:两种编码都在编码器内部对输入图像进行运动预测,将其残差信号依次进行DCT、量化、之字型扫描、可变长度编码,解码器内进行的是编码器的逆处理从而得到解码图像,

29、MPEG-1和MPEG-2的对比,(1)图像格式MPEG-1只能处理逐行扫描图像,而MPEG-2不仅能处理逐行扫描图像,还能处理隔行扫描图像。在色差格式方面,用MPEG-1只能处理420格式,而MPEG-2还能处理422格式和444格式。也就是说,用MPEG-2可处理几乎现有的所有图像格式。(2)图像质量由于能适应各种图像格式和具有高质量编码图像所需的技术(编码方式的单元技术),MPEG-2可提供比 MPEG-1更高质量的图像。,MPEG-1和MPEG-2的对比,(3)比特流的可改变性可改变性是指由一个比特流可解码成两种以上空间分辨率时间分辨率信噪比都不一样的图像。这几种可改变性既可单独使用,

30、也可组合使用。MPEG-2可提供3种可改变模式:空间可改变性、时间可改变性和信噪比可改变性。(4)兼容性MPEG-2语法完全包含了MPEG-1语法,具有对MPEG-1的向后兼容性。使用空间可改变性,可将MPEG-1比特流与MPEG-2比特流混合传送。,(3)MPEG-4标准,MPEG-4专家组成立于1993年。在1995年3月的Florence会议上初步定义了一个音频验证模型(Verification Model),并于1996年1月在Munich会议上定义了第一个视频验证模型,它提供了支持基于内容的视频表达环境。运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC1

31、4496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。,(3)MPEG-4标准,目标:最初目标是适用于以移动电视电话为主要用途的64kbps以下的低速率;随着网络图像通信的发展,目标变为在多媒体环境中允许视频数据的有效存取,传输和操作。MPEG-4提供了一组工具与算法,通过这些工具与算法,从而支持诸如高效压缩,视频对象伸缩性,空域和时域伸缩性,对误码的恢复能力等功能。因此,MPEG-4视频标准就是提供上述功能的一个标准化工具箱。,MPEG-4的编码理念是:基于对象在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输

32、到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。,MPEG-4用运动补偿消除时域冗余,用DCT消除空域冗余;为支持基于对象编码,MPEG-4还采用形状编码和与之相关的形状自适应DCT(SA-DCT)技术以支持任意形状视频对象编码。,MPEG-4特点,高速压缩基于内容交互基于内容分级扩展,MPEG4应用领域,因特网视音频广播 无线通信电视电话静止图像压缩计算机图形、动画与仿真电子游戏,(4)MPEG-7标准,MPEG-7正式名称叫作“多媒体内

33、容描述接口”(Multimedia Content Description Interface),于98年10月提出总目标扩展现在有限的查询能力,使其包括更多的信息形式,即确立各种类型的多媒体信息标准化的描述方法。使网上的多媒体内容变成象现在的文本内容一样,具有可搜索性。,MPEG7的目标,支持多种音频和视觉的描述根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求支持数据管理的灵活性、数据资源的全球化和互操作性。,MPEG7,MPEG7 并不是一种压缩编码方法,而是一个多媒体内容描述接口。MPEG7 力求能够快速且有效地搜索出用户所需的不同类型的多媒体影像资料

34、,MPEG7的应用,数字化图书馆:图像分类目录、音乐字典等。多媒体目录服务 即黄页。广播式媒体选择:包括收音机频道、电视频道等。多媒体编辑:个人电子新闻服务、媒体著作。其它潜在的应用领域:教育、旅游信息、娱乐、购物 等。,MPEG-7启示,MPEG系列标准有一个原则:它不对编码方法做出规定,也就是说,它只规定最后的数据格式,而不管采用何种方法获得这些数据格式。这正是制订国际标准的一个重要原则。一方面,它为以后出现新的编码技术留下余地;另一方面,它为各大公司和研究所的技术竞争留下了宽广的舞台。,(5)MPEG21,制定MPEG-21标准的目的是将不同的协议、标准、技术等有机地融合在一起;制定新的

35、标准;将这些不同的标准集成在一起。MPEG-21标准其实就是一些关键技术的集成,通过这种集成环境就对全球数字媒体资源进行透明和增强管理,实现内容描述、创建、发布、使用、识别、收费管理、产权保护、用户隐私权保护、终端和网络资源抽取、事件报告等功能。,3.4.3 视频通信编码标准,(1)H.261CCITT于1988年针对可视通信的需要,提出电视电话、电视会议H.261建议,H.261标准的名称为“视听业务速率为p64kb/s的电视图像编解码”,即P64kb/s视频编/解码标准,并于1990年获得批准。,H.261,H.261的图像可分为全屏格式CIF:所需最低速率为320kbps亮度信号分辨率为

36、360*288色度信号分辨率为180*144四分之一屏格式QCIF:所需最低速率为64kbps亮度信号分辨率为180*144色度信号分辨率为90*72,P*64kb/s视频编码压缩P是一个可变参数,取值为130。P=1或2时,只支持QCIF格式,用于窄带电视电话、静止或准静止图像传送;当P6时,支持CIF格式,如电视会议等应用。由于位率的提高,复杂的画面能传送出去,画面质量也得到了提高和改善。,P64kb/s视频编码压缩算法,是采用混合编码方案,即基于DCT的离散余弦变换编码方法和带有运动预测的差分脉冲编码调制(DPCM)编码方法的混合。P64kb/s标准的压缩算法与MPEG压缩算法有许多共同

37、之处,只是传输速率P64kb/s覆盖较宽的信道频带(当P取值不同时速率不同),而MPEG是基于较窄的频带上传输。,(2)H.263,H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。,H.263,.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;数据流层次结构的某些部分在H.263中是可选的,使得

38、编解码可以配置成更低的数据率或更好的纠错能力;H.263包含四个可协商的选项以改善性能;H.263采用无限制的运动向量以及基于语法的算术编码;采用事先预测和与MPEG中的P-B帧一样的帧预测方法;H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,3.4.4 M-JPEG标准,M-JPEG(Motion-Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可

39、进行精确到帧的编辑M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩,故压缩效率不高。,M-JPEG标准,M-JPEG的优点是:可以很容易做到精确到帧的编辑、设备比较成熟缺点是压缩效率不高 M-JPEG这种压缩方式并不是一个完全统一的压缩标准,不同厂家的编解码器和存储方式并没有统一的规定格式。这也就是说,每个型号的视频服务器或编码板有自己的M-JPEG版本,所以在服务器之间的数据传输、非线性制作、网络向服务器的数据传输都根本是不可能的。,3.4.5 其它压缩标准,Real Video 是Real Networks公司

40、开发的在窄带(主要的互联网)上进行多媒体传输的压缩技术。WMT WMT是微软公司开发的在互联网上进行媒体传输的视频和音频编码压缩技术,该技术已与WMT服务器与客户机体系结构结合为一个整体,使用MPEG-4标准的一些原理。,QuickTime QuickTime是一种存储、传输和播放多媒体文件的文件格式和传输体系结构,所存储和传输的多媒体通过多重压缩模式压缩而成,传输是通过RTP协议实现的。,国际标准小结,标准化是产业化成功的前提早期的视频服务器产品基本都采用MJPEG标准,开创视频非线性编辑时代H.261、H.263推动了电视电话、视频会议的发展。MPEG-1成功地在中国推动了VCD产业MPEG-2标准带动了DVD及数字电视等多种消费电子产业,其它MPEG标准的应用也在实施或开发中Real-Networks的Real Video、微软公司的WMT以及Apple公司的QuickTime带动了网络流媒体的发展,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号