本书精辟阐述了数字视频系统工程理论,涵盖了标准清晰度电视(SDTV)、高清晰度电视(HDTV)和压缩系统,并包含了大量的插图。内容主要包括了:基本概念的数字化、采样、量化和过滤,图像采集与显示,SDTV和HDTV编码,彩色视频编码,模拟NTSC和PAL,压缩技术。本书第2版涵盖新兴的压缩系统,包括NTSC、PAL、H.264和VP8 / WebM,增强JPEG,详细的信息编码及MPEG-2系统、数字视频处理中的元数据。适合作为高等院校电子与信息工程、通信工程、计算机、数字媒体等相关专业高年级本科生和研究生的“数字视频技术”课程教材或教学参考书,也可供从事视频开发的工程技师参考。
本书从基本概念、基础理论、实际问题、演播室标准、视频压缩、发行标准6个方面系统阐述了数字视频与高清技术。作者多年从事数字视频与高清技术方面的学术及工程应用研究,书中对基本概念的诠释极为精准,这在同类书籍中较为罕见。本书适合作为高等院校计算机、电子与信息工程、通信工程、数字媒体等相关专业高年级本科生和研究生的“数字视频技术”课程教材或教学参考书,也可作为工程技术人员的参考资料或培训教材。
本书特色
呈现了数字化、采样、量化、伽马、滤波的基本概念。
介绍了基于文件的工作流概念,强调了元数据的新兴领域。
保留了少量但必要的公式,高质量的图示,便于读者理解理论概念。
讨论了新的母带处理中用到的参考显示可观看条件。
介绍了立体(3D)视频相关知识。
作者简介
查尔斯·波因顿(Charles Poynton) 美国电影与电视工程师学会(Society of Motion Picture and Television Engineers,SMPTE)会士,并于1993年因在计算与通信集成视频技术方面的杰出贡献被授予David Sarnoff金奖。1981年,他创立了伯顿矢量公司,同年为美国宇航局的约翰逊航天中心设计数字电视处理设备。他还著有《A Technical Introduction to Digital Video》。
自2003年年初本书第1版问世以来,视频技术不断发展,视频和计算机图形学两者进一步地“融合”(Jim Blinn称之为碰撞)。电视正在没落,而计算机技术和网络传输正高奏凯歌。如今,哪怕“TV”这个缩写也是值得怀疑的:在过去的半个世纪中,TV意味着广播,但今天大部分的视频——来自苹果的iTunes商店、Hulu、Netflix、YouTube等——都不是传统意义上的广播。在这一版中,我用SD(标清)和HD(高清)取代SDTV(标清电视)和HDTV(高清电视)。
现在,数字视频无处不在,而图P1所示的模拟扫描已过时。在这一版中,我把像素阵列提高到首要地位。第1版介绍了扫描线,而这一版改用图像行和图像列。这一版删除了微秒,改用样本计数;删除了毫伏,改用像素值。第1版中“巨大的数据容量”等已经被“相当大”或甚至“适中的数据容量”代替。
已经过时。在现代视频和高清中,图像为像素阵列的形式。任何著作若用此类图描述图像的采集或显示,都没有准确地描述数字视频
图P1模拟扫描
在我1996年出版的第一本书《数字视频技术介绍》和本书第1版中,我先介绍编码,然后介绍解码。从工程角度来看,这样的顺序是有道理的。然而,现在我认为这样的顺序里隐藏着一条深深的哲学裂痕。一旦节目素材准备就绪,经过解码并在演播室的参考显示器上播放,同时进行加工,也就是在下行流最终审定播出后,只有解码和显示过程才重要。为了在再次观看时显示一幅逼真的图像而进行图像数据采样和编码还算方便,但在加工时解码并显示图像数据的难度太高。如果创作人员在编码时为了达到某个美学效果而歪曲了颜色,例如,他们将黑电平提升015倍,或将色调旋转123°——经典编码方程便不再适用,但这些图像数据的修改并不是编码出错引起的,而是创作意图运用的结果。传统的观念认为编码过程是固定的,但真正重要的是解码过程才是固定的。我提倡的原则很像MPEG的原则,精确定义了解码器,而只要产生的是合法的位流,编码器被允许做任何事。这一版里我强调解码。第2章作为新的一章,概述了这一哲学观点。
视频技术涉及的领域很广。对于本书重点阐述的图像编码,尤其是视觉科学、色彩学、图像学、信号处理与视频技术之间的关系。
如果别处有关于某一章主题的延伸、权威的信息,那么该章的结尾处会有“延伸阅读”部分。
SMPTE是许多老式标准和现代标准的根源。在本书第1版和第2版相隔出版的时间里,SMPTE弃用了许多历史标准的M后缀,而给标准加上ST前缀(并列使用EG表示工程指南,以及RP表示实践建议)。本书根据新的命名引用近期的SMPTE标准。
来到2012年,我们可以肯定地说,模拟电视技术和复合电视技术已经过时。写作本书第1版时,我把精力集中在我认为不会迅速改变的事情上。然而,第1版中可能有15%或20%的内容介绍了现在会被归类为“老式”的技术,主要是模拟电视和复合电视,以及NTSC和PAL。由于对自己花了数百或数千小时写就的内容难以割舍,我虽然把这部分内容拿掉了,但却将其放在《Composite NTSC and PAL: Legacy Video Systems》书中,在wwwpoyntoncom/CNPLVS/上可免费获得。
据说一本书中每出现一个公式就会让潜在的读者减少一半。对于本书,我希望读者在计算过10个公式之后,数量下降到2-10!本书保留了部分公式,但这些公式一般对于理解概念并非必需。如果你被某个公式吓到了,可跳过它,如果你愿意计算的话,也可以稍后再回来。我希望读者能用Bringhurst建议的关于页面组成原则的数学描述的方法来看待数学公式。在其经典著作《字体风格的要素》的第8章,Bringhurst说道:“数学在此不是强加给任何人的苦差事。相反,它们在此完全是为了娱乐。它们的目的是为了愉悦那些也许是希望把事情做得更好而乐意检验自己正在做的或要做的或已做的事情的读者。那些在任何时候都更喜欢直接行动而把分析留给别人的读者,在本章中也会满足于研究图画而忽略文字。”
在写作本书时,我小心翼翼地避免引入错误。不过,尽管我和我的审稿人尽了最大的努力,但仍可能会有一些错误。就像我的前一本书一样,我将为这本书编写勘误表,并放在wwwpoyntoncom/DVAI2/中。请在此页面报告您发现的任何错误,我将努力订正它并把这归功于你!
Charles Poynton
2012年1月于多伦多
数字视频
本书从基本概念、基础理论、实际问题、演播室标准、视频压缩、发行标准6个大的方面系统阐述了数字视频与高清技术。作者多年从事数字视频与高清技术方面的学术及工程应用研究,书中对基本概念的诠释极为精准,这在同类书籍中较为罕见。本书适合作为高等院校计算机、电子与信息工程、通信工程、数字媒体等相关专业高年级本科生和研究生的“数字视频技术”课程教材或教学参考书,也可作为工程技术人员的参考资料或培训教材。
本书特色:
·呈现了数字化、采样、量化、伽马、滤波的基本概念。
·介绍了基于文件的工作流概念,强调了元数据的新兴领域。
·保留了少量但必要的公式,高质量的图示丰富,生动易懂,便于读者理解理论概念。
·讨论了新的母带处理中用到的参考显示可观看条件。
·介绍了立体(3D)视频相关知识。
[加]查尔斯?波因顿(Charles Poynton)著:
查尔斯·波因顿(Charles Poynton),美国电影与电视工程师学会(SMPTE,Society of Motion Picture and Television Engineers)会士,并在1993年因在计算与通信集成视频技术的杰出贡献被授予David Sarnoff金奖。1981年,他创立了伯顿矢量公司,同年为美国宇航局的约翰逊航天中心创建数字电视处理设备设计。他还著有《A Technical Introduction to Digital Video》 (Wiley, 1996; ISBN 0-471-12253-X)。
刘开华 褚晶辉 马永涛 吕卫 宫霄霖 等译:暂无简介
图像是人类认识世界并且传递信息的重要技术手段,数字视频就是以数字形式记录的连续图像信息。随着计算机技术和智能设备的快速发展,数字视频与高清技术已经渗透到人们的日常生活、工作和社会生产中。数字视频技术的发展必然会影响人们生活和工作的方方面面,随着科学技术的不断发展,数字视频技术的应用领域将会不断扩大。
本书从基本概念、基础理论、实际问题、演播室标准、视频压缩、发行标准6个大的方面系统阐述了数字视频与高清技术。作者多年从事数字视频与高清技术方面的学术及工程应用研究,在书中对基本概念的诠释极为精准,这使得本书在同类书籍中脱颖而出。希望本书中文版的发行能吸引我国更多的科研人员从事相关的理论研究和系统研制,提高国内学者在数字视频和高清技术方面的基础素养,为将来的创新研究打下基础。
全书由褚晶辉、吕卫、马永涛和宫霄霖共同翻译,全书的译文由刘开华教授统一术语、格式,并进行一致性检查和统稿。在翻译的过程中,译者对原著关于图的细微描述做了删减,对原著的排版格式进行了修改,以适应国内读者的习惯。刘开华教授课题组的研究生薛蒙蒙、付伟、汪忠伟、徐文会、张忍、王晶、沈郭浩、申倩伟、曾亚辉对本书翻译做出很大贡献,在此表示谢意!感谢机械工业出版社积极引进本书,使得本书中文版能够尽快与读者见面。
在本书的翻译过程中,我们力求忠实、准确地表达原著的本意,同时保留原著的写作风格。尽管数字视频与高清技术是译者从事科学研究的重要方向,但由于水平有限,译文中难免存在一些错误和不当之处,敬请广大读者批评指正。
本书适合作为高等院校计算机、电子与信息工程、通信工程、数字媒体等相关专业高年级本科生和研究生的“数字视频技术”课程教材或教学参考书;也可作为工程技术人员的参考资料或培训教材;还可供在视频技术、图像处理与通信、电视工程技术、影视技术、多媒体技术、电影技术等领域从事研究、开发、生产及维护的科技人员阅读、参考。
译者
2017年4月
出版者的话
译者序
前言
致谢
第一部分引言
第1章光栅图像2
11幅型比概念3
12几何4
13图像采样4
14数字化4
141量化5
142一维采样5
143二维采样5
15感知均匀性5
16色彩6
17亮度和色差分量6
18数字图像的表示方法7
19标清和高清8
110方形采样8
111幅型比的比较9
112幅型比9
113帧频11
第2章图像的采样和显示12
21图像状态12
22EOCF标准13
23娱乐节目14
24图像获取14
25面向消费者的视频获取14
26消费类电子显示器15
第3章线性光和感知均匀性16
31对比16
32对比度17
33感知均匀性18
34“编码100”难题和非线性图像编码18
35线性和非线性21
第4章量化22
41线性度22
42分贝22
43噪声、信号和灵敏度23
44量化误差24
45全摆幅24
46演播室摆幅(下余量和上余量)25
47接口偏移量26
48处理编码26
49二进制补码回绕27
第5章对比度和明亮度28
51感知特性28
52显示处理信号的历史28
53数字驱动电平29
54信号和明度之间的关系30
55算法31
56黑色电平设置33
57对比度和明亮度控制的影响33
58交替传译35
59LCD中的明亮度和对比度控制36
510PDP中的明亮度和对比度控制36
511桌面图形的明亮度和对比度控制36
第6章计算中的光栅图像38
61特征图像的描述39
62光栅图像39
621二值图像39
622灰度图像40
623真彩色图像40
624伪彩色图像41
63不同类型之间的转换41
64图像文件42
65计算机图形学中的“分辨率”42
第7章图像结构43
71图像重建43
72采样孔径44
73光斑轮廓45
74“箱”分布46
75高斯分布46
第8章光栅扫描47
81闪烁率、刷新率和帧频47
82扫描简介48
83扫描参数48
84隔行扫描49
85抖动50
86模拟系统中的隔行扫描51
87隔行扫描和逐行扫描51
88扫描表示法52
89运动描绘53
810分段帧(24PsF)53
811视频系统的分类53
812系统之间的转换53
第9章分辨率55
91幅频响应和带宽55
92视觉灵敏度56
93观看距离和角度56
94克尔效应57
95分辨率58
96视频中的分辨率59
97观看距离59
98再谈隔行扫描59
第10章恒定照度61
101恒定照度原理61
102CRT补偿62
103从恒定照度的分离62
104亮度63
105照度转换成色度的“泄露”63
第11章图片渲染66
111环绕效果 66
112色调比例调整66
113渲染合并67
114桌面计算中的图像渲染68
第12章亮度和色度简介69
121亮度69
122照度简述69
123色差编码(色度)69
1231Y′PBPR70
1232Y′CBCR70
1233Y′UV70
1234Y′IQ70
124色度亚采样71
12414∶4∶471
12424∶2∶271
12434∶1∶171
12444∶2∶071
125色度亚采样符号71
126色度亚采样滤波器72
127复合NTSC和PAL的色度73
第13章SD分量介绍74
131扫描标准74
132宽屏(16∶9)SD76
133方形和非方形采样76
134重采样77
第14章复合NTSC和PAL的介绍78
141NTSC和PAL编码78
142NTSC和PAL解码79
143S视频接口80
144频率交织80
145复合模拟SD80
第15章HD介绍81
151HD扫描81
152BT709 HD彩色编码83
第16章视频压缩简介84
161数据压缩84
162图像压缩84
163有损压缩84
164JPEG85
165运动JPEG85
166JPEG 200086
167夹层压缩86
168MPEG87
169图像编码类型(I、P、B)87
1610重排 89
1611MPEG189
1612MPEG289
1613其他MPEG标准90
1614MPEG IMX90
1615MPEG490
1616H26490
1617帧内AVC91
1618WM9、WM10、VC1编解码91
1619CE采样压缩91
1620HDV91
1621AVCHD92
1622IP传输到用户的压缩92
1623VP8(WebM)编解码92
1624狄拉克(基本)92
第17章流和文件93
171历史概述93
172物理层94
173流接口94
174IEEE 1394(火线接口、iLINK)95
175HTTP实时流媒体(HLS)96
第18章元数据97
181元数据例1:CDDA97
182元数据例2:yuv文件98
183元数据例3:RFF98
184元数据例4:JPEG或JFIF99
185元数据例5:序列显示扩展100
186小结102
第19章立体(三维)视频104
191图像获取104
192S3D显示104
193立体电影104
194时间多路复用105
195偏光法105
196波长复用(光谱立体/杜比)106
197裸眼立体显示106
198视差屏障显示106
199立体光栅显示106
1910录制和压缩107
1911用户接口和显示107
1912幻影108
1913聚散度和调节108
第二部分理论
第20章滤波和采样110
201采样定理110
202对频率为05fS的信号进行采样111
203幅频响应112
204矩形函数的幅频响应113
205sinc(·)加权函数114
206点采样的频率响应114
207傅里叶变换对115
208模拟滤波器116
209数字滤波器116
2010冲激响应119
2011有限冲激响应滤波器119
2012滤波器的实际可实现性120
2013相位响应(群延迟)121
2014无限冲激响应滤波器121
2015低通滤波器122
2016数字滤波器设计124
2017信号重构125
2018接近05fS的重构125
2019“(sin x)/x”修正126
延伸阅读127
第21章重采样、插值和抽取128
2112∶1下采样129
212过采样130
213插值131
214拉格朗日插值131
215用于滤波的拉格朗日插值132
216多相插值器133
217多相抽头和相位134
218多相插值器的实现134
219抽取135
2110用于抽取的低通滤波器135
第22章图像数字化与重构136
221空间频域137
222梳状滤波138
223空域滤波139
224图像预采样滤波器139
225图像重构滤波器139
226空间(二维)过采样140
第23章感知和视敏特性142
231视网膜142
232适应性142
233对比灵敏度143
234对比灵敏度函数144
第24章照度和明度146
241辐射度和强度146
242照度147
243相对照度148
244红、绿、蓝的照度148
245亮度(CIE L)148
第25章CIE色度系统151
251视觉的基本原理151
252定义151
253光谱功率分布和三刺激值152
254光谱约束153
255CIE XYZ三刺激值155
256CIE [x,y]色品156
257黑体辐射157
258色温158
259白光158
2510色彩适应159
2511感知均匀颜色空间160
2512CIE L*u*v*系统160
2513CIE L*a*b*参数(CIE LAB)161
2514CIE L*u*v*和CIE L*a*b*总结162
2515色彩规范和彩色图像编码162
延伸阅读163
第26章视频色彩学164
261加性重建(RGB)164
262RGB基色特性165
263BT709基色166
264老式标清基色167
265sRGB系统168
266SMPTE无标度基色168
267AMPAS ACES基色168
268SMPTE/DCI P3 基色169
269CMF和SPD169
2610归一化和缩放175
2611照度系数175
2612RGB和CIE XYZ之间的转换176
2613矩阵化引入的噪声177
2614RGB系统之间的转换177
2615相机白色基准178
2616显示器白光基准178
2617色域178
2618宽色域重现179
2619自由尺度色域、自由尺度指数179
延伸阅读179
第27章伽马值181
271CRT物理学中的伽马值181
272惊人的巧合182
273视频系统中的伽马校正182
274光电转换函数183
275BT709 OECF184
276SMPTE 240M OECF185
277sRGB传递函数185
278标清的传递函数186
279位深度的需求187
2710现代显示设备中的伽马校正187
2711伽马估计188
2712视频、CGI和Macintosh中的伽马值189
2713计算机图形学中的伽马值191
2714伪彩色中的伽马值192
27158位线性编码的局限192
2716CGI中的线性和非线性编码192
第28章亮度与色差194
281色敏度194
282RGB和R′G′B′彩色立方体194
283传统的亮度、色差编码197
284照度和亮度标记198
285非线性红、绿、蓝(R′G′B′)199
286BT601亮度200
287BT709亮度200
288再论色度亚采样200
289亮度/色差总结200
2810标清和高清亮度的混乱202
2811亮度、色差分量集203
第三部分实际问题
第29章标清分量视频彩色编码206
291标清的B′Y′、R′Y′分量207
292标清的PBPR分量207
293标清的CBCR分量208
294从演播室RGB到Y′CBCR210
295从计算机RGB到Y′CBCR210
296“全摆幅”Y′CBCR 210
297Y′UV、Y′IQ的混淆211
第30章高清分量视频彩色编码213
301BT709高清B′Y′和R′Y′分量213
302BT709高清PBPR分量214
303BT709高清CBCR分量214
304xvYCC的CBCR分量215
305从演播室RGB到Y′CBCR 215
306从计算机RGB到Y′CBCR216
307高清和标清之间的转换216
308彩色编码标准217
第31章视频信号处理218
311边沿处理218
312过渡样值218
313图像行219
314SAL和SPW参数选择 219
315视频电平220
316建立电平(基座)220
317从BT601到计算机领域221
318增强221
319中值滤波 222
3110核心化223
3111色度转换改善223
3112混合与键控223
第32章帧频、场频、行频和采样率225
321场频225
322行频225
323声音副载波225
324添加复合彩色226
325NTSC彩色副载波226
326576i PAL彩色副载波227
3274fSC采样227
328常见的采样率227
329高清扫描的数字学228
3210音频速率229
第33章时间码230
331引言230
332丢弃帧时间码 230
333编辑231
334线性时间码231
335垂直间隔时间码232
336时间码结构232
延伸阅读232
第34章23下拉234
3412332下拉235
342将电影转换到不同的帧频 235
343原生24Hz编码237
344转换到其他帧频237
第35章去隔行239
351空间域239
352垂直时间域240
353运动自适应性241
延伸阅读242
第36章彩条243
361标清彩条243
362标清彩条标记法244
363PLUGE元素244
364使用彩条调整复合解码器244
365标清彩条中的-I、+Q和PLUGE元素245
366高清彩条245
第四部分演播室标准
第37章参考显示器和观看条件248
371简介248
372信号接口248
373参考基色(黑色、白色)248
374参考EOCF248
375参考观看条件249
延伸阅读249
第38章SDI和HDSDI接口250
381分量数字标清接口(BT601)250
382串行数字接口252
383分量数字HDSDI252
384SDI和HDSDI同步、TRS和辅助数据253
3854∶2∶2 SDSDI中的TRS253
386HDSDI中的TRS255
387模拟同步和数字/模拟时序关系255
388辅助数据255
389SDI编码256
3810HDSDI编码257
3811压缩视频接口257
3812SDTI257
3813切换和混合258
3814数字设备的时序258
3815ASI258
3816数字接口总结259
第39章480i分量视频260
391帧频260
392隔行扫描260
393行同步261
394场/帧同步262
395R′G′B′ EOCF和三基色263
396亮度(Y′)263
397图像中心、幅型比和消隐263
398半行消隐264
399数字分量4∶2∶2接口264
3910模拟分量R′G′B′接口265
3911EBU N10模拟分量Y′PBPR接口265
3912行业标准模拟分量Y′PBPR接口266
第40章576i分量视频267
401帧频267
402隔行扫描267
403行同步268
404模拟场/帧同步268
405R′G′B′ EOCF 和三基色270
406亮度(Y′)270
407图像中心、幅型比和消隐270
408数字分量4∶2∶2接口270
409模拟分量576i接口271
第41章1280×720像素高清272
411扫描272
412模拟同步272
413图像中心、幅型比和消隐273
414R′G′B′ EOCF 和三基色273
415亮度(Y′)274
416数字分量4∶2∶2接口274
第42章1920×1080像素高清275
421扫描275
422模拟同步276
423图像中心、幅型比和消隐278
424R′G′B′ EOCF和三基色278
425亮度(Y′)279
426数字分量4∶2∶2接口279
第43章高清录像带280
431D5 HD(HDD5、D15)280
432D6281
433HDCAM(D11)281
434DVCPRO HD(D12) 281
435HDCAM SR(D16) 281
第44章模拟分量高清接口282
第五部分视频压缩
第45章JPEG和MJPEG压缩286
451JPEG块和MCU286
452JPEG框图287
453电平转换288
454离散余弦变换288
455JPEG编码示例288
456JPEG解码290
457压缩率控制290
458JPEG/JFIF291
459MJPEG292
延伸阅读292
第46章DV压缩293
461DV色度亚采样293
462DV帧/场模式294
463DV的穿梭图像295
464DV溢出方案295
465DV量化295
466DV数字接口296
467消费类DV录制297
468专业DV变体297
第47章MPEG2视频压缩298
471MPEG2的类和级298
472图像结构300
473MPEG中的帧频和23下拉301
474亮度和色度采样结构301
475宏块302
476图像编码类型(I、P、B)302
477预测303
478运动向量304
479块编码305
4710帧和场DCT类型305
4711之字形扫描和可变长编码306
4712刷新307
4713运动估计307
4714码率控制和缓冲区管理308
4715位流句法309
4716传输310
延伸阅读310
第48章H264视频压缩311
481算法特性、类和级311
482基本类和扩展类313
483高类313
484层次结构313
485多参考图像314
486宏块条314
487空间帧内预测314
488灵活的运动补偿314
489四分之一像素运动补偿插值314
4810运动补偿预测的加权和偏置315
481116位整数变换315
4812量化器315
4813可变长编码315
4814上下文自适应性316
4815CABAC317
4816去块滤波器317
4817缓冲区控制317
4818可分级视频编码317
4819多视点视频编码318
4820AVCIntra318
延伸阅读318
第49章VP8压缩319
延伸阅读320
第六部分分发标准
第50章MPEG2存储与传输322
501基本流322
502打包的基本流322
503MPEG2节目流322
504MPEG2传送流 323
505系统时钟 323
延伸阅读324
第51章数字电视广播325
511日本325
512美国325
513ATSC调制326
514欧洲327
延伸阅读327
附录A使用YUV和照度是有害的328
附录B辐射测定与光度测定简介332