![]() |
|
时间:2008年10月11日下午14:00-17:00
地点:索尼高清影视技术学院
主题:高清影视技术节目与环绕声
嘉宾:陈奇楠
北京冠华荣信系统工程股份有限公司 副总经理
高级录音师
中国传媒大学 影视艺术学院 录音系 客座教授 兼职硕士生指导教师
主持人:大家下午好,很高兴今天有这个机会,很长时间以来我们都在做一些培训活动,这样的沙龙今天还是第一次,来到这里的有高清学院培训过的毕业的学员,也有客户。我们希望今后的课程中会安排高清方面的产品内容,和高清节目制作以及与索尼产品间接有关的内容。像音频环绕声,现在索尼没有,实际上它和高清节目制作是有关系的,包括舞美、灯光等一些内容,我们希望陆续的以沙龙的形式和大家做一些沟通共享,这也是一个尝试,大家有什么要求欢迎向我们提出来,使内容更丰富,把这个平台做得更好。
今天是沙龙的第一次,我们今天请到的陈奇楠老师,他现在是冠华的副总经理,同时在传媒大学做教授。一些行业中的朋友和陈老师也比较熟悉。今天陈老师讲课的内容是“高清影视节目与环绕声”。
陈奇楠:我觉得今天还是以沟通交流的形式或者慢谈的形式比较好。
主持人:陈老师准备了一些材料,来的朋友有音频部门的、也有一些专门做音频的,还有一些朋友是做技术支持的,或者是在运行过程中涉及到音频的,大家也可以提出一些问题共同探讨,希望从各个角度、各个方位做一个交流。
陈奇楠:感谢各位在百忙之中参加这个沙龙活动,也感谢索尼高清影视技术学院提供时间、环境、和场地,给我提供与大家做交流的机会。
在活动开始之前,索尼方面也把预期要参会的来宾名单给我看了一下,今天这个沙龙的内容对于我来说也是一个比较新的课题,因为以往不管是在专题交流会或者是在学校担任课程,课题的内容可能相对比较单一,但是今天大家来自于不同的专业方向,有视频的、音频的,还有一些是节目策划或者管理等各个不同的方向。不同的方向,对于今天提出的题目的关注点也是不同的,或者是有侧重的。在这种情况下,对于我来讲,如何利用下午的时间和大家做更好的沟通和交流,我也没有特别充分的思想准备应该怎么去做。所以,希望今天先按照自己的想法罗列出几个题目或者方向,围绕着这些方向,希望大家更多的根据自己的关注点和兴趣所在展开,在这个题目上展开一下,或者提出一些问题、见解和观点供大家进行沟通和讨论。
今天讲座的题目可能有些比较分散,大家也可以根据自己的专业方向、侧重来看:第一,声音和电视画面之间的关系,即声音和图像之间是怎样的关系;第二,电视声音制作的发展过程,即从单声道到立体声,到今天我们所要讨论的环绕声的问题;第三,电视声音的“录”与“制”。讨论我们所看到的影视节目里的声音,录,我们把它定义为一种什么概念,怎么样录制出来的是声音?或者是什么样的工艺和做法做出来的是录出来的声音。还有一种,什么样的是制作出来的声音,我们希望对此进行概念性讨论;第四,混的基本概念及音响美学。谈到环绕声的时候,环绕声的基本概念是怎样的?我们评价一个声音的审美观点,即我们怎样看待一个声音作品,或者是与影视画面结合起来的声音作品的审美方向;最终,我们通常概念下的电视节目是通过一个播出、传输、一直到用户端的整个链路来完成的,最后送到受众面前的过程,也就是第五,电视声音制播工艺链的特点。通常情况下,这个链路有什么样的特点?对于我们电视节目的制作以及受众观看这个节目,目前还有什么需要讨论的,还有什么制约?第六,如何建立电视、声音(环绕声)的概念。到今天为止我们讨论的是要制定一个比较严格的标准,这个标准一直在讨论,由于标准目前没有严格地建立,还有一些标准没有真正提出来而引发的电视声音信号的传出和收视所存在的基本问题,我们也要进行讨论。
因为今天的主题有一些大家感兴趣的话题或者内容有不确定性,所以我的幻灯片介绍更多的是提纲或者概念,提到相关的内容,我会找出一些资料和大家一起探讨。
第一,声音与电视画面之间的关系。
在所有的介绍或者以往的讲课中,我一直把电视里的声音叫做电视声音或者电视音响,很少把它按照以前的传统叫法,叫做“伴音”。我认为,这个“伴”字就把已经声音放在一种伴随或者从属的位置上去了。实际上,声音和画面可以说是电视媒体传输的不可缺少的两个重要组成部分。可能是因为我是搞音频出身的,可能有对它有偏好、有感情,所以往往把它提到比较重要的位置。但是至少我认为,声音和画面应该是平分秋色的,一半一半的。甚至我们搞音频的人,往往在提出一些佐证来证明声音的重要的时候,经常举这样一个例子:看《新闻联播》,如果我们把电视声音关掉之后只看画面,往往可能不知道这条新闻讲的是什么事情,因为很多画面都是背景性的、素材性的画面,比讲工业产值也好、工业事故也好、矿难也好,拍了很多镜头,如果没有声音、解说、背景或者背景音效等声音做陪衬,或者用声音来说明,仅仅看画面,可能都只是素材的画面,比如工厂、厂区等镜头。如果我们看新闻节目不看画面只听解说,或者是一个专题片只听解说,那么对这个节目所要阐述的内容,我们基本是搞不清楚的。我说的也有可能是极端的现象,但是首先我们认为声音和画面之间是有相对比较密切的关系。
声音的表现手段也是很丰富的,它可以把画面中能够表现的,甚至是意犹未尽的内容通过声音的方式表现出来。所以,在电视节目里,包括所有的影视节目中,我们始终认为声音是一个非常重要的部分。而且声音和画面的结合程度,包括声音的环境感、空间感,甚至是素材的地理和国际的环境,都是很重要的。因为早期我们在用很多电视音效的时候,比如我们是购买版权节目,用的是国外的声音素材,里面的环境声或者背景声可能是某一个国家特有的环境声,但如果这种环境和画面结合不正确的时候,可能也会出现一些纰漏,闹出一些笑话出来。这也说明声音和画面之间要有非常密切的关系。
接下来看一下电视的声音。
现在由于高清提到了技术和艺术的建设日程上来,在中央台电影频道和中央台都开始试播高清节目了,好像高清离我们很近了。由于高清电视的声音格式里是支持环绕声的,因此,在声音制作方面,也把环绕声提到了议事日程上来了,大家马上就可以在高清的时代听到环绕声了,我们就要制作和录制环绕声的节目了。但是在我们以往的沟通和交流中,有很多人包括电视台里的专业制作人员,开始在接触到环绕声这个概念的时候,还是比较茫然的状态,到底是什么环绕声?怎么去做环绕声?环绕声究竟是怎么一回事?我们要说环绕声的时候,实际上还是要回顾一下,推回到以前的时间,从单声道、立体声,到环绕声,简要地把这个过程回忆一下。
在早期录音的时候肯定是从单声道开始的,大约20年代后期到30年代电影工业开始有了用磁性录音记录声音的时候,就是单声道录音。单声道录音一直延续到今天,仍然作为一个最基本的记录录音的方式存在着。在单声道录音的时候,声音没有方位感。但是即使是单声道录音,它是有深度感的。也就是说,它没有宽度这个空间的定位,但是仍然有深度定位的概念,能够听出声音距离的远和近,这是由于声音传导延时造成的。
到今天为止,电视台的绝大多数节目,除了一些个别频道的试播立体声和随着一些高清试播频道的声音在传输的时候,就是说原来的节目源一直到传输,到机顶盒接收下来的是环绕声的以外,我们可以说,90%甚至是99%以上的电视节目的播出状态还是在单声道状态。但是反过来说,在和录音相关的其他行业里,立体声和环绕声是远远比电视走得快得多、发展快得多。
立体声录音在音像出版界,也就是最早期生产盒式录音带的时候,在国内开始出现立体声录音大约是在70年代末期,也就是改革开放刚刚开始的时候。我记得当时国内第一套立体声多声轨录音系统是1979年末已经建立起来并且投入生产,是在北京农业电影制片厂的院子里,是国内最早的16声轨的录音系统,已经可以出立体声的出版物了,当时的载体主要是盒式磁带。
到了上世纪80年代中期,1985年左右,国内的调频广播开始立体声广播。到今天为止,大约20多年,调频段广播基本都是立体声录制播出,一直到接收机都可以作立体声接收了。但是只有电视的制作到今天为止仍然保持着99%以上仍然是单声道电视声音播出的现状。这和广播、和音响出版唱片业的距离变得非常大。
因为环绕声只是最近很短一段时间才开始提出来、才开始尝试做,至少从单声道到立体声这么漫长的发展过程中,在电视行业中,真正动手做立体声录音和制作的实践机会和提供的条件都相对比较少。所以,在现在单声道占有如此大比例的情况下,一下子提出要做环绕声或者过渡到环绕声,可能就对大家提出了很大的一个挑战、难题,也使大家会有很多困惑。这是目前实实在在的现状。
但是实际上如果从录音制作的硬件或者设备上来讲,到今天为止,可以说在音频制作环节中所有用的设备,至少可以说,百分之百都是可以完全支持立体声制作的。在设备上,在制作环节上几乎不需要做任何新的改造或者投入。当然,作为一些高端录音用的调音台和其他设备,标准配置目前也是完全支持环绕声制作的。从这一点上来说,首先目前的设备环境、硬件的条件,对于探索和尝试立体声和环绕声的制作,我认为没有特别大的障碍。所谓技术和设备,对于电视来讲,可能是后端的播出到整个传输链路,以至到用户端,这块目前制约着转向多声道播出。
实际上,从单声道、立体声到环绕声,也可以把它说成从单通道到多通道的声音制作的转移方向。立体声通常是两个声道,因为环绕声有很多个格式,可能有四个声道、五个声道、六个声道,甚至是七个声道以至于更多,一般电视标准用的是5.1声道的环绕声,所以大家说起环绕声来,通常都说是5.1声道的环绕声,但5.1环绕声只是其中的一种格式。环绕声,包括立体声在内,通常把它定义为多声道、多格式的一种音频。我个人通常是这样认为的,因为它存在不同的格式,当然这种格式有独立通道的,还有以后为了制作、为了传输而做的编码格式,这些今天不做过多讨论。
单声道最简单的是只有一只扬声器,在做重放时,在听音的位置听声音时,对于我们听音而言通常把它叫做“点声源”,也就是单一位置、单点位置的声源。从这一点上放出来的声音是没有左右方位感的。到今天为止,即使是电视里的接收机里通常都叫做立体声的接收,或者是有立音方式或者立体声方式的电视接收机,但是我们接收到的重放出来的音频信号仍然是一个单声道的信号。
在单声道的基础上发展出来的立体声,我们把它也叫做平面立体声,它是由两只扬声器组成,这两个扬声器和我们听音位置标准的要求应该是构成一个等边三角形,中轴线和左右扬声器的夹角两侧各为30度,这是一个标准立体声的听音环境。这时候,这个等边三角形,我们所处的听音的顶点,在最佳发烧友中把它叫做“皇帝位”,也就是最佳的听音位置。
要想搞清楚环绕声的概念,还要从立体声上来说。
我们在决定立体声声音定位的时候,更多的是强度差立体声。左右两个扬声器重放出来的信号是同一个信号源而且强度完全相等的时候,我们听到的是在两个扬声器正中间的位置的声音,我们感觉到声音是在两个扬声器的正中间。这个时候,我们把这个为之所形成的声像叫做虚声像,所谓的虚幻的声像。当左右两个扬声器在重放信号时,在强度发生变化的时候,我们感觉到虚声像的位置就会向声音响度响的这只扬声器的方向移动。当强度的比率大到一定程度的时候,或者是完全由一只扬声器发声而另一只扬声器没有声音的时候,这种情况下声音就被锁定到了一端。因此,我们在立体声的调音台上做节目的时候,我们用声像变位器就是把某一个声源分配在两个扬声器之间输出的电平的比率,来造成声音的移动。如果我们把这个比率调定之后,这个声像就锁定在了某一个点的位置。但是,当两个扬声器的响度在连续不断变化的时候,我们就可以听到一个移动着的声源。假设我们录下来的是一辆汽车的声音,但是做节目的时候,从左扬声器到右扬声器电平产生变化,原来左最大,右没有,左逐渐降低,右逐渐升高的情况下,这个虚声像就是一个移动的声像,移动和调整电平的改变速度成正比。因此我就可以决定声音移动的方向和速度。这就是我们经常看到的在立体声和环绕声中移动声像的概念。
在做后期合成的时候,有很多不同的声源,我们把每一个不同的声源放在两个扬声器之间不同的位置时,通常把左右扬声器构成的中间的空间叫做声音舞台或声像舞台。假设录一个乐队,我可以把不同的乐器分布到两只扬声器之间不同的点上,就造成在一个声音舞台上的声源定位。这是立体声制作里一个最基本的概念。
如果是环绕声,原来立体声左右的两只扬声器位置不变,仍然保持立体声环境下的等边三角形的位置,在里面再加上一个中间声道的扬声器,同时再加上左和右两只后方环绕声扬声器,这样就构成了一个5.0环绕声系统(见图)。这个时候,因为我们比较侧重电视环绕声制作,电视的环绕声制作现在基本上遵循扬声器的摆位方式,也就是扬声器的间距布置和摆放标准是按照杜比系统推荐的摆放方式来布局的。在我们做电视传输播出到家庭用户端的接收,以及DVD影片里所做的环绕声,它的标准就叫杜比数字音频,通常我们也把它叫AC3标准,这个AC3的标准和胶片电影的标准是不相同的,在电影院里放的杜比影院,如果是数字系统的话,用的是杜比SRD标准,它是一个大面积观众群、为比较大的观众坐席面积服务的环绕声录制和重放系统,是为电影院所用的。而通常的电视播出及DVD影片制作的环绕声,是为了小面积环境,通常是指家庭消费环境做的。它的最佳听音区是大约四平方米左右的区域,即差不多2米×2米的区域。
为什么我们一般说的都是5.1的环绕声呢?因为是在5.0的基础上再增加一个超低音声道。按照杜比规定,前面的“5”表示五个独立的全频带通道,也就是左、中、右、左环绕、右环绕五个独立通道,按照杜比的标准,原则上这五个声道所重放的扬声器(音箱)应该是相同规格、相同型号的,而且重放的是全音域(全带宽)声音。另外一个超低音通道,通常是在125赫以下的低频段音频通道,它是一个低频的效果通道,在影视作品里,这个通道只做超低音的效果所用,也就是战争片、灾难片,这种大的、动态的、低频的效果声是通过这个通道来重放的。这种低频的效果给人的感觉甚至是超出听觉的效果感觉。大家在电影院中看大片的时候,甚至在超低频的作用下会感觉到身体有压力、胸闷,这实际上是超低声波的作用,这种感受可以增强电影的渲染力、增强刺激感,给你带来听觉以外的感受。
一般情况下,如果是音乐会的录音或者一些音乐作品的录音,更多是5.0的系统重放,即使是5.1的系统,可能自始至终超低音通道是没有信号的,从设备表头来看,这个通道也没有任何输出。所以说,超低音声道的声音一般是人工做出来的声音放到这个通道里。
在单声道向环绕声过渡的时候,主要是声道增加了,记录设备的通道要增加,不管是录音机还是录像机,重放系统还原的扬声器通道也要增加,布置出来这样一个重放的声音环境。这是从单声道到环绕声的演变、过渡过程。
目前在电视播出的环节中,就像我们刚才讲的,后面还不具备环绕声的传输和环绕声的播出,但是很多电视台在建设新台项目时,把高清系统或者高清演播室以及支持高清环绕声的声音制作,包括录音系统和后期制作系统,都已经提到议事日程中,也是考虑为支持高清声音的制作提供实践条件和尝试的可能性,另外就是为录音师、为声音制作人员提供经验的积累和做各种手段尝试的环境。
下面我们讲一下关于电视声音的“录”与“制”或者叫做“录”和“做”两个不同的概念。我们先说“录”,在这里“录”所指的不仅仅是用一只话筒把声音记录下来,因为即使在后期对声音进行很复杂的后期制作的时候,它的素材、它的源也是需要在前期录,而这个“录”在专业里讲是叫做拾音——拾取声音。最简单的讲,哪怕是做一个新闻采访,放一个摄像机做单机出去,甚至一个摄像师扛一部机器出去,他即使一个人出去工作,也要身兼录音师的职责,把声音录回来。用一只手持的采访话筒或者在摄像机机头上装一个机载话筒,也要把环境声、同期声一起录回来。在拾音的概念下这是一个录的概念,但是我们在这里讨论“录”与“制”的问题的时候,不是这样定义下的“录”。我们说的“录”,除了要把拾取的主声源录回来之外,更多的是在录的同时要包含大量的空间信息。在一些实况录音、体育比赛或者音乐会录音的时候,“录”的概念可能表现得更突出或者更能说明一些问题。在这种情况下在录的时候,除了要把舞台上表演的演唱或者一个乐队演奏的声源录下来,同时在这个概念下的“录”是要把整个音乐厅或者歌剧院的整个空间信息录回来,使得听众在观看这个电视节目听这个声音的时候,能够感觉到是在一个什么样的场合、什么样的空间。如果从高、保、真的角度或者更高端的角度来讲,应该有一个身临其境的感觉。从这一点上来讲,“录”的概念是要同时拾取空间信息、空间的感觉。
和“录”相对应的“制”,更多的是在后期来做声音的合成和制作。在后期的合成与制作中是人为的创造空间信息。再打一个比方,所有我们看到的好莱坞的电影,所有这些大片具有感染力、很具夸张的声音都是后期制作出来的,包括一些声音的特写、声音的定位,甚至包括所有电影中的对白,我们听到的都不是同期的录音。如果在一个拍摄的战争场面中,在当时那么嘈杂环境情况下,同期在拍摄时对白的声音那么清晰,不太可能做到,一般都是在做后期配音的时候,把同期的对白加上去。这种电影的画面在同期拍摄时,演员是要讲对白、讲台词的,不讲话、不交流,演员无法进入情绪、无法表达剧情,就无法入戏,但是为了后期的声音质量,用配音把原始的对白给替换掉。包括后期环境的效果,枪炮、榴弹效果等都是后期音效合成做出来的。这种音效节目的形式是后期做出来的,并不是实实在在一次录制出来的。所以,我们把电视声音、电影声音分为录制出来的和后期制作出来的,也可以说是工艺手段上有本质的不同。
提问:您刚才画的5.1音像摆放图,是按照ITO方式,但是其实在立体声过程中,我们以60度为音箱夹角,但是在环绕声中还用这个60度,而已经加上了中置扬声器,两边的立体声可以更宽一点更好。我在做后期录音和聆听的过程中发现,音箱只能重放两个音箱之内的空间,而实际上我们在听音乐会和听人讲话的过程中,音像不只在60度之内,我们希望更宽一些。那么为什么不把音箱放得更宽一些呢?比如70度80度。
陈奇楠:我个人感觉有这样几个方面的问题:一,考虑到环绕声和立体声的兼容性,比如同一个系统在同一个节目制作的时候,有立体声和环绕声的兼容性问题。现在不管是影视还是音乐,像DVD可以在菜单中选择立体声重方还是环绕声重放。二,在不同的录音师或不同音响导演要求的情况下,如果是纯音乐制作,是不是考虑到4.0,其实并没有中置音箱,实际上可以兼容在5.1或5.0系统里做,但并没有中置。因为中置在一定情况下,比如在很大的电影院里看,观众不可能都坐在中轴线上,可能会坐在比较偏的位置上,这样可以把对白锁定在画面上,这时候才用中置。其实在电影中,单独solo中置的话只有对白。而且是在AC3环境标准下,还是取60度作为标准。
追问:在做立体声的过程中,如果把这个角度放大,可能也很舒服,一方面我们可以很精确地听到声像定位分布,因为60度只能在60度的范围内听到声音。
陈奇楠:如果再宽于60度的时候,会不会引起声像变位器的变化曲线的改变。因为如果我们按照60度来算的话,等于是PAN的变位器的中间正好是负3个DB,如果再宽的话,因为要求PAN在移动的时候响度不能变,从左到右,单独锁定在左,直到移动到全部在右,这个响度是不能变的,这个Pan的曲线正好到中间,是一个负3DB的提升和衰减的变化曲线,如果再宽的话会不会有问题?
追问:我想不会,把音箱的角度拉大,相当于音箱不变,人在“皇帝位”往前走一步,因为音箱的输出功率也不一样。
陈奇楠:现在也有这个说法,你说的向前移动,是有这种推荐的方式,实际上是把三角形顶点的交点放在头后40、50公分的位置上。当时探讨的这种做法,当时是为了录音师在制作节目的时候声音锁定,他连头都不能晃,如果一晃声像定位就会偏移,如果包角大一点,包容性好一些的话,起码录音师可以有一个工作的移动范围。
说到角度问题,对于后面110度张角的后环绕,现在也有不同看法,美国就不太赞同ITU的标准。
追问:ITU是一个范围,是90—115度。
陈奇楠:是100—120。通常我们取中就取110。但是美国甚至有人建议后面张角做到135,更往后去。
提问:做家庭影院是怎样摆放?
陈奇楠:通常就是我介绍的这种摆放方式,会比较理想。但是真正的家庭听音环境往往很难做到这一点,关键是房间尺寸、房间空间的问题。一般的房间,我们只能照顾到前面,电视机或投影的位置在正前方,保证这个位置之后,一般地方见对面摆一个沙发,后面基本就是后墙了,人的后部没有空间了,一是环绕声音展不开,二是后面的空间声场建立不起来,很多就是后面墙的反射,所以很多发烧友甚至拿出一个房间来做成一个真正欣赏、看片的听音室或看片室。
后面我们也会说到建立标准的问题,抛开家庭环境不讲,家庭里有没有条件建立这样一个标准环境是另外一回事,我们在前端制作的时候,是应该遵循一个相对标准的环境来制作节目的。我们始终认为,一个监听系统对于录音师来讲,就等于是视频制作人员的标准监视器或技监,你的色彩还原、构图是否正确、是否合乎标准、是否具有交换性,在于你的监听系统,监听就是一个尺度,尤其是节目的互换性,如果你的监听不标准,各个监听环境的出入特别大的时候,实际上你的节目就不具备交换标准,我在我的房间里做完感觉特别好,但我的房间并不标准。就如同我拿9寸的尺子当一尺来做东西,将来做出来的成品肯定尺寸不对。所以说,监听标准的建立是非常重要的,不管单声道立体声环绕声。
提问:您画的图中间只是一个人,一个监听点,那么这个监听点适应多大的范围?
陈奇楠:这个中间区基本是2米×2米的范围,当然这和扬声器的监听半径有关系。首先,作为AC3监听半径,资料上建议最小监听半径是不小于1.5米。但在实际工作实践环境里,1.5米往往都不太能够保证,比如在一些尺寸比较小的电视转播车里。除非做到有侧拉箱的电视转播车才能有1.5米的半径,如果不侧拉,因为车厢的车体宽度只允许2.5米,如果去掉蒙皮和一些隔音设施,车的内径只有2.3米。包括很多国外的转播车,也满足不了1.5米的监听半径的标准。
追问:可不可以这样说,如果是1.5米,监听的人只能在一个点上。如果是3米,人还可以左右再顾几个点,有没有计算公式?
陈奇楠:杜比应该有一个图。如果录音控制室的空间非常大,一般半径也就做到3米左右,圆周直径是6米,加上房间里其他的空间,差不多应该是50平米的录音控制室。基本上就是在这样的范围内。3米或更远一点,如果在立体声环境下,我们甚至可以把拿看成圆场监听。
我们通常做音乐录音、做环绕声唱片,比如SACD唱片、做DVD影片声音、做电视节目,其受众及消费群体是指个人、家庭的消费环境,所以基本都是按照这样的布局标准。它和电影制作是完全不一样的,电影最后的混录(终混)是在一个相当于中型影院的混录棚里制作的,这个棚里的扬声器布局和标准电影院线的布局一致,而且是一个多点环绕声的布局。
提问:做电视的音量要求是多大?
陈奇楠:我们也是基本按照杜比的标准做,用粉红噪声来测试,单只音响是82分贝的声压级,在监听点的位置,不管箱子放到多远,在这一点上,扬声器单只开的时候,在监听位置点上是82spl,超低应该是87—89,电影通常是85分贝,环绕声小2—3个分贝也就是82-83分贝,超低音应该是89—90分贝。按杜比的推荐,应该是五只型号一致的箱子,但是由于房间的限制,把后环绕都用成尺寸小的箱子,至少前面左、中、右应该是三只同型号的音箱。这也牵扯到后期是录还是做的问题,录是一个平衡的空间声场拾回来的东西,是应该样就是怎么样。如果做,完全是用声像分配自己做定位、做设计。一般来讲,现场录的时候,尤其是音乐节目,除非一些很特殊的东西,后面基本是一个空间,没有明确声音定位。如果做影视,就会有很多效果要表现。
在声音“录”和“制”的情况下,回到最简单、最基本的状态下,以前交流的时候也有人提出这样的问题,一个单机出去,哪怕就是采一个新闻或者做外出采访,能不能是实现很简单的情况下、不用很多复杂的设备,不用带很多不便于移动的设备就可以做环绕声或立体声的制作?最简单的方式怎么做?实际上有很多现成的设备可以做。
立体声话筒放在摄像机上,这是最简单的外拍把现场声音同期声拾取从单声道转换为立体声的方式。从外观上看,和标准的摄像机机头话筒相同,但它是一个立体声话筒。用这个话筒在采录的时候,马上就可以获得有两个声道、有左右方位感的立体声,是M/S制式。因为标准的M/S制式在一个话筒里,输出的M/S要变成左声道和右声道的立体声时要通过一个矩阵,是一个和差的变压器,要重新做一个算法出来。现在有很多话筒直接把M/S到LR立体声转换的和差电路做在话筒内部,因此直接输出左右立体声,但是话筒的工作原理是M/S工作原理。这样,我们把它直接放到摄像机上,左声道给录像机一声道,右声道给录像机二声道,直接就可以记录立体声的现场采录的信号。我们做过这方面的听音实验,即使是面对面的访谈或外出采录,我们回来收听的时候,立体声的感染力和空间感与单声道已经完全不同,在声音空间的表现上会有很强的感染力。这是最简单的手段。
二是有很多用几支话筒进行组合构成单点式立体声或环绕声的套装话筒,(见图)它由前面的XY制式立体声话筒和后背的XY制式立体声话筒组成前左前右和后左后右的两个组合,然后中间用一个短小的超指向话筒,也就是用一个强指向的话筒作为中间声道,组合起来就是5.0套装。整个套装放在防风绒和防风毛衣里面组成起来,和一只单声道采访话筒挑一个鱼竿,外观是基本没有区别,但这时候这只话筒直接可以有5个通道输出,是一个环绕声话筒。在户外录一些环境声的采录、环境效果的采录,都是比较简单有效的方式。
提问:前左前右、后左后右是有角度的吧?
陈奇楠:因为是XY制式的立体声话筒,通常标准的XY制式立体声话筒前后两个话筒膜片的夹角是90度。两个话筒之间的轴向是可以调整旋转方向的,如果合并成0度,也可以变成一个单声道话筒。
追问:5.0环绕声在录像机上不能直接做记录吗?
陈奇楠:这种不可以,因为录像机通常只有4个通道,这种5.0在用的时候相对比较麻烦的是它可能需要一个话筒的前置放大器或一个小的、外出用的采访调音台,通过调音台把这5个声道记录到专门的音频记录设备上,比如多轨机等等。
第三种是一个比较独特的话筒,是日本SANKEN公司独有设计专利的话筒,也是5.0话筒,有5个通路输出,话筒里面由两个M/S制式话筒组合起来。最大的特点是,当我们配合摄像机来用这个话筒的时候,话筒实际上有5个通道的输出,左通道、右通道、中间通道、左环绕通道和右环绕通道。当我们和录像机配合使用的时候,录像机一般音频通道只有4个,在这种情况下,我们利用M/S话筒的特性,只取中间通道和左后右后这三个通道作记录,话筒前方左右两个通道不去使用,即实际采录的时候不去作记录,这时候我们在录像带上记录的音频通道只有3个,多出来的通道还可以给点话筒做采访单独用。比如给主持人手持的话筒作采录,这时候录像机的4个通道用满。我们把三个机头话筒的通道和采访话筒的4个通道记录到录像带,制作的时候通过录像机播放,它同样放出来原始记录的4个通道的信号。话筒的生产厂家为这种话筒的记录格式专门出了一个编码器,也算是解码器。实际上,在这个过程中,它可以利用M/S和差的计算方式,加上后左后右及中置这三个通道的记录信息重新解出来,通过解码设备把左前右前这两个声道给算回来,这个过程完全是M/S和差正负加减的算法,这个算法完全是一个模拟过程,它并不是一个数字设备,也没有进行数字编码,转换之后没有在数字域里做数字域计算出来,而是完全在模拟域里做的。因此,这种方式很容易实现外拍摄像机实取5.1环境声,同时把主持人、把采访对象的声音拾回来。
当然,除了和摄像机搭配使用的情况以外,这个话筒实实在在是有5个通路输出的,因此也可以作为标准5.0话筒直接输出录制5个通道。
追问:您说的是属于3解5吗?与上面的点话筒没有关系?
陈奇楠:对,点话筒是独立的,记录的是独立通道,在解的时候不进解码器,是直接送出去的。
追问:能否说这个3本身并不是纯的左后右后和中,而是已经进入编码了,所以在解的时候才能解出前左前右。
陈奇楠:不是,实际上前方的两个信号是不使用的,并没有放进去作为压缩编码合成到后面的声道做一个三声道的编码,严格地讲,在前面记录的过程中没有编码的过程,但是用M/S话筒的方式把前面的两个信息重新再现,再算回来。这是日本SANKEN公司和NHK联合研发的系统,并且申请了专利,所以到现在为止没有见到其他厂商有同类产品。
追问:假如我前面没买这个话筒,后面有解码器,是不是也能用呢?比如前面用自组的话筒,前右前右不记录,是否能解码呢?
陈奇楠:不可以,前面的组合方式是用XY组合,不是M/S制式,当然如果用其他的M/S制式话筒拼出这样一个话筒,我想应该是可以的,但前提必须是M/S制式。M/S是指中间和两侧的概念,因为M/S话筒中间是一个新形指向性的图形。
追问:这样一个话筒里含了5个M/S?
陈奇楠:不,这样一个话筒实际上是两个M/S。
就这个话筒,SANKEN的工程师专门在音频工程协会大会上发表了论文,在去年5月。整个研发实验由SANKEN公司和NHK利用了基本的 M/S原理,中间声道是心型,单一指向性的;侧面膜片是8字型的,所以是一正一负。左声道是M+S,右声道是M-S,是和差的方式推算出来的。论文介绍了推导过程,实际环绕声话筒采用的是双M/S技术,实际双M/S是向前方中置膜片和正后方中置膜片加上左右两侧8字型侧向膜片组成的,正正是两倍正,正负抵消,用这个和差和反向方式推出来中置、左、右、左后、右后通道。作为超指向话筒,利用像位干涉原理构成了膜片的位置,正前方膜片和背后膜片和侧向膜片的布局位置,利用像位的干涉特性组合而成。当时做这个话筒测试的时候,做过这样一个测试,有一个移动声源在录音室里对着话筒作移动,在控制室里有一个人根据声源和话筒在圆周上移动关系,来听环绕声系统的声音重放定位,比如移到A点时,监听控制室里的人在扬声器的机线上挂一个纸条做标记,我现在感觉到声音在这个位置。声源又移动了,然后再挂一个纸条做一个标记。从听音点将虚声像角度的定位和在录音室里实际听的位置的角度做一个对比判定,判定声像定位是否真实准确,是做这个角度判定。实际上我拼出来的话筒就是这个组合方式图的翻版,可以明确看出,只用中置、左后右后和独立的单边采录信号,进入到高清摄像机,最后从磁带上还原出来的只有中、左后和右后。但是通过三声道到五声道的信号存储设备,我们通常把它看作是一个解码器,叫解码器并不准确,因为它并没有编码,最后从解码器里出来是5个声道环绕声。
通过这个给大家介绍我们制作环绕声的可能性,并不需要在很复杂的设备、很复杂的条件下,必须是大团队、多人员的组合作战,设置像拍电影,要到外景地、带上发电车,这样才能制作环绕声,我们并不需要,实际上在简单的手法下就可以制作环绕声。
提问:这个话筒和组合式话筒的实际效果有过比较测试吗?
陈奇楠:主观的对比没有做过。因为最后不仅是这种比较特殊的话筒,就是在音乐厅里用不同的话筒阵来做,话筒布局的角度、张角宽度、前后和中置的间距等不同情况下,录出来声音定位的感觉不同,甚至是远近的感觉、定位的感觉、深度的感觉等等都会有很大不同。有时候不是谁正确谁错误、谁好谁坏的问题,而是审美观的问题、音响美学的问题。有些东西是针对不同的节目源,比如录交响乐的空间很大,感觉到声场很恢弘,但是录室内乐等很细腻的东西,只需要一种亲切感,甚至在听音乐的时候就感觉到就是一个很小的乐队在我面前为我演奏的感觉。所以很多情况下取决于审美的观点,并不是说谁就是正确、谁就是错误的,只可以怎么样,不可以怎么样。
除了相对比较特殊的这些方式以外,环绕声的制作也牵扯到美学概念的问题。说到声音定位和声场概念之前,我总会想到在八十年代初我开始学录音、自己开始做录音的时候,立体声盒式磁带,所谓中国的流行音乐刚刚起步的时候,我们探索立体声录音的时候也是在非常浅薄的概念、甚至是没有概念的情况下盲目地尝试。最后人家总结完了之后,最典型的事是,刚开始接触立体声,什么是立体声呢?人家总结的时候说,你那个东西就叫“乒乓效应”。打乒乓球的时候,你一下,我一下,两个人打,球在案子上“当、当”两边跳。开始认为从单声道一下子有了立体声,有了两只扬声器,有一个空间了,最能表现这个空间的就是声音的移动,给人听的感觉是这边一下、那边一下,声音能动起来了,声音有了位移了。这在单声道的时候不能实现的,我们有了很新奇的感觉,给了人一种直接的感觉,这样最能体现立体声。
现在有了立体声,到了环绕声的时候,也可能有很多人觉得做一个飞机,几个扬声器一转,感觉到声音在头顶上转了一圈,这就是环绕声了。或者是打一个炮弹,在起点响,然后飞过去落地炸开,在另一个地方炸开,这就是环绕声。在初期阶段大家都会有一个认识、理解的过程,但随着接触多了、实践多了、听别人的经典的和成熟的作品多了,然后自己去感受,以后就会有不同的感悟、不同的认识了。实际上我们现在认为,作为环绕声,最重要的一个点是要做一个场。这个场就是要营造录制一个我所需要的、或者是这个环境尽可能真实的空间,所谓“身临其境”,就是要有这样一个空间。这个空间并不一定是要动起来,或者有了移动、有了位移、有了旋转才有这样的空间,因为我们每个人生活中积累下来的听音感觉,一种是潜移默化的,另一种就是习以为常的,你自觉不自觉地已经习惯了。但是当你到了另外一个你认为不应该是这样的听音环境下,突然给你建立了这种环境,你的感受是非常强烈的。假设我在这么安静的屋子里,在5.1的听音环境下,在你没有准备的情况下声音就突然出来了,如果是一个万人体育场的足球比赛现场,那马上就会吸引住你,你现在所处的环境是这样一个环境,实际上这个场营造的空间效果就达到了。这里包含了很多信息,当然也许你不是专门搞录音专业的,但是人的这种习惯反应,即使你不去描述、不去感受,在生活中这种听音的感觉也是有的。简单来说,对房间尺寸空间、墙面材质的感觉,任何人没有要明确描述的想法,但由于生活中日积月累,蒙起眼睛来,把你放到一个什么样的空间环境里,你能够感受到身处在什么样的空间里。最简单的是“浴室效应”,冲凉的房间尤其是公用的浴室,都是白瓷砖,有很强烈的反射材质的房间,混响时间非常长。当你蒙起眼睛进入到这种房间的时候,不告诉你是什么环境,但你会马上感受到这种空间是什么样的,会马上感觉到墙面是很硬的,是石头或者瓷砖这样具有很强烈反射介质的环境。这些都是日常生活的感受,并不需要专业训练。
现在我们营造这样一个空间,不管你是在音乐厅还是体育场。尤其对于电视节目来讲,在声音制作上空间最大、表现力最强的是体育节目。我始终认为体育比赛,尤其是足球、橄榄球这种很激烈、场面很大的节目具备了很多做大片声音的要素:一,它是有悬念的,因为实况比赛谁都不知道结果;二,场上的拼搏是非常激烈的;三,场面足够宏大;四,有很多有特质的特色声音可以让你去捕捉。在这种体育比赛的情况下,如果是做环绕声录制,首先是要营造一个环境氛围,这个环境氛围是固定的,在你听音的时候,就等于你坐在观众席看台上一个固定的位置,你感受到的是整个体育场里的气氛,你的前后左右都是观众,都在呼喊、在鼓掌、在喧嚣,是这样一个空间环境。在细致制作的时候,我们根据不同的比赛、不同赛场上运动项目的不同特点,会放很多点话筒去拾某些有特点的位置的声音,比如足球比赛的时候,两侧端线罚角球的位置肯定要有超指向的话筒去拾罚角球的声音,球门的背后肯定要有射门和球入网拾取这些声音的特效,巡边员特定的位置上可能会有固定话筒,还会有超强指向的专门的移动话筒,就像卫星接收天线的锅一样是个抛物状的话筒,有个话筒放在锅中心位置的焦点上,有人端着这个锅跟着运动员去跑,这样才能把镜头跟的运动员触球时的声音拾取回来。当有了背景声音以后,再有了各个点拾取的声音素材,你就可以像混录大片一样去做这个声音。一般的体育比赛环绕声制作概念和格局就应该是这样做,除了人的操作以外,还要用一些技术手段,比如现在最简单的一种,在做体育转播的时候,要求音频设备和视频设备配合的时候,都有一个AUDIO FOLLOW ME的概念,也就是音频要跟随视频联动,因为有时候场景的切换非常快,导演看到场景马上在切换台上做出动作,镜头变了、机位变了,切过去之后,如果音频看着监视器再去跟,那肯定跟不上。在这种情况下,有一种技术方式,利用GPIO的接口,实现调音台和视频切换台进行联动,对应的通道和视频机位一一对应,导演切过去画面的同时也就把这个通道上的话筒打开,保证声音能够跟随画面切换。当然前提一般是整个环绕声背景的场是固定的、不动的。
(见图)图为一只5.0话筒,放在球场某一个位置上,作为总的环境声话筒进行试音。
(见图)图为日本很流行的棒球比赛环境下,边上还有一个集音器,是一个像锅一样的抛物面设备,超指向话筒放在中间。
有一个很形象的比喻,我们所用的话筒和照相机的镜头很相仿,话筒的指向性等于镜头不同的焦距。照相机的镜头角度最大的是鱼眼镜,可以达到180度。但在话筒里有全指向话筒,360度入射声音拾取输出的灵敏度是相同的,我们就可以把它等同于超广角或鱼眼镜头。心型指向性或单一方向性话筒也就等于标准镜头到中焦,超指向话筒就等于是长焦。如果是抛物状的超强指向性话筒,就可以看成是超长焦距的望远镜头。越是指向性强的话筒,拾取拾音距离越远的话筒,相对的拾音夹角就越窄,这都是相同的。
(见图)高尔夫比赛也有专门的一套拾音方式,在日本,拍摄高尔夫比赛的时候,是有一个专门团队进行高尔夫比赛拍摄,因为跟着一个洞一个洞、一个球场一个球场打下去的话,距离是非常远的。这种情况下,话筒拾音系统和摄像机都采用无线传输的方式,在高尔夫的球场中会有一个中心技术机房,把摄像信号和声音信号通过无线传输的方式传输到中央机房中进行录制或者制作。
体育比赛有很多技术特点和与运动项目相结合的特点,包括声音制作的工作人员,甚至一些摄像师,都可以称为专项运动的自由职业人。最典型的就是转播F1汽车大奖赛,那些摄像师并不隶属于哪一间电视公司或制作公司,也可以说这些人的职业特性决定了他扛摄像机只会拍F1,除了F1,别的运动项目他都不钻研,他也不会拍风光片、纪录片这些题材的片子,他就是非常职业化的,他是职业摄像师。每次有F1比赛的时候,就把所有这些人聚集到一块儿,组成F1的转播团队,说他很职业化,包括他对每一辆车的外形特征、对车手的信息、对车的标志,包括和导演配合的镜头调度的默契指向性,别人都是做不到的。因为F1的车速这么高,包括上海第一次主办F1的时候,当时中央台也参与了,中央台自己也讲自己根本就做不了什么,只能做一些辅助性和配合性的工作,否则导演指令来了,镜头还没有抓住车呢,车早就过去了,都没有办法跟拍。有一个声音制作团队,就可以F1赛车在赛道和所有从镜头前面过去的非常有刺激性的声音全部捕捉到。包括日本的高尔夫转播,也是一个非常专业的团队,可能就是针对这项专项运动组成的团队,非常职业化,这和国内的体制可能有比较大的出入。
(见图)这些工作照是跟随摄像机的环绕声话筒就放在摄像机上拍摄。
刚才介绍了摄像机话筒,我们还说到体育场地里布置的不同、音乐厅里安置吊挂的话筒。总之,我们用不同的布局来拾取不同的声音,这就产生了一个问题,在我的创作中有一个听音的人,在制作过程中是录音师,到了用户端是欣赏的人,或者是受众,或者是听音的人的主观位置的问题,这和摄像时的镜头主观感受也有相同之处。很典型的就是,在机头上的话筒跟着摄像机去拍,这应该是最主观的视角,这个听音和画面是最一致、最吻合的。
音乐厅或大环境中还会有各种各样的话筒,成套的组装好的话筒和我们用普通话筒、用各种各样方式拼装组合起来的话筒,(见图)图中的话筒,表面上看是5个传声器组成的5.0话筒,而且有一个前置放大器,可以把5个话筒收集的信息自动派生出.1通道来,再生成一个次低音通道,本身看起来是5.0的话筒,但通过设备做出来是5.1的环绕声。
(见图)图为单点四膜片话筒,也是用编码的方式最后做出5.1的效果。以上各种各样的手法做出5.1的话筒,等于是在拾音的时候选择了不同的镜头、不同的方式来拾取声音,最终声音是要给人听的,我们的话筒布局和最后听众主观感受的位置是有密切关系的。因此,在声音制作的时候,我们怎么去体现?(见图)下面两图为音乐会录制的典型情况,一种是在超大的录音棚里做一次合成的音乐会录音,指挥在中间的位置,主话筒在指挥的后部上方位置。另一种是在标准音乐厅舞台,图中只看到左右辅助话筒,主话筒在指挥后部上方的位置上。总之,这种样子的话筒摆放方式基本是在音乐厅的最佳听音位置上设立的,因为这个拾音位置就是将来欣赏音乐的听众的听音位置,这个位置是放在了最佳听音区。也有一种方式是把话筒放在乐队中间,录室内乐的时候,让乐队围绕着5.1的话筒,包围在话筒四周来录,最后听音的主观位置就完全变了,等于是你在乐队中间。这同样也不存在哪一种方法是对的、哪一种是不对的,这完全是一种艺术创作,是你想体现给听众、传达给听众,或者你想达到的一种目的和感受。
但是有一些情况原则上是不允许的,或者是没有人这样做的,这种情况也是我们从声音美学上要解释的。尤其是这种音乐会的节目(见图),不管怎么样,如果是一个音乐会的电视转播,我们把话筒摆放在一个最佳的听音位置,我们听音的时候,耳朵的主观位置和音乐的声音、和画面不能有一个严格对应的关系,为什么这样讲呢?如果说我们所有的声音都跟着镜头、画面同步变化的话,这个音乐会就乱了,就没有办法听了。首先,在很多情况下,根据乐队的表现,到了某一个乐器独奏的时候,镜头推上去要给特写,我们绝不能允许马上把这个声部的声音推大。镜头角度变化之后,声音的位置也要跟着做相应的移动。如果现在换了一个机位,从乐队后面反打,直接照指挥,我能把乐队左右的布局翻过来吗?不可以。在这种情况下,就如同是在体育比赛中建立一个环境声的声场,它是不动的,是营造的一个场。在音乐会的电视转播和录音中,我们应该认为我们的耳朵和眼睛实际上是不一致的,耳朵是永远在观众席的最佳听音位置上,面对着舞台用耳朵欣赏音乐会,但是摄像机是能够带着你的眼睛到舞台上去观察乐队和指挥各个细节。在这一点上,没有办法认同声音和画面绝对同步的统一。
从美学角度上来讲,有些是可以任意寻找创作方式,但是大家达成共识的情况看起来似乎是一个原则问题,是不能够变的,如果那样变的话,音乐会转播就乱套了,根本不是声音的欣赏,而是变成玩儿声音,而且是不对的。
(图)图中明显看到,5.0的主话筒放在乐队的中间,大家团团围着话筒,我相信这个作品要听起来是一个你身置于乐队中间,像一个乐队指挥,甚至就是一个乐队演奏员的感受。
一些基本概念和音响美学的内容前面都讲到了。关于环绕声的基本概念及音响美学这部分的内容,不管是大家实际工作中的体会,希望将来要探索的、尝试的方向,我们也都可以沟通。
另外补充一下,从器材、设备的运用来讲,利用设备器材进行艺术创作的宽容度(空间余地),我认为音频比视频大得多得多。当然我不是摄像师,没有搞过摄像,我不知道假设说同样一个摄像机,使用佳能或富士的镜头,在色彩、色调的上会有一些偏差,但是到底会有多大的差异?我可以明确地说,面对同样一个声源,在选择不同品牌和型号的麦克风的时候,变化是非常大的。录音师通常说,话筒是非常有个性的。每一个品牌、每一个型号我之所以要用它,是要用它的特质,话筒和声源配合起来的获得的音色是有很大出入的。有很多地方是要靠经验、靠长时间的摸索,在器材的配搭上寻求一种录音师的风格和创作方向。
还有对于声音来讲,对于所有声音也就是听觉的描述,全部是用视觉和触觉来体现的,没有一个纯粹描述声音的词汇,例如说“这个声音非常的明亮”、“这个声音非常的暗淡”、“这个声音有光泽”,这都是用视觉来描述听觉的。“这个时候声音真的非常冷”、“这个声音就感觉到很温暖”、“这个声音是尖锐的”、“那个声音是柔和的”,这些都是用触觉来描述的。还可以用很多色彩词汇来描述声音,直接说这个声音的色彩如何,简称就是音色。甚至说一个不好的房间对声音有干扰,我们叫“声音的染色”。从颜色上来讲,原本它是一个白的东西,由于环境的反射、由于环境的光的干扰,把它变成粉色的、蓝色的,这叫染色。声音也同样,由于外界的因素改变了声音的本质,我们把它叫声染色。
目前至少在国内,通过我接触到的和我自己的工作实践,音频和视频方面存在一定差异,有很多视频在后期制作、编剪的过程中,尤其多机位、多镜头、多角度的拍摄的时候,更多的时候是导演决定了一切,导演切哪部机器,导演要求这部机器的景别、镜头的调度、距离等等,以及后期画面的剪接,更多是导演居于完全绝对的主动地位。甚至在后期,尤其是做电编的时候,或者是非线性编辑的时候、做画面剪接的时候,基本是操机员的操作来实现导演的指令,这一点跟电影有很大的不同。当然由于电视的生产周期等各方面的制约,它不像电影那样精工细作,电影在这几十年中出了很多好的剪接师或者著名的剪接师,导演会把很多的镜头直接交给剪接师,把自己的创作意图告诉剪接师之后,剪接师自己去处理镜头的衔接。电视里更多的是完全服从导演,剪接师完全是处于设备操作的状态。但是在音频领域,录音师的创作空间要比视频制作的创作空间大很多,录音师可以从始至终直接去创作一部作品,比如对于一个音乐会的录音,录音室就是再创作。很多情况下,整个唱片最终的结果、最终的质量或者它的表现力、是不是完好地再现了原作还是把原作又有了进一步的提升等等,所有的事情都是操作在录音师的手中,录音师是直接进行节目的再次的创作。即使是有监制人、制作人、音响导演和录音师配合,录音师和导演的配合默契的程度是非常高的,因为导演通常都是用听觉或者触觉描述他对声音的感觉,但是录音师要把导演的这种感觉和他对这个导演要求的理解用设备来实现。
在电视声音制作、播出的整个链路中,目前如果仅仅是在演播室制作,或者是整个前期制作过程中,声音制作做到环绕声没有任何问题,当然做的水平高低、艺术水平好与不好是另外一个问题,但是实现环绕声的制作,目前在前期制作设备不是太大的问题。但现在环绕声之所以没有迫切的要求、没有提到议事日程上来,很多制作单位和电视台还采取观望的态度,主要的原因还是市场还没有足够的需求。最后到用户端没有足够的用户全部都能收视高清和环绕声的节目。在技术上,包括发射、传输系统,一直到用户端的解码器(机顶盒)的普及程度,当然最终还要考虑是不是有足够的节目源来支撑这个平台。节目源和最后市场的需求、收视的情况是相辅相成的,或者是一个“先有鸡还是先有蛋”的问题。双方都在等,一方说没有足够的节目源就不用考虑传输,反过来对方说,你还没有传输链路呢,我做它干嘛?如果两边等的话,这件事前进不了。所以,这是整个制播的工艺链一直到用户端的问题。
下面说到标准制式的问题。如果环绕声节目和高清配合起来,将来的传输到底用什么样的编码方式?用哪一家设备?定制在哪种格式下?到现在还没有确定。从目前来看,至少央视高清频道和央视电影频道目前播的高清节目环绕声编码采用的都是杜比的AC3,但将来是不是杜比的AC3就成了国内的标准,现在仍然是在讨论中的问题。包括原来信产部也一直希望我们有一个民族品牌、一个有自主知识产权的项目,今后到底会怎样,现在也不是很明确。这些都制约着高清、制约着环绕声的最终普及。
刚才和大家讨论了关于环绕声概念的问题,包括我们刚才说到的传输编码等等,要建立一个相应的严格标准。这个标准包括了很多问题,实际上标准的建立不仅仅在环绕声上,在音频方面目前出现的问题是要不没有标准,还有一种情况是有标准没有人去遵循。已经说过好多年了,开过若干次研讨会了,甚至已经到了“两会”代表在人大会上为这件事提案了,到现在也没有根本解决。对于音频来讲,就是一个播出的响度问题。所谓播出响度,每一个人在家里看电视都深有体会,换频道,这个频道声音很小,我把音量开大了,一换频道能吓死人,那个频道声音突然就大了。不只是两个频道之间,就是在同一个台不同栏目、不同节目段的时候,最可怕的是广告节目的插入。广告认为做得好、吸引客户的手段就是我这个广告的声音比别人的大,变成了它的竞争手段,认为声音大就好。这难道没有标准吗?有标准,只是没有人遵循和依据标准去做节目。对于响度控制,从广电总局到中央电视台以及到地方台一直在讨论这件事情,尤其是两次在人大会上都有人把它作为一个提案提出来,这种提案提出来,广电总局也非常着急,在那种情况下几次召开研讨会,几次三令五申,但最终电视台也说我没有办法,我播的广告都是广告公司做的,不是电视台做的,除非我不接这个广告,我不播它,否则来了之后没法控制。可是又有经济效益的驱动,我还得接这个广告,还得挣广告费。所以到现在为止,响度问题在电视播出方面、遵循标准方面首先就是一个特别突出的、有法不依的状况。
从制定标准方面来讲,也包括监听标准。容易做到的是响度标准,我要求每一只扬声器都调到80多分贝,这都很容易解决,叫一叫、测一侧,平时经常检验设备、经常做一些测试,这都好解决。现在最难解决的是房间的声学标准,我们做录音、做音频的人经常会为这种事情发牢骚。因为做一个标准的声学环境,最大的问题是在很多方面都是一个吃力不讨好的事情,我要想做一个严格的、标准的声学空间,要用很多特殊的或者专门为声学设计所用的声学材料才能满足声学指标。但是这些声学材料布置在房间里、装修空间的时候,由于声学设计的特定要求,材料放在空间里要占有房间的大量体积。比如原来一百平米的房间要做成一个录音棚,做完声学之后剩下的净空间只有80平米左右,要吃掉差不多20%的空间。做控制室也同样,再加上所有的声装材料可能是比较昂贵的,比一般的普通装修所用的材料都要贵,但是装完之后是没有任何视觉效果,它是隐蔽工程,是埋在墙里、装在墙里的。又多花了钱,又不漂亮,没有视觉效果,还吃掉了很多空间,自然一些非专业的、但可能是掌握预算或者批准项目的人就不愿意干这件事。我们通常说盖一个新的大楼、装一个大堂,花了钱那是用了,花岗岩就是比大理石的效果好,谁都能看见。我用了好的木材的地板比用了一般的复合型地板,没有花钱的不是,就是不一样,所有人都能看到,而且是门面上、脸面上的事。但是做声学装修完全不是这回事,做声学装修所伺候的、最后受惠的就是耳朵。但是耳朵的分辨率往往比眼睛更灵敏,分辨率更高、解析度更高,但实际上人们往往忽视了听觉。因此,目前很多地方新建造的大剧院,比如目前正在建的武汉大剧院、合肥大剧院等等,在录音设施方面都作为最后一块延伸出来的追加项目,有时候这方面的预算控制使你完全没有办法按照标准建立一个标准的录音空间。这也是一个很具体的问题,是制定或者达到一个标准所遇到的很大困难。
围绕高清和环绕声的内容,想到的或者谈到的基本上是属于概念性的内容,具体的和大家的关注点、和大家实际工作能不能吻合,我不是很清楚。大家如果还有希望讨论或者关注的问题,我们还可以用一些时间进行沟通和交流,我准备的内容差不多这这样。
提问:我们有一些人是专门做音频的,其他多数人可能制作的,包括电视台也好、公司也好,有的没有专门的能力达到音频专栏。经常是在制作的时候,稍带手技术负责人统调一下,是这样的情况。而且现在高清学院做的主要是前期培训比较多。
陈奇楠:这是一个很实际的问题,例如从立体声再做环绕声,你的制作周期、包括机房、录音棚的租用时间都要长,成本要加大,而你又不能等比例地收回成本,肯定有很多人不愿意用。
提问:老师,咱们能用现在的环境举例吗?比如后面搭设几台摄像机,这是我们的一个环境,这时候拍出来的画面,大概是镜头从这儿往前,后面可能还没有。这时候,我们应该怎么布环绕话筒?如果照刚才的形式,架在摄像机上一个话筒,可能就会造成以摄像机的点为准的前和后。
陈奇楠:这就等于是和镜头的主观位置是一致的。
追问:假如我的镜头主观位置包括的前面,能看到的是前方,我在画面的后面说话,是否应该在后面拾取声音?
陈奇楠:对。
追问:像摄像机上单架一个话筒能否实现?
陈奇楠:能够实现。
追问:摄像机本身在后面,话筒就在摄像机上,我实际上是在话筒的前面,可是画面里没有我,我在画面的外面。话筒是不是不能放在摄像机上,要放在声源和我之间。
学员回答:这位学员说的是专题片的拍摄方式,一般访谈节目基本上都不做这种方式。
陈奇楠:这也有一个问题,去年总局为了给环绕声订立一些标准,组织了调研小组去了解国外的情况,其中有一个很大的问题,常态的、每天电视台播出的节目,即使国外已经实现了全高清频道,每天节目的播出比例里环绕声的、立体声的、单声道的各占多大的比例?首先要看画面是否需要环绕声渲染的要求,还有制作周期、制作成本的要求,像新闻类的节目,做环绕声是没有意义的,所以大量的这种节目是不做环绕声的。
追问:有没有这样的技术,在屋里我布一个话筒,靠外一点,如果摄像机的镜头往后拉,涵盖整个画面,因为话筒不动,我在调话筒音量的时候,可否就话筒的配比跟着画面做变化?
陈奇楠:这一定是通过后期制作来做,就像一个点话筒录不同的声源,录分轨,然后缩轨,你再调声像的比例,那就愿意怎么摆就怎么摆了。即使影视剧单声道后期的时候,也是多轨制作,比如五个人,有人缺席可以用补录的方式,五个人就录五个声轨的对白,几轨的动效、几轨的音乐、几轨的同期声都等于是素材,最后放到调音台去混录、调比例。这时候环绕声也好、立体声也好,每一个声源、每一个素材摆在什么位置、想做到什么距离,再加上混响、做空间,这完全是一个后期做。现在的单声道也都是这么做,等于完全是后期制作的范畴。
提问:怎么判断一个片子的录音做得好与不好?
陈奇楠:每年国内对于电视的技术评奖有两个,一个是政府奖,广电总局科技司每年颁发金帆奖,包括视频、音频、灯光、化妆等等都有专项奖,这是电视技术质量奖。专门针对声音方面,今年的BIRTV在几天后就有一个评奖,属于学会奖,中国影视技术学会(CSMPTE)下设声音专业委员会,由中央电视台音频部牵头,专门颁发一个录音方面的奖项。以政府奖来说,金帆奖评声音质量的时候至少要考虑两个方面,一个是硬性的技术指标,也就是看磁带的技术电平,按照平均的数字记录标准,0VU=-20DBFS,各台送评的节目磁带都送到评选大会的组委会之后,专门有一些人放着录像机、放着监测仪器,把你的磁带插到录像机中,在带中、带头、带尾随机抽一些点播放,不听声音、不看艺术质量,只看表头上的读数,如果读数没有通过,其他的什么都不看就出局了。这个硬指标。这个指标通过以后,又分成新闻类、专题类、体育类、综艺类各种大的不同的门类去评价艺术方面的水平,包括各种各样的标准,比如首先是声音比例的平衡,比如环境声总是把对白或解说淹没,解说都听不清楚,这肯定不行。解说太大了,背景环境太小,这些都是比例不对的问题。还有更加细节的地方,音效、音乐等等。这是一个总体的艺术评分,最后声音奖就是这么评出来的。
提问:单机出去采访,在没有录音师的情况下自己录音,要调整到什么指标呢?
陈奇楠:回到这一点来说,录音最基本、最重要的就是掌握动态。掌握动态有很多因素,首先就是本身设备的动态你是不是用到足够了,因为在磁记录的时候,尤其是用录像带记录的时候,当然更早模拟时代的时候有一个磁带最基本的设备噪声,上限指的是录音的时候达到不失真,不能大信号的时候声音就劈了、破了、失真了。还有一个就是环境动态,包括你采录的环境周边的噪声,你去工厂车间采访的时候,肯定环境噪声大,这时候你掌握用什么样的话筒,话筒和采访对象的距离,有各种手段,比如机位离人相对比较远的情况下,机头话筒和采访对象如果距离比较远,这时候如果环境噪声特别大,有一个直达声和环境声的声能比,如果这个声能比是一半一半,甚至环境声的声能比大于需要的直达声的声能比,那总是会有被淹没的感觉,后期处理的时候也很困难,因为已经混合形成了。在这种情况下,虽然你是一个人工作,但是不是同时可以配一只无线话筒,不用机头话筒,把领夹话筒给采访对象戴上,如果是在桌面上,可以用一个无线话筒用小架子摆在桌面上,改变话筒和采访对象的距离来改变环境声和直达声的比例。总之,用各种手段,在音质、音色都不说的情况下,对清晰、可懂度有要求,而且一定要清晰,尽量噪声低,而且不能失真,不能录“破”了,这是对采访最起码的要求。
提问:上限我知道是多少,但是下限是多少,很难掌握。
陈奇楠:这很大程度上是经验问题,也就是你对你所录制的这段节目素材或者节目对象的动态范围的掌握,我所录制的这段节目的最小音量、最低电平是多少,如果突然大起来了,要大到什么程度,这是一个动态域,你必须掌握。
追问:但是太难掌握了,每个人审的时候都不一样,所处环境也不一样。
陈奇楠:这又牵扯到监听标准的问题。
追问:其实上限很好掌握,只要不超过红线就行,但下限很难掌握,每个人的感觉都不一样,同一个片子,这个人听着声音小,那个人听着可能声音就大,这方面有没有统一的标准,比如以前有VU表。
陈奇楠:感觉不一样,最重要的是视觉感觉,因为这两个表的时间长数是不一样的,因为原来的VU表是机械指针的,实际上它叫音量单位表,是符合人耳听音特性的,所以它的响应速度比较慢,VU表规定从没有信号到调制度百分之百(0VU)的时候,上升时间是0.3秒。信号过去之后,表针回来也是0.3秒。不管是数字峰值表还是模拟的PPM音量表(节目峰值表),为了看顺态信号,上升得非常快。VU表上面至少要保证有9分贝的余量,通常我们都放到12。实际上语言不超过-3的规定我们也有疑义,认为偏低,虽然它是平均值。声音没上去,就因为是VU表,顺态的东西,300毫秒反应不过来,但语言里有很多峰值已经上去了,所以如果有VU表和PPM表的话,你要对应着看。
追问:计审的人听的时候,每个人感觉都不一样,他会根据每个人自己的习惯或个性来决定,很难掌握。
陈奇楠:外拍的时候可能受一个人携带器材、设备的限制,我们通常说语言信号看起来简单,实际上动态很大,不好录。当然在固定场合录的时候相对会比较好,我们用好质量的压缩器来控制动态,保证声音的饱满度和响度,把低电平的信号稍微提一点,把上面控制住不让它过,这样录制出来的声音会比较饱满,提高平均响度就可以。外拍会有一些问题,但要真正拍一些高质量的节目的时候,一般来说,摄像师和录音师要两个人至少要有分工。
提问:比较严格的纪录片一般是挑杆还是领夹话筒?
陈奇楠:一般是挑杆。如果用领夹话筒,这不是一个很好的解决方法,因为在综艺节目里,大家从镜头的美学观点已经开始认同带头戴而不是领夹了,如果用领夹非常满意,干吗还要用头戴呢?因为领夹解决不了问题,第一声音辐射方向不一样,人说话向前辐射,但领夹戴在领子上,人不能总低着头说话,音色上的差异就产生了。而且一般这种领夹话筒为了避免人移动偏离方向,都用全方向而不是心型的,这样对环境噪声的声场就会有影响,甚至如果是现场做综艺节目,甚至会产生反馈、啸叫。在录音,尤其是扩声、拾音的时候,特别强调拾取对象的实际声源和周围环境空间声源的声能比,这个比值越大,清晰度就越高,直达声越够的时候,增益余量就越大,就不用推得很大,当话筒离得比较远,觉得直达声声音不够,加大调音台输出,加大推的位置,实际上环境声也是等比增大,清晰度没有提高,而在话筒里还会产生反馈,会产生声音发空、很晃的声音,不是很实在。
为了追求声音更稳定、质量更好,大批的都在用头戴。但是这种头戴有局限性,一般来讲,领导人不能戴,配合使用话筒是一个很重要的问题,采访对象的声源一方配合使用话筒很重要,演员和主持人非常好沟通,因为他要表现的就是声音,你不告诉他自己也会很注意,因为影响到他的表现力。但是我们做会议采访或非专业人士讲话的时候,他就离着话筒很远来说话,你也推不起来,推起来则环境声能比不够,录出来的效果就很差。在这种情况下就要想办法用一些特殊的应对措施来解决这个问题,因为拾音终归是很科学的问题,不是这个距离就达不到这个效果,就不可能在同样距离下或应该有的标准拾音距离下产生同样的应该有的效果。
总之,各方面的因素都有,环境的因素更大,包括电视台的演播室里,最近一段时间都有希望作开放式演播室的潮流,看到后面的电视背景墙,甚至后面有编辑机房、有设备作为衬景,这种时候就会产生环境噪声的问题,解决这个问题很多情况下都会加玻璃隔断,那么就产生反射的问题,为了解决反射的问题,就要考虑到话筒的指向摆位,是用桌面话筒还是用头顶吊话筒,各种各样的情况,都要去实地探索测试。
追问:究竟是桌面话筒比较好还是吊话筒比较好?
陈奇楠:一般来说桌面话筒比较好。
追问:如果是站着的环境呢?
陈奇楠:如果站着,最好还是有一个支架话筒,比如声乐表演等这是最佳拾音位置。或者略微矮一点,因为如果直对会有演员喷口的问题,有气流的声音、喷话筒的声音,或者是过多的齿音、气息的声音会比较多,所以稍矮一点相对来讲在下巴或者稍微低一点的位置会比较好。
基本上我做拾音的时候都是用心型的指向性话筒,方向性不是特别尖锐,但还是单一方向性的话筒。这样,后背180度的入射地方的灵敏度是比较低的,环境回来的环境声音会比较少。超指向话筒一般都不会用在这种播音的场合下。
追问:超指向话筒要注意什么?
陈奇楠:首先是正对声源,因为它的指向夹角比较窄,偏离之后衰减比较厉害。其次,超指向话筒的侧面有很多槽,有很多开口的缝隙,千万不要把这种隙堵起来。很多电视台采访的时候,希望把台标套在话筒上,如果台标套在话筒上,把杆周围的缝隙(干涉管),从正面入射的声波和侧向通过缝隙入射的声波,正好因为杆的长度和膜片的位置,声音入射和侧向入射到达膜片的声音的路径是经过严格计算出来的杆的长度,之所以是超指向话筒,就是因为前面有一个管,这个带槽的管是干涉管,用声干涉的方式来解决指向性的问题,侧向入射的声音在像位上是会抵消的,所以才有声音的很强的指向性。指向性越强的话筒,干涉管就越长,416和816比起来,816是超指向的,416只是强指向,杆越长指向性就越强。但是如果把杆两边的封闭堵住了,干涉作用就被破坏或者变形了,就影响了它的拾音特性
提问:单机拍摄风光片也要注意环境声,同时不想再单录,是不是买一支立体声话筒就最好了?
陈奇楠:可以。当然这种环境声录起来,跟着机头录一些同期声,尽管专门的机头话筒和机头安装连接件已经做了悬浮海面的减震处理,但是在操作机器的时候,有可能还会把不必要的操作噪声引进来。这种情况下,比较理想的就是用一个鱼竿,独立放在一个点上。如果你的机位不是移动或长距离跟拍,只是在一个地方拍一个比较长的镜头或者一组镜头的时候,最好把话筒放在单独的位置。比如你的周围有泉水、鸟叫,这是一个整个的环境空间,最好把话筒放在独立的位置,包括你拍摄过程中的工作噪声都不要拍进去。
如果拍的都是风光,但总的是在这样的环境、这样的场里,没有特效的声音,假如你跟拍的过程中前面有条路突然过了一辆车,你要把整个车在画面移动的感觉都拍出来的话,那么话筒可能要指向车。如果是立体声的话筒就不需要跟,因为立体声话筒固定在这里,立体声技术本身就是移动的效果,你是不用跟的。最后要看你最后的画面和车的声音效果是不是一定要和画面吻合。
提问:立体声后期制作的时候监听有没有特殊要求?
陈奇楠:没有,应该是相对比较标准的监听。虽然音箱不用太大,在一个小的后期制作间里,音箱终归还是要用广播专业的、监听级别的,现在好多机房都弄多媒体音箱也拿去做监听,我个人认为钱不是要省在这一点地方。
提问:很多摄影棚也是为了节省经费,对声音的隔音或反射做得不太好,我们在拍摄的时候也不能让人家改造,那么我们采取什么措施能减少回声,做得尽量真实一点,尽量像实际声音效果呢?
陈奇楠:在室内,首先自己要分清你面对的声音的缺陷和噪声源是什么,一种是宽带的背景性的噪声,比如房间的空调或者是空调的风机设备,等于是整个房间的本体噪声,你录的时候就同时录进来了。还有一种是某种声学缺陷,比如某个地方就有固定方向的反射,就会造成回声或反射,这种改善就要想一些措施了,比如我能确定是从哪个面、哪个方向上的反射,我把这边挂一些帘子、厚重的幕布,改善一下,就得调整一些东西,这还是有作用的。
追问:房顶上也可以挂一些布?
陈奇楠:可以,可以用一些临时措施来减少影响。
追问:话筒的回受啸叫呢?
陈奇楠:这一定是在有扩声系统的时候才会有,单独录音不会有。录音时候的啸叫是在录音棚做配音或者录音乐节目的时候,演员是戴反送监听耳机的,反送监听的耳机密闭不好或者摘耳机的时候,和麦克风会产生一种回受,这种回受有的时候很严重、很可怕,这一瞬间的回受可能把监听扬声器的高音单元给烧掉。在录音里发生最多的是反送监听的耳机和话筒之间产生的回受。
提问:电视台播的只有中央音乐台是立体声?
陈奇楠:它打了一个立体声的LOGO,但是我从来没有听到过。
追问:我们的遥控器也无法控制,在日本或国外,遥控器有一个声音多同,比如这个节目放的是日语,按了遥控器一切换,节目可以转换成英语,我不知道我们国家电视节目是不是能切换?
陈奇楠:很多年前我们国家推出过一个“丽音”,是为了照顾到少数民族,比如左声道是汉语,右声道是藏语等少数民族语言。
追问:咱们国家对此有标准吗?
陈奇楠:标准应该有。电视立体声为什么会产生这么大的时间差距,到今天为止还是这样的状况,我也不清楚。
追问:即便是在标清或模拟时代,国外已经有了,但我们好象没有这种需求,即便到了高清时代。
陈奇楠:应该说常态都是立体声节目,只不过播一些老片子或其他节目的时候兼容单声道,在高清频道同时兼容环绕声,当然环绕声节目相对少一些。
追问:就像刚才说的,你做了立体声节目,也是按照单声道来播,这对于整个产业发展不是政府正确的支持,也可以说是领导上的缺陷。
陈奇楠:还是市场的需求问题。
追问:问题是家里买了新房都配家庭影院,配左右声道,但是电视不支持,只能看片子时候用到。
陈奇楠:这关键还是标准问题,为什么杜比推行的时候认为自己是一个比较完整、比较圆满的系统?国内现在也承认,但是碍于杜比在设备的环节方面要收取专利费,存在费用问题。另外,国内也始终想发展具有自主知识产权和民族品牌的技术。关键问题是,杜比在前端制作过程中,环绕声从制作到播出、到用户端是一脉相承的,有一个完整体系,而且很重要的是它有一个源数据,从一开始制作一直贯穿到用户端。比如我制作的时候,通常用杜比E来编码,在编码的时候,做环绕声时势必要考虑,如果用户不能收听环绕声、需要单声道或者立体声的时候,杜比E的信号向下的兼容性是怎么样的,因此在制作领域的杜比E的这个系统来有一套仿真监听系统,可以把源数据加进去之后使你感受到编码以后再解码回来,甚至是转换成单声道、立体声的情况,要保证它的兼容性。最后到了播出前端,为了把数据量再做更大的压缩,用AC3的编码方式传出去,不管是上卫星传输还是到了地面,直到用户接进家庭到了机顶盒,这个编制的源数据信息是贯穿始终都带着的。也就是说,机顶盒接收下来的电视信号,源数据里带来的信号就告诉你了原始的信号是立体声的还是环绕声的还是单声道的。所以,机顶盒接到这个信息之后,就会自动转换成是环绕声还是单声道的声道分配方式,而且同时和用户家里的播放系统相配合,如果接收到的信号是环绕声,而你的接收系统是立体声,它会自动下变换成立体声,整个链路是通的。现在一般没有标准的情况下也都是在用杜比AC3在做,包括央视的高清频道,也是在用杜比的AC3来播。
提问:现在电视台的高清频道可以接机顶盒?
陈奇楠:应该可以,现在很多地方试播有通过歌华等高清收视,外地每个月不同的有高清频道收视费,但是你在选择机顶盒的时候有区别,用松下的机顶盒才能解出来环绕声的解码,国产的机顶盒没有环绕声的解码芯片,这个芯片还是要买杜比的。
提问:也有,但是没有输出。杜比的解码器是没有的,只是输入输出的问题,下变换是解不出来的。如果机顶盒兼容高清,一种是松下的带60兆输出,一种是长虹的,不带输出。输出的口没有,还得接到AV功放。
主持人:今天的讲座到此结束。特别感谢陈老师给我们做沙龙,也特别感谢大家的参与,我们希望今后每个月能有一次机会,请大家一起来聚一聚,不拘形式,来讨论大家共同关心的问题,也希望大家给我们提出更多、更好的建议,不管是高清技术学院毕业的学生还是我们的客户,我们都欢迎。
※版权所有,未经许可请勿随意转载※