网站首页 > 摄影> 文章内容

全景视频拍摄多机组合方案入门

※发布时间:2016-10-7 18:30:00   ※发布作者:habao   ※出自何处: 

  文章摘要:本文将简析多机组合方案的设计原理、拼接时画面死角的计算方法、提供针对画面接缝的优化建议、对现有的主流多机组合方案进行简单评析、并提出符合不同需求的独家优化创意方案。全景视频常被误称为VR视频,事实上现有大部分全景视频的交互性很低,或者说本身并不产生交互,只是一种可以用于VR设备720°观看模式的视频素材。全景视频在观看时可以视角有720°,可以看到前后左右上下全立体空间,这是因为在拍摄时就按照选用的多机组合方案,将多台相机放置在方案对应的支架上,覆盖拍摄点位上的全视野可见画面,来完成。

  在拍摄时就要求画面能够覆盖视野内可见画面的新视听模式,目前常作为VR设备的标配内容。进行全景视频拍摄的基本逻辑就是在一个设计好的支架上,按照一定规律放置多台拍摄装置。

  这些装置在同时开启后,会记录下时间轴上该装置组所在点位水平和垂直面上的所有图像信息。在录制完成后,利用专业的拼接软件,从所有拍摄装置中抽取同一时间点上的一帧画面,进行拼接变形后生成符合柱形全景投影标准,水平和垂直比率为2:1的全景图片,再利用这一帧的数据渲染所有拍摄的帧序列,最终生成可以进行全景播放的全景视频。

  这种视频在内嵌漫游技术的播放器或者播放平台上,就可以实现720°全方位的观看,在VR眼镜端口可以实现全沉浸体验,带上眼镜就等于置身拍摄时拍摄装置所在的点位,有远超传统视听模式的临场感和时空感。

  全景视频的拍摄目前还处在摸索阶段,用于拍摄全景视频的设备存在两个大的分支:一体机和多机组合解决方案,这两种分支在结构原理上是相同的,都是通过多个摄像单元采集720°视野的画面来获取全景视频素材,不同处主要在于整体方案解决能力上。

  Facebook开源的Surround、诺基亚的OZO,三星的Gear360这些都属于一体机,一体机采用相对封闭的结构,多个摄像单元采集的素材在拍摄完成后会按照内置的算法进行自动拼接后输出,有效减少了大量的后期工作,通常一体机还包含了推流编码等解决方案,可以稳定地用于直播或者监控。

  多机组合方案是根据需求现成的拍摄设备,通过计算后按照一定的矩阵模型进行组装,来进行全景拍摄的组合型配置,最常见的就是Gopro的多种全景矩阵,但这种方式需要自己进行后期拼接和其他配套方案设计。

  本文进行基本的全景摄像入门、简析多机组合方案的设计原理、通过案例分析拼接时画面死角的计算方法、提供针对画面接缝的优化建议、并对现有的主流多机组合方案进行简单评析和个人推荐,为正在进行多机组合方案探索的团队提供基础的设备选择判断标准。

  拍摄最重要的工作就是进行设备选择,全景视频本质上就是几台单元设备同时拍摄的一种视频形式,所以也需要考虑视频画质、清晰度、宽容度、分辨率、帧率等因素,根据出片需求进行最佳优化方案标的设计,并根据设计来进行相应的器材选择。过高的设备配置会增加预算,降低制作效率;过度的设备配置会导致无法满足出片目标。

  全景视频作为一种全视角的视听新模式,在画面尺寸需求上远超传统视频,电影级别的全景视频清晰度至少需要8K,但因为8K级别的视频在拍摄端、后期端、播放端要求都需要顶尖配置,所以现阶段大部分的全景视频都按照4K标准在进行创作。

  在从VR眼镜中进行全景视频观看的时候,4K以上的清晰度才能勉强满足体验上的沉浸感,即使在PC端或者手机端上纯粹以全景漫游的形式观看,也最好达到2K左右的清晰度,才能在漫游模式下观看体验PC端达到标清,手机端达到高清。

  说完了需求以后再来看清晰度达成的条件,目前VR观看设备主要有三种形式:分别是VR头盔、VR一体机和VR手机盒子,这些设备并不都具备播放4K全景视频的能力。

  使用手机盒子模式的设备,播放视频的清晰度依赖手机本身的屏幕像素。索尼在2015年9月推出的XperiaZ5Premium是目前全球唯一一款搭载4k屏幕的手机,可以预期未来会有越来越多的品牌先后推出自己的4k手机,但是具体需要多长时间目前还难以判断。市场上主流的手机屏幕依然是2K和1080p,这就导致需要借用手机播放来完成VR体验的VR眼镜所能获得的画质基本被限制在了2K以下。

  不仅移动端在面临清晰度的考验,在PC端领域同样存在着配置门槛,目前大部分中低PC端对于4K级别视频的播放都难以满足。各大巨头的一代VR头盔都默契选择了2K分辨率阶段,4K基本都作为二代的目标处于研发阶段。

  VR一体机与头盔相似,但是其从构造上就决定了必然比PC端更难达到4K。

  除了硬件端播放的限制以外,全景视频合成上也存在着制约因素。大部分常见的拼接软件都暂时只支持到4K(4096x2048)分辨率的视频输出。

  现阶段全景视频现阶段最理想的分辨率是4K,这是最能够平衡需求和限制两方面矛盾的阶段最佳方案。8K虽然是理想的全景视频分辨率,但其无论是采集、拼接、生成还是播放上都还存在着技术和硬件上的滞后,现阶段并不能普及。目前最主流的全景视频分辨率还在2K阶段,这个分辨率能够适应现阶段移动端和PC端的输出限制,能够更好地用于VR直播等内容展示端口,但是也面临强烈的淘汰危机。VR内容的不断成熟会带来一次硬件端的快速迭代,4K分辨率存在的制约有望在近期得到改善。

  决定画质的因素是多方面的,在同等分辨率的情况下,最重要的一个因素就是摄像单元器材的CMOS尺寸。

  利用大画幅设备进行拍摄的影片在画质上会表现出明显的优势,以全画幅设备和1/2.3英寸设备作为对比参照案例:全画幅设备的CMOS尺寸为36×24mm,1/2.3英寸设备的CMOS为6.16×4.62mm,大概是全画幅的3.2%。所以当全画幅的设备和1/2.3英寸的设备拍摄出同样为4000万像素的图片时,全画幅设备每一个像素宽约有11.18微米,1/2.3英寸设备每一个像素宽约有0.76微米,像素越宽的时候,其捕捉的光子越多、画面噪点越少、且更能适应低照度的拍摄环境,所以具备拍摄同等像素视频的设备之间,画幅越大的设备画质越具有优势。

  所有进行VR拍摄的团队应该都遇到了接缝的问题,无论是使用多机组合还是一体机,画面在拼接时都会因为多种原因,导致出现明显的拼合接缝,这种问题导致的原因是多方面的,在下节“接缝原理篇”中会针对全景接缝出现的原理,优化的方案和死角领域的计算方法进行详细地阐述,这里只简单说明一下接缝问题与全景视频出片质量的关系。

  多个机位拍摄的素材在拼接时,两端相邻素材之间有时候会出现无法完全拼合的情况,尤其在距离较近的情况下,如图1所示,当视频人物出现在接缝位置上,会出现断手断脚断头等情况,这就严重影响了全景视频的观感和沉浸感。不同的多机组合方案,接缝出现的严重程度、范围和可控度各不相同。

  通常接缝问题都是按照距离,从远到近逐渐严重,所以这里用米为单位来衡量拼接完成度,数字越小则拼接完成度约高。接缝问题控制较差的方案,会在3米内都存在接缝干扰,甚至是多面上难以规避的接缝,这种方案的拼接完成度就是3米。接缝问题控制较好的方案,可以将接缝干扰控制在1米内,同时接缝规整,容易规避,这种方案的拼接完成度就是1米。

  较差的接缝控制方案会对全景视频从拍摄到后期都造成巨大的干扰,相反在方案配置上优化好接缝问题,能够为全景拍摄团队带来更大的创意空间和更高的工作效率。

  综上所述,根据全景视频在清晰度、帧率、画质和拼接完成度四个方面不同的需求,可以大致判断出来在进行多机组合方案设计的时候,根据不同的出片需求应该选择的对应装备。比如用于VR直播的方案,清晰度只需要在拼合完成时能够满足2K,那么选择的单元设备可以按照水平面上累积满足2048像素,垂直面上累积满足1024像素要求即可。

  这里推荐的可商用配置应该满足4K画质+30帧帧率+M43画质+1米外的拼合完成度。

  全景视频拼接实际上是一帧一帧全景照片的拼接,常用的拼接软件KolorAutopano和VideoStitch的原理都是从采集视频的多个画面中抽取一帧完成拼接后,利用这一帧的拼接数据进行全视频的渲染,来最终实现整个全景视频的拼接和输出。

  因为合成全景视频的一帧是来自多个镜头抽取的一帧来进行,所以本身就会因为各个画面信息在采集时的细微差异造成区别,比如曝光不同就会造成明暗接缝,对焦点不同会造成清晰度接缝。

  并且现有的绝大部分拼接软件,都只支持合成来自完全相同单元配置采集的视频,即相同的机身和镜头焦段,所以单元配置不同的组合方案很难进行后期合成。

  相对来说这些问题总体还属于可控的范围内,通过将采集设备进行精确设置可以有效减少及避免这种来自采集设置上造成的拼接问题。但是还有两个更加重要也更加难以控制的重要元素:一个是镜头的节点,一个是相邻照片拍摄内容的重叠面积。对于大部分拼接工作人员而言,这两个元素的控制情况决定了全景视频的最终拼接品质。

  首先来看一下什么是镜头节点,镜头节点也被称为镜头的光学中心,大概就位于下图2中,两条红线在镜头内交叉的位置上,具体每个镜头的测算方法可以自己寻找教程。

  传统的全景照片拍摄就是将相机安置在一种特殊的云台上,利用云台的特殊设计来保证相机的节点不发生偏移,然后旋转相机进行720°方位的拍摄,这样拍摄的一组照片能够最大限度保证对物体的透视关系不发生变化,如图3所示相邻画面重叠部分的内容透视关系一致,进而帮助拼接软件计算同组不同画面之间的关系,从而进行更好的拼接渲染工作,最大程度实现精确拼接的目的。

  但是在进行全景视频拍摄的时候,为了保证各个机位在时间线上的一致性,必须将多台机器组成一个矩阵,同时进行拍摄,这些机器的光学中心是不可能重合的,也就是说相邻两台设备拍摄内容中重合的部分会出现不同程度的透视关系偏移,这是导致拼接难度较大,也是大部分直接使用软件自动拼接功能时,出现接缝问题的第一个要素。

  传统全景摄影中也有不使用全景云台进行拍摄的情况,这种情况下控制节点问题的方法也较多,通常使用的设备画幅越大,被拍摄的物体距离越远,使用的镜头FOV(视角度数)越小,出现偏移的情况则越不明显。

  最令人振奋的是,在Nuke公司推出了专用于全景视频的插件 CARAVR后,节点问题的可控性变得更加容易,如下图5所示,利用CARAVR,可以在软件中设置使用的摄像器材数据,利用其强大的节点计算能力,减少了大量依赖控制点、位场等微调手段来进行画面拼接的后期工作。

  再来看看造成接缝出现的第二个要素:相邻设备拍摄内容的重叠面积。从软件计算的角度来看,相邻设备拍摄内容的重叠面积越大,拼接软件在进行自动识别的时候准确度越高。在传统的全景摄影中认为相邻画面理想的重叠面积为30%~45%,但是节点的准确性和画面的丰富性可以有效减少这个需求。尤其是节点与画面重叠面积的需求存在强关联性,节点越精准,画面重叠面积需求越小。而画面内容的丰富性则有利于拼接软件的控制点识别,信息较少且带有规则花纹的画面比如天花板、木地板、墙纸等都会给拼接软件带来较大的困扰。

  可以预见随着全景拼接技术的进步,拼缝这个问题将变得越来越可控,只要镜头拍摄到了需求的素材,并能保证相邻画面存在10%甚至5%左右的重叠率,就能极大的减少拼缝痕迹。但是现有的很多多机组合方案在采集素材的时候,本身就存在素材获取不完整的问题,这部分无法获取素材的区域我们称之为死角区域。造成这个问题的原因一部分是因为设备本身要在空间中占据一定位置,为了便于解说,我们以五台90度垂直地面排布的SONYILCE-7SM2(以下简称A7S2)全画幅相机+10mm鱼眼镜头为例。如图6所示设备所在的粉紫色阴影部分,也就是第一死角区域是绝对不会被拍摄到的。

  另外一个死角区域是由单元设备本身的FOV决定的,A7S2+10mm鱼眼镜头在垂直面和对角线上的视角度数能够达到180°,中心横向面视角度数约为120°,向垂直轴两级视角逐渐变大。按照A7S2官方数据资料,在使用4K模式时,该机拍摄视频的尺寸是3840*2160,画幅比例为16:9,也就是说在横向面上需要再乘以0.84的系数,最终中心横向面上的视角度数约为100度,实际所得视频画幅如下图7中灰色阴影部分所示。

  视频画幅垂直面和对角线上的内容都在180°,在其朝向方位垂直面的信息都能够得到足够的记录,但是越是接近垂直轴中心点的横向界面的视角越窄,最终只有100度左右,所以按照案例设计的排布,下图8中粉红色阴影部分就是这一套多机组合方案物理中心水平面的死角区域。

  死角区域三维示意图

  参照A7S2的机身宽度126.9mm,根据图10示意图可以大致算出这个死角五角星的最远端约为405mm,如图10所示,以画面至少重合5%为最低需求,使用这套配置拍摄的安全距离大约是520mm,以画面至少重合10%为最低需求,使用这套设置拍摄的安全距离大约是640mm。

  这套方案生成的视频会在顶端和底端存在一个与第一死角区域对应的五角形空白区域,鉴于这个范围在相对开阔的空间中存在感较弱,大部分情况下可以直接通过后期快速修补处理。

  如果有大量的运动画面需要拍摄或者追求更完美的拼接结果,还有两个方案可供选择,一个是直接在在顶部和底部分别再增加一台设备,完美采集到所有角度上的画面;另外一个是将5台设备分别对天极和地极方向进行一定的角度偏移,具体计算方式可以自行筹算,这种方案在后期和方案设计上会增加一些难度,但可以节约部分器材费用。

  选择A7S2+10mm这套方案作为案例主要是因为全幅相机不需要换算焦段倍率便于计算,在利用案例所示的计算方式,进行其他设备方案安全拼接距离计算的时候,需要根据所选设备的感光元件尺寸与镜头焦段及其换算比例进行对应的测算,才能按照出片需求为选择理想的多机组合方案提供基础的模型设计参考。

  多机组合方案有两个重要组成部分,一个是单位器材的选择,二是矩阵的设计。单位器材就是能满足拍摄需要的摄像机或者相机,根据镜头的特性和摄制成品POV的差异,可以组合的方案还是很有想象空间,下面就先来简单了解一下几个最常见的矩阵设计。

  1、双鱼眼FISHEYE

  以柯达的SP3604K运动相机为例,这款机器的传感器尺寸和Gopro一样为1/2.3英寸,号称235°超鱼眼视角,4K拍摄时候的视频尺寸为3840*2160,采用的方形截取,视频长宽比例为16:9,这就会造成大额的视角度数损失。水平面上能够保证全域的视角,但垂直面就只有214°,拼合的全景视频天空和地面都存在大范围的缺失。

  事实上即使能够通过双鱼眼实现水平和垂直角度都达到360°的覆盖,双鱼眼矩阵这种模式也存在着天然的瓶颈。水平面上仅有两个180°的鱼眼素材,无法摆脱鱼眼天然存在的过度畸变问题和画质损失问题。鱼眼镜头将高FOV的画面强制压缩在一张平面图片上,所以越靠近画面边缘部分的内容畸变越严重,而且在相同像素宽度中会挤压更多的内容,也就意味着越往外野的画面信息获得的像素空间越狭窄,在生成投影图时与中心区域的像素和质感存在显著差异。这种画质的严重损失问题又会进一步导致视野过窄,进而导致观看者出现眩晕的问题,以一体机GEAR360为例,在采相原理上同样是双鱼眼,拼接后的全景视频虽然不存在视角缺失,但还是极易产生严重的眩晕。

  2、Gopro标准6目

  这是目前大部分工作室或者初创企业在探路阶段的首选方案,大约3500刀的成本,利用Gopro拍摄全景视频的时候,为了保证最大画幅,通常会选择4:3的宽视角设定,这个时候Gopro拍摄出来的视频在水平和垂直面上的FOV分别约为122度和94度,勉强能够符合这种菱形六目矩阵的拼合需求。

  但是要满足相邻画幅超过5%的叠合率,大概需要2.5米以上的安全距离,在单元设备水平轴中心位置上这个距离要求会更高。

  在各大VR在线视频网站上可以看到,使用6目GOPRO方案的视频多数将视角放得很低或者放得很高,拍摄对象也相对安静,动作幅度小或者就在原地进行舞蹈等表演,通过将拍摄对象严格控制在安全范围内的方法来规避夸张的接线问题。

  3、MOOOVR方案

  这个模型就是前一节中案例设备方案的原型,MOOOVR公司目前国内的合作方是乐视,拼接软件的合作方是Videostitch。该公司官网主打方案的是单元设备为:佳能M2+三阳7.5mm的搭配,M3属于APS-C画幅,转换系数1.6,如果垂直90°排布能够在单元设备采集画面对角线上实现180度视角,天极和地极的缺失部分会略高于案例方案,可以通过更优化的排布和后期来改善这个问题。MOOOVR销售的这套设备目前售价9000刀,能够生成4K较高画质30P每秒的全景视频。如果能够具备自己制造支架的能力,纯粹五台设备+镜头大约需要4500刀。

  在前一节案例中设计的方案中试验用的设备是“SONYILCE-7SM2+佳能8-15mm+镜头转接环”的配置,这套方案综合性价比较高:能够直接拍摄出8K清晰度、微电影画质的全景视频,并且拼合安全距离低于1米,接缝位置容易把控,在这种标准下2.5万刀的成本称得上价廉物美。但是本文前面已经提到8K目前还不是主流,所以如果不是对画质或者视频内容有更长远的布局,也可以考虑MOOOVE官方提供的方案。

  4、Surround360方案

  Facebook这套开源方案出来的时候就有人预言今年夏天在深圳会有无数的复刻版出现,这套方案无论是视角、拼接、同步、画质、分辨率、安全距离还是推流等问题上都进行了周到的优化,甚至还解决了散热、串流等对初创团队来说难以攻克的问题,堪称现阶段最经典的组合方案布局。比较遗憾的是其独特的拼接算法只能用于灰点公司开源的单元设备上,其他设备因为节点等差异无法实现完美复刻,成本大约3万刀,是在资金充裕情况下最佳的选择方案。

推荐:

关键词:摄影入门视频
相关阅读
  • 没有资料