
2025年5月15日至16日,中国电影电视技术学会电影高新技术专业委员会2025年度会议在陕西西安成功举办。本次会议以"智影融合·AI+XR赋能中国电影产业创新升级"为主题,汇聚行业专家共商技术发展。全球领先的视听传输技术商科腾科技受邀出席,公司中国区负责人杜俊峰在会上发表《基于AI智能路由的影院直播方案》主题演讲,详细分享了公司在高画质、高可靠性影院直播领域取得的技术突破与成功商业化实践。
以下是演讲主要内容:
各位领导、各位来宾、各位专委会的委员大家下午好!
我是来自瞬已网络,同时也叫科腾科技的杜俊峰。今天要跟大家分享基于AI智能路由的影院直播方案。
科腾科技本身已有20多年在广播电视、视频传播技术及服务领域的行业经验。10年前,科腾科技开始技术出海,目前总部位于新加坡。而作为专委会的新聘委员单位,瞬已网络科技上海有限公司是科腾科技在中国大陆的运营实体,同时也是研发与生产中心,主要业务包括以下三方面:一是传统广播电视领域国内外频道的节目传输;二是国际A类体育赛事转播及相应版权内容在全球的分发;三是我今天即将跟大家着重分享的影院直播,具体而言是舞台线上表演和影剧院直播的落地场景。
科腾科技的影院直播业务始于2019年,当时与一家名为 Live Viewing Japan 的日本公司,即 LVJ 合作。这家公司的最大股东是日本一家上市公司—Amuse。但相比电通集团、东映、东宝等其他股东在影视媒体行业的赫赫有名,它在国内并不是那么知名。LVJ 是做影院直播业务的,它把高质量的现场内容通过直播技术传播至当时日本国内200多家影院和其他一些场所,做沉浸式观看体验。LVJ找到科腾建立合作就是为了把这些优质内容传播至除日本之外的其他国家和地区并在影院播出。截至2024年,科腾科技、瞬已已累计执行了200多场国际影院直播,合作影院累计超过200余家,在超过600块大银幕展示。目前,我们直播过的内容包括音乐会、音乐剧、话剧,还有日本的二次元动漫。2025年年初,我们和 LVJ 共同宣布成立了合资公司 LVE,即 Live Viewing Entertainment,以打造崭新的全球影院直播平台。
我们近期直播的内容仍以日韩内容为主,从过往的直播记录上看,我们做过的单场票房最高直播是在2023年6月3日,是BTS防弹少年团的个人演唱会,在亚洲区域内创造了320万美元的直播票房收入。我们在上个月(4月)和上上个月(3月)分别执行了韩国女团IVE和韩国女歌手TAEYEON的直播任务,同时有100+影院参与了相应场次的直播。
回到技术本身,影院直播最重要的挑战是什么?我认为这个问题的答案不止一个,但视听画质一定是其中非常重要的因素。因为在当前互联网视频如此发达的时代,大众娱乐方式日渐多元,观众可以通过手机等各类载体观看很多网络视频,那为什么大家要走进电影院去观看这些内容呢?其中很重要原因就是影院具备其他娱乐方式不可替代的沉浸感,就是它的画质。而基于影院的直播技术方案涉及传输,且一定需要编码,也曾有影院技术人士问过我:如果编码画质是不是有损失?答案是肯定的,但这种画质损耗是可以被测量,且测量编码后视频画质损耗的方法众多,今天我着重跟大家介绍其中一种名为 PQR 的方法。
PQR 是基于图像感知的评估指标,与原始视频和编码后又解码的视频进行对比,其测评得分值越小越好,值越小代表感知差别越小,画质相应也就越高。
根据 PQR 官方文档的说明,可 PQR 得分为1时,测试视频与原始视频的差异小于0.1%,观众几乎无法通过肉眼看出区别,则视为顶级画质,通常来讲可认为是几乎无损的压缩了;当得分在2-4之间时,观众可察觉轻微区别,但所呈现画质仍可归为非常好到杰出的范畴,且数字越小越杰出。这是非常典型在广播级别应用时会采用到的一些视频,包括我们做的电视节目、体育比赛等都会用到的码率段或质量段。影院直播起码应达到这一画质,但目前尚无相应标准。如果以 HEVC 为标准,HD 典型码率须在12兆以上,建议最好到20兆;影院 UHD 应在30兆以上,更建议达到40兆。PQR 在5-9之间为消费级视频画面,即通常在手机和互联网上观看到的视频;PQR>10属于较低劣的画质,不在我们今天讨论的范围。
正是由于影院直播对高画质的极致要求,带来了一个技术挑战,即高码率。其对于传统传输方式的影响是增加了不稳定性,同时增加了可靠传输难度和成本。但高可靠对于影院直播业务而言是核心的核心,是至关重要的。基于我们大量直播场次的经验,在商业视频直播时出现中断、黑屏是严重的播出事故,会导致直接经济损失;如果画面出现破损、卡顿,影院声誉也会下降,直播业务可能无法再继续开展下去。此外,低成本和灵活性仍需被考量。如果成本很高,影院和内容方都不愿承担,则无法覆盖票房,进而导致没有人会去做这样的业务。灵活性是指在影院快速部署开通,如果说今天一个影院想加入,至少很快时间它就可以,技术上都达到相应要求,可立即加入播放联盟中。
这里我列举了4种目前市面上能看到的影院直播传输方案,以一个四维雷达图,分别从画质、灵活性、可靠性、经济性四个角度呈现这些方案的优缺点。
一、专线方案最早出现,也是最早被应用的。其优点非常明显:高可靠且能承载最高画质。此处就是前面提到2019年前在日本国内全部采用这种方案,是唯一能保证品质的方法。但该方案的缺点跟优点一样明确,就是成本高且非常不灵活。这也是 LVJ 选择走出日本国内、必须与科腾这样的合作伙伴联合拓展业务的最根本驱动。
二、CDN,这也是目前大众普遍采用的视频观看方式,其本质是消费级内容分发网络技术,技术方案已非常成熟。CDN 基于苹果 HLS 分片技术,具备灵活、成本低、易得的特点;但缺点在于无法承载更高码率,且由于其为应用于C端的技术,尚不能保证真正意义上的可靠性。
三、SRT 代表一类网络优化技术,由于做了协议优化,其可支撑比 CDN 更高的码率,即承载更高码率,通过优化算法补包达到更高效果。但是它仅仅是一种协议优化技术,并没有自己的网络基础设施,无法建立立体式的高速通路,也就无法承诺传输的可靠性,无法在短时间内达成大规模应用。
四、Caton Media XStream,简称 CMXS,具备高可靠、高画质、同时兼顾低成本和灵活性,是四边形战士。
科腾是如何实现这一方案的呢?我们称之为第一性原理思考,是从物理本质思考。从系统论角度而言,任何系统的可靠性当随并行路径增加呈几何数增长。单条的互联网是不靠谱的,但当N条互联网在一起并行运行,它就会变成非常可靠的传输网络,相应问题得到转化,转变为:如何管理并调动如此大量并行、不可靠的互联网线路,将其转变为可靠的传输线路。科腾科技结合人工智能和机器学习技术实现了对这些不可控的大量互联网并行路径的自主可控。我们把 AI 技术用于传输路由规划上,并做了相应经济测算,得出当前全世界大部分地区互联网的低成本,即使科腾的传输方案出现大量冗余线路,仍比专线技术方案具备更高的效率,所以它在商业上是成立的。
大概从2019年开始经历3年研发,到2022年中,我们发布了这套方法和传输平台,它带来的首要益处即是可靠性的极致提升。这里引入一个概念 SLA(Service Level Agreement),SLA 作为承诺可靠度会约定在合同里,如果不达到是要罚款的。截至目前,我们签过最高的 SLA 是6个9,即 99.9999%,而通常运营商专线签订的 SLA 不会超过99.95%,科腾科技敢承诺6个9,同时由于基础设施全部采用互联网构建,能保持非常低的成本,此外我们建好的节点可以很快速加入新的播放终端,同时保持了灵活性。
落地技术方案拓扑是这样子:我们对网络会有一定要求,比如我们会要求在信号源端至少有两个运营商(ISP)网络,以期达到6个9的效果;同时在第二现场也会放解码器,影院端最好也有两个ISP,如果没有条件,至少保证一个有线+一个5G的部署方案。部分场合基于监管要求,会需配置播控,需要加垫片或做一些切换,我们也会提供支持这样的行为。核心是中间 CMXS 这个传输平台,也就是 Caton Media XStream,下面我们把这个图再分解一下,跟大家讲解一下。
接下来以我们实际运营的新加坡到美国俄勒冈的一段节目传输为例,方案动用十几个节点和几十条不同路径共同参与,这是我们事先备好的基础设施,绿色线路代表传输实际线路,可以看到它时不时会跳动一下,这个跳动其实是 AI 自动评估的结果,通过动态选择当前最快和最有效的路径,也就是没有丢包或丢包最低的线路,来避免延时和拥堵。和传统意义上出错后切换方案的方式迥然不同,我们称之为择优倒换,通过 AI 发现更好的线路后就把它切到更好的线路上,切换全部是在IP包的级别,对于终端接收端是无感的。综上所述,CMXS 传输平台是以一个基础网络设施加AI算法,最终实现超高可靠性,且无需人工干预,减少人为错误。
接下来讲讲信号源这一端,我们把它放大来看的话,在图上编码器右边两个小点,代表它有两个网口,科腾所用编码器有两个网口,可连接运营商网络,同时每个发送端平台都会布置2-3个边缘节点进行覆盖,最多有6条不同路径同时存在,其中的实线是实际在走数据的,虚线没有走数据,但虚线连接始终存在。多条路径的作用有以下几个:一是单条路径带宽不够时可多条路径合并共用,所以我说5G也可以聚合使用;二是更常见的场合,当某条路径突然出现故障,这个画面里红色打叉处意味着线路断掉或出现问题,它可以切换到另外的线路上继续运行,不会把线路中断。影院端或第二现场道理差不多,我们同时有2-3个节点覆盖一个接收端,同样有6条可选线路,在图上可以看到它切换的方法比发送端稍复杂一点,因为接收端还没有数据,当一条线路断掉,边缘节点A会把数据转发给与它同级别的B、C节点,同一级别的这些节点把数据聚合传输给最终的解码端,以这种方法来达成最终接收的完整性。
这里结合 PQR 和编解码器一起讲,左下角讲了我们怎么用 Caton Prime 编解码器开展 PQR 测试:通过把原始画面送到编码器,经过 HEVC 编码送至解码器,再还原出视频画面,把两个画面用仪器进行测量,上面两个图表是在实验室实测的数据,可以看到在 HD 情况下,15兆达到了相对较好的画质;在30兆时 PQR 可达1.8,进入下一等级画质;UHD 时30兆 PQR 已达3,到60兆时 PQR 到了2,进入下一级别。我们现在在海外大部分合作的影院用的都是这款设备。
当然我们还不得不考虑一件事情,就是影院端的IT能力,以前根本不需要相关能力,因此大部分影院工作人员可能并不具备丰富的 IT 知识。因此当前我们也只要求相关人员能把设备上电,插好线缆,剩下所有工作由中心管控。包括这个图上左边是对设备管控和检查,右边是对网络、对传输过程的管控和设置都是在中心完成,定期做设备健康检查,确保每次直播成功。
以上就是我今天的分享内容,期待与大家的交流,谢谢大家!
关于科腾科技
科腾科技是下一代 IP 传输领域的全球领导者,凭借无与伦比的创新和客户服务,共享媒体分发的未来。我们助力广播公司和媒体公司通过 IP 传输卓越的视频直播。利用我们开创性的云平台和 AI 技术,科腾 Media XStream 服务彻底改变了 IP 传输,确保零错误传输和最佳网络性能。Media XStream 的可靠性超过了 99.9999%,完全超越了专线,并以比专线更具有竞争力的成本优势提供更高更优质的服务。有了科腾科技,我们的客户可得到质量、性能和价值的完美兼顾。关注科腾科技,获取完整技术方案与行业案例!更多详情请访问官网:https://www.catontechnology.com/zh/
若您希望收到来自科腾科技一个月来汇集的最新动态,新闻发布,活动资讯和行业洞察,请简单填写以下的表格。