如今,时光流转,这场演出在2022年的夏天在直播间里,通过手机屏幕和上亿人见面。
不过令人意外的是,尽管演唱会的母带已经称得上是“老古董”了,但是直播间播放的画面却没有糊成渣。
无论是黄家驹脸上细微的表情,还是黄贯中斗琴时上下翻飞的手指,歌迷们都能从手机这样的小屏幕上看得一清二楚。
△动图效果略有压缩
如此清晰的效果和细节呈现,让不少人恍惚间仿佛重回了90年代,引得歌迷直呼“Beyond精神永存!”
更值得关注的是,这种精神和情怀背后,提供核心支撑的是正在走向规模化商用的AI修复技术。
众所周知,Beyond这盘演唱会影碟录制于90年代,当时的技术设备都还十分有限。
就拿画面来说,能达到的水平只有540p、25FPS。
音质方面,也会受到现场噪声大等因素影响,最终录下的歌声也会大打折扣。
而Beyond的修复,画面和音质都达到了一种新水准。更重要的是,这场看上去工程浩大的修复,其实只花1个星期就搞定了,其中绝大部分还都是由AI“直出”的。
这种技术和效率,也让更多人潜在的情怀寄托和需求,得到释放。
是的,AI修复正在从黑科技成为日常,也是时候更清晰地了解背后的技术原理了。
“细节到眼线都看清了”
其实这几年,大众对AI修复已经不再陌生。
去年,央视动漫和上海美术电影制片厂的多部经典动画通过AI修复技术,画面清晰度可以达到4K水平。
不过和过去的一些修复工作相比,这次修复演唱会录像,AI还着重注意了这3个方面:
多帧去交错人像修复亮度、色彩、氛围调节首先来看多帧去交错。
这里先要普及一个概念:什么是去交错?
早期由于设备处理速度或者带宽限制的问题,不少视频录像都是使用交错式信号。
也就是将整个画面平均分成一定数量的横行,两个场分别显示画面的奇数行和偶数行。
这样一来,设备的缓存和处理速度要求都能减半。
而利用“视觉暂留效应”,两个画面可以在快速播放过程中呈现出完整的画面。
不过,随着显示设备不断进化升级,如液晶显示器等都只支持逐行扫描。
这就导致老旧影片在新设备上播放时,会出现非常明显的闪烁。
所以,需要使用去交错的办法,来将隔行扫描的信号转换为逐行扫描信号。
传统常见的去交错方法,一般是把连续的两个场直接拼为一帧,不做任何修改。
但是每个场之间的拍摄时间还是会存在细微变化,如果这一刻拍摄物体正在移动,就会导致去交错后的图像会出现“拉丝”问题。
针对这个问题,AI这次使用的是基于运动补偿的多帧去交错算法。
和传统方法相比,这种方法的大致原理是根据邻近场使用动态估计,去预测画面中的物体移动并得到动态向量,根据前一个场及动态向量就能重建出一个新的场,然后将此两个场并完成反交错。
它的特点是泛化性更强,细节处理能力更好。
从结果来看,修复后吉他手的手部伪影完全被去除了,轮廓也清晰了起来。
第二个不同之处,便是对人像的着重修复。
演唱会录像中势必会存在大量的人像镜头,很多还是怼脸大特写,歌迷格外关注的镜头往往也是这些部分。
但受限于当年的拍摄设备水平,最终呈现的效果很容易是人和背景糊成一片,五官轮廓也不清晰。
针对这一问题,这次修复中使用了火山引擎自研的自适应人像增强算法。
这种方法基于深度学习模型,会在消除人脸整体的模糊和压缩损伤的同时,进一步对五官进行重建。
比如之前不少网友说,修复后影像里,黄家驹的眼睛都有了光、眼线都能看得一清二楚。
这就是因为算法对眼睛部分进行了重建,并补足了更多细节。
除了五官以外,这一算法还能兼顾皮肤纹理、头发丝等方面的细节处理,可以让修复后的人脸更加真实。
此外,考虑到演唱会中拍摄到表演者的脸部不只有正面,算法还考虑到侧脸、俯视、仰视、被话筒遮挡等多种情况,可以解决很多极端情况下的修复问题。
第三方面,体现在色彩亮度增强上。
据技术提供方火山引擎介绍,原片中其实存在大量过曝、死黑场景,色彩还原度也不够高。
而这些问题不是简单调节亮度或色彩就能解决的。
就拿死黑场景举例,因为影片本身还存在很严重的底噪,如果直接把偏暗场景调亮,底噪也会被同时放大。
至于色彩方面,还需要平衡好修补褪色和保留复古感两方面因素。
在这方面,火山引擎是根据具体片源的效果,依据美学评分对不同方面进行调整。
并能根据不同帧的色彩统计信息进行分区域自适应亮度增强,从而找到最佳的明暗平衡效果。
据技术人员介绍,以上几方面工作几乎都是由AI完成的,人工参与的只有一些调参部分。
甚至连对画质的评估,AI都参与了一波。
这次使用了一个针对画质的VQScore算法,对影片效果进行评估。
该算法在ICME 2021的“压缩UGC视频质量评估”比赛中,获得了“无参考视频质量评价(NR-VQA)MOS赛道”第一名。
拯救古早收音bug
视频修复方面细节拉满,不过既然是演唱会,光修复画面可不够,音质体验更是拨动观众心弦的关键。
受限于当时的技术水平和录音设备,在原版影碟中,其实存在各种各样的音质问题。
比如:
噪声干扰:设备、环境的噪声影响音质带宽不足:设备、压缩算法等导致音频截止频率低响度问题:响度问题导致听感不适针对这些问题,此次火山引擎音频技术团队在Beyond演唱会的音质修复方面,主要用到了三种算法。
音频降噪算法
首先,来看看音频降噪算法带来的效果。
由于90年代演唱会收音条件有限,现场的环境又比较嘈杂,原版音频中噪声是比较明显的。
而修复之后,黄家驹的声音和音乐声变得更加清晰、干净。
这一点在频谱图上表现得很明显:降噪前,音频频谱较为浑浊;降噪后,频谱图清晰了不少。
值得注意的是,传统的降噪方案通常针对人声,在演唱会这样的场景里,容易“误伤”音乐本身。
因此,在为演唱会设计降噪算法之初,技术团队就将降噪导致的音乐失真问题考虑在内,通过在训练时加入音乐数据等方式,实现了对音乐场景和人声场景的兼容。
也就是说,可以在保留人的说话声、唱歌声以及音乐本身的同时,抑制其他噪声。
音频超分算法
噪声之外,由于演唱会拾音设备、录制硬件以及存储压缩等技术原因,声音带宽受损(即带宽变窄)同样会影响听觉体验。
因此,修复团队还引入了音频超分算法。
该算法主要对演唱会中人声的部分进行了频带拓展,以使人声更加清晰。
从蓝框部分可以看到,经过超分,原始音频的高频部分得到了拓展和增强。
响度算法
最后,是通过音源分离算法提取演唱会中歌声的部分,然后用响度算法对响度进行调整。
这是因为演唱会现场拾音的过程中,可能会出现人唱歌的声音被乐器、环境声盖住的情况。
单独提取唱歌部分的人声,进行响度调整,然后再与原音频混合,能够使整体的声音大小听上去更加舒适。
一个幕后小故事是,无论是画质修复还是音频修复,都需要人工来进行最终质量评估。
而修复团队的程序员们恰好都是听着《海阔天空》、《光辉岁月》长大的一群人。
因此处理Beyond演唱会的旧影像时,修复人员们都是以粉丝的心态,一遍又一遍不断地去听、去看修复效果,力图用算法把当年红馆的热烈氛围在今日重现。
他们的标准说起来也很简单:
我得先觉得身临其境了。
另外,值得一提的是,修复人员谈到,本次修复基本都是AI搞定的。目前,这样的技术能力已经被集成到火山引擎对外开放的智能处理、音频技术两个产品中。
AI修复技术的B/C面
当一场场线上怀旧演唱会在网上掀起热潮,AI修复技术也再一次成为技术热点。
并且在一次次的“出圈”之中,这类“网红”技术的发展路径和商业化前景,逐渐清晰明朗起来。
第一阶段,是新兴技术的探索期。
在这个阶段,老片修复的相关技术手段从实验室走向民间。以B站up主大谷的视频为代表的个人修复作品,屡屡吸足眼球,引发热议。
△大谷修复作品
伴随着云与AI的进一步结合,各大科技厂商开始把“网红”引入家门,这也就开启了AI修复技术的第二阶段:技术工业化进程中的试验期。
这时候,开始有更多工业级的修复项目出现在大众眼前,但仍旧有“单个项目、单点突破”的特点。
比如此前西瓜视频和火山引擎推出的“经典视频4K修复计划”,就是通过工业化的AI技术手段,成批量地修复《哪吒传奇》、《黑猫警长》等百部经典动画。
而现在,你或许不知道的是,这样的技术不再仅仅停留在公益项目、To B产品的阶段,甚至打开抖音,你也能用上。
比如画质修复的相关算法,就已经被集成到抖音个人用户的作品发布功能当中。即使没有专业的拍摄设备,用户投稿的作品经过AI针对清晰度、色彩、瑕疵、失真等问题的自动修复,也能达到不错的效果。
由此可见,在长期的技术积累与实践之后,AI修复技术作为一种成熟技术产品的第三阶段——大规模商用落地,或许已经拉开帷幕。
尤其对于字节跳动这样的厂商而言,其旗下拥有抖音等每天都会产生海量音视频UGC内容投稿的平台。
从修复动画到Beyond演唱会,一系列技术问题的突破和解决,最终都会直接在产品层面上有所体现。
并且不仅在云这一侧面向B端,也已经在C端显现出潜能。
实际上,这也是AI技术不断普惠、下放过程中的一个典型案例。
咱们作为普通用户,受益其中,自然喜闻乐见。
说说你最希望AI修复的“老东西”吧?
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。