本文回顾淘宝图片发展的历史,阐述了新一代图像编解码格式AVIF在淘宝业务场景中的应用及落地方案,节省流量,为用户提供更好的看图体验。
淘宝图片空间下行链路承载着集团图片的访问请求,包括手淘、飞猪、闲鱼等业务场景,核心工作在于提升用户访问体验,在图片质量不降低的情况下降低访问带宽。常态下CDN侧千万级别 QPS(每秒请求数)图片访问,未命中时的回源量也在百万级别,通过引入新的编码技术,可大幅降低访问带宽,节省流量成本,同时体积的减小也能带来访问提速,提升用户看图体验。
淘宝图片访问模型如图1所示,用户发起请求,在CDN(content delivery network,用于图片缓存)缓存未命中的情况下,请求回源到源站,源站从OSS(object storage service)存储上拉取商品原图,按照用于请求格式进行实时处理(包含解码、缩放、编码等过程,RT < 100ms)后返回,常态下CDN命中率约为95%,此时用户访问的RT小于20ms。
由于访问端(PC、手机)及场景(首页、详情页)的多样性,相同的图片存在多种尺寸、格式,如淘宝首页访问的图片尺寸相对较小,而详情页尺寸较大,通过在图片源站侧进行实时计算(本质上是计算换存储的方式),支撑相同图片内容的多种格式访问。
图1:图片空间下行链路架构
回顾过去的工作,我们对淘宝图片下行处理做了大量的优化:
2018年,通过引入FPGA异构计算,HEVC关键帧图片编码格式开始在淘系大规模商用,相比WEBP编码格式,降低带宽约30%,相比JPEG降低超50%,采用高密度存储、异构计算技术的新集群规模只有老集群的十分之一,高密度存储、异构计算分别使单位存储、计算成本降低超80%;
2019-2020年,图片空间FPGA集群极致优化,通过将JPEG解码、PNG解码、高质量SCALER、WEBP编码 Offload至FPGA,同时利用Nginx多worker负载调配实现FPGA板卡IP的负载均衡,单机性能由2000提升至5500 QPS,在保证图片质量的情况下,计算成本降低超60%,同时处理耗时大幅降低;
2020年,FPGA集群容器虚拟化,通过设备虚拟化技术,采用设备直通方式实现PCIe设备(FPGA板卡)的虚拟化。接入集团云原生应用统一基础设施ASI(Alibaba Serverless infrastructure),可根据业务流量快速调整不同服务集群的比例,实现FPGA服务间的快速扩缩容。最终业务部署至ASI pouch集群,为业务的灵活部署及调度提供了可能。
基于上述工作的积累,我们开始寻求在压缩率及用户体验上更进一步的方案,新一代视频图像编码技术进入项目组视野。
以Google为首的多家公司成立的AOM(Alliance for Open Media,开放媒体联盟)组织,制订了一套替代HEVC技术的免费开放视频编码标准AV1(AOMedia Video 1)。随着18年AV1格式的定稿,其图片格式AVIF在18年12月份由Netflix推出,2020年8月chrome及随后的Firefox 86版本已支持AVIF,即将推出的Android 12也将原生支持其解码显示。鉴于其以下特点,我们选择AVIF作为下一代图片格式,进一步降低带宽,提升用户体验。
进行图片压缩率测试,结果如图2所示,原图为无损编码格式,分别对比不同PSNR下VVC、AV1不同工具以及手淘目前在用的HEIF格式,考虑到PSNR高于40dB时编码后的图像质量非常接近原始图像,我们选取39dB和41dB(线上平均为41-42dB)计算压缩率指标,相比HEIC格式,AV1的压缩率提升约26%-32%。
图2:不同格式压缩率测试
图3:压缩率对比
图4:浏览器对AVIF的支持情况(绿色表示已支持)
除上述特性外,AVIF能支持动图、PQ/HLG等高动态EOTF场景(兼容高亮度高动态显示器)、BT.2020广色域、10bit/12bit显示、alpha/depth图,为后续的场景效果扩展提供便捷。
高压缩收益带来的是计算复杂度的提升,AVIF使用AV1关键帧编码技术,通过帧内预测去除图像的空间冗余以提升压缩率。包括方向预测的粒度进一步升级,而非仅仅是方向性的预测,同时纳入了梯度和相关性,亮度的一致性和色度也得到充分利用,主要包括以下技术特点:
为了在方向纹理中实现更多种类的空间冗余,在AV1中,将方向帧内模式扩展到更具精细粒度的角度集。将最初的VP9帧内编码的8个角度设为名义角度,基于这些角度引入步长为3度的精细角度微调,即预测角度由名义内角度加上角度增量表示,该角度以-3〜3的倍数为步长。为了以通用方式在AV1中实现定向预测模式,这48个扩展模式由统一的定向预测器实现,预测器将每个像素链接到像素边缘的一个参考像素位置,并通过2 tap的双线性插值对参考像素进行插值,最终AV1帧内编码共启用了56个定向内部模式(HEVC帧内包含33个角度+DC+Planar)。
AV1通过添加3个新的平滑预测器SMOOTHV,SMOOTHH和SMOOTH扩展了无方向帧内模式,它们在垂直或水平方向,使用二次插值或其平均值预测了像素块。
为了捕获边缘参考块的衰减空间相关性,FILTER INTRA模式通过将亮度块使用二维不可分离的马尔可夫过程。AV1预设计的五个滤波器帧内模式中,每个模式用一组八个7-tap滤波器表示,反映4×2色块中的像素与相邻的7个像素之间的相关性。一个内部块可以选择一种帧内滤波模式,并以一批4×2补丁进行预测。
Chroma from Luma(CfL)是仅用于色度的帧内预测器,通过以重建后亮度像素的线性函数建模得到色度像素。重建的亮度像素被二次采样为色度分辨率,然后去除直流分量以得到交流分量。为了从交流分量中估计色度的交流分量,AV1 CfL根据原始色度像素确定参数并在比特流中用信号发送。这降低了解码器的复杂性并得到了更精确的预测。对于DC预测,它是使用内部DC模式计算的,该模式对于大多数色度内容来说已经足够,并且具有成熟并能快速实现的方法。
对于屏幕截图和游戏之类的人造视频,可以用少量颜色的近似块来替代,AV1帧内编码引入调色板模式进一步提升压缩率。
AV1允许其帧内编码器参考同一帧中先前重建的块,类似于帧间编码器引用前一帧中块的方式,对于包含重复纹理的屏幕内容视频非常有用。IntraBC新预测模式的引入,在当前帧中拷贝一个重建的块作为预测。参考块的位置由位移矢量指定,类似于运动补偿中的运动矢量压缩。
图5:HEVC与AV1帧内预测
复杂的帧内编码需要耗费大量的计算,软件方案编码一帧图像耗时达到了秒级,显然无法满足实时处理的需要,大规模落地必须借助专用硬件方案,其开发工作是项目的重点和难点。另一方面,新格式的落地也需要客户端解码的支持,前期计划先基于自研高性能解码器进行解码,后期考虑切到系统原生解码(Android 12支持AVIF解码)。
项目落地上按4个版本迭代,核心的开发包括服务端软硬件编码以及客户端的解码,服务端采用先软件后硬件的思路,通过基础版本、全功能版本、稳定版本、优化版本的迭代实现新格式的平滑升级。
图6:项目落地计划
服务端沿用图片空间服务端图片转码架构,使用阿里云AIS自研的AV1硬件编码器进行服务端编码,集成AV1/HEVC/WEBP等多种硬件编码IP,业务部署至ASI Pouch集群,同时进行新格式的线上全量PSNR校验,如有异常可一键降级为HEVC编码方案。
服务端完成图像的转码(如JPEG转码为AVIF),系统分为Nginx统一接入、资源解析、图像处理、FPGA硬件加速等模块,AVIF编码Offload至FPGA,为防止硬件图像处理出现异常,在图像处理层对硬件编码的数据进行decoder,PSNR对比编码前和解码后的YUV数据,确保硬件处理的正确性。
图7:服务端架构
在不同Pouch上部署不同的FPGA逻辑版本,做到新老版本的隔离,不影响老业务稳定性的情况下,做到新业务的快速迭代。
图8:容器化FPGA部署
图像质量和稳定性是追求极致图像体验的前提,图片基础设施面向全集团提供图片服务。线上是否有花图,图片是否清晰,用户请求是否有超时,新版本效果是否达标等问题出现在我们面前,必须确保高并发下图片质量的稳定。
通过梳理图像主客观质量测试、线上预警及自动化分析流程,从质量回归、在线PSNR抽样检测、回放压测三个方面来监管系统稳定性:
图9:图片质量保障方案
在服务端进行转码后输出AV1编解码图像格式,手淘上对其进行解码,结果如下:
图像格式的发展与编解码技术发展息息相关,基本处理十年出一代的节奏,回顾过去的JPEG->WEBP->HEVC格式的发展历程,高的压缩率格式的落地无一不是算法与硬件结合的结果。
得益于团队在算法硬件加速与工程落地的经验,项目组开始将AVIF图像格式进行工程落地,同时由于AVIF格式的良好生态以及扩展特性(目前各大主流浏览器均已支持),我们计划在PC及手机端全线使用AVIF图片格式,同时覆盖动图场景,并做到不同设备平台的高保真支持,希望通过技术升级,进一步降本提效。
目前软硬件加速方案初始版本已经开始使用,高性能版本(算法及时序优化)开发完成后,再来更新相关信息,敬请期待。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/fWk5WXZPWRJVmHVdhNRhDw
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。