合创投资

Invested

「图鸭科技」获得2020年度CVPR视频压缩冠军

2020-07-02

一年一度的CVPR 视觉盛宴在西雅图召开,CVPR是国际上视觉的第一大会议。2020年是一个特殊的年份,CVPR 也历史性的转到ZOOM 视频会议上。为了促进深度学习在视频压缩行业的发展,由google ,Netflix等巨头联合举办的CLIC(CHALLENGE ON LEARNED IMAGE COMPRESSION)已经举办到了第三届。


继2018年图鸭科技clic获得图片压缩两项世界冠军,2019年包揽图片压缩4项世界冠军,在2020年的cvpr大赛上,图鸭科技登顶视频压缩的桂冠,力压阿里达摩院,拿下了视频压缩的世界冠军。


深度学习视频压缩发展已经有5年左右,在过去几年的时间里,深度学习在图片压缩上有很大的突破,但是在视频压缩上进展一直不是很理想。无论是从速度上还是压缩性能上,都无法和传统的h.266竞争。从今年的比赛结果看,图鸭科技的性能已经超越了传统的h.266,比起阿里巴巴使用的传统方法,具有更快的解码速度。在今年的比赛中,也加入了对模型大小的考量,在深度学习弱势的模型大小下,图鸭科技摘文件大小比阿里巴巴小的情况下,依然在指标上超越了阿里巴巴为代表的h.266传统模式。从2020年开始,深度学习视频压缩真正的开始走向成熟。在编码效率上,深度学习压缩和解码效率相当,甚至更快,这是传统方法无法想象的。


目前图鸭科技的深度学习压缩的在单张2080ti 显卡上,已经可以实现3840*2160 @26fps的压缩,真正的开始走向商用。由于编码效率和解码效率相当,对于大量的非结构化数据(图片和视频)的存储和传输带来了巨大的好处。


随着安防行业的发展,中国每年铺设的摄像头数据达到2亿个以上,每个摄像头视频的存储时长已经由30天提升到90天,单个摄像头的存储成本也达到了2000元,这对数据的存储的压力是超级大的,深度学习压缩的出现可以解决大量视频的存储问题。随着智慧城市的发展,每个城市每天产生几十亿张高清的照片,无数的摄像头拍摄了大量的照片,对图像存储的压力也很大。一个5000个摄像头的抓拍系统,存储成本高达800万元。使用图鸭科技的技术可以节约600万元的成本。


4K+5G的发展成为了社会发展的动力,随着5G的发展,数据量爆炸,5G解决了数据传输的最后一公里问题,但是,在公共网络上,光纤网络的升级是缓慢的,成本因为5G的到来而逐步升高。利用图鸭的技术,可以解决公共网络传输的带宽问题。一个4K电视升级,存储和带宽花费1500万元,一路4K视频的读写速度已经接近硬盘的读写速度上限,数据太大,已经成为了生产4K内容的巨大负担,图鸭的技术可以解决4K的读写问题。


新冠病毒的发展,使得每个人都在家办工,视频会议,视频教育,短视频都产生了大量的数据,给网络和存储带来了巨大的压力,数据量随着新冠的发展而爆炸。图鸭科技的技术可以解决视频会议,视频教育的流量和存储问题,节约70%的成本。


3840*2160 @25fps GPU 和cpu 使用率


一个新的时代已经到来,深度学习结束了传统的266每年提升3%压缩的率的节奏,压缩率每年以20%-40%以上在提升,今年正式超越了h.266,也意味着拐点的到来。整个行业的洗牌也从2020年开始。

上一篇
下一篇