B 站画质补完计划:视频超分让像素细腻生动

目前, 超分算法已成功投入线上点播业务,并已支持了大量视频的高分辨率视频流生产。未来,我们将持续在覆盖范围、主观效果和部署灵活度等方面进行算法的迭代更新,以在直播、点播、应用端等多个场景为视频画质提供更大的增益。

1 前言

为了给用户提供更清晰的画质体验,B站自研的超分辨率算法已经在站内广泛应用,支持了如《赛马娘》、《流浪地球2》、《权力的游戏》、英雄联盟S赛赛事直播等知名番剧、电影电视剧以及重要游戏赛事直播的 4K 视频流生产。

2 超分算法的应用背景

2.1 不同分辨率视频的画质差异

随着终端显示技术的快速发展,4K 规格的终端显示设备已经逐渐开始普及,用户对于 4K 清晰度视频的观看需求也呈现出不断增长的趋势。然而,由于制作年代久远、拍摄设备受限等原因,流媒体平台上大量视频片源还是以 1080P、720P 的规格存在,无法满足用户在高规格显示设备上观看 4K 清晰度视频的需求。

那么,1080P 视频和 4K 视频的画面质量差距有多大呢?可以参考图1中的视频画面对比,由于 1080P 视频画面里没有足够多的有效像素去描述草地的纹理、圆柱的线条,因此其呈现的草地纹理细节远没有 4K 视频画面中丰富,圆柱线条也远没有 4K 视频画面中流畅。

为了满足不断增长的 4K 清晰度视频的观看需求,可以将低分辨率视频增强提升为高分辨率视频,所使用的技术称为超分辨率( Super Resolution )。

图1. 1080P 视频和 4K 视频的画面质量对比

图1. 1080P 视频和 4K 视频的画面质量对比

 2.2 传统插值超分算法的局限

各类超分辨率算法中,在实际应用层面覆盖范围最广的是传统插值超分算法。传统插值超分算法(最近邻差值、双线性插值、双三次插值等等)的原理是利用原始画面中的部分像素作为原始信息并根据某些规则对新像素的像素值进行预测。传统插值超分算法解决的问题是可以将原始视频的分辨率高效地上采样到任意规格,以适应各种高规格显示设备的实际播放尺寸。

但是,传统插值超分算法缺乏足够的非线性拟合能力来复现复杂的图像特征,无法真正还原缺失的纹理细节。如图2所示,1080P 原始视频画面中缺失的草地细节在经过传统插值超分算法处理后并未被恢复。因此,其主要作用仅限于调整视频播放的尺寸,并不能改善原始视频的画面质量。

图2. 传统插值超分算法的局限

2.3 深度学习超分算法的应用价值

由于插值超分算法在提升分辨率的同时并不能真正还原缺失的纹理细节,因此如果想要在高分辨率屏幕上获得更优质的观看体验,就需要一种在提升分辨率的同时又能拟合复杂纹理细节的超分算法,基于深度学习的超分算法在这方面展现了出色的效果。如图3所示,低分辨率图像块在经过插值超分算法处理后线条边缘仍存在一定程度的伪影,且整体观感较为模糊。对比之下,经过深度学习超分算法处理后的高分辨率图像块显然减少了线条附近的伪影,线条边缘更加连续。

图3. 插值算法与超分算法的处理结果对比

图3. 插值算法与超分算法的处理结果对比

2.4 超分算法的难点及基于深度学习的解决方案

超分辨率算法的原理如图4所示,低分辨率像素块在像素域扩充后得到高分辨率像素块,高分辨率像素块中存在诸多未知像素值的像素,而超分辨率算法的作用就是预测出合理的像素值以提升高分辨率像素块的画面质量。从原理上看,超分算法的难点在于这是一个不适定问题,其潜在的解空间可能很大,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/439500.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Tablesgenerator 使用

1.在线工具网站 Create LaTeX tables online – TablesGenerator.com 2.按住 shift 选择边框 3.选择标题和双栏布局 4.保存和加载表格 5.默认风格与三线表 Default table style使用 \hline 而 Booktabs 使用 \toprule、\midrule和\bottomrule。 \toprule、\midrule和 \botto…

echarts x轴名称过长tip显示全称

xAxis的axisLabel的内容如下: axisLabel: { rotate: -45, color: document.body.className.indexOf(custom-f4c46d) > -1 ? #fff : #343434, // 显示省略号操作(第一步) formatter: function (value) { var val if (value.length >…

【网络层】IP多播技术的相关基本概念(湖科大慕课自学笔记)

IP多播 1:IP多播技术的相关基本概念 我们简单举例,如下图所示: 一共有60个主机要接受来自视频服务器的同一个节目,如果采用单播方式,则视频服务器要发送60份,这些视频节目通过路由器的转发,最…

windows10下powershell中如何在后台执行python程序

背景 在windows10本地执行时间较长的程序时,很容易忘记,随手关掉编译器,程序就此中断,造成精神伤害。 功能介绍 如果不管不挂起,不管日志重定向,我要运行的python脚本的命令很简单 python CUTE_pipelin…

在人工智能领域,如何平衡技术进步和人类安全?

人工智能(AI)技术的迅速发展为人类社会带来了许多潜在益处,但同时也引发了一系列安全和伦理挑战。在这个领域,如何平衡技术进步与人类安全成为了至关重要的议题。本文将探讨在人工智能领域中平衡技术进步与人类安全的方法&#xf…

世界的尽头是sql注入漏洞

sql注入漏洞大家都了解吧?但是人类也会有类似sql注入型的漏洞存在! sql注入本质是数据内容被当做命令执行。 举个简单的例子: 某国面临全国性战争,发起全国性的捐款捐物,基本流程是: 居民填写自愿捐助单由军…

混合专家系统(MoE)概述

MoE概述 神经网络的学习能力受限于它的参数规模,因此寻找更有效的方法来增加模型的参数已成为深度学习研究的趋势。混合专家系统 (MoE) 可以大幅增加模型参数规模且不会等比例地增加模型计算量,对于单个样本,神经网络只有某些部分被激活。在混…

使用Python进行股票分析(1)

简介 Python具有非常好的数据分析和数据可视化的功能。在本文中,我们将通过使用Python获取股票的闭市价格,并且对股票价格进行分析从而向我们提供买卖股票的依据。 数据获取 需要说明的是在这里我们获取的是美国股票的数据。至于中国股市的数据大家可…

0环PEB断链

在操作系统层面上,进程本质上就是一个结构体,当操作系统想要创建一个进程时,就分配一块内存,填入一个结构体,并为结构体中的每一项填充一些具体值。而这个结构体,就是EPROCESS 在0x088 偏移处有一个指针Act…

windows安装Chocolatey方法注意事项,以及安装openssl方法

chock是一个很强大的软件包管理工具官方:Chocolatey Software | Installing Chocolatey 使用管理员打开powershell工具: 必须以管理员打开,不然安装失败,提示没有权限 然后输入: Get-ExecutionPolicy 如果返回&…

大模型笔记:最少到最多提示过程 (Least to Most prompting, LtM)

LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS 2023 ICLR 1 概述 进一步发展维链提示过程 (CoT prompting) 分为两个阶段: 第一阶段:向语言模型提出查询,将问题分解成子问题。第二阶段:再次向语…

表单提交 滚动到必填校验位置

handleCommit(flag) {this.$refs["form"].validate((valid, object) > {if (valid) {this.form.checkState flag;this.form.checkLevel 1;this.form.type 1; //规划this.form.filingsId this.form.id;checkFilings(this.form).then((response) > {this.$mo…

nestjs10.x使用jwt生成token

1 安装依赖: pnpm install --save nestjs/jwtpnpm install passport passport-jwt nestjs/jwtpnpm install types/passport-jwt --save-dev 2 可以使用命令新建auth鉴权文件夹 nest g mo auth // auth.module.ts nest g s auth // auth.service.ts nest g co …

香橙派AIpro外设接口样例大全(附源码)

Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机器…

备忘 clang diagnostic 类的应用示例 ubuntu 22.04

系统的ncurses环境有些问题 通过源码安装了ncurses6.3后,才可以在 llvmort-18.1.rc4中编译通过示例: 1,折腾环境 ncurses-6.3$ ./configure ncurses-6.3$ make -j ncurses-6.3$ sudo make install sudo apt install libtinfo5 sudo…

机器学习的魔法(一)从零开始理解吴恩达的精炼笔记

一、机器学习是什么? 1、机器学习的概念 机器学习是一种人工智能领域的技术和方法,旨在使计算机系统能够从经验数据中自动学习和改进,而无需显式地进行编程。它涉及开发算法和模型,使计算机能够自动分析和理解数据,并…

MES组件车间解决方案:提高生产管理效率和质量的关键

市场环境的变化得越来越恶劣,现代生产管理理念不断更新,制造型企业是否进入管理的良性循环,关键在于“计划”与“执行”的密切配合,企业和车间管理人员必须在最短的时间内掌握生产现场的变化,并做出准确的判断和应对措…

龙芯第四代3A6000主板与龙芯3A500龙架构兼容,具备丰富的接口和扩展性

龙芯 3A6000 处理器完全自主设计、性能优异,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器的推出,说明国产 CPU 在自主可控程度和产品性能上已双双达到新高度,也证明了国内有能力在自研 CPU 架构上做出一流的产品。 …

洗车行业小程序源码系统 带完整的安装代码包以及搭建教程

大家好!今天来给大家分享一款洗车行业小程序源码系统,通过小程序,用户可以方便地预约洗车服务、查看服务进度,洗车店也可以实时管理订单、安排人员,从而提高服务效率。同时,小程序界面简洁明了,…

蓝牙耳机什么牌子好?全价位段盘点,真人实测带你避开雷区!

​无线耳机已经成为现代生活中的必备数码产品,尤其在感受到无线带来的自由后,很难再适应有线耳机的束缚。因此,耳机市场竞争激烈,各种类型和外观的耳机层出不穷。在此,我为大家总结了五款使用体验很不错的蓝牙耳机&…