音视频技术开发周刊 | 318

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

60cccf739b1ac67412c48a3298777b8a.png

日程揭晓!速览深圳站大会专题议程详解

LiveVideoStackCon 2023 音视频技术大会深圳站,保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会时间,您可以快速了解音视频大咖前瞻的思想、把握音视频技术发展的最新动向、深入学习技术内容和工程化方面的一手实践。现在,深圳站大会日程正式揭晓,一起来看看您所关注的演讲都出现在哪些时段吧!
●时间:2023年11月24日-25日
●地点:深圳圣淘沙酒店(翡翠店)
●咨询:13520771810(微信同号)了解详情。
●官方链接:https://sz2023.livevideostack.com/topics

「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速

在【抖音背后的体验增长实战揭秘】专题中,我们将深入解析抖音背后的体验增长实践,结合抖音拥有的亿级日活跃用户所沉淀的经验,剖析在大规模用户背景下如何实现降本增效。

扫描二维码,免费报名火山专场演讲。

c984043924b2c35a9bda0166742c91ee.png

70096d63d5a412dbacaf6e883dabf860.png

首个人体动捕基模型面世!SMPLer-X:横扫七大榜单|NeurIPS 2023

想要快速制作角色动画,但是没有动捕设备?快来试试SMPLer-X!

吴恩达加入图灵三巨头混战,炮轰Sam Altman:AI监管「不会管不如不管」,LeCun转赞

针对「AI末日论」引发的大佬们关于AI监管的口水战,吴恩达下场力挺LeCun:「不合格的监管不如不要监管」!

用童话训练AI模型,微软找到了探索生成模型参数的新切入点

即便大语言模型的参数规模日渐增长,其模型中的参数到底是如何发挥作用的还是让人难以琢磨,直接对大模型进行分析又费钱费力。针对这种情况,微软的两位研究员想到了一个绝佳的切入点,用生成简练但是又涵盖各种常见逻辑和语法的童话故事来作为模型的生成任务,这样做能在减少模型的学习负担的同时,保留模型对逻辑和语法的学习能力,进而用小模型来分析参数发挥的作用。这种方法可能会开创一条新的研究道路。

4a756e906755649506aa37f9f31d73d0.png

港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构

GraphGPT框架将图结构模型和大语言模型进行参数对齐,利用双阶段图指令微调范式提高模型对图结构的理解能力和适应性,再整合ChatGPT提高逐步推理能力,实现了更快的推理速度和更高的图任务预测准确率。

8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍

最近,来自ISTA的研究人员提出了一种全新的模型量化方法QMoE,可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下(每个参数0.8位),且精度损失很小。

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。

基于Transformer和注意力的可解释核苷酸语言模型,用于pegRNA优化设计

核苷酸语言模型用于预测 pegRNA 的效率和设计优化。

febe93ea474d6a2da77e2cb2d137e2bf.png

SupSLAM:使用SuperPoint用于无人机的鲁棒视觉惯性 SLAM 系统

近年来,使用机器学习技术进行特征提取的现代基于特征的 SLAM受到越来越多的关注,并有望在几乎所有机器人工作环境中超越传统方法。这种方法利用经过训练的网络来学习关键点,从而增强视觉SLAM数据关联的鲁棒性。

港中文新发布|超逼真!基于隐式结构扩散的超逼真人像生成!

HyperHuman,用于生成高度逼真和多样化布局的野外人类图像。

中科院自动化所和图森联合开源FSD V2:通过虚拟体素改进的全稀疏三维物体检测

基于LiDAR的全稀疏架构引起了越来越多的关注。FSDv1作为代表性的工作在效能和效率方面表现出色,尽管具有复杂的结构和手工设计。在本文中,我们介绍了FSDv2,这是FSDv1的升级版本,旨在简化以前的FSDv1,同时消除其手工设计的实例级表示引入的归纳偏差,从而提高更好的通用适用性。为此,我们引入了虚拟体素的概念,取代了FSDv1中基于聚类的实例分割。虚拟体素不仅解决了全稀疏检测器中臭名昭著的中心特征缺失问题,还赋予了框架更加优雅和简化的方法。

9efed644d90855684371fdce87c0f718.png

Quest 3,差强人意

Meta Quest 3 的包装盒非常小,仅有 Quest 2 的一半左右。包装尺寸为 22.1 x 21.5 x 12.6 cm,达 1.44 kg。

主攻AR细分赛道,元霓Xrany X1背后的产品与技术思考

元霓Xrany X1 AR智能眼镜套装从硬件设计到软件适配,都从文旅展陈场景的实际应用出发,考虑场景的规模化发展和运营,满足游客在体验过程中的智慧化沉浸式体验。

开发者探索用Quest 3+PC渲染改善MR情景的虚拟屏幕显示效果

屏幕可以非常逼真地照亮附近的表面,以及图像能够反射到桌面之上。另外,虚拟屏幕的全彩透视效果相当不错。

8b2c1310bb5249a6c62783c9fd5563d2.png

行业观察 | AI时代下,半导体“芯”核心——光芯片

本期继续推出系列内容,介绍半导体产业链中的技术、代表性企业、发展趋势和热点,并继续探索半导体产业中的知识产权和科创板问题。

苹果M3芯片,深度解读

苹果公司本周发布了新一代 M 系列 Apple Silicon 处理器,并随之推出了新一代 MacBook Pro,为新处理器发布的繁忙月份画上句号。

谷歌官宣:安卓全面支持RISC-V

Google 显著推进了让 Android 在使用 RISC-V 指令集架构的 CPU 上运行的努力。

012b43818deecbcf43d58eb489e2de4b.png

全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线

国内大模型创业公司,正在技术前沿创造新的记录。10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了192K token。

声波控制原子空位可增强通信技术,为量子计算提供新的控制机制

声波控制原子空位可增强通信技术,为量子计算提供新的控制机制。

研究人员揭示了极性反铁磁体中巨大的波动增强声子磁矩

声子是晶格振动的集体激发,是固体中最常见也最重要的准粒子之一。通常声子被认为不具备磁矩,但如果其能获得与电子相当的磁矩,则将为基础磁学研究和自旋器件设计提供全新可能。近日,南京大学物理学院张琦、温锦生、孙建与中科院物理所万源合作攻关,在声子磁性研究领域取得重要进展。通过光谱学手段,研究团队发现了反铁磁体系Fe2Mo3O8中巨大的声子磁矩,并且首次观测到自旋涨落对声子磁矩的增强,高达600%,相应声子磁矩达到0.68 玻尔磁子(μB),已接近电子磁矩量级。

1b0df4ab2c2b191609c80f1d874e5952.png

FFmpeg直播能力更新计划与新版本发布

客户端作为直接面向用户大众的接口,随着技术的发展进化与时俱进,实现更好的服务是十分必要的。FFmpeg作为最受欢迎的视频和图像处理开源软件,被相关行业的大量用户青睐,而随着HEVC标准的发布到广泛使用,相信国内很多网络流媒体从业者都在长期关注FFmpeg FLV支持HEVC的官方更新。LiveVideoStackCon 2023 上海站邀请了来自快手的音视频首席架构师刘歧,为大家带来他关于FFmpeg 直播能力的更新计划。

「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速

随着全行业视频化的演进,营销、知识、商业和空间的交互体验正在被重塑。这种变化不仅仅是一种抽象的趋势,更是关系到用户留存和业务增长的关键因素。面对这样的挑战,一个关键的问题摆在我们面前:如何寻找到体验、成本与增长之间的平衡之道?

b578551f9bd609163a5bdef950914e77.png

吴恩达加入图灵奖得主讨论:「AI灭绝论」弊大于利

关于「AI灭绝论」引发的一系列争论,各路大佬们又吵起来了。这次加入争吵的是著名人工智能学者、斯坦福大学计算机科学系教授吴恩达。

对话阿里云 CTO 周靖人:AI 云基础设施如何做,为何难?

今年的阿里云云栖大会再次使用了 8 年前的主题:“计算,为了无法计算的价值。” 阿里云希望像 8 年前一样,重启高速增长。

对话MyDearest:以VR技术为手段,让游戏成为改变生活的叙事体验

提到注重游戏剧情的VR开发商,MyDearest绝对能排在前列。这家日本公司将“叙事体验”作为愿景,把传统文字冒险类型的游戏与VR技术相结合,开发出包括《东京时笼》《阿尔特斯:超越时空》和《虚实异境:迷离时空》在内的多款佳作。

92c2bad040fed91dc213d2b8925191b6.png

晚点独家|腾讯企业服务不再设收入增长目标,转为加速扭亏

腾讯云与智慧产业事业群从今年开始,不再强调收入目标,腾讯总办对其的主要考核方式也改为以减亏为导向的利润指标。

深耕B端,HTC要做大生态

早在2016年左右,HTC就开始布局VR,创立虚拟现实品牌VIVE。后一度成为继索尼、Meta后,全球排名第三的VR设备商。在2107-2018年VR冷静期间,HTC一直在低调做VR大生态。据VR陀螺了解,目前HTC VIVE相关的VR业务已经开始有了很好看的盈利表现,并且在市场上已经稳住了阵脚。

半导体行业周期黎‍明将至

11月1日据业内人士透露,目前已听到存储原厂放话,明年存储报价将逐季调涨。此举也提醒下游客户加紧备货,以免‍采购成本愈来愈高。本轮半导体周期自2022年二季度至今,已经下行了六个季度。如今,越来越多的信号预示,半导体行业周期黎明将至。

点击阅读原文 

跳转LiveVideoStackCon 2023 深圳站 官网,了解更多信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/121076.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

git commit规范提交

Git每次提交代码时,都要写Commit Message(提交说明),通常情况下,Commit Message应该清晰明了,说明本次提交的目的和具体操作等。然而笔者工作多年来发现,有些公司对Commit Message没有明确的要求…

wpf Grid布局详解 `Auto` 和 `*` 是两种常见的设置方式 行或列占多个单元格,有点像excel里的合并单元格。使其余的列平均分配剩余的空间

比如只有行的界面 <Window x:Class"GenerateTokenApp.MainWindow"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d"http://schemas.microsoft.com/exp…

SpringCloudAlibaba——Sentinel

Sentinel也就是我们之前的Hystrix&#xff0c;而且比Hystrix功能更加的强大。Sentinel是分布式系统的流量防卫兵&#xff0c;以流量为切入点&#xff0c;从流量控制、流量路由、熔断降级等多个维度保护服务的稳定性。 Sentinel采用的是懒加载&#xff0c;这个接口被访问一次&a…

企业级低代码开发,科技赋能让企业具备“驾驭软件的能力”

科技作为第一生产力&#xff0c;其强大的影响力在各个领域中都有所体现。数字技术&#xff0c;作为科技领域中的一股重要力量&#xff0c;正在对传统的商业模式进行深度的变革&#xff0c;为各行业注入新的生命力。随着数字技术的不断发展和应用&#xff0c;企业数字化转型的趋…

SpringBoot自动装配 Spring相关 常用设计模式 双亲委派 MongoDB Redis 适配器模式与策略模式

SpringBoot自动装配 阿里云登录 - 欢迎登录阿里云&#xff0c;安全稳定的云计算服务平台 Spring相关 阿里云登录 - 欢迎登录阿里云&#xff0c;安全稳定的云计算服务平台 常用设计模式 双亲委派 Java虚拟机定义了三个主要的类加载器: 1、启动类加载器 2、扩展类加载器 …

《网络协议》02. 物理层 · 数据链路层 · 网络层

title: 《网络协议》02. 物理层 数据链路层 网络层 date: 2022-08-31 22:26:48 updated: 2023-11-08 06:58:52 categories: 学习记录&#xff1a;网络协议 excerpt: 物理层&#xff08;数据通信模型&#xff0c;信道&#xff09;、数据链路层&#xff08;封装成帧&#xff0c…

CSDN中: Markdown编辑器使用说明

Markdown编辑器使用说明 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一…

Android UI 开发·界面布局开发·案例分析

目录 ​编辑 1. 线性布局&#xff08;LinearLayout&#xff09; 2. 相对布局&#xff08;RelativeLayout&#xff09; 3. 表格布局&#xff08;TableLayout&#xff09; 4. 帧布局&#xff08;FrameLayout&#xff09; 5. 网格布局&#xff08;GridLayout&#xff0…

05【保姆级】-GO语言的标识符

之前我学过C、Java、Python语言时总结的经验&#xff1a; 先建立整体框架&#xff0c;然后再去抠细节。先Know how&#xff0c;然后know why。先做出来&#xff0c;然后再去一点点研究&#xff0c;才会事半功倍。适当的囫囵吞枣。因为死抠某个知识点很浪费时间的。对于GO语言&a…

Android 10.0 系统默认打开OEM解锁开关功能实现

1.前言 在10.0的系统定制中,在9.0系统以后为了设备的安装,系统开始启用oem机制,所以在adb push文件就需要先oem解锁,然后才可以 进行相关操作,所以就需要默认打开oem解锁的开关,来方便oem解锁功能的实现 如图: 2.系统默认打开OEM解锁开关功能实现的核心类 packages\ap…

初步了解 RabbitMQ

目录 ​编辑一、MQ 概述 1、MQ 的简介 2、MQ 的用途 &#xff08;1&#xff09;限流削峰 &#xff08;2&#xff09;异步解耦 (3)数据收集 二、RabbitMQ 概述 1、RabbitMQ 简介 2、四大核心概念 3、RabbitMQ 的核心部分 ​编辑 4、名词解释&#xff1a; 三、Hello …

ESP32 C3 smartconfig一键配网报错

AP配网 在调试我的esp32c3的智能配网过程中&#xff0c;发现ap配网使用云智能App是可以正常配置的。 切记用户如果在menu菜单里使能AP配网&#xff0c;默认SSID名字为adh_PK值_MAC后6位。用户可以修改这个apssid的键值&#xff0c;但是要使用云智能app则这个名字的开头必须为ad…

香港金融科技周VERTU CSO Sophie谈Web3.0的下一个风口 手机虚拟货币移动支付

10月31日&#xff0c;香港金融科技周正式拉开帷幕。这项香港金融科技界地年度盛事今年已经踏入了第八届&#xff0c;本届活动吸引超过数百位金融科技专业人士、创业者和行业领袖现场参与&#xff0c;线上参与观众超过10万人次。 在金融科技周的圆桌会议上&#xff0c;VERTU首席…

Java-继承

1 继承 1.1 为什么需要继承 Java中使用类对现实世界中实体来进行描述&#xff0c;类经过实例化之后的产物对象&#xff0c;则可以用来表示现实中的实体&#xff0c;但是现实世界错综复杂&#xff0c;事物之间可能会存在一些关联&#xff0c;那在设计程序是就需要考虑。 以下…

Vulnhub靶场之Funbox

正如该靶场的描述所说&#xff0c;它对初学者来说非常简单。 项目地址&#xff1a;Funbox: Scriptkiddie ~ VulnHub 所需工具&#xff1a; KaliLinux即可。 0x00 信息收集 打开虚拟机后使用nmap扫描一下网段存活&#xff0c;这里我给的虚拟机的范围是100-253,其中kali的IP是10…

Git 安全警告修复手册:解决 `fatal: detected dubious ownership in repository at ` 问题 ️

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

postman接口测试

postman使用 开发中经常用postman来测试接口&#xff0c;一个简单的注册接口用postman测试&#xff1a; 接口正常工作只是最基本的要求&#xff0c;经常要评估接口性能&#xff0c;进行压力测试。 postman进行简单压力测试 下面是压测数据源&#xff0c;支持json和csv两个格式…

论文阅读——变化检测

Viewpoint Integration and Registration with Vision Language Foundation Model for Image Change Understanding 只有fused adapter image encoder, viewpoint registration flow, semantic emphasizing module, 和 fully connected layer 训练&#xff0c;其他参数冻结。 F…

Linux内核有什么之内存管理子系统有什么第三回 —— 小内存分配(1)

接前一篇文章&#xff1a;Linux内核有什么之内存管理子系统有什么第二回 —— 单刀直入 本文内容参考&#xff1a; 内存分配不再神秘&#xff1a;深入剖析malloc函数实现原理与机制 系统调用与内存管理&#xff08;sbrk、brk、mmap、munmap&#xff09; 特此致谢&#xff01;…

CCF ChinaSoft 2023 论坛巡礼 | NASAC青年软件创新奖论坛

2023年CCF中国软件大会&#xff08;CCF ChinaSoft 2023&#xff09;由CCF主办&#xff0c;CCF系统软件专委会、形式化方法专委会、软件工程专委会以及复旦大学联合承办&#xff0c;将于2023年12月1-3日在上海国际会议中心举行。 本次大会主题是“智能化软件创新推动数字经济与社…