音视频技术开发周刊 | 291

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

fdb300511f70de5f24f8c07baec9ca67.png

谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊

OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。

Google DeepMind最新研究:如何将人类价值观融入AI?

政治哲学家 John Rawls 在《正义论》中探讨共生社会下的道德问题时,提到了一个旨在帮助确定群体决策公平原则的思想实验——无知之幕,Google DeepMind 认为,它可能是在管理 AI 时选择分配原则的合适机制。

美国NMA正式发布,ChatGPT等生成式AI监管原则

这是美国第一家权威机构正式发布的生成式AI监管原则,本次原则包括知识产权、透明度、问责制、公平、安全和设计6大部分,适用于文本、视频、图片、音频等其他格式的AI生成内容。

国内首个类 ChatGPT 模型:复旦大学 MOSS 正式开源,RTX 3090 显卡可运行

目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。

https://github.com/OpenLMLab/MOSS

全球首个车载语音GPT发布:SoundHound Chat AI for Automotive

据悉,这款AI内置了ChatGPT等当今顶级大语言模型产品,同时也支持汽车制造商自定义集成任何第三方大语言模型,以满足特定场景业务需求。众多汽车生产商对于该产品也产生了浓厚的兴趣。

https://www.businesswire.com/news/home/20230424005379/en/SoundHound-Launches-Chat-AI-For-Automotive-As-Study-Finds-50-Of-Regular-Drivers-Likely-To-Use-Generative-AI-Capabilities

WPP收购声音品牌服务商amp,将拓展基于生成式AI的品牌体验设计

完成收购后,amp将加入WPP旗下的品牌和设计咨询公司Landor & Fitch,增强后者在提供沉浸式品牌标识方面的专业知识,从而改变客户体验并使客户品牌在竞争激烈的市场中脱颖而出。

OpenAI将发布企业版订阅服务ChatGPT Business

OpenAI计划为ChatGPT引入一个新的订阅层,以满足企业客户的需求。这款被称为ChatGPT Business的产品被OpenAI公司描述为“为需要更多数据控制的专业人士以及寻求管理终端用户的企业提供服务”。

https://techcrunch.com/2023/04/25/openai-previews-business-plan-for-chatgpt-launches-new-privacy-controls/

投资10亿美元!普华永道扩大对ChatGPT、GPT-4的应用

全球四大会计事务所之一的普华永道(PwC)在宣布,计划在未来三年内投资10亿美元,扩大对ChatGPT、GPT-4等生成式AI的应用,并帮助客户通过生成式AI重构业务流程实现降本增效。

30de12f698a070a76b6aeb320786e5a1.png

AIGC的阿克琉斯之踵 

文章总结了ChatGPT的诸多难以忽视的问题,剖析了多模态大模型的本质、前提和不足,值得一看。

https://huaweicloud.blog.csdn.net/article/details/130284728?spm=1001.2014.3001.5502

AI音乐家:给我一个prompt,帮你实现编曲自由

来,放松一下,听点AI做的音乐吧。

1769a3663bc43c102086288f7f846e15.png

陆奇最新演讲实录:我的大模型世界观 

奇绩创坛创始人兼CEO陆奇是中国AI布道人,也是中国针对大模型最有发言权的人之一。到现在为止,你几乎很难在公开渠道听到陆奇的观点。本文涵盖了他对大模型时代的宏观思考,包括拐点的内在动因、技术演进、创业公司结构性机会点以及给创业者的建议。

对话算想未来创始人赵亚雄:希望做“为中国 AI 经济而生的 AWS” 

“未来一定是AI的世界”,赵亚雄博士的商业猜想转移到大模型。但他的商业方案“算想未来”不直接参与做大模型,而是要做大模型和AI应用的基础设施。未来“算想未来”要做AI的基础设施—— AI IaaS Cloud,区别于传统的云计算厂商,即一个以AI为导向的云计算厂商。

52c9fd2f3ea084ea0ea35c69d2b65cbe.png

如何在Java Spring Boot应用程序中使用Amazon S3存储桶来存储和检索媒体文件

这篇文章提供了一个非常实用的指南,教你如何在Java Spring Boot应用程序中集成Amazon S3存储桶来存储和检索媒体文件。它涵盖了所有必要的步骤和配置,并提供了有用的技巧和最佳实践。

https://www.twilio.com/blog/media-file-storage-java-spring-boot-amazon-s3-buckets

3fb2ca14d1c92e1535e83a426536f1f7.jpeg

腾讯多媒体实验室画质增强技术的前沿应用

LiveVideoStackCon 2022 北京站邀请到腾讯多媒体实验室视频技术研发负责人——夏珍与大家分享画质增强技术的一些前沿探索和应用研究,在经典影像中非常重要的画质提升技术人脸修复和去压缩失真的能力,以及在腾讯视频和云游戏中能带来画质增强的技术。

333de3cddd65ed930917d8957c150c72.jpeg

美国海军空战中心开源!首个仅使用单目拍摄地面纹理的SLAM系统

64dac00178feedec7e7787af215d03b4.png

振动台系统的预防性维护

与被动维护不同,预防性测试方法为您的振动台是否会在不久的将来遇到问题提供了有价值的见解。实施预防性维护测试计划允许您在紧凑的测试计划的时间范围内规划维护,并降低计划外停机和设备故障的风险。 

AudioGPT:理解并生成语音、音乐和播报 

虽然ChatGPT一直在挑战我们的认知极限,但目前的大模型仍然无法处理复杂的音频信息或进行语音对话(如Siri或Alexa)。在本篇论文中,作者团队研发出名为AudioGPT的多模态 AI 系统。测试表明,AudioGPT在解决任务方面的能力,包括在多轮对话中理解和生成语音、音乐和声音中表现不凡。

http://export.arxiv.org/abs/2304.12995

2b293c471e41b2a11cf33c547a7772c7.png

SIGCOMM 2020|LiveNAS 神经增强型实时流媒体:通过在线学习改进实时视频摄取

规模增长背后抖音如何构建直播体验优化 

随着抖音直播用户持续增加,生态日渐丰富,在经历亿万规模化增长的过程之中,体验优化是必须要面对的问题,LiveVideoStackCon 2022北京站邀请到火山引擎直播技术负责人周一楠,分享抖音体验优化过程的一些探索与实践。

SIGCOMM 2020|LiveNAS 神经增强型实时流媒体:通过在线学习改进实时视频摄取

作者提出了 LiveNAS 实时视频摄取框架,它利用超分辨率深度神经网络来增强独立于 ingest 端网络带宽的实时视频质量。LiveNAS 通过 WebRTC 在各种真实世界的网络轨迹中实现了 PSNR 相比 WebRTC 平均 1.96 dB 的整体视频质量改进,并为直播流观众带来了显着 (12%-69%) 的 QoE 改进。

NAB2023:OpenGear 和 Dante 集成以及 Bridge Live 等新功能

AJA 正在开发一种新的 OpenGear 卡,可以将 Dante 音频直接集成到 OpenGear 系统中。这样,用户就可以将音频和视频信号共享相同的设备,从而简化工作流程并提高生产效率。此外,AJA 还发布了 Bridge Live,这是一种基于云的视频编码和传输解决方案。该系统可以帮助用户实现高质量的远程视频制作,并支持多个协议和格式,如 RTMP、SRT 和 HLS。

https://www.streamingmedia.com/Articles/News/Online-Video-News/NAB-2023-AJAs-Bryce-Button-Talks-OpenGear-Dante-Integration-and-Bridge-Live-158337.aspx

a67cc835987edb3dd8b3a48f0ac7c871.png

Wowza Streaming Engine + AMD Alveo U30 让高密度流媒体变得简单

在本届NAB2023中,AMD宣布和Wowza达成合作,以应对在流媒体处理方面所面临的挑战,例如高负载和高延迟。AMD Alveo U30加速卡可以提供高性能和低延迟。将Wowza Streaming Engine与AMD Alveo U30集成,以便实现高密度流媒体处理。

https://www.wowza.com/blog/high-density-streaming-made-easy-with-wowza-streaming-engine-amd-alveo-u30

26e3921ac58aa3bd387836cf861ad4fa.png

2023年中国智能视频编码行业白皮书


194bb0a7407fb5b059c3abb49910e157.png

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/16960.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于STATCOM的风力发电机稳定性问题仿真分析(Simulink)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

thinkphp6 JWT报错 ‘“kid“ empty, unable to lookup correct key‘解决办法

文章目录 JWT简介安装问题先前的代码解决办法修改后的完整代码 JWT简介 JWT全称为Json Web Token,是一种用于在网络应用之间传递信息的简洁、安全的方式。JWT标准定义了一种简洁的、自包含的方法用于通信双方之间以JSON对象的形式安全的传递信息。由于它的简洁性、可…

关于SpringBoot整合Websocket实现简易对话聊天窗

前言 官网链接:Websocket Websocket 是什么?它可以将两个独立的浏览器窗口作为通信的两端。 这种形式的通信与传统的 HTTP、TCP 所不同。传统的 HTTP 请求—响应协议是无法实现实时通信的,也就是说,只能由客户端向服务端发送请求…

英语中主语从句的概念及其用法,例句(不断更新)

主语从句的原理 主语从句是一种充当整个句子主语的从句,主语从句构成的句子,是要以引导词开头的。它可以用名词性从属连词、关系代词或关系副词引导。主语从句通常位于谓语动词之前,用于表示动作、状态或事件的主体。 以下是一些常用的引导主…

MiniGPT-4,开源了!

上个月GPT-4发布时,我曾写过一篇文章分享过有关GPT-4的几个关键信息。 当时的分享就提到了GPT-4的一个重要特性,那就是多模态能力。 比如发布会上演示的,输入一幅图(手套掉下去会怎么样?)。 GPT-4可以理解…

推荐几个可以免费使用的ChatGPT工具

在ChatGPT相关API推出之后,各种工具如雨后春笋一般层出不穷,这篇文章就列举一些日常使用到的工具。 工具列表 OpenAI 在线读取任意网页内容包括视频(YouTube),并根据这些内容回答你提出的相关问题或总结相关内容支持…

Mysql-视图

视图 视图介绍视图的语法视图的检查选项CASCADEDLOCAL 视图的更新视图的作用 视图介绍 视图(View)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的…

【配电网优化】基于串行和并行ADMM算法的配电网优化研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

2023年值得关注的20大网络安全趋势

随着围绕所有企业的数字革命,无论大小,企业、组织甚至政府都依赖计算机化系统来管理他们的日常活动,从而使网络安全成为保护数据免受各种在线攻击或任何未经授权访问的主要目标。 随着数据泄露、勒索软件和黑客攻击的新闻成为常态&#xff0…

java获取文件夹下所有文件名

在进行 Java编程的过程中,我们会经常使用到文件夹下的所有文件名。有时候可能不太熟悉 Java编程的小伙伴们会发现,在代码中没有获取到所有的文件名,那么这个时候我们应该怎么去获取到这些文件呢?在进行 Java编程的过程中&#xff…

深度学习卷积神经网络学习小结

————————————————————————————————————————————— 学习小结: 1)深度学习综述;(2)对卷积神经网络(CNN)的认识;(3&#xff0…

08 Kubernetes应用配置管理

课件 在 Kubernetes 中,secret 是一种用于存储敏感信息的对象。Kubernetes 支持以下三种类型的 secret: Opaque:这是默认的 secret 类型,可以用于存储任何类型的数据,包括字符串、二进制数据等。 Service Account&…

Python研究生组蓝桥杯(省二)参赛感受

为什么参加蓝桥杯? 今年是读研的第一年,看着我简历上的获奖经历“优秀学生干部”“优秀志愿者”“优秀毕业生”......大学四年,我竟然没有一次竞赛类的经历,也没有拿得出手的项目,我陷入了深深的焦虑。 听说蓝桥杯的…

[架构之路-183]-《软考-系统分析师》-13-系统设计 - 高内聚低耦合详解、图解以及技术手段

目录 第1章 什么是高内聚低耦合 1.1 概念 1.2 目的 1.3 什么时候需要进行高内聚低耦合 1.4 什么系统需要关注高内聚、低耦合 第2章 分类 2.1 内聚的分类 2.2 耦合的分类 第3章 增加高内聚降低耦合度的方法 3.1 增加高内聚 3.2 降低耦合度 第1章 什么是高内聚低耦…

超详细的R语言svykm函数绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)

我们在既往的文章《R语言绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)》中介绍了怎么使用jskm包的svykm函数绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier),但是有粉丝觉得讲得不够详细,希望讲得详细一点,今天我们继续来介绍一下…

排序算法 — 归并排序

文章目录 归并排序介绍从下往上的归并排序从上往下的归并排序 归并排序实现从上往下的归并排序从下往上的归并排序 归并排序的时间复杂度和稳定性归并排序时间复杂度归并排序稳定性 代码实现核心&总结 每日一道算法,提高脑力。第五天(时隔7天,终于回…

Mybatis 框架 ( 一 ) 基本步骤

1.概念 1.1.什么是Mybatis框架 (1)Mybatis是一个半ORM(Object Relation Mapping 对象关系映射)框架,它内部封装了JDBC,开发时只需要关注SQL语句本身,不需要花费精力去处理加载驱动、创建连接、…

【工具使用】- git实现gitee托管代码以及检出代码

1. 下载Git工具 git下载地址1:https://git-scm.com/download/win git下载2:https://mirrors.tuna.tsinghua.edu.cn/github-release/git-for-windows/git/Git%20for%20Windows%202.40.1/ 下载完成后安装 安装直接执行exe可执行程序,下一步…

Packet Tracer - 配置 RIPv2

Packet Tracer - 配置 RIPv2 目标 第 1 部分:配置 RIPv2 第 2 部分:验证配置 拓扑图 背景信息 尽管在现代网络中极少使用 RIP,但是作为了解基本网络路由的基础则十分有用。 在本活动中,您将使用适当的网络语句和被动接口配置…

【Java笔试强训 24】

🎉🎉🎉点进来你就是我的人了博主主页:🙈🙈🙈戳一戳,欢迎大佬指点! 欢迎志同道合的朋友一起加油喔🤺🤺🤺 目录 一、选择题 二、编程题 🔥年终奖 …