大模型日报-20240204

刚刚,字节版GPTs「扣子」上线了

在这里插入图片描述

https://mp.weixin.qq.com/s/efNjbeK8Zul39nLzQuawCg

在持续一年的大模型热潮之后,「智能体」成为了科技公司们新的押注方向之一。近日,字节跳动正式推出「Coze 扣子」AI Bot 开发平台。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。当然,除了可以创建自己的 Chatbot,Coze 官方还提供了 Bots 商店和插件。链接:https://www.coze.cn/

最强开源多模态生成模型MM-Interleaved:首创特征同步器

在这里插入图片描述

https://mp.weixin.qq.com/s/-MpwnoqH1_vA3QGHq0M1NQ

想象一下,AI 不仅会聊天,还长了「眼睛」,能看懂图片,甚至还会通过画画来表达自己!这意味着,你可以和它们谈天说地,分享图片或视频,它们也同样能用图文并茂的方式回应你。最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLab)、清华大学、商汤科技、多伦多大学等多家高校、机构,共同发布了一个多才多艺的最强开源多模态生成模型 MM-Interleaved,借助全新提出的多模态特征同步器刷新多项任务 SOTA。它拥有对高分辨率图像细节和微妙语义的精准理解能力,支持任意穿插的图文输入和输出,带来了多模态生成大模型的崭新突破。

赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了

在这里插入图片描述

https://mp.weixin.qq.com/s/WKWD3cBR7X0r57CwS3rvxA

去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多模态指令数据集训练的,却在一些样本上展示了与 GPT-4 非常相似的推理结果。10 月,LLaVA-1.5 重磅发布,通过对原始 LLaVA 的简单修改,在 11 个基准上刷新了 SOTA。现在,研究团队宣布推出 LLaVA-1.6,主要改进了模型在推理、OCR 和世界知识方面的性能。LLaVA-1.6 甚至在多项基准测试中超越了 Gemini Pro。

无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍

在这里插入图片描述

https://mp.weixin.qq.com/s/7XTonFIy-olDuBPUMqxqZQ

在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型,其在每个基准测试中,都优于 Llama 2 13B,并且在代码、数学和推理方面也优于 LLaMA 1 34B。与大模型相比,小模型具有很多优点,比如对算力的要求低、可在端侧运行等。近日,又有一个新的语言模型出现了,即 7.52B 参数 Eagle 7B,来自开源非盈利组织 RWKV,其具有以下特点:

•基于 RWKV-v5 架构构建,该架构的推理成本较低(RWKV 是一个线性 transformer,推理成本降低 10-100 倍以上);

•在 100 多种语言、1.1 万亿 token 上训练而成;

•在多语言基准测试中优于所有的 7B 类模型;

•在英语评测中,Eagle 7B 性能接近 Falcon (1.5T)、LLaMA2 (2T)、Mistral;

•英语评测中与 MPT-7B (1T) 相当;

•没有注意力的 Transformer。

小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜

在这里插入图片描述

https://mp.weixin.qq.com/s/Etl0HUVRdxwsgcM0ErqHjA

最近,有一群来自小红书的 95 后神秘团队,自称 InstantX,搞了个大动作 —— 开源「InstantID」项目。InstantID 凭借着高质量的图像生成能力,在开源界掀起了一股热潮:不仅获得了众多技术大佬的点赞,更是在 GitHub 热榜上迅速飙升,成为焦点。这个「出片神器」,让用户只需上传一张照片,就能轻松定制出多种风格的 AI 写真。

智源研究院院长交接:前快手技术副总裁王仲远加盟,接替黄铁军

在这里插入图片描述

https://mp.weixin.qq.com/s/2_a2uFpBKLDtNopr_I-IIQ

智源研究院院长交接班了。前快手技术副总裁王仲远博士接任智源研究院院长,全面负责研究院各项工作。自此,黄铁军将不再兼任院长的身份。去年(2023年)6月,他接任智源研究院理事长,负责领导智源的整体战略布局和创新生态构建。

OpenAI:正在构建一个针对LLM辅助生物威胁创建的早期预警系统

在这里插入图片描述

https://x.com/OpenAI/status/1752758698991354317?s=20

我们正在构建一个早期预警系统,用于辅助识别大型语言模型(LLMs)在生物威胁创建方面的能力。目前的模型被证明在这种误用上最多只是轻微有用,我们将继续发展我们未来的评估蓝图。

Codellama-70b在VSCode Copilot上线,在VSCode中直接利用最新模型

https://x.com/dani_avila7/status/1752813610240200924?s=20

终于来了!Codellama-70b 作为 VSCode 中的 Copilot!😱

你现在可以在 Visual Studio Code 中直接利用最先进的代码生成模型,Code Llama 70B 的力量,通过 @perplexity_ai 这个模型在代码编写方面甚至已经超越了 GPT-4,并且现在已经无缝集成到我们的编辑器中🥳

你是否预期会出现更多超越 GPT-4 的开源模型?

OpenArt

在这里插入图片描述

https://openart.ai/

OpenArt 是一个为每个人提供 AI 图像生成工具的平台。他们致力于打开 AI 图像生成的黑匣子,让人们可以通过简单的文本提示来实现他们的创意。OpenArt 与其他 AI 图像平台不同,它策划了由世界各地独立开发者构建的应用程序,包括动画 GIF 生成器、草图到图像、RPG 人像制作者、逼真的图像转换器、换脸、AI 漫画店、AI 标志生成器、AI 贴纸生成器等。用户可以免费在 OpenArt 上创建令人惊叹的图像,并且还可以训练自己的自定义模型。

Faith

在这里插入图片描述

https://namastefaith.com/

Faith 是一个 AI 提供支持的心灵导师,通过各种宗教和非宗教精神作品的深刻见解来提供指导和智慧。它的目标是为人们提供对各种信仰和观点的理解和指导,无论他们是虔诚的宗教信仰者、休闲的灵性追求者,还是只是对生活中更大的问题感到好奇。 Faith 在宗教层面为用户提供心灵指引。

MobileAgent

在这里插入图片描述

https://github.com/X-PLUG/MobileAgent

Mobile-Agent 是一种自主的多模态移动设备 Agent,利用视觉感知工具来准确识别和定位应用程序前端界面中的视觉和文本元素。它能够根据感知到的视觉上下文自主规划和分解复杂的操作任务,并逐步引导移动应用程序完成操作。与以前依赖应用程序的文件或移动系统元数据的解决方案不同,Mobile-Agent 以视觉为中心的方式允许在不同的移动操作环境中具有更大的适应性。

AutoMathText

https://huggingface.co/datasets/math-ai/AutoMathText

AutoMathText 是一个包含 200GB 数学文本数据集的资源,它支持文本生成和问答等任务,适合用于开发和测试能够理解和生成数学相关内容的模型。包含来自不同来源的数据,经过特定的过滤和处理,以适应数学推理、推理训练和微调等多种应用场景。

GPU深度学习性能的三驾马车:Tensor Core、内存带宽与内存层次结构

https://zhuanlan.zhihu.com/p/669987669?utm_medium=social&utm_oi=56635854684160&utm_psn=1736330574372118528&utm_source=wechat_timeline

本篇文章讨论了GPU在深度学习性能中的三个关键因素:Tensor Core、内存带宽与内存层次结构。Tensor Core对于矩阵乘法运算至关重要,可以大幅提升性能。由于矩阵乘法是深度神经网络中计算量最大的部分,因此这种计算核心显得格外重要。内存带宽的大小直接影响Tensor Core的数据获取速度,进而影响整体性能;而内存层次结构,尤其是二级缓存的大小,决定着训练过程中数据加载的次数。了解这些性能指标有助于选用合适GPU、优化深度学习应用的运行效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/369520.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据孤岛是什么?企业如何应对?

数据孤岛指的是数据在组织内部无法自由流通和共享的状态,这种现象不仅影响了业务的高效运作,也威胁着企业的创新和竞争力。本文将深入探讨数据孤岛问题,分析其产生的原因以及对企业的影响,最后提出有效的应对策略。 一、数据孤岛…

npm---设置淘宝镜像时报“certificate has expired“的错误

今天使用vue create my-app 创建项目时,竟然报错: Error: Command failed: npm info vue-cli-version-marker --json --registryhttps://registry.npm.taobao.org npm ERR! code CERT_HAS_EXPIRED npm ERR! errno CERT_HAS_EXPIRED npm ERR! request t…

速度规划:用s形曲线规划速度------pencv c++绘图(2)

理论篇 应用篇 实现变速规划 #include <iostream> #include <opencv2/opencv.hpp> // 包含OpenCV头文件 #include <chrono> #include <thread>using namespace std;#define _CRT_SECURE_NO_WARNINGS #define a_max 1.0 #define J 0.2 #define v_m…

商家转账到零钱功能申请方法

商家转账到零钱是什么&#xff1f; 商家转账到零钱功能整合了企业付款到零钱和批量转账到零钱&#xff0c;支持批量对外转账&#xff0c;操作便捷。如果你的应用场景是单付款&#xff0c;体验感和企业付款到零钱基本没差别。 商家转账到零钱的使用场景有哪些&#xff1f; 商…

基于YOLOv8的工业油污缺陷检测,多种优化方法---自研新型轻量级的实时检测算法(四)

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要内容:详细介绍了工业油污缺陷检测整个过程&#xff0c;从数据集到训练模型到结果可视化分析&#xff0c;以及如何优化提升检测性能。 &#x1f4a1;&#x1f4a1;&#x1f4a1;加入 自研新型轻量级的实时检测算法 mAP0.5由原始…

IDEA创建JavaWeb项目(保姆级别)

文章目录 1.1 原始的 Web 项目1.1.1 创建 Java web 项目1.1.2 完善项目结构1.1.3 依赖添加1.1.4 部署服务器(Tomcat)1.1.5 启动项目 1.2 使用 Maven 创建 Web 项目1.2.1 使用 maven 创建 web1.2.2 配置编译路径和jar包存放位置1.2.3 部署服务器&#xff08;Tomcat&#xff09;1…

2024.2.3

单向循环链表的头插 头删 尾插和尾删 //头结点插入 Linklist insere_element(Linklist head,datatype element) {Linklist screat();s->dataelement;if(NULLhead){heads;}else{Linklist phead;while(p->next!head){pp->next;}s->nexthead;heads;p->nexthead;}r…

【51单片机】开发板&开发软件(Keil5&STC-ISP)简介&下载安装破译传送门(1)

前言 大家好吖&#xff0c;欢迎来到 YY 滴单片机系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过单片机的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴C专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; YY的《C》专栏YY的《C11》专栏YY的…

Netflix Mac(奈飞mac客户端) v2.13.0激活版

Clicker for Netflix Mac版是一款适用于Mac的最佳独立Netflix播放器&#xff0c;具有直接从从Dock启动Netflix&#xff0c;从触摸栏控制Netflix&#xff0c;支持画中画等多种功能&#xff0c;让你拥有更好的观看体验。 软件特色 •直接从Dock启动Netflix •从触摸栏控制Netflix…

迅为STM32MP157开发板底板板载4G接口(选配)、千兆以太网、WIFI蓝牙模块

底板扩展接口丰富 底板板载4G接口(选配)、千兆以太网、WIFI蓝牙模块HDMI、CAN、RS485、LVDS接口、温湿度传感器(选配)光环境传感器、六轴传感器、2路USB OTG、3路串口CAMERA接口、ADC电位器、SPDIF、SDIO接口等。 支持多种显示屏 迅为在MP157开发板支持了多种屏幕&#xff0…

C# 使用 MailKit 发送邮件(附demo)

C# 使用 MailKit 发送邮件&#xff08;附demo&#xff09; 介绍安装包&#xff08;依赖&#xff09;案例简单代码属性介绍&#xff1a;MailboxAddress属性介绍&#xff1a;BodyBuilderSMTP 服务器端口SSL的案例&#xff1a;非SSL&#xff1a; 介绍一下SMTP 介绍 MailKit 是一…

2024年【高压电工】考试内容及高压电工模拟试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 高压电工考试内容参考答案及高压电工考试试题解析是安全生产模拟考试一点通题库老师及高压电工操作证已考过的学员汇总&#xff0c;相对有效帮助高压电工模拟试题学员顺利通过考试。 1、【单选题】 FN5-10的型号含意是…

「Kafka」消费者篇

「Kafka」消费者篇 Kafka 消费方式 Kafka 消费者工作流程 消费者总体工作流程 新版本&#xff08;0.9之后&#xff09;的 offset 保存在 kafka 的 Topic 里&#xff0c;持久化到磁盘&#xff0c;可靠性有保障。 老版本&#xff08;0.9之前&#xff09;的 offset 保存在 Zook…

2.0 Hadoop 运行环境

由于 Hadoop 是为集群设计的软件&#xff0c;所以我们在学习它的使用时难免会遇到在多台计算机上配置 Hadoop 的情况&#xff0c;这对于学习者来说会制造诸多障碍&#xff0c;主要有两个&#xff1a; 昂贵的计算机集群。多计算机构成的集群环境需要昂贵的硬件.难以部署和维护。…

LeetCode_19_中等_删除链表的倒数第N个结点

文章目录 1. 题目2. 思路及代码实现&#xff08;Python&#xff09;2.1 计算链表长度2.2 栈 1. 题目 给你一个链表&#xff0c;删除链表的倒数第 n n n 个结点&#xff0c;并且返回链表的头结点。 示例 1&#xff1a; 输入&#xff1a; h e a d [ 1 , 2 , 3 , 4 , 5 ] , n…

爬虫(二)

1.同步获取短视频 1.只要播放地址对Json数据解析&#xff0c;先把列表找出&#xff1a; 2.只想要所有的播放地址&#xff0c;通过列表表达式循环遍历这个列表拿到每个对象&#xff0c;再从一个个对象里面找到Video,再从Video里面找到播放地址(play_addr),再从播放地址找到播放…

大模型增量预训练新技巧:解决灾难性遗忘

大家好&#xff0c;目前不少开源模型在通用领域具有不错的效果&#xff0c;但由于缺乏领域数据&#xff0c;往往在一些垂直领域中表现不理想&#xff0c;这时就需要增量预训练和微调等方法来提高模型的领域能力。 但在领域数据增量预训练或微调时&#xff0c;很容易出现灾难性…

Github 2024-02-04 开源项目日报 Top9

根据Github Trendings的统计&#xff0c;今日(2024-02-04统计)共有9个项目上榜。根据开发语言中项目的数量&#xff0c;汇总情况如下&#xff1a; 开发语言项目数量Python项目6Ruby项目1HTML项目1C项目1Go项目1TypeScript项目1 Windows 终端、控制台和命令行存储库 创建周期…

2024年新版全国行政区划代码

嗨喽&#xff0c;大家好&#xff0c;我是小码哥&#xff0c;今天免费将2024年全国行政区划代码分享给大家&#xff0c;已经整理成sql和excel文件&#xff0c;方便大家直接使用&#xff0c;文章末尾直接获取。 01-数据来源 根据国家统计局官网统计查询&#xff0c;目前全国最新…

mermaid使用指南+notion使用实例-持续更新中

最近一个月了吧&#xff0c;发现Notion插入图片的功能坏了&#xff0c;直接paste会404&#xff0c;本地上传也不行。电脑本地版和手机端都插不了图片&#xff0c;很头疼。解决方法也简单&#xff0c;用图床&#xff0c;放链接。 付费版我用的七牛&#xff0c;结合PicGo&#x…