NLP 时事和见解【2023】

一、说明

        AI的新闻当然不是即时的,但作为趋势和苗头,我们不得不做出自己的决定。比如,一些软件的支持是否持续,哪些现成的软件将不再使用,等等。

图片来自中途

以下是NLPlanet为您选择的有关NLP和AI的每周文章,指南和新闻!

二、😎 来自网络的新闻

  • Stack Overflow宣布OverflowAI。Stack Overflow正在通过OverflowAI将生成AI集成到他们的平台中。这包括使用矢量数据库的语义搜索和个性化结果。他们还增强了跨不同平台的搜索功能,并为Stack Overflow for Teams引入了企业知识摄取功能。
  • 稳定性AI宣布稳定扩散XL 1.0。Stability AI 发布了 SDXL 1.0,这是一个开放访问图像模型,具有惊人的 6 亿个参数模型集合管道。此版本在颜色、对比度、照明和阴影方面有重大改进。
  • 介绍Bittensor语言模型 — 适用于移动和边缘设备的最先进的3B参数模型。BTLM 是一种具有 3 亿个参数的语言模型,可在 RAM 有限的移动和边缘设备上高效运行。凭借更高的准确性和较大的上下文窗口,它在基准测试中优于类似大小的模型。BTLM 在准确性上与 7B 模型保持一致,但在内存占用和推理成本方面超过了它们。其目的是在边缘设备上启用AI应用程序,从而减少对集中式云基础架构的需求。
  • 认识FreeWilly,我们庞大而强大的教学微调模型。Stability AI和CarperAI实验室合作发布了FreeWilly,这是一个使用监督微调(SFT)技术微调的LLaMA 2模型。FreeWilly2在某些任务中的表现与GPT-3.5相当,其功能已得到Stability AI研究人员和Hugging Face的验证。这两种型号均在非商业许可下公开提供。
  • OpenAI在“低准确率”上破坏了AI编写的文本检测器。OpenAI决定停用其AI分类器,因为它在检测AI生成的文本方面的准确率较低。大型语言模型的快速发展使得有效识别特征或模式变得具有挑战性。
  • Microsoft的Bing Chat在Chrome和Safari上针对“选定用户”进行测试。Microsoft已经确认,必应聊天将很快在Google Chrome和Safari等浏览器上使用。
  • 前沿模型论坛。Anthropic、Google、Microsoft和OpenAI联手创建了前沿模型论坛,这是一个致力于安全和负责任地开发前沿AI模型的平台。该论坛旨在推进人工智能安全研究,建立安全最佳实践,分享知识,并利用人工智能应对社会挑战。

三、📚 来自网络的指南

  • 使用 Gradio 构建生成式 AI 应用程序。Hugging Face和 DeepLearning.ai 推出了一个新的短期课程,使用Gradio构建生成AI应用程序。该课程侧重于使用开源语言模型创建用户友好的应用程序,项目范围从文本摘要到图像分析和图像生成。
  • 构建一个 AI 图表生成器,只需 50 行即可适应任何数据集类型。开发人员可以使用 GPT-3.5 或 GPT-4 和 Langchain 轻松创建 AI 图表生成器,只需 50 行代码。
  • 自动化网络研究。本文探讨了网络研究代理的发展。该方法涉及使用LLM生成搜索查询,执行搜索,抓取页面,索引文档以及为每个查询查找最相关的结果。
  • 使用 Whisper 和 GPT-4 创建自动会议记录生成器。本指南探讨了会议记录生成工具的开发,该工具利用 Whisper 和 GPT-4 来有效地总结讨论、提取重要细节和分析情绪。

四、🔬 有趣的论文和资料库

  • karpathy/llama2.c:在一个纯C文件中的推理骆驼2。Andrew Karpathy在纯C中发布了LLaMA 2推理的教育实现。该项目允许您在 PyTorch 中训练 LLaMA 2 LLM 架构,然后将权重加载到单个 C 文件中以进行高效推理。
  • FLASK:基于对齐技能集的细粒度语言模型评估。FLASK 是专门为 LLM 绩效评估设计的评估协议。它将评估分解为 12 种不同的技能集,允许根据特定技能(如逻辑稳健性、事实性和理解力)对模型的性能进行详细分析。
  • 对对齐语言模型的通用和可转移攻击。最近的一项研究探讨了对开源和闭源语言模型的对抗性攻击的自动构建,使它们容易受到有害命令的影响。这些攻击转移到广泛使用的聊天机器人,引发了人们对有效修补这些漏洞的担忧。深度学习模型对对抗性攻击的固有敏感性仍然存在不确定性,类似于计算机视觉面临的挑战。
  • WebArena:用于构建自治代理的逼真Web环境。WebArena 是一个逼真的 Web 环境,允许自主代理在与电子商务、社交论坛、软件开发和内容管理相关的任务中发展他们的技能。它提供了评估任务完成情况的基准,并强调了改进代理的必要性,因为即使是像 GPT-4 这样的高级模型的成功率也只有 10.59%。
  • LLaVA:大型语言和视觉助手。LLaVA是一种大型多模态模型,结合了视觉和语言处理,以提高视觉和语言理解。它实现了令人印象深刻的聊天功能,并为科学 QA 设置了新的最先进的准确性。初步实验表明,与 GPT-4 相比,它在合成多模态指令遵循数据集上具有更高的性能。
  • FABRIC:通过迭代反馈个性化扩散模型。研究人员开发了一种称为FABRIC的免训练方法,将用户反馈整合到基于扩散的文本到图像模型中。通过利用自我注意,该模型可以根据迭代用户输入增强其生成过程,从而提高输出质量和更好的用户体验。
  • 3D-LLM:将3D世界注入大型语言模型。一项新的研究引入了3D-LLM,它通过结合3D点云及其特征来增强具有3D理解的语言模型。通过使用 3D 特征提取器和现有的 2D VLM,3D-LLM 在字幕、问答和导航等任务上实现了令人印象深刻的性能,超过了现有的 LLM 和 VLM。
  • 具有规划、长上下文理解和程序综合的真实网络代理。WebAgent是一个LLM驱动的代理,它使用Flan-U-PaLM和HTML-T5来改善真实网站上的自主Web导航和任务完成。通过分解指令、总结 HTML 文档和生成 Python 程序,与以前的模型相比,成功率提高了 50%。
  • STEVE-1:Minecraft 中文本到行为的生成模型。Minecraft中的STEVE-1模型可以理解和响应文本指令,这要归功于其训练过程,包括预先训练的模型和自我监督的行为克隆。它不仅在遵循各种说明方面设定了新的基准,而且还以较低的培训成本实现了卓越的性能,使研究人员可以在预算内使用它。

感谢您的阅读!如果你想了解更多关于NLP的信息,记得关注NLPlanet。您可以在LinkedIn、推特、媒体和我们的 Discord 服务器上找到我们!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/69596.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux上安装温度监控软件

文章目录 Linux上安装温度监控软件IDRAC设置 Linux上安装温度监控软件 服务器的温度是影响服务器性能重要条件,怎么监控机器的温度呢,这里知道的有两种方式 通过管理界面,查看机器的温度通过机器上安装监监控软件来监控温度 在物理机上怎么…

SAP AIF-Application Interface Framework基本介绍

AIF-Application Interface Framework基本介绍 SAP AIF-应用程序接口框架特性: 通知业务用户出错的自动警报; 用户友好的事务,用于界面监控、错误处理和直接从应用系统内纠正错误; SAP GUI 和基于 Web 的用户界面; 使…

8月10日计算机考研信息差

距24考研初试还有134 天。 8月关注:科目调整、招生宣讲、推荐免试 下一关键节点:预报名(预计2023年09月24日-09月27日) 计算机考研最新资讯: 1、哈尔滨工业大学(威海)发布24专业目录 计算机相关专业: 0812计算机科学与技术 …

Go语言工程实践之测试与Gin项目实践

Go 语言并发编程 及 进阶与依赖管理_软工菜鸡的博客-CSDN博客 03 测试 回归测试一般是QA(质量保证)同学手动通过终端回归一些固定的主流程场景 集成测试是对系统功能维度做测试验证,通过服务暴露的某个接口,进行自动化测试 而单元测试开发阶段,开发者对单独的函数…

在单元测试中使用Jest模拟VS Code extension API

对VS Code extension进行单元测试时通常会遇到一个问题,代码中所使用的VS Code编辑器的功能都依赖于vscode库,但是我们在单元测试中并没有添加对vscode库的依赖,所以导致运行单元测试时出错。由于vscode库是作为第三方依赖被引入到我们的VS C…

redis学习笔记(一)

文章目录 一、引言二、redis介绍2.1、定义2.2、Redis的数据类型及主要特性2.3、Redis的应用场景有哪些? 三、redis环境安装3.1、下载和安装 一、引言 在Web应用发展的初期,那时关系型数据库受到了较为广泛的关注和应用,原因是因为那时候Web站…

Springboot三层架构--DAO层、Service层、Colltroler层--这波我在外太空

目录 1.DAO层 Dao层的设计 2.Service层 Service层的设计 设计Service层的优点 Dao与Service的关系 3.Colltroler层 Collertroler层的设计 4.项目中的具体流程 1.DAO层 全称数据访问层,全称data access object,属于一种比较底层,比较基…

Attention is all you need ---Transformer

大语言模型已经在很多领域大显身手,其应用包括只能写作、音乐创作、知识问答、聊天、客服、广告文案、论文、新闻、小说创作、润色、会议/文章摘要等等领域。在商业上模型即产品、服务即产品、插件即产品,任何形态的用户可触及的都可以是产品&#xff0c…

棒球课堂的发展规划·棒球联盟

棒球课堂的发展规划 1. 棒球课堂的发展环境 探讨棒球课堂如何通过运用创新的教学方法来适应不断变化的市场需求。包括但不限于,科学地运用大数据和人工智能技术来提高教学效率,加强教师队伍的专业培训,以及拓展课外活动,增强学生…

外来jar包运行项目,更换部分文件重新压缩成jar包部署运行

跟公司一个外部支援同事合作开发,发包版本在他那里,功能开发工作我来做,可能是因为我是后来加入的,他不想把代码交到公司来,每次要发布新版本急于测试,联系他发包一直不回复消息,打电话也不接&a…

【STM32RT-Thread零基础入门】 2. 新建RT-Thread项目

硬件:STM32F103ZET6、ST-LINK、usb转串口工具 文章目录 前言一、新建RT-Thread项目二、项目结构三、构建项目四、下载程序(调试器下载)五、终端交互总结 前言 RT-Thread的全称是Real Time Thread,顾名思义,它是一个嵌…

竞赛项目 车位识别车道线检测 - python opencv

0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习 机器视觉 车位识别车道线检测 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) …

plt绘制雷达图

1、圆形 import matplotlib.pyplot as plt import numpy as npplt.rcParams[font.sans-serif][SimHei] #显示中文 plt.rcParams[axes.unicode_minus]False #正常显示负号def radar_map(data, label, cls):# 设置雷达图的角度,用于平分切开一个圆面n len…

【C++】开源:abseil-cpp基础组件库配置使用

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍abseil-cpp基础组件库配置使用。 无专精则不能成,无涉猎则不能通。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下&#…

途乐证券-最准确的KDJ改良指标?

KDJ目标是技术剖析的一种重要目标之一,它是利用随机目标(%R)发展而来的,是一种反映商场超买和超卖状况的买卖目标。KDJ目标由快线(K线)、慢线(D线)和随机值(J线&#xff…

LabVIEW开发分段反射器测试台

LabVIEW开发分段反射器测试台 随着对太空的观察需求越来越远,而不是当前技术(如哈勃望远镜)所能达到的,有必要增加太空望远镜主镜的尺寸。但是,增加主镜像的大小时存在几个问题。随着反射镜尺寸的增加,制造…

微服务与Nacos概述-3

流量治理 在微服务架构中将业务拆分成一个个的服务,服务与服务之间可以相互调用,但是由于网络原因或者自身的原因,服务并不能保证服务的100%可用,如果单个服务出现问题,调用这个服务就会出现网络延迟,此时…

章节5:脚本注入网页-XSS

章节5:脚本注入网页-XSS XSS :Cross Site Script 恶意攻击者利用web页面的漏洞,插入一些恶意代码,当用户访问页面的时候,代码就会执行,这个时候就达到了攻击的目的。 JavaScript、Java、VBScript、Activ…

Ajax 笔记(二)—— Ajax 案例

笔记目录 2. Ajax 综合案例2.1 案例一-图书管理2.1.1 渲染列表2.1.2 新增图书2.1.3 删除图书2.1.4 编辑图书 2.2 案例二-背景图的上传和更换2.2.1 上传2.2.2 更换 2.3 案例三-个人信息设置2.3.1 信息渲染2.3.2 头像修改2.2.3 信息修改2.3.4 提示框 Ajax 笔记: Ajax…

计算机网络:网络字节序

目录 一、字节序1.字节序概念2.字节序的理解(1)大端模式存储数据(2)小端模式存储数据 二、网络字节序 一、字节序 1.字节序概念 字节序:内存中存储多字节数据的顺序。 难道存储数据还要看顺序吗? yes。内…