Cyber Weekly #1

赛博·新闻

1、弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书

使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。弱智吧数据集在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。

2、Open AI发力模型定制

OpenAI又有动作了,推出了一系列新功能和程序,让开发者在微调和创建定制模型时有更多的控制权和灵活性。

主要功能包括:

  • 在每个训练周期中保存完整的微调模型检查点,这可以显著减少后续重训练的需要,尤其是在模型出现过拟合时尤为重要。
  • 引入了一种全新的并排比较式Playground界面,它允许开发者在单个提示下,直观地比较和评估不同模型或微调状态的输出质量和性能。
  • 支持与第三方平台(本周起首先与Weights and Biases合作)集成,使开发者能够将详细的微调数据与他们使用的其他技术栈共享。
  • 每个训练周期结束时,将通过验证数据集(而非之前的样本批次)计算得到的性能指标,如token损失和准确率,从而更好地展示模型性能并提供关于模型泛化能力的反馈。
  • 现在,开发者可以直接在Dashboard上配置可用的超参数,而不再局限于仅通过API或软件开发工具包(SDK)进行设置。
  • 对微调Dashboard进行了多项改进,包括配置超参数的功能,查看更详细的训练度量,以及能够根据先前的配置重新运行任务。

3、OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

OpenAI 使用了超过100万小时的YouTube视频转录来训练其最先进的大型语言模型 GPT-4。这是他们收集高质量训练数据工作的一部分,这些数据对于开发和改进 GPT-4 等人工智能模型至关重要。

4、OpenAI大动作,无需注册就可使用ChatGPT_澎湃号·湃客_澎湃新闻-The Paper

4月1日,OpenAI宣布当天起,任何用户无须注册,就能免费使用ChatGPT。GPT4由于需付费依然需要账号登录。由于开放后用户数量激增,目前网站响应缓慢。

5、谷歌正式推出VLOGGER

VLOGGER能让照片栩栩如生:你只需要上传一张脸部照片,Al 将其变成动画,并配以自然的手势和表情。

它包括了:1)读唇器:根据音频预测你的动作;2)动画制作器:根据你的照片和动作细节创建视频帧。

赛博·工具

1、IKI:RAG驱动的内容收藏

一款能够用AI重新思考和构建稍后阅读和内容收集工具。iki这个笔记工具非常强大,你不需要整理自己收藏的内容一切都交给AI来完成。它可以处理你收集的大量杂乱、非结构化数据,让应用程序为你组织和显示信息,而不必你自己动手。

主要功能有:

  • 自动提取和总结
  • 自动在聊天和任何现有笔记中显示相关数据
  • 为任何文件添加个人注释
  • 与团队共享数据集合
  • 关注社区其他人创建的合集和阅读内容

2、Hacker News:完全AI驱动的中文科技播客

一个完全由AI驱动的中文播客,每天总结Hacker News热门的前十条信息。TTS语音现在是真的自然语言类节目基本不需要人口播了。

赛博·洞见

1、2024Q1商用LLM API进展简评【2024.4 W1】

主要讨论从2024.2.1-2024.4.5的商用LLM API的进展,2024年Q1的商用LLM API进展可谓争奇斗艳,尤其是海外,各家都有重量级的新模型推出。

2、优化人机协作

本文探讨了如何优化人工智能(AI)在写作过程中的协作,特别是通过“支架理论”(scaffolding theory)的视角。支架理论最初源于教育领域,旨在通过提供适时的支持和指导来帮助学习者掌握他们尚未能独立完成的技能

文章通过Dhillon等人(2024年)的研究,系统评估了不同级别的AI支架对写作质量、用户满意度、认知负荷和生产力等方面的影响。研究发现,与控制组相比,低级别的支架(如单句建议)降低了输出质量,而高级别的支架(如段落建议)显著提高了输出质量,尤其对非常规和技术不太熟练的写作者更为有益。然而,随着AI协助的增加,用户满意度和拥有感却呈现相反的趋势,尽管质量有所提高。

文章还强调了对用户体验(UX)专业人员的建议,包括了解用户的需求、设计能够适应不同用户专业水平的界面、实现个性化和定制化、逐渐调整AI支持的级别以及促进用户的主动性和拥有感。通过这些策略,我们可以显著提升用户体验,使AI工具不仅有用,而且在实现多样化活动目标中变得不可或缺。

3、万字复盘我的AI作品《Devices》| 解析AI创作中的变与不变

这篇文章是晨然在VisonOS 开发者大会的作品《Devices》实践经验分享。作者探索了如何通过调整AI模型的提示词(prompt)来改善生成的图像质量,并提供了一系列技巧和策略,用于指导AI创作中的变与不变,帮助创作者更好地控制AI生成内容的质量和风格。

4、一个顶级 AI 产品经理的自我修养 | 42章经

来自42章经,采访了光年之外产品负责人Hidecloud,他分享了产品创新之处,以及对 Al 技术的理解和开源模型的应用。他认为产品经理需要理解技术,解决产品与技术的匹配,同时指出AI领域需要更多人去深入理解最新技术进展和模型能力边界。

5、他山之石|重新思考人工智能时代的信息素养

本文从人工智能技术对教育领域带来的变革出发,讨论了生成式人工智能和机器学习如何重塑我们的世界,特别是在信息传播和媒体互动方面。通过分析聊天机器人的发展,如小冰和Tay的案例,文章指出了人工智能在模仿人类交流和传播信息时可能存在的偏见和误导性问题。

文章进一步探讨了深度伪造技术对个人和社会的潜在威胁,以及它如何影响民主制度和公众舆论。为了应对这些挑战,文章提出了几种解决方案,包括横向阅读、培养学生成为数字侦探、寻找图书馆员的帮助,以及回顾历史来更好地理解信息素养的未来。

最后,文章强调教育工作者的责任,即引导学生提升信息素养,使他们能够在充满误导性信息的世界中成为明智的信息消费者,并在不断变化的环境中发挥积极作用。

6、完整版 Y Combinator W24,100+ AI项目全览|硅兔独家

文章报道了硅谷著名的创业孵化器Y Combinator(YC)在其W24批次中展示的260多家初创企业,这些企业在两天内向1500多家投资机构和媒体展示了各自的AI项目。文章强调了AI技术在医疗、金融、生物技术等行业的应用,并预测了AI技术未来的发展趋势。特别提到了AI项目在YC中的录取率极低,以及亚裔创始人的比例增加。文章还提到了AI技术迅速发展,许多去年还无法实现的事情,今年已经可以通过AI技术轻松完成。最后,文章提供了一个获取YC W24 AI项目数据库的链接,供读者深入了解。

7、【AI 时代的教育-02】从个性化训练到个性化教育

文章批评了教育科技公司过度依赖技术进行所谓的“个性化教育”,指出这种方法虽然比传统的刷题方式有所改进,但本质上仍然是在对学生进行机械化的训练,而非真正的教育。作者引用了Seymour Papert的观点,强调应该让学生学会创造而非仅仅是模仿。

文章提出当前的AI技术已经能够超越简单的对错判断,通过理解学生的回答和推测他们的思维模式,提供更加个性化的学习支持。AI教育应用,如可汗学院的苏格拉底问答式AI导师,能够引导学生按照自己的节奏构建知识,实现真正的个性化学习。

最后,文章展望了AI在教育中的新可能性,包括支持个性化学习路径和学习目标,使得学习不再局限于课堂,而是融入到学生的日常生活中。

8、傅盛对话甲子光年:搞AI真的不能再这么烧钱了

文章主要围绕傅盛与「甲子光年」的对话展开,讨论了当前AI领域的热点问题和未来趋势。傅盛认为,当前AI领域存在烧钱和泡沫问题,尤其是大模型的开发和应用,需要更加务实和注重成本效益的商业模式。

傅盛分享了自己从互联网产品经理到AI创业者的经历,以及在猎豹移动和猎户星空两家公司中的经历和反思。他现在更注重技术的实用性和与企业需求的结合,而不是单纯追求技术的先进性。文章中,傅盛还对当前AI领域的一些热门话题,如人形机器人、大模型的发展趋势和应用场景等,提出了自己的观点和看法。他强调,技术创新应该基于实际需求和应用场景,而不是盲目追求规模和技术的突破。

文章最后,傅盛提出了对未来AI领域的预测和建议,包括注重基础研究、避免无谓的竞争和烧钱,以及寻找与企业实际需求相结合的创新路径。他鼓励创业者和企业要有耐心,从实际出发,逐步推动AI技术的发展和应用。

9、Suno技术大揭秘🤐;AI音乐发展史:罗马不是一天建成的;音乐生成模型 | ShowMeAI

文章回顾了AI音乐生成技术的发展历程,从1938年电子语音合成器Voder的诞生到现代各大公司如Google、Meta等发布的音乐生成工具。

文章重点介绍了Suno的创始人Mikey Shulman及其团队,他们从AI金融科技领域转向音频生成技术,并推出了一系列创新产品,如Bark、Chirp和Parakeet等。Suno通过整合这些技术,实现了高质量的音乐生成,包括歌词、人声、乐器等元素,被誉为音乐圈的ChatGPT时刻。

文章还讨论了Suno的商业模式、用户创造的新玩法、支持的语言、以及如何使用Suno创作音乐。同时,提到了Suno在音乐社交方面的愿景,以及它如何激发普通人的音乐创作热情。最后,文章探讨了音乐生成模型的技术原理和挑战,包括数据稀缺、版权问题、以及如何训练模型捕捉音乐与文本之间的联系。文章预测,随着技术的进步,音乐生成领域将迎来更多的创新和发展。

赛博·资源

1、通义千问开源Qwen1.5-32B模型

通义千问开源新的Qwen1.5-32B模型,在语言理解、支持多语言、编程和数学能力方面表现出色。

2、什么是 GPT? transformer的可视化介绍

3Blue1Brown大神非常好的一个演示视频,通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。

3、【亿欧智库】AI电商行业展望与价值分析(关注公众号【产品老A】回复【AI电商行业展望与价值分析】下载

本报告探讨了Al技术在电商领域的应用前景和潜在价值,预测Al将重塑电商流量价值、提升消费体验、降低成本、提高效率,并带来新的市场机遇。报告强调了A技术在产品设计、供应链管理、内容创作、营销运营、客户服务等电商环节的重要作用,并提出了Al电商发展的策略建议。

4、【智象出海】2024中国新科技出海报告(关注公众号【产品老A】回复【2024中国新科技出海报告】下载

2023年随着海外网络基础设施的发展,海外用户在多元视频、工具智能化、社交功能增重方向上都有较大的需求。在2024年社交需求将继续增强,互联网应用的Al化不可避免,用户将越来越向Al原生方向发展,交流与互动的智能化将会对社交、视频、游戏、摄影、工具等多个行业产生变革式影响。

5、2024中国百模大战竞争格局分析报告(关注公众号【产品老A】回复【2024中国百模大战竞争格局分析报告】下载)​​​​​​​

报告详细分析了2024年中国人工智能领域的竞争态势,特别关注了各种AI模型的发展和应用。报告首先介绍了AI技术的背景和当前市场的状况,然后深入探讨了不同AI模型的特点、应用场景和竞争力。报告还提到了一些关键的行业参与者,包括大型科技公司和新兴的AI初创企业,以及他们在市场中的地位和策略。

报告进一步讨论了AI技术在不同行业中的集成和应用,如金融、医疗、教育和娱乐等,并预测了这些技术将如何推动行业变革。此外,报告还关注了AI技术发展可能带来的风险和挑战,包括数据隐私、伦理问题和技术失控等。 最后,报告对2024年至2028年的AI市场进行了预测,展望了技术进步和市场扩张的趋势,并提出了行业发展的一些建议和策略。

(内容整理于互联网)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/534879.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

审查元素时,hover等伪元素,只会在鼠标悬停在对应元素上时生效。一旦鼠标移开,样式就会消失,已解决

最近遇到个小小的问题 当el-input 设置cleable属性的时候,鼠标移入输入框内,会有个清除的图标 输入框的内容居右显示,导致清除的图标和内容重叠了 通过控制台查看元素,只有在鼠标悬停在对应元素上时生效。一旦鼠标移开&#xf…

JR-SMD201网络直播解码器

详细介绍: JR-SMD201网络直播解码器,支持AVS/H.265/H.264/MPEG2解码,支持IP输入,支持1080P/1080I/720P/576I/480I多种分辨率,支持DRA/AC3/EAC3/AAC/MPEG等音频。 产品特点 支持多种输入方式IP 接口丰富,CV…

ELK(Elasticsearch+Logstash+Kibana)日志分析系统

目录 前言 一、ELK日志分析系统概述 1、三大组件工具介绍 1.1 Elasticsearch 1.1.1 Elasticsearch概念 1.1.2 关系型数据库和ElasticSearch中的对应关系 1.1.3 Elasticsearch提供的操作命令 1.2 Logstash 1.2.1 Logstash概念 1.2.2 Logstash的主要组件 1.2.3 Logsta…

【MATLAB源码-第8期】基于matlab的DPSK的误码率仿真,差分编码使用汉明码(hanming)。

1、算法描述 差分相移键控常称为二相相对调相,记作2DPSK。它不是利用载波相位的绝对数值传送数字信息,而是用前后码元的相对载波相位值传送数字信息。所谓相对载波相位是指本码元初相与前一码元初相之差。差分相移键控信号的波形如概述图所示。 假设相对…

前端开发攻略---轻松实现排序功能:利用JavaScript创建直观的拖拽排序体验

拖拽事件主要包括以下几种: dragstart(拖拽开始):当用户开始拖拽一个元素时触发,通常在被拖拽的元素上绑定此事件。在该事件的处理函数中,可以设置被拖拽元素的一些属性或数据。 drag(拖拽移动…

【Shell语言学堂】函数调用练习

Shell编程的函数 Shell中的函数概念优点标准shell函数定义函数调用实战案例1、实现画菱形2、将画正三角和倒三角拆分为两个函数3、将菱形的代码拆解成1个函数:画空格和*号4、将十进制的IP地址转为二进制5、选做:将二进制的IP地址转为十进制 Shell中的函数…

多通道电路PCB如何布局布线 - Altium Designer模块复用功能介绍

原文出自微信公众号【小小的电子之路】 电路设计的过程中难免会遇到多通道电路设计,在通道数较少的情况下,可以多花点时间,一个通道一个通道地布局布线,但是在通道数特别多的情况下,这种方法就不现实了,好在…

掼蛋的5-10原则

掼蛋的5-10原则指的是在掼蛋游戏重,所有的5被打出后,牌面上就不可能有9以下的小顺子;而当10都被打出后,6以上到A的顺子也没有了。这就被掼蛋玩家用来判断手中顺子的实际价值。 前期注意观察5和10的出牌情况。如果起手就有较多的5和…

gradio简单搭建——关键词简单筛选【2024-4-11优化】

gradio简单搭建——关键词简单筛选[2024-4-11 优化] 新的思路:标签自动标注界面搭建优化数据处理与生成过程交互界面展示 新的思路:标签自动标注 针对通过关键词,在文本数据中体现出主体的工作类型这一任务,这里使用展示工具grad…

VS中使用QT的UI提升类时,找不到头文件的情况

1、情况简述 在使用VS时,会发现与QCreator存在一些差异。最主要的就是要设置很多东西,如果不配置的话,就会遇到一些问题。下面我分享下我调试过程中遇到的一个问题。使用Qdesigner的UI提升类时,找不到头文件的情况: …

安装 windows 版 dash —— zeal

1、下载安装 下载地址:Download Zeal 选择 Protable 版 直接使用 zeal 下载文档比较慢甚至失败,可以设置代理,也可以使用下面两种方式。 2、手动下载 docset 文档后导入 这种方法不能够选择文档的版本 (1)在 http://…

如何将CSDN的文章以PDF文件形式保存到本地

1.F12 打开开发者工具窗口 2.console下输入命令 (function(){$("#side").remove();$("#comment_title, #comment_list, #comment_bar, #comment_form, .announce, #ad_cen, #ad_bot").remove();$(".nav_top_2011, #header, #navigator").remove…

全球数字贸易产业联盟分享18个抓单秘诀让你业绩暴涨 | 箱讯科技

1、你就是企业 即使你所在的公司有庞杂的分支机构和几千名职工,但对于顾客来讲,公司就是你,同他直接接触的是你。顾客把你的公司看作一个仅为满足他要求的整体。结论一:不可以把问题推给另一部门;结论二:若…

Unity构建详解(7)——AssetBundle格式解析

【文件格式】 文件可以分为文本文件、图片文件、音频文件、视频文件等等,我们常见的这些文件都有行业内的标准格式,其意味着按照一定的规则和规范去保存读取文件,可以获取我们想要的数据。 有些软件会有自己的文件格式,会按照其…

SpringBoot学习笔记四

SpringBoot学习笔记四-监听机制 1. SpringBoot监听器1.1 无需配置1.1.1 CommandLineRunner使用1.1.2 ApplicationRunner的使用1.1.3 CommandLineRunner与ApplicationRunner的区别 1.2 需要创建META-INF文件,并在其中创建spring.factories,配置相关的信息…

WEB3浪潮下的全新体验:精灵派对链游引领边玩边赚的创新之旅

在当前的数字经济浪潮中,区块链技术以其独特的去中心化特性,正在逐渐改变我们的生活和工作方式。其中,区块链游戏(链游)作为新兴的领域,正以其独特的优势吸引着全球玩家的目光。在这样一个背景下&#xff0…

Windows系统安装WinSCP结合内网穿透实现公网远程SSH本地服务器

List item 文章目录 1. 简介2. 软件下载安装:3. SSH链接服务器4. WinSCP使用公网TCP地址链接本地服务器5. WinSCP使用固定公网TCP地址访问服务器 1. 简介 ​ Winscp是一个支持SSH(Secure SHell)的可视化SCP(Secure Copy)文件传输软件,它的主要功能是在本…

Win11又来「重大」更新!

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站ai人工智能工具 更多资源欢迎关注 Windows 11预览通道的22635.3420版本迎来了几个比较大的改进,主要有三个方面: …

LeetCode题练习与总结:不同路径--62

一、题目描述 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 问总共有多少条不同的路径&…

【教学类-51-01】20240411动物皮毛图片的彩色打印PDF制作(一页两张图片,2个表格)

作品展示 背景需求: 为了便于快速做出A4两份图片的效果,设计以下代码,进行图片的PDF合成打印 代码参考: 【教学类-50-06】20240410“数一数”4类星号图片制作PDF学具-CSDN博客文章浏览阅读531次,点赞8次,收…