赛博·新闻
1、弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。弱智吧数据集在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。
2、Open AI发力模型定制
OpenAI又有动作了,推出了一系列新功能和程序,让开发者在微调和创建定制模型时有更多的控制权和灵活性。
主要功能包括:
- 在每个训练周期中保存完整的微调模型检查点,这可以显著减少后续重训练的需要,尤其是在模型出现过拟合时尤为重要。
- 引入了一种全新的并排比较式Playground界面,它允许开发者在单个提示下,直观地比较和评估不同模型或微调状态的输出质量和性能。
- 支持与第三方平台(本周起首先与Weights and Biases合作)集成,使开发者能够将详细的微调数据与他们使用的其他技术栈共享。
- 每个训练周期结束时,将通过验证数据集(而非之前的样本批次)计算得到的性能指标,如token损失和准确率,从而更好地展示模型性能并提供关于模型泛化能力的反馈。
- 现在,开发者可以直接在Dashboard上配置可用的超参数,而不再局限于仅通过API或软件开发工具包(SDK)进行设置。
- 对微调Dashboard进行了多项改进,包括配置超参数的功能,查看更详细的训练度量,以及能够根据先前的配置重新运行任务。
3、OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4
OpenAI 使用了超过100万小时的YouTube视频转录来训练其最先进的大型语言模型 GPT-4。这是他们收集高质量训练数据工作的一部分,这些数据对于开发和改进 GPT-4 等人工智能模型至关重要。
4、OpenAI大动作,无需注册就可使用ChatGPT_澎湃号·湃客_澎湃新闻-The Paper
4月1日,OpenAI宣布当天起,任何用户无须注册,就能免费使用ChatGPT。GPT4由于需付费依然需要账号登录。由于开放后用户数量激增,目前网站响应缓慢。
5、谷歌正式推出VLOGGER
VLOGGER能让照片栩栩如生:你只需要上传一张脸部照片,Al 将其变成动画,并配以自然的手势和表情。
它包括了:1)读唇器:根据音频预测你的动作;2)动画制作器:根据你的照片和动作细节创建视频帧。
赛博·工具
1、IKI:RAG驱动的内容收藏
一款能够用AI重新思考和构建稍后阅读和内容收集工具。iki这个笔记工具非常强大,你不需要整理自己收藏的内容一切都交给AI来完成。它可以处理你收集的大量杂乱、非结构化数据,让应用程序为你组织和显示信息,而不必你自己动手。
主要功能有:
- 自动提取和总结
- 自动在聊天和任何现有笔记中显示相关数据
- 为任何文件添加个人注释
- 与团队共享数据集合
- 关注社区其他人创建的合集和阅读内容
2、Hacker News:完全AI驱动的中文科技播客
一个完全由AI驱动的中文播客,每天总结Hacker News热门的前十条信息。TTS语音现在是真的自然语言类节目基本不需要人口播了。
赛博·洞见
1、2024Q1商用LLM API进展简评【2024.4 W1】
主要讨论从2024.2.1-2024.4.5的商用LLM API的进展,2024年Q1的商用LLM API进展可谓争奇斗艳,尤其是海外,各家都有重量级的新模型推出。
2、优化人机协作
本文探讨了如何优化人工智能(AI)在写作过程中的协作,特别是通过“支架理论”(scaffolding theory)的视角。支架理论最初源于教育领域,旨在通过提供适时的支持和指导来帮助学习者掌握他们尚未能独立完成的技能。
文章通过Dhillon等人(2024年)的研究,系统评估了不同级别的AI支架对写作质量、用户满意度、认知负荷和生产力等方面的影响。研究发现,与控制组相比,低级别的支架(如单句建议)降低了输出质量,而高级别的支架(如段落建议)显著提高了输出质量,尤其对非常规和技术不太熟练的写作者更为有益。然而,随着AI协助的增加,用户满意度和拥有感却呈现相反的趋势,尽管质量有所提高。
文章还强调了对用户体验(UX)专业人员的建议,包括了解用户的需求、设计能够适应不同用户专业水平的界面、实现个性化和定制化、逐渐调整AI支持的级别以及促进用户的主动性和拥有感。通过这些策略,我们可以显著提升用户体验,使AI工具不仅有用,而且在实现多样化活动目标中变得不可或缺。
3、万字复盘我的AI作品《Devices》| 解析AI创作中的变与不变
这篇文章是晨然在VisonOS 开发者大会的作品《Devices》实践经验分享。作者探索了如何通过调整AI模型的提示词(prompt)来改善生成的图像质量,并提供了一系列技巧和策略,用于指导AI创作中的变与不变,帮助创作者更好地控制AI生成内容的质量和风格。
4、一个顶级 AI 产品经理的自我修养 | 42章经
来自42章经,采访了光年之外产品负责人Hidecloud,他分享了产品创新之处,以及对 Al 技术的理解和开源模型的应用。他认为产品经理需要理解技术,解决产品与技术的匹配,同时指出AI领域需要更多人去深入理解最新技术进展和模型能力边界。
5、他山之石|重新思考人工智能时代的信息素养
本文从人工智能技术对教育领域带来的变革出发,讨论了生成式人工智能和机器学习如何重塑我们的世界,特别是在信息传播和媒体互动方面。通过分析聊天机器人的发展,如小冰和Tay的案例,文章指出了人工智能在模仿人类交流和传播信息时可能存在的偏见和误导性问题。
文章进一步探讨了深度伪造技术对个人和社会的潜在威胁,以及它如何影响民主制度和公众舆论。为了应对这些挑战,文章提出了几种解决方案,包括横向阅读、培养学生成为数字侦探、寻找图书馆员的帮助,以及回顾历史来更好地理解信息素养的未来。
最后,文章强调教育工作者的责任,即引导学生提升信息素养,使他们能够在充满误导性信息的世界中成为明智的信息消费者,并在不断变化的环境中发挥积极作用。
6、完整版 Y Combinator W24,100+ AI项目全览|硅兔独家
文章报道了硅谷著名的创业孵化器Y Combinator(YC)在其W24批次中展示的260多家初创企业,这些企业在两天内向1500多家投资机构和媒体展示了各自的AI项目。文章强调了AI技术在医疗、金融、生物技术等行业的应用,并预测了AI技术未来的发展趋势。特别提到了AI项目在YC中的录取率极低,以及亚裔创始人的比例增加。文章还提到了AI技术迅速发展,许多去年还无法实现的事情,今年已经可以通过AI技术轻松完成。最后,文章提供了一个获取YC W24 AI项目数据库的链接,供读者深入了解。
7、【AI 时代的教育-02】从个性化训练到个性化教育
文章批评了教育科技公司过度依赖技术进行所谓的“个性化教育”,指出这种方法虽然比传统的刷题方式有所改进,但本质上仍然是在对学生进行机械化的训练,而非真正的教育。作者引用了Seymour Papert的观点,强调应该让学生学会创造而非仅仅是模仿。
文章提出当前的AI技术已经能够超越简单的对错判断,通过理解学生的回答和推测他们的思维模式,提供更加个性化的学习支持。AI教育应用,如可汗学院的苏格拉底问答式AI导师,能够引导学生按照自己的节奏构建知识,实现真正的个性化学习。
最后,文章展望了AI在教育中的新可能性,包括支持个性化学习路径和学习目标,使得学习不再局限于课堂,而是融入到学生的日常生活中。
8、傅盛对话甲子光年:搞AI真的不能再这么烧钱了
文章主要围绕傅盛与「甲子光年」的对话展开,讨论了当前AI领域的热点问题和未来趋势。傅盛认为,当前AI领域存在烧钱和泡沫问题,尤其是大模型的开发和应用,需要更加务实和注重成本效益的商业模式。
傅盛分享了自己从互联网产品经理到AI创业者的经历,以及在猎豹移动和猎户星空两家公司中的经历和反思。他现在更注重技术的实用性和与企业需求的结合,而不是单纯追求技术的先进性。文章中,傅盛还对当前AI领域的一些热门话题,如人形机器人、大模型的发展趋势和应用场景等,提出了自己的观点和看法。他强调,技术创新应该基于实际需求和应用场景,而不是盲目追求规模和技术的突破。
文章最后,傅盛提出了对未来AI领域的预测和建议,包括注重基础研究、避免无谓的竞争和烧钱,以及寻找与企业实际需求相结合的创新路径。他鼓励创业者和企业要有耐心,从实际出发,逐步推动AI技术的发展和应用。
9、Suno技术大揭秘🤐;AI音乐发展史:罗马不是一天建成的;音乐生成模型 | ShowMeAI
文章回顾了AI音乐生成技术的发展历程,从1938年电子语音合成器Voder的诞生到现代各大公司如Google、Meta等发布的音乐生成工具。
文章重点介绍了Suno的创始人Mikey Shulman及其团队,他们从AI金融科技领域转向音频生成技术,并推出了一系列创新产品,如Bark、Chirp和Parakeet等。Suno通过整合这些技术,实现了高质量的音乐生成,包括歌词、人声、乐器等元素,被誉为音乐圈的ChatGPT时刻。
文章还讨论了Suno的商业模式、用户创造的新玩法、支持的语言、以及如何使用Suno创作音乐。同时,提到了Suno在音乐社交方面的愿景,以及它如何激发普通人的音乐创作热情。最后,文章探讨了音乐生成模型的技术原理和挑战,包括数据稀缺、版权问题、以及如何训练模型捕捉音乐与文本之间的联系。文章预测,随着技术的进步,音乐生成领域将迎来更多的创新和发展。
赛博·资源
1、通义千问开源Qwen1.5-32B模型
通义千问开源新的Qwen1.5-32B模型,在语言理解、支持多语言、编程和数学能力方面表现出色。
2、什么是 GPT? transformer的可视化介绍
3Blue1Brown大神非常好的一个演示视频,通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。
3、【亿欧智库】AI电商行业展望与价值分析(关注公众号【产品老A】回复【AI电商行业展望与价值分析】下载)
本报告探讨了Al技术在电商领域的应用前景和潜在价值,预测Al将重塑电商流量价值、提升消费体验、降低成本、提高效率,并带来新的市场机遇。报告强调了A技术在产品设计、供应链管理、内容创作、营销运营、客户服务等电商环节的重要作用,并提出了Al电商发展的策略建议。
4、【智象出海】2024中国新科技出海报告(关注公众号【产品老A】回复【2024中国新科技出海报告】下载)
2023年随着海外网络基础设施的发展,海外用户在多元视频、工具智能化、社交功能增重方向上都有较大的需求。在2024年社交需求将继续增强,互联网应用的Al化不可避免,用户将越来越向Al原生方向发展,交流与互动的智能化将会对社交、视频、游戏、摄影、工具等多个行业产生变革式影响。
5、2024中国百模大战竞争格局分析报告(关注公众号【产品老A】回复【2024中国百模大战竞争格局分析报告】下载)
报告详细分析了2024年中国人工智能领域的竞争态势,特别关注了各种AI模型的发展和应用。报告首先介绍了AI技术的背景和当前市场的状况,然后深入探讨了不同AI模型的特点、应用场景和竞争力。报告还提到了一些关键的行业参与者,包括大型科技公司和新兴的AI初创企业,以及他们在市场中的地位和策略。
报告进一步讨论了AI技术在不同行业中的集成和应用,如金融、医疗、教育和娱乐等,并预测了这些技术将如何推动行业变革。此外,报告还关注了AI技术发展可能带来的风险和挑战,包括数据隐私、伦理问题和技术失控等。 最后,报告对2024年至2028年的AI市场进行了预测,展望了技术进步和市场扩张的趋势,并提出了行业发展的一些建议和策略。
(内容整理于互联网)