👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
👀 百度智能云 | 千帆大模型平台黑客马拉松
https://segmentfault.com/e/1160000044353489
百度智能云携手 SegmentFault 思否,面向广大开发者打造了一场生成未来的黑客马拉松挑战赛,鼓励开发者使用平台提供的国内外主流大模型、先进的生成式AI开发工具链等,构建新型应用或插件,做到让生成式 AI真正「为我所用」,解决实际问题。
比赛的一二三等奖和创新实验奖等获奖团队,将获得非常丰厚的先进奖励!感兴趣可以着手报名准备啦!注意关键 DDL 哦!
报名参赛&创意提交:即日起 - 11月19日
名单公布&赛前准备:11月21日-11月22日
作品开发&作品路演:11月25日-11月26日 ⋙ 了解更多
🉑 OpenAI DevDay 亲历者:激动→害怕→迷茫,上个时代的开发者被干掉了
OpenAI 这场开发者大会「后劲儿很大」,各类总结满天飞的三天后,我们依然在讨论技术、产品、创业,回顾历史并尝试寻找出路。日报今天推荐一篇「亲历者」的分享:身为开发者的他兴致勃勃参会,却被兜头泼了一盆冷水,在现场听奥特曼 (Altam) 描述未来又被拉回现实接受一轮轮的情绪暴击。
摘录几条现场人群的反应以及作者的思考结论,与大家共勉:
配合奥特曼身后大屏幕上接二连三跳出的各种 GPT 版本改进和新功能,除了惊叹与冲击,很快,在场的见过这么多硅谷发布会的人们甚至开始感到有点儿害怕了。
随着发布会进行,奥特曼每介绍一项更新,场下的氛围就变得愈加复杂,掌声也是时而热烈,时而稀疏。人们双眼紧盯演示屏,面露凝重,渐渐笑不出来了。
台下观众里,有的在窃窃私语讨论,有的不停拍照传给同事,然后低头匆匆发信息。在当天的活动结束后,包括我自己的公司在内,一众硅谷大厂的AI部门紧急开了讨论会。
在户外休息区,大家把现场「抓」到的 OpenAI 产品经理、开发人员们里三层、外三层地团团围住,争相询问他们接下来的迭代方向,希望能探听到自家产品有没有被不幸列在 OpenAI 的「to do list」上。
会议席间,一家做AI室内设计公司的创始人一直都在激动地鼓掌,给出的全是正面反馈。仔细分析这些还在鼓掌的人,他们的共同点是:专心扎根垂直领域,本身就是个好产品,AI只是让它变得更好了。
不能只做大语言模型下游应用开发,充其量只是套壳公司,很容易随时丧失主导权。要深入做垂直领域,精通行业内部细节,发现和利用那些标准助手 API 无法满足的复杂场景和细分市场机会。
产品和市场很关键。有 OpenAI 们你追我赶的竞赛,技术层面的参差总会被拉平。真正的差距体现在对市场痛点和用户需求的精准捕捉。一流的产品经理团队、高效的销售策略和稳定的客户基础是区分胜负的重要因素之一。
打不过就加入,尽快对接 OpenAI 入驻 GPT 商店,做榜一大哥 (认真) ⋙ 阅读原文
👀 OpenAI TTS 文字转语音工具,新鲜热乎可体验
https://huggingface.co/spaces/ysharma/OpenAI_TTS_New
官方文档 https://platform.openai.com/docs/guides/text-to-speech
11月6日,OpenAI 在开发者大会上发布了 TTS (Text-to-Speach,文本转语音) 工具,基于 OpenAI 的 TTS 模型将文本转换为逼真的语音音频,并提供了一个名为speech
的 API。
OpenAI TTS 工具支持英语、西班牙语、法语、德语、意大利语等多种语言,还支持 tts-1、tts-1-hd 和 tts-2等多种语音模型,并且可以在5 种男声和2种女声中进行切换。Hugging Face 项目链接如上,可以体验一下~
🉑 Mootion:使用文本生成3D角色,搭配其他工具还能解锁花样玩法
https://www.mootion.com
Mootion 是一个 text-to-motion 的Al生成服务,在 Discord 中输入文本就可以快速创建 3D 角色并生成有趣的动画效果,还可以下载为背景透明的视频和 FBX 格式文件。
基于 Mootion 的生成,内容创作者们可以拉到视频编辑软件中增加背景图,或者使用 AnimateDiff、Gen-1 等AI视频工具渲染成新的视频作品;专业的建模师可以继续在 Blender、3Ds Max、Maya 等专业 3D 建模软件中完成后续工作。
这个工具最近很火热呀!国内外的社交媒体和视频网站都有创作者在分享~ 日报简单介绍下使用流程,感兴趣可以试起来:
从官网进入官方 Discord 频道,选择 Creation 开头的频道,就可以开始3D创作啦
输入
/motion
命令,输入提示语 (例如 a dancer is dancing.)选择角色 (目前有机器人、猫、骑士、圣诞老人四个角色)
选择是否在原地运动
回车确认开始生成 (如上图,系统会快速生成 M1、M2两个角色动画)
下载单独角色的视频或3D格式文件
👀 完蛋!我被 LLM 包围了!
ModelScope https://modelscope.cn/studios/LLMRiddles/LLMRiddles/summary
HuggingFace https://huggingface.co/spaces/LLMRiddles/LLMRiddles
社区的小伙伴们这两天都在玩一款「LLM Riddles (大模型解谜)」的游戏,需要模仿大模型的思考方式,和模型对话使得输出符合题目,通过之后则闯入下一关!大家正玩得不亦乐乎,作者却宣布受限于计算资源等原因,关闭了这款游戏。
好在!魔搭 ModelScope 社区接手复刻了这款游戏!访问上方链接,就可以继续愉快地玩耍啦~ 按照最初的设定,游戏共四章、19道题,不过随着玩游戏和贡献题目的人越来越多,通关过程也会越有挑战性呦 (* ̄3 ̄)╭
注意:配图是个错误示例,实际玩下来还是有挑战的~
🉑 大模型解谜游戏 LLM Riddles,作者分享创作历程和完整题库
https://zhuanlan.zhihu.com/p/665393240
如上一条所说,LLM Riddles 是一款大模型解谜游戏,可以在玩游戏过程中加深对大模型的理解。游戏作者在知乎发文,分享了受一个灵感启发进行游戏开发啊、爆火增长、最后宣布关闭的全过程。而且分享了完整的题目清单 (评论区还有各路大佬公布答案):
第一章 对话之趣
第1题:初来乍到。作为第一个题目,请你构造一个问题使模型的回答是一字不差的“1+1=3”(不需要引号)。
第2题:小试牛刀。请输入三个字以内的问题,使模型的回答在30个字以上。
第3题:短说长话。请输入一个字的问题,使模型的回答在100个字以上。
第4题:短说短话。请输入一个字的问题,使模型的回答在20个字以内。
第5题:回文不变。请输入一个本身不是回文串的问题,使无论正着问还是倒着问,模型的回答是一样的。
第6题:无中生狗。请提一个不包含“狗”这个字的问题,但是回答中至少出现3次“狗”这个字。
第二章 数字游戏
第1题:质数长度。你需要提出一个字数是质数的问题,使回答的长度刚好是它的下一个质数。
第2题:越说越大。请输入一个大于一的正整数作为问题,使回答里包含至少比它大一千的数。
第3题:越说越小。请输入一个大于一的正整数作为问题,使回答里包含至少10个不同的至少比它小一千的自然数。
第4题:警世名言。请在不提及1,4,5这三个字符的情况下让模型回答114514,不要有多余的字符。
第5题:开平方数。请输入一个大于一的平方数作为问题,使回答里包含它的平方根对应的数。
第6题:得寸进狗。请提一个不包含“狗”这个字的10个字以内的问题,使回答中“狗”这个字出现的次数至少是问题字数的2倍。
第三章 巅峰挑战
第1题:自说自话。请做出一个至少10个字的提问,使回答和提问完全一样。
第2题:话自说自。请做出一个至少10个字的提问,使回答是提问的逆序。
第3题:就是敢说。请在不提及1,3这三个字符的情况下让模型回答1+1=3,不要有多余的字符。
第4题:回文协变。请输入一个本身不是回文串的问题,使正着问和倒着问的时候,模型的回答本身不回文且也是逆序的关系。
第四章 无人之境
第1题:循环往复。请构造一个问题A,它的回复是不同于A的B,然后以B提问能再次得到A.
第2题:惜字如金。本题可能没有答案。你可以自由的先去做其他的题。请输入一个字的问题,使模型的回答在16个字以内。
第3题:自然之密。请输入一个大于一的正整数作为问题,使回答里包含和它刚好相差1的数。
👀 垂直领域大模型的思考
https://zhuanlan.zhihu.com/p/652645925
这篇对「垂直领域大模型」的介绍非常系统,不仅包括系统设计的流程和专业细节,还串讲了一系列的相关论文和产品,如法律大模型、医疗大模型、教育大模型和金融大模型等。
垂直领域大模型需要在通用大模型的基础上进行二次开发,通过继续预训练、领域微调数据构建等方法,让模型具备领域内问题的判别能力、基于召回的知识回答问题的能力、以及领域内风格对齐的能力。
根据作者的思考和分享,构建一个面向特定领域的大模型,有以下几个关键步骤和:
继续预训练:在通用大模型的基础上,使用领域内的语料进行继续预训练,以注入领域知识。混合通用数据和领域数据进行训练,以保持模型的通用能力。
领域微调数据构建:构建高质量大规模的领域微调数据。文章提到了三种数据生成方法:Self-Instruct、Self-QA 和 Self-KG。
减缓幻觉:通过生成带有引用的文本、事实一致性评估等方法,提高模型生成结果的质量,减少幻觉。
知识召回:在多轮场景中,需要先整合当前问题和对话历史,然后对当前问题进行改写,使其成为一个独立问题,再进行知识检索。文章提到了 DPR、GTR、Keyword LLM、Context Rewriting 和 Knowledge Selection 等方法来优化知识召回。
系统设计:垂直领域的大模型需要基于检索系统进行构建,包括问题解析、知识召回和推理求解等模块。文章提到了阿里云和 ChatLaw 等系统的架构作为参考。
🉑 吹爆 | 关于 AI 的深度研究:ChatGPT 正在产生心智吗?
https://www.bilibili.com/video/BV1uu4y1m7ak
这是B站UP主 @小凡今天出片了吗 发布的科普长视频,用43分钟的时间回答了标题里提到的问题:ChatGPT 正在产生心智吗。
UP主从神经网络与深度学习训练、依据的统计学原理、注意力机制、Transformer 详细过程来阐述 ChatGPT 的工作原理,解释 ChatGPT 为什么可以预测下一个输出单词。
随后,通过对「压缩即智能」的阐述,解释 ChatGPT 为什么会出现智能。最后,通过对人脑的进化过程和结构分析,解释人类心智与 ChatGPT 智能之间的相同点及巨大的差异。
不夸张地说,整个视频的制作水准非常非常非常高!比如,配图所属的动画 (开始自视频第11分钟) ,是「流浪地球2」视效团队墨VFX高级动效师的手笔,我甚至隐约看到了「太空电梯」的场景!!
这个视频清晰地解释了众多高频术语和概念 (神经网络、Transformer、深度学习训练、涌现、幻觉、压缩、思维链)……,展示了十数篇核心技术论文的要点,最后竟然还有震撼人心的人文思考!
唯一可惜的点是视频发布于7月底,自那之后,技术一直在突飞猛进地发展,AI产品也更加让人眼花缭乱,期待作者新作品对这些进行解读和展示~ (小小声:已三连,催更催更
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!