👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦!
1. Anthropic 发布 Claude Artifacts,大模型从「聊天」正式迈入「工作流」
上周,Anthropic 公司发布了最新的大模型 Claude 3.5 Sonnet,随后几天陆续斩获各榜单的一二名。
以权威榜单 LMSys Chatbot Arena Leaderboard 来说, Claude 3.5 Sonnet 在「Overall (全部)」榜单中排名全球第二,在「Coding (编程)」榜单中位列全球第一。
这次发布更应引起关注的,是官方在 Claude Chat 中增加的一项新功能「Artifact」。
简单说就是,用户要求 Claude 生成代码片段、文本文档、网站设计等内容时,屏幕右侧会自动弹出 Artifact 空间 (👆 如上图所示,需要在个人账号 → Feature Preview → 打开 Artifact 设置),可以展示代码,其中前端编程语言的代码还可以查看呈现样式。
↑ 要求「Create an HTML animation to demonstrate the working principle of “A Simple Neural Network”」,即创建一个 HTML 动画演示简单的神经网络的运行原理。
Claude 对问题进行了分析 (上图左侧),并生成了 HTML 代码段并支持预览最终的动画效果 (上图右侧)。
从 X 和 Youtube 等社交媒体的反馈来看,用户们相当欣喜啊!纷纷尝试生成各种小游戏,然后越来越复杂:贪吃蛇、计数器、倒计时、声音效果生成器、用 CSS 编写简历、生成网页…
国产大模型 DeepSeek 也支持类似功能哦!登录后左侧选择「代码助手」,输入任务提示词,生成 HTML 代码后点击右下角「运行HTML」,就可以在弹框里预览生成效果了!
↑ 上图是 DeepSeek 同样提示词的 HTML 运行结果。相较于 Claude Artifact,DeepSeek 目前还有很多局限:例如代码能力弱了一点 (Coding 排行榜第5),仅支持运行 HTML 代码,不支持上传图片和文件 (这点影响很大)…… 综合起来就有了明显的体验差异。
除了超越的编程能力 & 动态预览交互带来的眼前一亮,Claude Artifact 最重要的是把大模型集成进了更多用户的工作流,摆脱了「聊天助手」的尴尬定位。
这类功能目前支持的编程语言、协作方式还很有限。非常期待这个功能的进一步拓展,支持运行更多编程语言 (例如 Python 👀),或者成为团队协作工作流的重要组件 (甚至平台)。
Anthropic Claude Chat (需要魔法) → https://claude.ai/chat
DeepSeek Chat (左侧选代码工具) → https://chat.deepseek.com
一份还不错的中文讲解和试验视频 📺 Claude 3.5 Artifacts 功能测试 程序员离失业又近了一步
2. 全球AI模型 ● 数据可视化:60年踽踽前行,近10年突飞猛进
Epoch AI 在其网站更新了全球 800+ AI模型的详细信息 (数据截至本月19号),并制作了一个可交互的数据图。
AI 模型的起源要追溯到遥远的1951年。然后,一代代科学家和工程师的不断努力,将AI带入深度学习时代,并最终于2022年末爆发出巨大的能量,引发了新一轮的科技革命。
🔔 Notable AI Models
这张可交互的数据图表名为「Notable AI Models」,即知名AI模型 (页面下方有入选标准)。X轴和Y轴的含义可以在下方参数中进行选择:
- 训练计算量(FLOP)
- 可训练参数数量
- 训练数据集大小(datapoints)
- 训练计算成本(2023 USD)
- 发布日期
根据这份数据和可视化图,我们可以得到以下 4 个结论:
- 知名AI模型的训练计算量,大约每6个月翻一番。
- 最大的AI模型的训练计算成本,大约每9个月翻一番。
- 与视觉模型相比,语言模型的训练计算量增长更快。
- 用于训练语言模型的数据集大小,大约每8个月翻一番。
🔔 Large-Scale AI Models
这是 Epoch AI 网站同期公布的另一份可交互数据图「Large-Scale AI Models」,即大规模AI模型,共有 180 多个模型入选。入选标准也很明确,FLOP>10^23,这个参考数据大致相当于 GPT-3 大模型的计算规模。既然是动态可交互的数据图,那么X轴和Y轴的含义也可以选择:
- 训练计算量(FLOP)
- 可训练参数数量
- 训练数据集大小(datapoints)
- 发布日期
从这份数据中,我们可以观察到以下规律:
- 大规模模型发布的速度在加快。
- 语言模型构成了大部分的AI大模型。
- 大多数的大模型是由美国公司开发的。
- 几乎一半的大模型有公开发布的、可下载的权重。
值得注意的是,将鼠标放在网站图中的圆点上方,可以看到该模型的主要信息!👆 如上图左侧所示。
而且!网站支持下载数据文件:点击页面「Download this data」按钮,就可以下载 .csv 格式的数据文档~
Notable AI Models → https://epochai.org/data/notable-ai-models
Large-Scale AI Models → https://epochai.org/data/large-scale-ai-models
3. 是时候知道「AI真相」了:750名AI工程师,深度参与的2024调研报告
Retool 去年就发布了一份「技术从业者」为主的 AI 调研。前几天,今年的 AI 技术调研问卷的结果&解读都正式发布了。报告回应了很多棘手&尖锐的话题,并且给出了比较客观的统计和分析。
以下是报告提到的话题,看看有你感兴趣的嘛:
- AI采用率激增是真的吗?
- 领导层呼吁AI投资多多益善!
- 产品经理与工程师已经成为AI深度用户
- AI真的能显著提升生产力!
- 光明正大 VS 偷偷摸摸
- 编程基础岗位受到最大威胁!但没有基层何来中高层?
- 最活跃最真实的AI应用场景
- 你想得到、想不到的领域,都在用AI
- 2B or 2C
- AI应用程序即将爆发
- OpenAI占据市场大半壁江山
- 模型定制化技术深受欢迎
- 大量公司在构建自己的模型
- 向量数据库的兴起
- 推理平台尚未普及
- 开发者工具的重要性
- 公司如何分配GPU资源?
- 对AI技术栈的综合评价
我们选择3个有意思的话题,对图文进行整理和解读:
与半年前相比,使用AI可以提升工作效率成为越来越多公司的共识。但是!仍然有超过 1/4 的人在偷偷摸摸使用AI??
仔细看看,这部分人中只有 8.8% 的人直接违反了公司政策。其他更多是在纠结对AI的看发,或者缺乏明确的政策支持使用AI。
这是今年统计的最高频的AI应用场景。尤其值得注意的是,与去年相比,变化趋势似乎也在告诉我们一些故事:
- ↓ 编程或查询从 47.5% 下降到 42.1%,文案写作也从 32.9% 下降到了 28%
- ↑ 聊天机器人从 28.9% 上升到 33.9%,自动化工作流从 12.9% 跃升至 17.8%
各种大模型的市场采用占比 (仅就这次调研)。
原文 → https://retool.com/blog/state-of-ai-h1-2024
4. GenAI将取代初级程序员?NO!这个想法荒诞且危险!
这篇文章最近在外网很火,原文标题「Generative AI Is Not Going To Build Your Engineering Team For You」,直翻就是GenAI不会为你构建工程团队。
文章的核心思想是说,一个完整的、运转良好的工程团队,依旧是以人为核心的。GenAI可能在某些环节提供帮助,但「替代初级工程师」这个观点既不可行,也不可取。
文章作者 Charity 是 honeycomb.io 的联合创始人兼首席技术官 ,还曾经在 Parse、Facebook、Linden Lab 等公司担任运营工程师和工程经理。
她回顾自己十几年的技术从业生涯,有感于当下 GenAI 对行业的冲击和挑战,写下了当下的思考:
-
软件行业正在成熟:软件行业早期门槛低、不规范,但已经慢慢发展成为了一个标准更高、专业化更强的领域,因此提升了入行门槛。Charity 也在庆幸自己入行早……
-
软件行业本质上是师徒制行业:软件行业重视实践学习和经验积累,项目中的实际操作、编码、审查、部署代码以及与资深工程师的合作,才是学习和成长的主要途径。
-
"高级工程师"的真正含义:成为高级工程师不仅意味着编写代码的能力,更包括对大型软件系统的深入理解、维护、解释和管理,以及将业务需求转化为技术解决方案的能力。
-
必须停止损害自己的未来:有观点认为AI可能取代初级工程师。但行业必须认识到初级工程师的重要性,并加大对他们的招聘和培养,毕竟未来不可能把代码的运维、理解和扩展这些繁重的工作交给AI。
-
编程其实不是最难的部分:编程本身是软件工程中相对简单的部分。真正的挑战在于代码的运维、理解、扩展和整个生命周期的管理。GenAI 工具虽然使编写代码变得更容易,但并不能帮助更好地管理、理解或操作代码,有时甚至增加了难度。
-
生成代码容易,生成优秀代码难:尽管AI使代码生成变得容易,但生成符合实际需求和编码标准的优质代码仍是挑战。AI生成的代码看似合理,但常需人工审查和调整,以确保其可靠性和一致性,这在实际开发中可能并不节省时间。
-
工程师实际上如何使用GenAI:GenAI在生成示例代码、编写繁琐代码片段或在不熟悉的语言中生成小功能时非常有用.但使用时必须谨慎,需手动验证AI生成的代码。
-
GenAI有点像初级工程师:GenAI在快速生成代码方面像初级工程师,当然我们需要像对待新手代码一样仔细理解和测试这些生成的代码。
-
但GenAI并非你团队的一员:尽管GenAI能快速生成代码,但它不能取代团队成员的角色,缺乏人类互动、学习和文化适应能力,也没有促进成长的反馈机制,不会对团队氛围产生积极影响。
-
我们往往低估了聘请高级别人才的成本,高估了聘请初级别人才的成本:初级工程师在执行任务和成长方面有巨大潜力,而且招聘任何级别的工程师都需要时间来适应团队环境。
-
并非只有高级工程师才能为团队增值:中级工程师由于能够专注于编写代码,没有被会议和其他管理职责所拖累,往往在开发和发布功能方面表现出极高的效率和创造力,对团队贡献巨大。
-
招聘初级工程师的长远考量:团队需要培养更多高级工程师、降低成本、增加团队多样性、提高员工忠诚度等。这些道理大家都知道,但是公司通畅因为一些短期利益而选择忽视。
-
招聘初级工程师的短期优势:初级工程师能为团队带来新的视角和活力。
-
一个健康、高效的团队应包含不同级别的成员:健康且高效的团队应包含不同技能水平和经验的成员,这样的多样性确保团队能应对各种挑战。
-
我们面临的难题在于招聘,而非培训:软件行业的主要障碍是为初级工程师提供首份工作的机会,公司应将初级工程师视为投资而非成本。
-
是否每家公司都需要招聘初级工程师:当然不是。
-
没人会自动来解决我们的问题:改变初级工程师招聘和培养的现状,需要工程师和工程经理的主动参与,而不是被动等待外部的介。
原文 → https://stackoverflow.blog/2024/06/10/generative-ai-is-not-going-to-build-your-engineering-team-for-you/
5. 写给美国创企 Founders 的执行手册:两位资深律师带你穿越法律迷雾
这是一份由资深律师执笔的创业指导手册,面向美国本土科技初创公司的创始人,告诉他们在创业初期应该做哪些事情,以及有哪些注意事项。更重要的是,作者们列出了常见的「误区」,并进行了一一解释。
如果你正在计划「出海」,设立一家美国公司并将产品推出到海外,或者也有招聘和融资等相关计划,不妨看看这篇手册,对目的地有个大致的了解。
文章提到的「Startup Incorporation」可以粗浅地理解为公司注册,即将自己的业务变成一个法律实体,需要向州提交文件。
以下是手册详细解释过的话题,感兴趣可以前往阅读原文:
初创公司为何要进行公司注册?
- 有限责任
- 股权分配能力
- 简化招聘流程
- 降低联合创始人风险
- 便于筹资
有限责任公司(LLC)又如何?
- 税务考量
- 灵活性与定制性
- 运营的便捷与成本
- 股权补偿
- 转换可能性
- 投资者偏好
我应在何时成立初创公司?
- 多位创始人的情况
- 筹资需求
- 招聘活动
- 拥有客户
- 签订合同
- 不寻常的责任风险
- 公司名称的可用性
- 现有雇佣状况
- 资本收益
我应在何地成立初创公司?
- 初创公司的法律生态
- 投资者的偏好
- 文件提交的便利度
- 特许经营税
- 注册代理费用
- 董事会的灵活性
- 匿名性与隐私保护
- 责任保护
- 加密货币/区块链考量
公司章程是什么?
- 制定公司章程
- 提交公司章程
- 盖章副本与认证副本的区别
- 提交后的操作
初创公司章程中通常包含哪些内容?
- 公司名称
- 创立人
- 生效日期
- 注册代理
- 公司类型
- 股票种类
- 授权股份总数
- 面值
原文 → https://handbooks.clerky.com/startup-incorporation
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!