每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
几周前的 Google I/O 大会上,宣布了将 AI 概览功能推广至全美用户的计划。
用户反馈显示,使用 AI 概览后,人们对搜索结果的满意度更高,提出的问题也更长、更复杂,因为他们知道 Google 可以提供帮助。AI 概览成为用户访问网页内容的起点,网页点击的质量更高——人们更有可能停留在页面上,因为相关信息和有用网页得到了更好的推荐。
上周,社交媒体上出现了一些奇怪和错误的概览(以及大量伪造的截图)。用户信任 Google 搜索提供准确信息,他们也从不避讳指出排名或其他搜索功能中的怪异或错误之处。对于自身和用户都抱有很高的标准,因此期望并感谢这些反馈,并认真对待。
由于 AI 概览受到了关注,这里将解释发生了什么以及采取的措施。
AI 概览的工作原理
多年来,搜索中构建了许多功能,让人们更快找到所需信息。AI 概览进一步帮助解决那些可能需要多次搜索或跟进的问题,同时突出提供链接以供深入了解。
AI 概览与聊天机器人和其他大型语言模型(LLM)产品的工作方式非常不同。它们不是简单生成基于训练数据的输出。虽然 AI 概览由定制的语言模型驱动,但该模型与核心网页排名系统集成,旨在执行传统的“搜索”任务,如从索引中识别相关的高质量结果。因此,AI 概览不仅提供文本输出,还包括相关链接供用户进一步探索。因为在搜索中准确性至关重要,AI 概览仅展示由顶级网页结果支持的信息。
这意味着 AI 概览通常不会像其他 LLM 产品那样“幻想”或捏造信息。当 AI 概览出错时,通常是由于其他原因:误解查询、误解网页上的语言细微差别或缺乏大量优质信息(这些也是其他搜索功能会遇到的挑战)。
这种方法非常有效。总体而言,测试表明,AI 概览的准确率与搜索中的另一项受欢迎功能——精选摘要——相当,后者也使用 AI 系统识别并显示带有网页内容链接的关键信息。
关于那些奇怪的结果
除了设计 AI 概览以优化准确性外,还在发布前对该功能进行了广泛测试。这包括严格的红队测试、对典型用户查询样本的评估以及对部分搜索流量的测试,以查看其表现如何。但没有什么能比得上数百万人使用该功能并进行许多新奇搜索的情况。还观察到一些无意义的新搜索,似乎旨在产生错误结果。
另外,网上还广泛分享了大量伪造的截图。这些伪造结果有些明显且愚蠢,有些则暗示返回了关于在车内放置狗、怀孕时吸烟和抑郁等话题的危险结果。但这些 AI 概览从未出现过。因此,建议遇到这些截图的任何人自行搜索以验证。
确实出现了一些奇怪、不准确或无用的 AI 概览。虽然这些通常是针对用户不常见的查询,但也突显了一些需要改进的具体领域。
已做出的改进
在改进搜索时,不仅仅是逐个“修复”查询,而是进行可以帮助广泛查询的更新,包括以前未见过的新查询。
通过过去几周的示例,确定了未能正确处理的模式,并对系统进行了十多项技术改进。以下是已采取的一些措施:
- 构建了更好的检测机制,用于识别不应显示 AI 概览的无意义查询,并限制讽刺和幽默内容的包含。
- 更新系统,以限制在可能提供误导性建议的回答中使用用户生成的内容。
- 添加触发限制,对于不太有用的查询减少 AI 概览的显示。
对于新闻和健康等话题,已经有强有力的保护措施。例如,目标是避免在涉及时效性和事实性重要的热点新闻话题中显示 AI 概览。在健康话题中,推出了额外的触发优化,以增强质量保护。
除了这些改进,还在密切监控反馈和外部报告,并对少量违反内容政策的 AI 概览采取行动。这意味着包含潜在有害、淫秽或其他违反规定的信息的概览。发现每 700 万个出现 AI 概览的独特查询中,只有不到一个存在内容政策违规。
在每天有数十亿查询涌入的网络规模下,难免会出现一些奇怪和错误的情况。过去 25 年中,学到了很多关于如何构建和维护高质量搜索体验的知识,包括如何从这些错误中学习,以改进搜索。将继续改进 AI 概览的显示方式和时机,并加强保护措施,包括边缘情况的处理,非常感谢持续的反馈。