谷歌利用人工智能来推动搜索,显示出其组织信息的方式存在问题

谷歌利用人工智能来推动搜索,显示出其组织信息的方式存在问题

从相关文件到新闻报道、商业、音乐和社会互动,世界上的大部分信息现在都在网上。谷歌成立于1998年,其使命是“组织世界上的信息,使其普遍可用和有用”,它是我们接触知识和文化洪流的方式。

2024年4月,谷歌的搜索引擎占据了加拿大搜索市场90%的份额。对于学者来说,其专门的Google Scholar和Google Books是我们研究生活的支柱。

然而,尽管谷歌搜索是必不可少的基础设施,但谷歌自己正在以破坏社会的方式肆无忌惮地破坏它,这需要强有力的监管反应。

一次搜索

5月14日,谷歌宣布将对其核心搜索网站进行改造,为生成式人工智能内容提供一个中心位置,目标是“重塑”搜索。该公司首批推出的产品之一是AI Overviews,这是一款聊天机器人,它使用大型语言模型(LLM)对问题做出听起来很权威的回答,而无需用户点击到另一个网站。

在这里插入图片描述

OpenAI于2022年11月推出ChatGPT,点燃了生成式人工智能的热潮。但到目前为止,大多数用户应该意识到,llm驱动的聊天机器人是不可靠的信息来源。这是因为它们仅仅是高性能的模式识别机器。它们为响应查询而生成的输出是通过概率生成的:图像的每个单词或部分是根据它在其数据库中类似图像或短语中出现的可能性来选择的。

明确地说,LLMs不是一种人工或其他形式的智能。他们不能“推理”。对于LLMs来说,唯一的真理是其数据库内容之间的相关性。

这就是为什么当AI Overview用户开始报告谷歌告诉他们,除其他外,要在披萨酱中添加“大约1/8杯无毒胶水”以防止奶酪从披萨上滑落,地质学家建议人们每天吃一块小岩石,以及没有非洲国家的名字以字母K开头时,这既有趣又完全可以预见。

这些都不是报告错误信息意义上的“错误”。AI Overviews正在做LLMS一直在做的事情:根据数据库中的内容报告统计上可能的文本或图像链接。他们不会,也不可能评估真理的主张。

在这一连串的嘲讽之后,谷歌最终承认了这些批评。尽管它声称它将致力于改进人工智能概述,但LLMs作为统计机器的本质可能意味着,正如《连线》杂志所说,“人工智能概述总是会被打破。”

尽管这些故事很有趣,尽管谷歌做出了反应,但它们也提出了令人不安的问题,即我们依赖一家公司来提供我们过去委托给公共图书馆的服务:组织世界上的信息并使其易于获取。

剧烈的影响

谷歌搜索有两个根深蒂固的根本缺陷,随着它们的影响变得越来越严重,它们正变得越来越难以忽视。

首先,谷歌对广告收入的依赖导致它为了向用户提供付费广告而牺牲了自己的搜索功能。观察人士早就注意到,谷歌在搜索引擎中优先考虑付费广告的做法,对用户来说是一个更糟糕的产品,因为它优先考虑了广告商和谷歌的利益。

这种对广告的关注也对整个(广告驱动的)知识生态系统产生了连锁反应,因为它使谷歌与依靠谷歌搜索来帮助潜在读者找到他们的媒体公司直接竞争广告收入。

这种冲突是加拿大联邦政府有争议的《在线新闻法案》(Online News Act)的主要理由,该法案要求谷歌和Meta等公司就向加拿大新闻媒体机构付款进行谈判。这种冲突只会变得更糟:像AI Overview这样的产品显然是为了确保用户花更多的时间在谷歌上,而不是点击到底层网站。

人们较少认识到的是,谷歌获取知识的方式本身,导致了它对搜索结果的准确性和真实性的不计后果的漠视。谷歌和硅谷的许多公司都认同一种被荷兰媒体学者约瑟•范•迪克(jossour van Dijck)称为“数据主义”的意识形态:相信数据可以为自己说话,可以在不参考任何外部背景的情况下进行解释。

正如我和我的合著者娜塔莎·图西科夫(Natasha Tusikov)在我们的书《新知识:信息、数据和全球权力的重塑》(The New Knowledge: Information, Data and reaking of Global Power)中所探索的那样,对数据主义者来说,相关性等同于真理。这是一种反科学的世界观,它忽视了有效性(我们如何知道某件事是真的?)和可靠性(我们能复制结果吗?)的基本科学方法标准。

在这里插入图片描述
“相关性即真理”的理念是谷歌搜索算法的核心。简单地说,搜索结果不是客观的:Google搜索根据它们的受欢迎程度对(非付费)结果进行排名,这取决于链接到它们的页面的数量和数量。请注意,这种受欢迎程度的竞赛与图书管理员在为图书馆选择图书并将其分类到卡片目录中所使用的专家判断是非常不同的。

获取知识

不得不依赖于一个腐败的知识组织过程所造成的社会损害是很难夸大的。获得可靠的知识对社会的每个部分都至关重要。谷歌对广告的依赖和数据主义意识形态已经把它推向了积极破坏我们的知识生态系统的地步。

这种破坏需要严格的监管反应。坦率地说,谷歌搜索需要由具有图书馆员道德的人来运营,而不是由技术兄弟来运营。

为了实现这一目标,政府需要为搜索建立最低限度的可接受标准,以确保它产生足够高质量的结果。这些标准应该包括禁止广告和搜索结果之间的联系,以及使用搜索数据来推动个性化广告。

此外,搜索公司和所有全球平台都需要置于国内民主监督之下,但在与志同道合的民主国家协调下,保持跨境互操作。

这些步骤都不容易。但是,除非我们同意继续将世界信息的组织委托给一家不计后果的、以利润为导向的公司,而这家公司并不认为发布一款告诉人们吃石头有益健康的产品有什么问题,否则我们别无选择,只能让谷歌就义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/703859.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

STM32理论 —— μCOS-Ⅲ(2/2):时间管理、消息队列、信号量、任务内嵌信号量/队列

文章目录 9. 时间管理9.1 OSTimeDly()9.2 OSTimeDlyHMSM()9.3 OSTimeDlyResume()9.4 延时函数实验 10. 消息队列10.1 创建消息队列函数OSQCreate()10.2 发送消息到消息队列函数(写入队列)OSQPost()10.3 获取消息队列中的消息函数(读出队列)OSQPend()10.4 消息队列操作实验 11. …

深度学习500问——Chapter11:迁移学习(2)

文章目录 11.2 迁移学习的基本思路有哪些 11.2.1 基于样本迁移 11.2.2 基于特征迁移 11.2.3 基于模型迁移 11.2.4 基于关系迁移 11.2 迁移学习的基本思路有哪些 迁移学习的基本方法可以分为四种。这四种基本方法分别是:基于样本的迁移,基于模型的迁移&a…

【高阶数据结构】红黑树详解

目录 前言一、红黑树的概念二、红黑树的性质三、红黑树节点的定义四、红黑树的插入情况1:cur为红,parent为红,grandfather为黑,uncle为红情况2: cur为红,parent为红,grandfather为黑&#xff0c…

GD32C103/GD32C113 CANFD

CANFD介绍 FD全称是 Flexible Data-Rate,顾名思义,表示CAN-FD 的帧报文具有数据场波特率可变的特性,即仲裁场合数据控制场使用标准的通信波特率,而到数据场就会切换为更高的通信波特率,车端常用的为2Mbit/s和5Mbit/s,从而达到提高…

harbor问题总结

1. http协议的仓库docker login不上,更改/etc/docker/daemon.json,加一个镜像仓库地址 http: server gave HTTP response to HTTPS client 分析一下这个问题如何解决中文告诉我详细的解决方案-CSDN博客 2. Error response from daemon: login attempt t…

机器学习笔记 - 用于3D数据分类、分割的Point Net的网络实现

上一篇,我们大致了解了Point Net的原理,这里我们要进行一下实现。 机器学习笔记 - 用于3D数据分类、分割的Point Net简述-CSDN博客文章浏览阅读3次。在本文中,我们将了解Point Net,目前,处理图像数据的方法有很多。从传统的计算机视觉方法到使用卷积神经网络到Transforme…

【spring 】支持spring WebFlux 的容器

spring WebFlux 是 Spring 5 引入的响应式 Web 框架,它支持非阻塞、事件驱动的编程模型,特别适合处理高并发的场景。 Spring WebFlux 可以运行在多种容器上 包括下面: Netty: Netty 是一个异步事件驱动的网络应用程序框架,用于快…

WPF/C#:程序关闭的三种模式

ShutdownMode枚举类型介绍 ShutdownMode是一个枚举类型,它定义了WPF应用程序的关闭方式。这个枚举类型有三个成员: OnLastWindowClose:当最后一个窗口关闭或者调用System.Windows.Application.Shutdown方法时,应用程序会关闭。O…

分布式物联网平台特点

随着物联网(IoT)技术的飞速发展,我们正步入一个万物互联的新时代。在这个时代,设备、数据和服务的无缝集成是实现智能化的关键。分布式物联网平台作为这一进程的核心,正在成为构建智能世界的基石。 一、分布式物联网平…

【培训】企业档案管理专题(私货)

导读:通过该专题培训,可以系统了解企业档案管理是什么、为什么、怎么做。尤其是对档案的价值认知,如何构建与新质生产力发展相适应的企业档案工作体系将有力支撑企业新质生产力的发展,为企业高质量发展贡献档案力量,提…

IDEA创建简单web(servlet)项目(server为tomcat)

引言 鉴于网上很少有关于IDEA开发servlet项目的教程(24版idea,并且servlet技术十分复古,很少有人用到,能够理解,该文章旨在为在校的学生提供一个参考,项目技术简单)本人在此总结从头开始到项目…

C数据结构:排序

目录 冒泡排序 选择排序 堆排序 插入排序 希尔排序 快速排序 hoare版本 挖坑法 前后指针法 快速排序优化 三数取中法 小区间优化 快速排序非递归 栈版本 队列版本 归并排序 归并排序非递归 ​编辑 计数排序 各排序时间、空间、稳定汇总 冒泡排序 void Bub…

学习grdecl文件格式之后的事情

学习了grdecl文件格式,搞地质的专业人士都知道,这是专门用在地质上的油藏软件(个人感觉就是斯伦贝谢的Petrel的)的一种文件格式,正好自己也在学习三维的开发,顺手写了一个简单的读取grdecl算法,…

[深度学习]使用python转换pt并部署yolov10的tensorrt模型封装成类几句完成目标检测加速任务

【简单介绍】 使用Python将YOLOv10模型从PyTorch格式(.pt)转换为TensorRT格式,并通过封装成类来实现目标检测加速任务,是一个高效且实用的流程。以下是该过程的简要介绍: 模型转换: 利用官方提供导出命令…

Roboflow 图片分类打标

今天准备找个图片标注工具,在网上搜了一下,看 Yolo 的视频中都是用 Roboflow 工具去尝试了一下,标注确实挺好用的,可以先用一些图片训练一个模型,随后用模型进行智能标注。我主要是做标注然后到处到本地进行模型的训练…

html是什么?http是什么?

html Html是什么?http是什么? Html 超文本标记语言;负责网页的架构; http((HyperText Transfer Protocol)超文本传输协议; https(全称:Hypertext Transfer Protocol …

Linux 基本指令2

cp 指令 cp[选项]源文件 目标文件 将源文件的内容复制到目标文件中,源文件可以有多个,最后一个文件为目标文件,目标文件也可以是一段路径,若目的地不是一个目录的话会拷贝失败。若没有路径上的目录则会新建一个,若源是…

.NET MAUI Sqlite数据库操作(一)

一、安装 NuGet 包 安装 sqlite-net-pcl 安装 SQLitePCLRawEx.bundle_green 二、配置数据库(数据库文件名和路径) namespace TodoSQLite; public static class Constants {public const string DatabaseFilename "TodoSQLite.db3";//数据库…

MonoNodes – LOOK / LAB / PRINT DCTLS 复古美学柯达富士胶片负片模拟电影感DCTL达芬奇插件

MonoNodes – LOOK / LAB / PRINT DCTLS,我们包装中的“MONOLOOK”DCTL 的灵感来自柯达和富士的经典胶片美学。这些工具提供了三种特定的负片仿真,每种都经过精心设计,以捕捉模拟胶片的独特色彩质量。它们专为希望将胶片的永恒魅力与数字传感…

文心智能体体验,打造你自己的GPTs应用

利用百度智能体搭建的《RPG冒险游戏大作战》已经发布啦! RPG冒险游戏大作战 玩家扮演一位小小勇士女孩,从被巨龙毁灭的冒险小镇出发,一路披荆斩棘,集齐四件神器后,打败巨龙,夺回小镇的安宁! 整…