读天才与算法:人脑与AI的数学思维笔记05_算法的幻觉

1. 自下而上

1.1. 代码在未来可以自主学习、适应并进行自我改进

1.2. 程序员通过编程教会计算机玩游戏,而计算机却会比教它的人玩得更好,这种输入寡而输出众的事情不大可能实现

1.3. 早在20世纪50年代,计算机科学家们就模拟该过程创造了感知器

  • 1.3.1. 其原理是:神经元就像一个逻辑门,接收输入的信息,然后通过计算来判断是否触发并产生兴奋反应

  • 1.3.2. 通过调整权值和阈值来模拟你的行为

  • 1.3.3. 更为精细的感知器,如S型神经元,可进一步地平滑输出,而不仅限于“是”和“否”两种结果

  • 1.3.4. 归根结底,还是因为数据,感知器的学习和进化需要数据的支撑

    • 1.3.4.1. 我们可通过编程为感知器分配初始的权值和阈值,通过真实的输入数据对其进行训练,每一次错误的预测都将会作为反馈,用以促进权值的调整和修正

1.4. 过去的5年间产生了现在世界上90%的数据

  • 1.4.1. 互联网每天创建的数据可达到1EB(1018),约为2.5亿张DVD光盘所存储的数据量

  • 1.4.2. 现在,人类两天内产生的数据量,就可以媲美从“文明曙光时代”到2003年所产生的数据量的总和

1.5. 海量的数据是机器学习进入新时代最重要的催化剂

  • 1.5.1. 在此之前,一直不具备任由算法在数据之中学习、遨游的客观条件

1.6. 数据对于新的变革尤为重要,因此它也被称为“新的石油”

  • 1.6.1. 访问数据,相当于在21世纪的“油田”中进行开采

  • 1.6.2. Facebook、Twitter、谷歌和亚马逊备受瞩目,根源在于我们为其提供了免费的“石油储量”

  • 1.6.3. 严格意义上说,也不是完全免费,因为我们也在它们提供的服务中获得了数据的“交换

    • 1.6.3.1. 严格意义上说,也不是完全免费,因为我们也在它们提供的服务中获得了数据的“交换

    • 1.6.3.2. 很多人意识不到这种“交换”的重要性,不愿提供有价值的数据,因此其所得回报甚少

1.7. 机器学习的核心是在经验学习中改进算法的性能

  • 1.7.1. 对每个输出的结果进行自判断并即时调整算法公式,避免再次出错,在错误中不断学习进而得到改进

  • 1.7.2. 数据访问十分重要的原因

    • 1.7.2.1. 数据越多,可用来进行训练的样本越多,得到的经验就越丰富,算法可以在不断迭代的过程中不断完善

    • 1.7.2.2. 程序员创建的元算法遇到不同的数据,就会发展成不同的新算法

      1.7.2.2.1. 这种新方法的有效性同样震撼了整个人工智能领域,部分原因在于其底层技术并非独特的新技

  • 1.7.3. 机器学习为其开辟了一个新篇章,即算法会像我们人类一样成长并走向成熟

1.8. 在自下而上的算法设计思路下,算法可以基于训练数据自主创建决策树

  • 1.8.1. 网络上大量的训练数据

    • 1.8.1.1. 带标签的视觉数据(例如,Instagram上带评论的照片)
  • 1.8.2. 会为人工智能在视觉识别领域的迅速发展提供基本的支撑条件

2. 计算机的视觉问题

2.1. 人类大脑具备惊人的能力,可迅速处理数据并输出答案

2.2. 当看到一幅图像或一些特别的笔迹时,人类非常善于辨识出这幅图像或文字的特点,而计算机程序却不足以应对所有的变化

2.3. 通过由猫的图像组成的数据库对算法进行训练,算法逐渐建立起一个问题层次结构,它可以向一幅具有高准确度的图像发问,并将其准确地识别为猫

  • 2.3.1. 我们真正在做的是训练视觉识别的算法

  • 2.3.2. 用这些训练数据作为最好的问题类型可以训练算法,以便其区分猫和非猫的图像

  • 2.3.3. 每当算法识别错误,它将进行调整以便下次能够正确识别

2.4. 算法在大部分时间都在工作,但达不到100%,所以关键是要让其尽可能达到“最"

  • 2.4.1. 确定性算法到概率性算法的转变是一个重大的心理突破,类似于让数学家用工程师的思维方式去考虑问题

2.5. 在过去,我们都是通过苦思冥想或突发的灵感去设计一系列巧妙的问题

2.6. 机器学习会从一些我们认为可能解决问题的候选问题开始,所以不算是零起点学习

  • 2.6.1. 学习的过程就是将最初的想法逐渐优化,从而形成有效的解决方案

  • 2.6.2. 随着不断提问、回答、分析,该像素点位于身体哪个部位的答案将逐渐浮出水面

  • 2.6.3. 我们的目标是能够找到那些提供有价值的信息的问题

  • 2.6.4. 算法自己找到了最优的问题集合,但程序员并不真正清楚它是如何得到这样的结果的

    • 2.6.4.1. 他们可以查看决策树中任何一个结点及其前后结点上所询问的问题,但树中的问题超过百万个,每个问题又略有不同,所以很难采用逆向工程法得出算法具体是怎样解决问题的

2.7. 机器学习所面临的挑战之一是“过度拟合”

  • 2.7.1. 假设函数为了完美地拟合样本集,引入了过多的高次项

    • 2.7.1.1. 虽然这样做可以得到良好的样本拟合结果,但与实际情况完全偏离
  • 2.7.2. 针对训练数据提出用以区别图片的问题相对容易,但设计一个不针对特定数据的通用程序却非常困难,它需要从数据中抽象出广泛适用的规则

  • 2.7.3. 有必要减少方程的项数,以避免出现过度拟合的问题

  • 2.7.4. 过度拟合会误导你在建模时过分关注细节而错过数据呈现出的总体趋势,然后产生不符合客观规律的预测结果

3. 算法的幻觉

3.1. 新算法可以驾驭或识别的不仅仅是人类的身体

  • 3.1.1. 数码相机对图像细节的捕捉能力远超过人类大脑,但在图像识别的过程中,计算机读取到的是一个个孤立的像素点,而不是一副完整、有内容、有故事的图片

3.2. 接收到感官传递过来的信息后,人类大脑是如何将其当作一个整体看待的?

  • 3.2.1. 复制这种融合能力,一直是计算机解释图像所面对的挑战之一

  • 3.2.2. 按像素读取图像的方式,无法帮助计算机获得图像的整体信息

3.3. 由于沙漠的颜色跟人的肤色相近,而起伏的沙丘又极像裸露的身体曲线,所以很多人用作屏保的沙漠图片,有时就会被误认为是色情图片了

  • 3.3.1. 马克·斯托克斯(Mark Stokes)

3.4. 对抗图像

  • 3.4.1. 计算机科学家们一直在努力开发一些特殊类型的图片,企图用它们“欺骗”人工智能。这些特殊的图片被称为“对抗图像”

  • 3.4.2. 利用了计算机看世界的不同方式,让人工智能的“眼睛”看到了并不存在的东西,我们可以理解为人工智能产生的“视觉幻象”

3.5. LabSix

  • 3.5.1. 是一个独立运营的人工智能研究小组,由麻省理工学院(MIT)的本科生和毕业生组成

  • 3.5.2. 该团队把一幅狗的图像逐像素转换为两个在斜坡上滑雪的人,最终狗的图像在屏幕上完全消失了,但机器仍然将其识别为狗

  • 3.5.3. 麻省理工学院LabSix团队最新的研究试验表明,谷歌人工智能视觉识别系统对一只3D打印的海龟毫无辨识能力,无论以任何角度拿着这只海龟,甚至将它放置于大海等海龟应该在的环境里,其都会被识别为一支枪

    • 3.5.3.1. 点到了谷歌视觉识别的“完全死穴”

    • 3.5.3.2. 这种纹理是很巧妙地用由不断变化的来复枪图案组成的

    • 3.5.3.3. LabSix的贡献在于,无论从哪个角度看这只海龟,算法始终都会确信它看到的是一支步枪

3.6. 神奇贴纸

  • 3.6.1. 谷歌的研究人员创造了一种更适合算法口味的图像——“神奇贴纸”

  • 3.6.2. 它会导致算法忽略图片中的其他内容

  • 3.6.3. 其原理就是利用了算法会优先选择它认为对图像分类更重要的那部分像素

  • 3.6.4. 算法用于人脸识别时,它会自动过滤掉大部分背景像素

    • 3.6.4.1. 比如天空、草地、树木等
  • 3.6.5. 这种“贴纸”可以被标识为任意图像,比如一台烤面包机

    • 3.6.5.1. 无论算法正在识别的是什么图像,一旦“贴纸”进入机器的眼帘,它都会认为自己看到的就是烤面包机
  • 3.6.6. 先前的算法攻击测试绝大多数都需要事先获取被攻击对象(即被识别的图像)的大致内容,但这张“神奇贴纸”却什么都不用做

    • 3.6.6.1. 不管它试图干扰的图像里有什么,它都能正常工作

3.7. 人类不会轻易被这些黑客手段蒙骗,但这并不意味着我们可以彻底的免疫

  • 3.7.1. 魔术师们就可以利用人类大脑的潜意识行为倾向,分散我们的注意力

  • 3.7.2. 不仅算法存在视觉盲点,我们人类一样也有视觉盲点

3.8. 即便是训练数据中从未出现过的瑜伽动作,Kinect算法也能高度准确地识别出我身体的各个部位

  • 3.8.1. 由于缺乏外部刺激,即人身体能够做出的所有动作基本都是固定的,所以这个算法没有进一步“进化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/561159.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

内存概念理解:RANK,BANK,BURST,INTERLEAVING

背景:死磕内存的bank和rank概念的一天。网上的资料都差不多,还是有些地方没理通顺,有什么内存基础知识的书籍可以推荐吗? 物理RANK的概念 当我们给计算机购买内存条时候,上面显示的1RX8, 2RX8,其中R就是r…

【ARM 裸机】I.MX 启动方式之启动头文件 1

接上一节:【ARM 裸机】I.MX 启动方式之启动设备的选择; 2、启动头文件 当 BOOT_MODE1 为 1,BOOT_MODE0 为 0 的时候此内部 BOOT 模式,在此模式下,芯片会执 行内部的 BOOT ROM 代码,这段 BOOT ROM 代码会进…

常见的七种排序

目录 一、插入排序 1、直接插入排序 2、希尔排序(缩小增量排序) 二、选择排序 3、直接选择排序 4、堆排序 三、交换排序 5、冒泡排序 6、快速排序 四、归并排序 7、归并排序 五、总结 一、插入排序 1、直接插入排序 思路: i 用来…

Xamarin.Android中“ADB0020: Android ABI 不匹配。你正将应用支持的“armeabi-v7a;arm64-v8a”异常处理

这里写自定义目录标题 1、问题2、解决 1、问题 在Xamarin.Android中出现ADB0020: Android ABI 不匹配。你正将应用支持的“armeabi-v7a;arm64-v8a”ABI 部署到 ABI“x86_64;x86”的不兼容设备。应创建匹配其中一个应用 ABI 的仿真程序,或将“x86_64”添加到应用生成…

Parade Series - CoreAudio Loopback

Scenario 鉴于业务场景需要, 经过技术路径探索, 发现 comtypes 兼容性过于混乱,故而考虑整合一个 CoreAudio 的轮子dll来解决实际问题!std::StringStream ⇒ std::ios::binary ⇒ std::ofstream Loopback.dll #ifndef _DLL_C…

【nvm最新解决方案】Node.js v16.20.2 is not yet released or available

【nvm最新解决方案】Node.js v16.20.2 is not yet released or available 解决办法:下载想安装的node压缩包,放入nvm对应目录。 2024年最新node压缩包地址:https://nodejs.org/dist/ 1、选择对应的node版本:例如,我选的…

如何创建响应式HTML电子邮件模板

在这个适合初学者的指南中,你将学习如何创建一个响应式电子邮件模板。你将跟随逐步说明以及代码片段设计一个在任何设备上都看起来很棒的电子邮件模板。 这个项目非常适合渴望掌握电子邮件设计基础的新手! (本文视频讲解:java56…

怎么用手机远程控制电脑 远程控制怎么用

怎么用手机远程控制电脑:远程控制怎么用 在这个科技日新月异的时代,远程控制电脑已经成为了很多人的需求。有时,我们可能在外出时突然需要访问家中的电脑,或者在工作中需要远程操控办公室的电脑。这时,如果能用手机远…

Spring 声明式事务控制

1. 编程式事务控制相关对象 1.1 PlatformTransactionManager PlatformTransactionManager 接口是 spring 的事务管理器,它提供了我们常用的操作事务的方法。 PlatformTransactionManager 是接口类型,不同的 Dao 层技术则有不同的实现类。例如:Dao层技…

【Spring】Spring源码中占位符解析器PropertyPlaceholderHelper的使用

开发中经常需要使用到占位符,情况较为复杂时总是手工替换处理显得比较的繁琐,加之往往手工所写效率比不上框架自带的现有方法来的更好更快。Spring在处理yml配置文件时,对于yml文件名的占位符替换处理便是使用了占位符解析器PropertyPlacehol…

深入了解PBKDF2:密码学中的关键推导函数

title: 深入了解PBKDF2:密码学中的关键推导函数 date: 2024/4/20 20:37:35 updated: 2024/4/20 20:37:35 tags: 密码学对称加密哈希函数KDFPBKDF2安全密钥派生 第一章:密码学基础 对称加密和哈希函数 对称加密:对称加密是一种加密技术&…

Windows COM技术:COM介绍、代码演示。

目录 步骤一:理解COM技术 介绍COM的基础知识 1. COM的目的和特点 2. COM的关键概念 3. COM的实现 4. COM与DCOM、ActiveX 讨论COM的用途 1. 软件自动化 2. 插件和扩展 3. 跨语言开发 4. 分布式计算 5. 系统级组件 6. 网络浏览器插件 步骤二&#xff1a…

开源贡献代码之​探索一下CPython

探索一下Cython 本篇文章将会围绕最近给Apache提的一个feature为背景,展开讲讲CPython遇到的问题,以及尝试自己从0写一个库出来,代码也已经放星球了,感兴趣的同学可以去下载学习。 0.背景 最近在给apache arrow提的一个feature因为…

【做一名健康的CSDNer】程序员如何早日脱单?

程序员脱单的策略可以从以下几个方面着手: 拓展社交圈:参加技术交流会、行业聚会、开源社区活动等,不仅可以提升技术能力,还可以结识更多志同道合的人,其中可能就包括潜在的伴侣65。 改善形象和性格:注意个…

【GIS教程】ArcGIS做日照分析(附练习数据下载)

我国对住宅日照标准的规定是:冬至日住宅底层日照不少于1小时或大寒日住宅层日照不少于2小时(通常以当地冬至日正午12时的太阳高度角作为依据)。因冬至日太阳高度角最低,照射范围最小,如果冬至日12:00建筑物底层能够接收到阳光,那么…

探索边缘计算:技术的新疆界

探索边缘计算:技术的新疆界 在当今迅速发展的数字化时代,云计算作为数据处理的主力军已广泛应用。但是,随着物联网(IoT)设备的急剧增加和数据生成速率的加快,云计算面临着种种挑战。边缘计算因此诞生&…

python爬虫-----深入了解 requests 库下篇(第二十五天)

🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天…

[阅读笔记15][Orca]Progressive Learning from Complex Explanation Traces of GPT-4

接下来是微软的Orca这篇论文,23年6月挂到了arxiv上。 目前利用大模型输出来训练小模型的研究都是在模仿,它们倾向于学习大模型的风格而不是它们的推理过程,这导致这些小模型的质量不高。Orca是一个有13B参数的小模型,它可以学习到…

从零自制docker-11-【pivotRoot切换实现文件系统隔离】

文章目录 busyboxdocker run -d busybox topcontainerId(docker ps --filter "ancestorbusybox:latest"|grep -v IMAGE|awk {print $1})docker export -o busybox.tar $containerId or sudo docker export 09bbf421d93f > ./busybox.tar tar -xvf busybox.tar -C …

修复vite中使用react提示Fast refresh only works when a file only exports components.

前言 我通过 vite 构建了一个 react 应用并使用 react.lazy 来懒加载组件,但是在使用过程中 一直提示 Fast refresh only works when a file only exports components. Move your component(s) to a separate file.eslint(react-refresh/only-export-components)。…