读天才与算法:人脑与AI的数学思维笔记06_算法的进化

1. 现代算法

1.1. 知识不仅建立在真理之上,也建立在错误之上。

1.1.1. 卡尔·荣格(Carl Jung)

1.2. 现代算法是可以自学的,尤其是推荐系统算法,它可以根据每个人的喜好推荐有趣的东西给我们

1.2.1. 算法通过与用户之间的交互过程,获取用户的个人偏好信息,并从中学习进一步完善自身,发现其中的关联关系,以便为下一位用户提供更优质的推荐信息

1.2.2. 比如说适合的电影、书籍、音乐,等等

1.3. 人机交互给算法提供了持续学习的新数据,使它可以不断进行自我调整以适配我们的喜好

1.3.1. 在当今社会,这些算法在我们做出各种抉择时发挥了巨大作用:选择电影、音乐、书籍,甚至伴侣,等等

1.4. 机器学习的一个重要特点是,人类必须参与到数据的分类过程中,以便让机器知道它所看到的到底是什么

1.5. 从最原始的数据中学习并发现模式是训练算法最好的方式

1.5.1. 事实上,原始数据所蕴含的信息远比我们想象的要多

1.5.2. 它们有发掘新事物的潜力

1.5.2.1. 深度学习算法提取出了人类无法用语言描述和表达的特征信息
1.5.2.2. 就好比在没有建立颜色的概念,也没有红色或蓝色这种表示颜色的词汇的情况下,仅仅通过我们对所见事物表现出的好恶,计算机就能帮我们实现蓝色和红色的分类

1.6. 数据像是一种新型“石油”,而我们却把它“倒”在互联网上了

1.6.1. 谁拥有这些数据以及如何利用好这些数据,将是我们走向由这种新型“石油”推动的未来时,社会将要面临的一个重大问题

2. 电影推荐系统

2.1. 电影推荐系统的算法原理比较简单

2.1.1. 假定你喜欢电影A、B和C,而另一个用户也喜欢它们,但他还喜欢电影D,那么,D极有可能也是你所喜欢的

2.1.1.1. 现实中数据之间的逻辑关系并非如此简单

2.1.2. 算法通过查看你所提供的信息,分析出你喜欢某类电影的原因,进而会把你和那些曾经做出过相同选择的人匹配、关联到一起

2.1.3. 算法在用户浏览影片库的行为过程中拾取关键特征值

2.1.3.1. 计算机最终学会的是已知的知识,而不能发现新的潜在趋势,从而导致计算机形成拟人态的思维定式

2.2. 如果希望借助计算机找出数据中包含的信息,那么就需要降维处理

2.2.1. 电影和用户就像脸上一个一个的点,以一个角度投影,可能会看到这些点连成一条线,而以另外的一个角度投影,则可能并不会发现有明显的信息出现

2.2.2. 将高维空间中的电影和用户对应的点同时投射到一个二维平面上,这样用户对应的点就会非常接近他喜爱的电影所对应的点

2.2.2.1. 巧妙之处就在于,能够寻找到揭示影片、用户所具有的潜在特征的合适投影

2.2.3. 巧妙之处就在于,能够寻找到揭示影片、用户所具有的潜在特征的合适投影

2.2.4. 将高维空间投射到这20个特征所构建的20维空间中

2.2.4.1. 剧情片聚集在右上角,动作片聚集在左下角

2.2.5. 借助计算机强大的运算能力,从海量的投影方案中挑选出最好的那一个

2.2.5.1. 这正是计算机的强大之处,它的这种能力是人类的大脑和眼睛所无法企及的

2.3. 存在太多的因素影响着我们的决定,我们无法准确地描述出为什么喜欢某部电影

2.3.1. 决定个人偏好的人类代码遵循什么样的算法原理是隐性的,但计算机代码已经识别出了引导我们偏好的特征,而这些特征我们仅可凭直觉感知,却无法表达出来

2.3.2. 计算机代码在这一点上已经遥遥领先于人类了

2.4. 《断背山》因子

2.4.1. 她是一个未出柜的同性恋母亲,有关她对电影喜好的数据可能会暴露出她的性取向

2.4.2. 隐私权保护政策

3. 训练算法

3.1. 如果算法告诉你你可能会喜欢什么,那么就意味着你将永远都看不到算法认为你不喜欢的东西

3.2. 算法都采用了非线性或混沌理论的数学思想

3.2.1. 我和你喜欢的音乐风格只要略微不同,那么被推荐的歌曲将会大相径庭

3.2.2. 算法“连推带拉”地引导我从音乐库中挖到属于我自己的“宝石”

3.3. 电子邮件过滤器也是基于人机交互训练算法工作的

3.3.1. 电子邮件过滤器也是基于人机交互训练算法工作的

3.3.2. 只有在邮件有95%的概率是垃圾邮件的情况下,该邮件才应该进入“垃圾邮件”文件夹

3.3.3. 现在更酷的是:虽然算法的训练数据是一组普通的电子邮件,但你的日常行为也将教会它识别你感兴趣的事情

3.3.3.1. 算法会根据你所发出的邮件做出判断

3.3.4. 算法还会自主创建新的算法,用于从所有包含“糖尿病”一词的邮件中区分出垃圾邮件和正常邮件

3.3.4.1. 其方法是引入其他的关键词,例如“治愈”

3.4. 无人驾驶汽车也是基于这样的概率更新原理而设计的,虽然它的控制系统远比这复杂得多

3.4.1. 该算法根据感知所获得的道路、车辆位置和障碍物信息等,来控制车辆的转向和速度

4. 偏见和盲点

4.1. 人类的大脑不擅长进行概率分析,这是进化的失败

4.1.1. 机器学习可以看作对人类思维方式的补充,而不仅仅是简单的复制

4.2. 概率直觉感知力的构建必须基于大量的试验,然后从中发现可能的趋势性

4.2.1. 我们缺乏大量试验的机会,所以无法建立这种直觉

4.2.2. 从某种程度上来说,机器代码的发展弥补了人类大脑在数据交互方面低速率的缺陷

4.3. 机器掌握了人类所不具备的一项技能:对海量数据进行分析,并从中发掘出有价值的信息

4.4. 概率是机器学习的核心

4.4.1. 宇宙是由数学方程控制的,科学家的任务是发现其中蕴含的规律并用它们来预测未来

4.4.2. 量子物理理论认为,世界就像上帝在玩骰子,结果具有不确定性,取决于事件发生的概率

4.4.3. 概率思想主导下形成的算法具有非常强大的力量,这或许是为什么在新算法的世界中,那些受过物理思维训练的人比数学学者显得更游刃有余

4.4.3.1. 这是理性主义与经验主义之间的对抗

4.5. 美军用神经网络训练机器识别坦克图片

4.5.1. 一个经典的反面教材

4.5.1.1. 暴露了机器学习的一个缺点:它有时会把某些关联误认为是因果关系
4.5.1.1.1. 并不总是能够确定这之间存在什么样的因果关系

4.5.2. 该算法的训练数据是一些带标签的图片(标记出哪些有坦克,哪些没有坦克)

4.5.3. 通过对这些图片进行分析,算法获得了识别坦克的重要特征

4.5.3.1. 研究小组只是获得批准有权使用坦克有限的几天,所以他们将坦克开到不同地方,拍摄了大量位于不同伪装位置的照片,但没注意到那些天一直都阴阴沉沉的
4.5.3.2. 返回后,他们拍摄了一些没有坦克的乡村照片,但那时的天空是异常晴朗的

4.5.4. 在分析了数百张带标签的图片之后,研究人员用一些算法从未见过的图片进行测试,结果非常振奋人心,识别准确率达到了100%

4.5.5. 只要图片拍摄于阴天,探测器就能做出正确的判断

4.5.5.1. 用这些照片作为训练数据,算法就误认为晴天和阴天也是区分坦克的重要特征

4.6. 机器是能够学习的,但前提是你要让它学习对的东西

4.7. 很多证据表明,算法中暗藏着歧视和偏见

4.7.1. 虽然针对大量的人脸图像进行了训练,但这些数据中黑色皮肤的面孔较少

4.7.2. 针对男性的声音进行训练的语音识别软件识别不了女性的声音

4.7.3. 某图像识别软件将黑人辨认为大猩猩

4.7.4. 护照照片拍摄软件不适用于亚洲人,原因是它始终认为他们在拍照时闭眼了

4.8. 法律体系也面临着考验,申请抵押贷款、应聘工作、申领社会福利被算法程序拒绝后,人们有理由知道为什么

4.8.1. 由于算法是基于数据交互构建决策树的,证明其决策的合理性并不容易

4.9. 人工智能领域一直呼吁开发一种元语言,机器可用它来证明自己的决策是合理的

4.9.1. 必须谨慎对待这些算法对日常生活的影响

4.9.2. 绝大多数算法都有其专长,不善于处理无规律的行为,当意料之外的事情出现时,算法只能选择将其忽略,而人类对这类场景却能表现出非凡的应变能力

4.10. 没有免费午餐的定理表明,在任何情境下都能做出准确预测的通用性算法是不存在的

4.10.1. 机器学习的目标不是建立放之四海而皆准的通用模型,而是构建关于特定问题有针对性的解决方案

4.11. 数据本身永远无法自给自足,它必须与知识相结合

4.11.1. 人类的思维和智慧似乎能更好地应对环境的变化并对全局进行把控

5. 机器之间的战争

5.1. 作为一个物种,人类之所以取得进步,是因为我们积累了知识,并以比最初获得知识时更有效的方式将知识传递了下去

5.2. 作为一个数学家,也是用上大学的几年时间快速学习了前辈们近几个世纪发现的数学理论,而不是凭借一己之力去重新发现所有的数学知识,以此站到学科前沿的

5.3. AlphaGo

5.3.1. 基础学习阶段

5.3.1.1. 通过检索就可以找到给对手致命一击的决胜杀招
5.3.1.2. 仅仅使用这个数据库还是不够的

5.3.2. 强化学习阶段

5.3.2.1. 从长远来看,它为算法自我的发展确立了优势,提供了可能
5.3.2.2. 算法通过自我对战、强化学习来提高对弈水平,即与之前的“自己”不间断地训练以提高下棋的水平
5.3.2.3. 如果某些有望获胜的棋招失败了,算法就会修改这些棋招的概率
5.3.2.4. 这种强化学习会综合生成大量的新数据,有助于算法发现自身可能存在的弱点
5.3.2.4.1. 局部最优是这种强化学习的弱点之一
5.3.2.4.1.1. “局部极大值”

5.3.3. 人类的下棋数据将算法导向了局部最优,而实际更优或者最优的下法与人类的下法存在一些本质的不同,即人类在事实上“误导”了AlphaGo

5.3.3.1. 算法很快就学会了如何重新评估自己的落子,以最大限度地提高再次获胜的概率
5.3.3.2. 是新对手把算法“逼下山”,促使它找到了再攀高峰的新方法

5.4. AlphaZero

5.4.1. 由于是通用棋类人工智能,因此去掉了代表围棋的英文“Go”

5.4.2. 没有使用人类的知识,从零开始训练,所以用“Zero”

5.4.3. 两者相结合就得到了“AlphaZero”

5.4.4. 它已不再学习人类的棋谱、走法,而是完全依靠自我对弈来迅速地提高棋艺,从而走出人类对围棋认知的局限与定式

5.4.4.1. 由“白板”状态开始“自学成才”是AlphaZero的独门秘籍
5.4.4.1.1. 白板指所有知识均由感官和经验而来,即从零开始的学习
5.4.4.2. 它已不再受人类的思维和游戏方式的限制了

5.4.5. AlphaZero自我训练的时间仅为3天,完成的自我对弈棋局数量就达到了490万盘

5.4.5.1. 人类花3000年才能实现的,它却只用了3天
5.4.5.2. 它打败了曾书写历史的各版本AlphaGo前辈
5.4.5.3. 在对阵曾赢下李世石那一版的AlphaGo时,AlphaZero取得了100:0的压倒性战绩
5.4.5.4. 经过40天的训练之后,它就所向披靡了

5.4.6. 它甚至能够在8小时内学会如何下国际象棋和日本将棋,水平甚至超过了市面上两个最好的国际象棋程序

5.5. 如果能够实现“白板”学习,就相当于拥有一个可以从围棋移植到其他任何领域的桥梁

5.5.1. 这种算法是通用的,它会将你从所在领域的细节中解放出来,它普遍适合于任何领域

5.5.2. AlphaGo并不是要打败人类,而是要发现做科学研究意味着什么,让程序能通过自学最终学习到哪些知识

5.5.3. 首先解决智力问题,然后用它来解决其他问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/563243.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PTA L2-052 吉利矩阵

题目 解析 这题考的是搜索剪枝 可行性剪枝: 即判断当前行(列)是否已经超过L和剩下的格子都填最大值是否小于L,若是则剪枝。 当前行数大于1时,判断上一个填完的行是否等于L,若否,则剪枝。 当前行…

一个简单的记工tkinter窗口

代码分享: 导入datetime模块,用于获取当前日期 import datetime as da 导入csv模块,用于读写csv文件 import csv 导入tkinter模块,用于创建窗口和按钮 from tkinter import * 创建主窗口 appTk() 设置窗口大小为1048x2048&#xff0…

【网络协议】 TCP与UDP协议区别及应用场景深度分析

1. TCP与UDP简介 1.1 TCP 1.1 定义 TCP(TransmissionControl Protocol)传输控制协议。 是一种可靠的、面向连接的协议(eg:打电话)、传输效率低全双工通信(发送缓存&接收缓存)、面向字节流。使用TCP的应…

ROS1快速入门学习笔记 - 01Linux基础

目录 一、Linux极简基础 二、C与Python极简基础 1. for循环 2. while循环 3. 面向对象 一、Linux极简基础 终端快捷键:ctrlaltt 命令行的操作方式 查看当前终端所在路径:pwd切换路径cd;例如cd /home/ 进入home文件夹;cd …

【精】Devops实战学习CI/CD落地方案#CI篇#

目录 先有个大概了解 基本概念 CI/CD Devops 阿里云效 devops产品 K8s jenkins docker git maven 知行合一,上手操作 实操记录 安装VMware 安装并配置虚拟机 安装并配置docker docker安装 修改镜像源(关键且易出错) CentOS…

【数据结构-树和二叉树-森林-哈夫曼树】

目录 1 树1.1 树的描述(基本术语) 2 二叉树(树的度最大为2)2.1 注意事项-五种基本形态2.2 二叉树的抽象数据类型定义 3 二叉树的性质3.1 两种特殊形式的二叉树-重点会计算3.2 题目练习: 4 二叉树的存储结构4.1 顺序存储…

竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

配图来自Canva可画 随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。“BAT”等互联网大厂、华为、小米等通讯巨头,以及一些垂直AI公司,都开始在大模型市场积极布局。众所周知,发展大模型的关键在于应用场景的落地&…

超星图书转成PDF格式

转为pdf 为避免浪费您的时间,本篇转载文章不值得花费您的宝贵时间阅读 方法一 感谢医学插画动画杜鹏 Roison An两位提供的方法,经试验后简化了一下,得出以下方法:1、使用超星打开你想要转换的图书2、依次打开本书的所有页面,不要…

Linux基础和常见命令速览

来源:Linux 基础知识总结 | JavaGuide 一、Linux文件系统 1. 文件系统 Linux 系统中的一个重要的概念:一切都是文件。 在 Linux 操作系统中,一切被操作系统管理的资源,如网络接口卡、磁盘驱动器、打印机、输入输出设备、普通文件…

(避雷指引:管理页面超时问题)windows下载安装RabbitMQ

一、背景: 学习RabbitMQ过程中,由于个人电脑性能问题,直接装在windows去使用RabbitMQ,根据各大网友教程,去下载安装完之后,使用web端进行简单的入门操作时,总是一直提示超时,要么容…

Electron+Vue3整合-开发时整合-全部ts开发 + 一条命令启动vue3和electron两个服务

说明 本文介绍一下 Electron Vue3 的整合的中级操作。实现的效果是 : 1、一个正常的Vue3项目; 2、整合加入 Electron 框架 :开发时只执行一条命令,启动 vue 项目 后 再启动 electron;electron 的开发使用 typescript…

Office疑难杂症-Word页码重复无法修改

在现代办公环境中,Microsoft Office 套件扮演着不可或缺的角色,尤其是 Word 文档处理软件,在日常生活和工作中的应用广泛。然而,即使是这样成熟的软件,也不免有一些令人头疼的技术问题。本文将详细介绍如何解决Word中页…

深度学习之图像分割从入门到精通——基于unet++实现细胞分割

模型 import torch from torch import nn__all__ [UNet, NestedUNet]class VGGBlock(nn.Module):def __init__(self, in_channels, middle_channels, out_channels):super().__init__()self.relu nn.ReLU(inplaceTrue)self.conv1 nn.Conv2d(in_channels, middle_channels, …

回归预测 | Matlab实现BO-RF贝叶斯优化随机森林多变量回归预测

回归预测 | Matlab实现BO-RF贝叶斯优化随机森林多变量回归预测 目录 回归预测 | Matlab实现BO-RF贝叶斯优化随机森林多变量回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现BO-RF贝叶斯优化随机森林多变量回归预测; 2.输入7个特征&#xf…

互联网技术知识点总览——数据库知识点框架

简介 本文对数据库的知识点整体框架进行梳理和分享如下:

Vue3+TS版本Uniapp:封装uni.request请求配置

作者:前端小王hs 阿里云社区博客专家/清华大学出版社签约作者✍/CSDN百万访问博主/B站千粉前端up主 封装请求配置项 封装拦截器封装uni.request 封装拦截器 uniapp的封装逻辑不同于Vue3项目中直接使用axios.create()方法创建实例(在create方法中写入请求…

Oracle中的视图

1- 什么是视图 视图是一个虚拟表 视图是由sql查询语句产生的 视图真实存在 但是不存储数据 视图中的数据 只是对 基表(源数据表) 中的数据的引用 总的来说 视图可以简化数据 用户,订单,物流 三个表进行关联 吧很复杂的sql查询语句存储成一个视图 …

【 AIGC 研究最新方向(下)】面向平面、视觉、时尚设计的高可用 AIGC 研究方向总结

目前面向平面、视觉、时尚等设计领域的高可用 AIGC 方向有以下 4 种: 透明图层生成可控生成图像定制化SVG 生成 本篇(下篇)介绍 3、4,上篇在:https://blog.csdn.net/weixin_44212848/article/details/138035279?spm…

CSS——高级选择器

层次的选择器&#xff1a; <1> 后代选择器&#xff1a; 格式&#xff1a; 标签1 标签2{} 解释&#xff1a; 标签1 不生效&#xff0c;被标签1 嵌套中的 标签2才生效 举例&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charse…